TrustRank

TrustRank

TrustRank is a link analysis technique described in a paper by Stanford University and Yahoo! researchers for semi-automatically separating useful webpages from spam. [cite journal
last = Gyöngyi
first = Zoltán
authorlink =
coauthors = Hector Garcia-Molina, Jan Pedersen
title = Combating Web Spam with TrustRank
journal = Proceedings of the International Conference on Very Large Data Bases
volume = 30
issue =
pages = 576
publisher =
location =
date = 2004
url = http://www.vldb.org/conf/2004/RS15P3.PDF
doi =
id =
accessdate = 2007-10-26
]

Many Web spam pages are created only with the intention of misleading search engines. These pages, chiefly created for commercial reasons, use various techniques to achieve higher-than-deserved rankings on the search engines' result pages. While human experts can easily identify spam, it is too expensive to manually evaluate a large number of pages.

One popular method for improving rankings is to increase artificially the perceived importance of a document through complex linking schemes. Google's PageRank and similar methods for determining the relative importance of Web documents have been subjected to manipulation.

TrustRank method calls for selecting a small set of seed pages to be evaluated by an expert. Once the reputable seed pages are manually identified, a crawl extending outward from the seed set seeks out similarly reliable and trustworthy pages. TrustRank's reliability diminishes as documents become further removed from the seed set.

The researchers who proposed the TrustRank methodology have continued to refine their work by evaluating related topics, such as measuring spam mass.

References

See also

* PageRank
* Hilltop algorithm
* Spamdexing

External links

* [http://www.vldb.org/conf/2004/RS15P3.PDF Z. Gyöngyi, H. Garcia-Molina, J. Pedersen: "Combating Web Spam with TrustRank"]
* [http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=%2Fnetahtml%2FPTO%2Fsrchnum.html&r=1&f=G&l=50&s1=%2220060095416%22.PGNR.&OS=DN/20060095416&RS=DN/20060095416 Link-based spam detection] Yahoo! assigned patent application using Trustrank
* [http://pagerank.suchmaschinen-doktor.de/trustrank.html TrustRank algorithm explained]


Wikimedia Foundation. 2010.

Игры ⚽ Нужна курсовая?

Look at other dictionaries:

  • TrustRank — es una técnica de análisis de hiperenlaces descrita en un documento elaborado por la Universidad de Stanford y Yahoo!. Este sistema separa las páginas web útiles de las de spam de manera semiautomática.[1] Muchas páginas web de spam son creadas… …   Wikipedia Español

  • TrustRank — Le Trust Rank (terme anglais signifiant indice de confiance ) ou TR est le nom d un algorithme mis au point par deux chercheurs de l université Stanford et un chercheur de l entreprise Yahoo!. Cet algorithme visant à combattre les pages internet… …   Wikipédia en Français

  • TrustRank — Der TrustRank Algorithmus ist ein Verfahren zur Bewertung der Qualität von Webseiten[1]. Er dient zur halbautomatischen Klassifizierung der Qualität einer Seite bzw. zum Auffinden von Spam Seiten und soll Suchmaschinen bei der Bewertung von… …   Deutsch Wikipedia

  • PageRank — Illustration du PageRank. Le PageRank ou PR est l algorithme d analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l ordre dans les résultats de recherche qu il fournit. De …   Wikipédia en Français

  • Classement Google — PageRank Illustration du PageRank. Le PageRank ou PR est l algorithme d analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l ordre dans les résultats de recherche qu il… …   Wikipédia en Français

  • Page Rank — PageRank Illustration du PageRank. Le PageRank ou PR est l algorithme d analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l ordre dans les résultats de recherche qu il… …   Wikipédia en Français

  • Page rank — PageRank Illustration du PageRank. Le PageRank ou PR est l algorithme d analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l ordre dans les résultats de recherche qu il… …   Wikipédia en Français

  • Pagerank — Illustration du PageRank. Le PageRank ou PR est l algorithme d analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l ordre dans les résultats de recherche qu il fournit. De …   Wikipédia en Français

  • Rang De Page — PageRank Illustration du PageRank. Le PageRank ou PR est l algorithme d analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l ordre dans les résultats de recherche qu il… …   Wikipédia en Français

  • Rang de page — PageRank Illustration du PageRank. Le PageRank ou PR est l algorithme d analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l ordre dans les résultats de recherche qu il… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”