Google, recentemente, ha registrato il marchio TrustRank
presso la U.S.P.T.U (U.S. Patent
and Trademark Office)
Qual è il suo significato in relazione alle future iniziative di Google? E quanto questa applicazione e la sue funzionalità potenziali si possono adattare al Google Page Rank?
Il
PageRank è attualmente il cuore del motore di ricerca di Google.
Il PageRank è un sistema di misurazione che valuta e
classifica i siti web in relazione ad un valore determinato dal numero dei siti
che linkano ad esso.
Sebbene il PageRank determini l'importanza di un sito
web, non determina il suo valore in termini di credibilità del contenuto. Gli spammer, inoltre, sono stati in
grado di manipolarecon metodologie discutibili, il Page Rank dei loro siti. Per
questo si è pensato ad un meccanismo per valutare il TrustRank,
ossia l'indice di credibilità di un sito web ed alcuni
ricercatori del Digital Library Technologies dell'Università di Stanford hanno creato un documento intitolato
"Combating
Web Spam with Trust Rank".
Il documento estremamente tecnico è brevemente riproposto qui di seguito: "Le
pagine web di spam utilizzano diverse tecniche per raggiungere i primi posti nei risultati dei
motori di ricerca. Mentre esperti umani possono identificare lo spam, risulta troppo costoso
valutare manualmente un gran numero di pagine. Invece noi proponiamo tecniche semi-automatiche per separare le pagine degne di
reputazione da quelle di spam. Per prima cosa selezioniamo un piccolo set di pagine per essere valutato da un esperto. Una
volta che noi manualmente identifichiamo le pagine degne di reputazione, utilizziamo una struttura di link per scoprire altre
pagine che probabilmente sono buone. In questo documento discutiamo le vie possibili per implementare la selezione e la
scoperta di queste pagine.Presentiamo i risultati di questi esperimenti sul World Wide
Web indicizzato da Altavista e valutiamo le performance delle nostre tecniche. I nostri risultati
mostrano che noi possiamo efficacemente filtrare lo spam da una frazione significante del Web, basata su di un set di 200 siti. Il Web
sta divenendo sempre più caotico e il TrustRank potrebbe divenire un fattore importante per la sua sopravvivenza a lungo termine come deposito
dell'informazione globale.” Per scaricare il documento completo sul TrustRank clicca qui |
Consulenza Web S.r.l.
Viale Eritrea, 91
00199 Roma, Italia
Tel & Fax +39 06 9784 2278
P.IVA 08540351007 info@consulenzaweb.com
|