Internet è una miniera di informazioni, come di spazzatura. Ogni giorno migliaia di notizie si affacciano sulla pagina di Google News e fanno il giro del web pur non riportando fatti davvero accertati. Ora un team di ricercatori di Mountain View ha studiato come porre rimedio a questa deriva che alimenta il rumore di fondo della rete. Come? Con le loro tecnologie knowledge based applicate alle regole del motore di ricerca.
LA SCIENZA DEL SEO. Nel valutare una notizia e stabilire la posizione di una pagina web all'interno dei risultati del motore di ricerca, il complesso e segretissimo algoritmo di Google calcola una serie di parametri. I più noti e importanti sono le parole chiave (keyword) contenute nella pagina e i link che una notizia riceve da altri siti giudicati di qualità (referral), ma ci sono tanti altri elementi la cui importanza è meno nota e difficile da stimare.
Sapere utilizzare e sfruttare questi elementi per arrivare in cima alla apgina dei risultati di Google è una scienza, o meglio un vero e proprio mestiere, quello del Seo (Search Engine Optimization). A cui si aggiunge quello del Sem (Search Engine Marketing), in cui si cerca di scalare posizioni acquistando keyword attraverso strategie di marketing online.
LA CONTRADDIZIONE. Il principio fondamentale che ha decretato il successo del motore di ricerca di Mountain View (nato nel 1998), è proprio che se qualcuno (qualificato) cita le tue pagine web o le tue notizie (in forma di link), allora il tuo è un sito di qualità e merita una posizione elevata nei risultati di ricerca (ranking). Ma gli ingegneri di Big G si sono accorti che con questo sistema anche i siti pieni di informazioni sbagliate possono arrivare al vertice dei risultati.
IL DATABASE DELLA VERITà. Il team di ricercatori interno a Google ha dunque adattato a questa nuova esigenza il modello che misura la credibilità di una pagina, andando oltre la reputazione costruita con i link (link building) nel web.
Il sistema, invece che valutare i link in entrata calcola il numero di fatti non corretti riportati dentro una pagina. Il software si basa su Knowledge Vault, un sistema lanciato lo scorso anno che, sfruttando le informazioni masticate ogni giorno dal motore di ricerca, raccoglie un'ampia gamma di fatti, poi li analizza e infine li etichetta come "validi" (o no). È un archivio contenente informazioni sullo scibile umano (finora circa 1,6 miliardi di fatti) il più possibile accertate attraverso un immediato confronto con una serie di fonti sul web.
BAd NEWS. L'idea della compagnia americana non è una novità assoluta, nel senso che esistono già applicazioni per aiutare gli utenti a individuare informazioni non corrette, come LazyTruth o FactCheck.org.
Nel caso di questa ricerca al momento Google non sembra intenzionata a inserirla nel proprio algoritmo di ricerca. In una nota Big G ha spiegato che «abbiamo pubblicato una ricerca, una delle centinaia di ricerche che pubblichiamo ogni anno, e di cui pochissime vengono poi incorporate nei nostri prodotti. Questa non è incorporata nella search né abbiamo al momento piani di incorporarla».
Notizia aggiornata dopo la pubblicazione per correggere alcune imprecisioni. Nella prima versione la modifica dell'algoritmo era data per certa. Invece si tratta soltanto di una ricerca condotta dall'azienda e il cui meccanismo non verrà - al momento - incorporato negli algoritmi di ricerca.