Si è detto precedentemente che dall'algoritmo
dipende il
successo di un motore di ricerca. Nel passato
un motore non
utilizzava degli algoritmi particolari
per pubblicare una lista di risultati, ma
assegnava direttamente
un valore di
importanza alle pagine restituite in base
al numero di ricorrenze, in ogni documento, dei termini della
query.
Naturalmente, in un ambiente particolare come il
web,
attraverso questo metodo era facile apparire alle
prime posizioni:
bastava inserire un numero elevato, ed a volte esagerato, di
parole
chiave dentro una pagina e il gioco era fatto. Questo sistema,
però, è durato poco ed i
motori di ricerca
hanno cominciato a bannare (
eliminare dai loro db) e considerare
spamming (
cioè, tecniche fraudolente utilizzate per eludere
il motore di ricerca e fare apparire, comunque, il proprio sito nei primi
posti) alcuni metodi di costruzione delle pagine.
Quando un motore
effettua una ricerca
sul proprio database, entrano in atto una serie di calcoli statistici
che compongono il proprio algoritmo. Sorvoliamo sui calcoli matematici
con cui vengono applicate queste regole.
Inizialmente i motori
assegnavano importanza alle pagine
in base al numero di parole che l'utente ricercava. Per ovviare a questo
sistema, una tecnica moderna di ranking è quella della
link
popularity, in base alla quale un valore di importanza era dato
dal numero di link che una pagina riceveva dalle altre, sia interne che
esterne al sito.
In origine, alla base di tutto c'era il problema/obiettivo
di riuscire ad
usare un parametro umano per determinare
quanto fosse rilevante una pagina sulle altre, rispetto a un certo termine.
Ma come fare questo senza dover coinvolgere (
e quindi pagare)
un gran numero di persone e studiare un sistema valido per consentire
loro di dare valutazioni oggettive ? L'unico modo era creare un sistema
matematico incentrato sulla valutazione,
spesso non espressamente
riconosciuta, di un sito da parte di altri responsabili, amministratori
e creatori di
website. In pratica, il sistema doveva
poter rispondere alle domande:
Cosa pensano gli altri del mio sito
? Quanto lo valutano pertinente e interessante rispetto ad un dato argomento
? Google sembra essere stato un pioniere nell'utilizzo
dei
collegamenti ipertestuali per la creazione di un
sistema di valuazione dell'importanza di un website.
Grazie alla tecnologia chiamata
PageRank, Google riesce oggi
a fornire risultati altamente pertinenti, stabilendo in modo del tutto
automatizzato una misurazione oggettiva dell'importanza di ogni singola
pagina web presente nel suo database.
Per concludere, si può dire che le
pagine
web, a differenza dei normali testi, possono avere dei link ad
altre pagine e questi
link vengono interpretati dai motori
di ricerca come una specie di
voto da parte delle altre
pagine e quindi da parte degli altri siti e webmaster. Un link ricevuto
da un sito importante varrà sicuramente più di un link che
proviene da pagine meno importanti. Naturalmente questo è uno degli
algoritmi utilizzati da Google o da altri motori, perché ovviamente
anche qui c'è un punto debole, definito Google Bomb, cioè
una tecnica mirata ad aumentare la link popularity.