Breve guida alla comprensione dei motori di ricerca.
Definizione
Nel contesto del Web un motore di ricerca (search engine) è un software utilizzato per effettuare ricerche in database contenenti documenti (HTML, txt, pdf, rtf, doc, ed altri formati: immagini, audio, video, ecc.).
Importanza dei motori di ricerca
Nel Web non esiste un "elenco telefonico": a differenza degli altri mezzi mediatici, dove l'utente riceve in modo "passivo" le informazioni (es. radio, TV, ecc.), qui bisogna reperire in modo "attivo" le informazioni (accedendo a motori di ricerca, directory, pagine contenenti links, ecc.).
Questa funzione è svolta dalle pagine "links" dei siti web e dei portali, e, in larga parte, dai motori di ricerca: un buon posizionamento nei motori incrementa il numero dei visitatori.
Motori di ricerca e siti web
La crescita esponenziale dei siti presenti in rete e l'assenza di regole
in materia di classificazione delle informazioni, rendono difficile l'accesso alle informazioni stesse: i primi 10/20 siti web in testa ai risultati generati dai motori di ricerca, in risposta
alle richieste degli utenti, godono di visibilità massima in Internet (soprattutto su Google, Bing e Yahoo) e, quindi, di un buon incremento del numero dei visitatori.
Struttura di un motore di ricerca
Tipicamente un motore di ricerca è organizzato nei seguenti moduli:
- database: in cui sono archiviati i dati relativi ai siti web
- gatherer (raccoglitore): "visita" i siti per mezzo di un robot (spider) e invia al database le informazioni reperite nel sito (robots.txt, pagine, immagini, pdf, ecc.);
- indexer (indicizzatore): analizza i dati presenti nel database ed assegna ad ogni singola pagina web un indice di "rilevanza" per determinate parole chiave;
- search (ricerca): per mezzo di un'interfaccia web (ad es. un browser), permette agli utenti di Internet di formulare una richiesta (query) tramite parole chiave;
- retrieval (recupero): raccoglie le risorse presenti nel database e restituisce al modulo search i risultati da visualizzare all'utente. Tipologie
Tra i veri e propri motori di ricerca che utilizzano questo tipo di organizzazione figurano Google, Bing, Yahoo, Ask, Baidu, istella.
In alcuni motori di ricerca, definiti "directory" (categorie o cataloghi), ad es. Yahoo e Dmoz, sono dei redattori che si occupano di valutare i siti. La ricerca in questo tipo di motore avviene per "categoria" (internet, salute, ecc.). Spesso è a disposizione degli utenti anche un motore di ricerca, interno o esterno, Virgilio, Arianna e Tiscali, ad esempio, utilizzano Google.
Altri motori di ricerca detti metacrawler o metamotori (Dogpile.com, Mamma.com, Metacrawler.com, ecc.) restituiscono, in risposta alle query degli utenti, i risultati di altri motori di ricerca. Metacrawler.com, ad esempio, invia le query dell'utente a Google, Ask, ed altri, "organizza" i risultati, e visualizza le risposte all'utente.
Ricerca semantica
La ricerca Semantica sarà sicuramente uno dei prossimo obiettivi dei motori di ricerca.
Un motore di ricerca semantico, a differenza di uno"testuale", tenderà a "comprendere" la richiesta di un utente in relazione al "contesto" nel quale viene effettuata.