|
Internet costituisce una immensa risorsa informativa: in rete sono presenti enormi quantità di informazioni di qualsiasi genere e tipologia. E’ nella natura stessa di Internet però che tutte queste informazioni siano disordinate, disposte in modo non strutturato e caotico, e per questo la ricerca di una specifica informazione nell’universo di Internet può essere una operazione faticosa, costosa e deludente. Internet costituisce una immensa risorsa informativa: in rete sono presenti enormi quantità di informazioni di qualsiasi genere e tipologia. E’ nella natura stessa di Internet però che tutte queste informazioni siano disordinate, disposte in modo non strutturato e caotico, e per questo la ricerca di una specifica informazione nell’universo di Internet può essere una operazione faticosa, costosa e deludente. Quindi il problema che ogni utente nuovo o esperto si pone è, considerando che l'argomento che ci interessa è quasi sicuramente trattato su più di un sito, come trovare sulla rete in maniera efficace ed efficiente le informazioni di cui abbiamo bisogno; in questa operazione di ricerca in rete siamo aiutati da strumenti di navigazione divenuti ormai insostituibili: i motori di ricerca.
Si chiamano motori di ricerca i siti che catalogano in un database l' elenco delle pagine presenti sul web, offrendo ai navigatori la possibilità di estrarne le liste sulla base della ricerca delle parole attinenti ai contenuti. Si tratta di strumenti che consentono la ricerca di argomenti senza conoscere il sito che li pubblica, con la possibilità di impostare diversi criteri per la ricerca: sono quindi siti che dispongono di un database contenente informazioni sulle pagine indicizzate, ed è da questo database che verranno estratti gli url dei siti che rispondono ai criteri di ricerca immessi dall’utente. Ciascun motore di ricerca si differenzia per dimensione del database, tempestività di aggiornamento, potenza elaborativa e complessità della ricerca.
Vanno innanzitutto distinti dai motori di ricerca tradizionali le web directories e i meta-motori. Le web-directories sono cataloghi di siti organizzati gerarchicamente per argomenti, gestiti da personale addetto che si occupa di esplorare la rete e raggruppare i siti in categorie; i meta-motori sono dei server in grado di interrogare contemporaneamente vari motori di ricerca e/o directories e di riassumere i risultati ottenuti (sono utili quando si ha intenzione di effettuare ricerche multiple).
L’utilizzo del motore tradizionale da parte dell’utente alla ricerca di informazioni è semplice. Giunto alla homepage (almeno quella dovrebbe conoscerla…) c’è un box che consente l’inserimento delle parole da cercare. L’utente deve digitare le parole chiave e dare avvio alla ricerca; dopo qualche istante verrà emesso il risultato della ricerca sotto forma di elenco delle pagine dai contenuti attinenti. La richiesta, a seconda di come viene formulata, può risultare immediatamente soddisfacente oppure del tutto inadeguata, e per evitare quest’ultima situazione sono disponibili degli strumenti di ricerca avanzata. Tra questi i più comuni sono gli operatori BOOLEANI: essi sono supportati da tutti i motori di ricerca e devono il loro nome al matematico inglese George Boole. Si tratta di operatori semplici da capire ed utilizzare:
l’operatore AND serve per unire due parole che devono essere entrambe presenti nel risultato della ricerca;
l’operatore OR serve per unire due parole se si vuole che sia presente una o l'altra nel risultato della ricerca;
l’operatore AND NOT serve per unire due parole quando si vuole la prima nel risultato e la seconda no (questo operatore risulta essere un potentissimo strumento per raffinare le proprie ricerche).
Un altro operatore utile è NEAR: è usato quando si vuole unire due parole che devono essere presenti nel risultato e vicine nel testo trovato. La vicinanza massima tra le due parole dipende dal motore di ricerca (ad esempio Altavista considera un termine massimo di 10 parole, Lycos di 25).
Gli operatori booleani possono essere generalmente scritti indifferentemente in caratteri maiuscoli o minuscoli; è buona norma però utilizzarli in caratteri maiuscoli per poter meglio distinguere le parole della ricerca dalle istruzioni date al motore. E’ interessante notare che gli operatori booleani AND e AND NOT sono sostituiti nella ricerca semplice dai convenzionali operatori algebrici + e -, mentre digitare due parole senza nessun operatore interposto è equivalente ad utilizzare OR.
A volte può risultare indispensabile l’uso di parentesi e di asterischi. Le parentesi servono per indicare l’ordine di esecuzione degli elementi e della formula: il contenuto della parentesi sarà il primo ad essere processato, e in questo modo è assicurata la corrispondenza tra richiesta e risultato; gli asterischi, invece, informano il motore che potrà ritenere valide, ai fini della ricerca, le parole che hanno in loro luogo una qualsiasi porzione di testo: la stringa “fran*” porterà a ritenere valide le parole “Francia”, “Francesco”, “Frana”, ”Franchigia” e via discorrendo.
Sono disponibili altri strumenti di ricerca avanzata, che variano da un motore di ricerca all’altro: si possono ad esempio ordinare i risultati di una ricerca in base a dei criteri stabiliti; si può utilizzare la “compressione del sito”, che automaticamente filtra i risultati ed accorpa le pagine in modo che in lista risultino solamente le voci appartenenti a siti diversi (per alcuni motori di ricerca questa operazione è di default), si può impostare la delimitazione temporale, indicando il periodo di tempo entro il quale un sito dev’essere stato aggiornato per comparire nei risultati della ricerca….
Ci sono poi degli strumenti utilizzati dal motore stesso per rendere più efficienti le ricerche: è il caso ad esempio delle “STOP WORD”, che sono quelle parole talmente comuni nel database che quando vengono digitate nell’interrogazione sono automaticamente ignorate dal motore, in quanto il loro utilizzo come parametro di ricerca fornisce un contributo nullo. Si tratta generalmente delle parole comuni al mondo dell’informatica (quali “internet”, “computer” etc.) e parole molto comuni nella propria lingua (in italiano “e”, “di” etc.).
Ma ci sono, oltre ai cercatori d’oro (oro inteso qui come l’informazione voluta), altre persone interessate ai motori di ricerca: i proprietari di siti internet che vogliono promuovere il loro sito ed aumentarne gli accessi. I motori di ricerca sono sicuramente uno dei più importanti strumenti per la promozione di un sito Web, anche perché gli utenti di Internet si rivolgono soprattutto a questi per raggiungere le informazioni di cui hanno bisogno, per cui chi gestisce un sito web ha un grandissimo interesse a vedere inserito il proprio sito nel database di un motore di ricerca. Non solo: è stato dimostrato che l’internauta medio consulta generalmente i siti presenti nelle prime due o tre pagine dei risultati della ricerca, per cui non basta essere soltanto presenti nel database, ma c’è anche bisogno di trovarsi ai primi posti dei risultati della ricerca. Ma proseguiamo con ordine….
Le modalità attraverso le quali una pagina può essere inserita nel database di un motore di ricerca possono essere diverse; in generale l’inserimento può essere effettuato o dal webmaster, che inserisce la pagina a mano, oppure da un sistema automatico che esplora la rete alla ricerca di pagine web da inserire.
Occorre ricordare che invece nelle web-directory la pagina web viene inserita nel database, organizzato gerarchicamente per categorie di argomenti, da personale addetto. Le web-directory sono strumenti utilissimi per gli internauti, e c’è la tendenza a riunire in un unico sito i servizi offerti da motori di ricerca e web-directory per offrire agli utenti i benefici di entrambi: una grande quantità di siti indicizzati ed una larga scelta di siti visitati direttamente dai cosiddetti “surfers”.
Se il web master vuole inserire a mano un sito nel database del motore di ricerca deve seguire una procedura di registrazione (compilazione di appositi form), che varia da motore a motore. La scelta dei motori su cui registrarsi deve avvenire in relazione al mercato potenziale che si vuole raggiungere. Generalmente è bene registrarsi su i principali search engines internazionali quali Lycos, Google, Altavista, Yahoo (…), che soddisfano, secondo una ricerca, circa l’80% delle ricerche mondiali. E’ bene registrarsi presso i motori di ricerca nostrani, quali Virgilio ed Arianna, specie quando il sito non è bilingue ed è destinato ad un’utenza prevalentemente nazionale: da qualche anno i motori di ricerca ed i portali italiani (Jumpy, Godado etc) sono in grado di offrire una buona visibilità e di entrare in concorrenza con i già citati motori di ricerca internazionali. Dal momento della registrazione passa un certo periodo di tempo prima che il sito venga memorizzato negli archivi (anche questo lasso di tempo varia da motore a motore). Esistono sul mercato dei software che si occupano di registrare il sito web su diversi motori di ricerca, alleggerendo in tal modo il lavoro che grava sul webmaster.. Bisogna comunque considerare che se si vogliono registrare diverse pagine appartenenti ad uno stesso sito, possono sorgere delle complicazioni. Infatti alcuni motori di ricerca limitano il numero di pagine che è possibile inserire lo stesso giorno provenienti dallo stesso sito: Yahoo ad esempio pone lo stretto limite di un file per ogni sito. Si tratta di un vincolo imposto per non abbassare la qualità delle ricerche: può risultare infatti quantomeno fastidioso, per un internauta, trovare nella propria ricerca una schiera di pagine appartenenti allo stesso sito che trattano per lo più lo stesso argomento e che potrebbero essere facilmente raggiunte dalla homepage del sito stesso. Non tutti i motori di ricerca sono però dello stesso avviso: GO Network ad esempio non crea nessun limite di inserimento, anzi, permette anche di inviare via e-mail una lista di pagine (al massimo 50) da registrare tutte contemporaneamente. Ci sono altri motori che praticano un buon compromesso tra queste due soluzioni attraverso la pratica del clustering (raggruppamento). E’ possibile registrare un numero arbitrario di pagine appartenenti allo stesso sito, ma è permesso ad ogni sito Web di comparire una sola volta negli elenchi di risposta ad una interrogazione (è stato già accennato in precedenza); questo evita che un numero ridotto di siti occupi tutte le posizioni di testa, rendendo così i risultati più chiari e utilizzabili dagli utenti.
L’altro modo attraverso il quale i motori di ricerca vengono a conoscenza di un sito è una procedura automatica di controllo e ricerca di nuove pagine; i mezzi attraverso i quali questa procedura viene effettuata sono i robot (o spider). Tecnicamente un robot è un programma in grado di seguire i collegamenti ipertestuali e di accedere alle pagine Web senza controllo umano. Lo spider quindi naviga il Web, memorizza le URL e indicizza le parole chiave ed il testo di tutte le pagine che incontra. Questa procedura è chiamata “spidering” e viene svolta ad intervalli di tempo più o meno regolari che dipendono da fattori quali la popolarità del sito e la frequenza con cui le pagine vengono aggiornate. Il motore può inoltre reperire altre pagine seguendo i collegamenti che sono contenuti nei documenti che sta analizzando. C’è da dire che nessun motore di ricerca è in grado ad oggi di effettuare lo spidering di tutte le pagine presenti sul web: è un limite derivato dall’enorme mole di documenti presenti, dal continuo aggiornamento e dalla continua pubblicazione degli stessi e da norme di correttezza universalmente riconosciute sul web. Questo porta i motori di ricerca a fare dei compromessi per poter esplorare quanti più siti possibili: alcuni motori indicizzano solo la homepage di ogni sito, altri solo siti che gli sono stati segnalati, altri giudicano l'importanza del sito (controllando ad esempio il numero di pagine esterne aventi link che puntano al sito) prima di esplorarne i livelli più profondi.
Comunque, come accennato precedentemente, la semplice registrazione presso il database di un motore di ricerca può risultare completamente inutile se la pagina non si trova tra le prime posizioni delle ricerche effettuate, visto che sono proprio i primi link presenti nell’elenco ad essere cliccati ed a portare traffico al proprio sito: sorge quindi l’importantissimo problema della ottimizzazione di un sito web ai fini del posizionamento.
Ma come fa un webmaster a migliorare il posizionamento del proprio sito? La prima risposta è la più semplice e più efficace: pagare. Molti motori di ricerca infatti offrono dei servizi di pay-per-rank e pay-per-click che, insieme alle risorse pubblicitarie, costituiscono il grosso dei loro introiti; ma ci sono altre strategie di posizionamento. Occorre dire che il posizionamento è una strategia difficile e laboriosa; per raggiungere un buon posizionamento è indispensabile conoscere le specifiche dei motori e le statistiche delle parole più ricercate. Sono dati in continua evoluzione che risultano essere difficili da reperire e gestire per chi non se ne occupa professionalmente; è inoltre importante conoscere diversi motori di ricerca per far si che la pagina voluta sia presente nella “top-list” di più motori. Per questi motivi è consigliabile affidarsi ad aziende che svolgeranno volentieri (ma non gratuitamente) questo lavoro per voi.
Ciò non toglie che alcune strategie di posizionamento siano semplici e conosciute a tutti i web-master. Bisogna ottimizzare la propria pagina. E’ compito del SEO (l’operatore del posizionamento sui motori) ottimizzare le pagine affinché queste abbiano le caratteristiche per scalare le posizioni una volta che si sia riusciti ad inserirle negli indici.
Innanzitutto è necessario un lavoro a tavolino sul testo della pagina: il testo va sempre studiato a fondo per gli aspetti d'immagine, per quelli di comunicazione e per il posizionamento sui motori.
Poi sono necessarie delle operazioni sul codice della pagina: è indispensabile conoscere i tag html e la loro utilità ai fini del posizionamento.
E’ importante definire delle parole chiave, ossia delle parole attinenti alla nostra pagina web: queste parole devono essere inserite nel meta tag
.
Il meta tag non è visualizzato dal browser, quindi serve soltanto ai fini del posizionamento. Questo meta tag ha comunque perso parecchia della sua originaria importanza in seguito a comportamenti scorretti da parte dei SEO che rientrano nel cosiddetto “spamdexing”.
E’ importante poi il tag , che ha l’effetto di riportare il testo indicato come titolo della finestra del browser quando si visualizza la pagina: molti motori leggono questo tag e ne rendono conto ai fini del posizionamento. Generalmente il titolo deve avere una sola ripetizione di chiave, e la chiave deve essere presente anche nel corpo della pagina. Questo tag sta invece assumendo sempre più importanza, e in cima ai risultati della ricerca si trovano sempre pagine con titoli ben congegnati.
Esiste poi il meta tag per la descrizione del sito, nella seguente forma:
che risulta essere importante in quanto la descrizione è quasi sempre visibile nell’elenco dei risultati e quindi può suscitare interesse nel visitatore che ha individuato i siti. Bisogna tenere conto che una delle chiavi presenti nella descrizione dovrebbe essere riportata nel titolo e che la descrizione dovrebbe contenere le chiavi poi presenti nel testo della pagina.
Sono poi importanti i link relativi al nostro sito: una buona quantità di link verso siti a tema e che ricambino accrescono ulteriormente il peso della pagina negli indici; inoltre molti link dall'esterno aumentano il peso della pagina su Google e su altri motori di ricerca; è inoltre utile avere un proprio nome di dominio: il motore di ricerca premierà sicuramente l’url
www.giacomoditollo.it
rispetto al terribile url
www.fortunecity.com/victorian/cheyne/618/giacomoditollo.htm
in modo da privilegiare i nomi di dominio sui nomi di directory.
Ma c’è un aspetto “infausto”correlato all’ottimizzazione: la spamdexing. Questo altro non è che la creazione o alterazione di un documento con l'intento di ingannare l'algoritmo di un motore di ricerca. Qualunque tecnica che incrementi il posizionamento di un sito ai danni della qualità del database del motore di ricerca può essere considerata spamdexing (o spoofing).
Lo spamdexing ha assunto rilevanza sempre crescente con il crescere delle pagine web e delle ricerche. La forma più semplice consisteva nell’inserimento nella pagina di parole chiave non attinenti all’argomento trattato: ad esempio un webmaster, sapendo che una tra le parole più cercate era “sesso”, la inseriva tra le parole chiave della pagina. Subito i motori di ricerca si sono organizzati in modo da ridurre l’importanza delle keywords ai fini della ricerca e del posizionamento. I webmaster ed i SEO hanno subito messo a punto dei nuovi semplici trucchetti, come ad esempio l’inserimento di testo nascosto, in modo tale che, ad esempio, su uno sfondo rosso venissero inserite parole di colore rosso, tali da non risultare leggibili all’utente, ma individuabili dagli spider e dai robot ai fini dell’indicizzazione. Anche questi altri stratagemmi sono stati identificati e resi ormai innocui dai motori di ricerca, sempre attentissimi alla qualità del loro servizio. Oggi sotto il termine di spamdexing rientra una lunga lista di comportamenti scorretti: ogni motore ha la sua “lista” di azioni considerate spamdexing, tra cui le più comuni sono: riportare una lista di chiavi nel titolo o nella descrizione di un sito; inserire troppe chiavi nel tag Keywords, peggio se non attinenti all’argomento del sito; sottoporre un numero eccessivo di url giornaliere per lo stesso dominio…e bisogna stare davvero molto attenti a non ingannare i motori di ricerca, in quanto essi possono reagire in diverso modo, a seconda del motore e del tipo di violazione. Sono possibili il ridimensionamento del posizionamento sull’indice del motore, l’eliminazione della pagina dall’indice, l’eliminazione di tutte le pagine del sito dall’indice e il temutissimo inserimento nella lista nera del sito, con impossibilità di futuro inserimento nel database
.
|