mercoledì 4 marzo 2009

Ottimizzazione (motori di ricerca)


Ottimizzazione (motori di ricerca)
Da Wikipedia, l'enciclopedia libera.

Con il termine ottimizzazione si indica la complessa attività di strutturazione dei contenuti delle pagine web di un sito, allo scopo di facilitarne la lettura da parte dei motori di ricerca.
L'ottimizzazione è parte di un'attività più complessa, quale il marketing dei motori di ricerca (Search Engine Marketing, SEM).

L'attività di ottimizzazione per i motori di ricerca comprende varie operazioni tecniche che vengono effettuate sul codice HTML (incluso il markup) e sui contenuti delle pagine del sito web, nonché sulla struttura ipertestuale complessiva (tecnologie di interazione comprese).

La figura professionale specializzata in ottimizzazione è il SEO (search engine optimizator, ottimizzatore per i motori di ricerca). In siti di dimensioni elevate, o particolarmente complessi, il SEO resta in stretto contatto con il team di lavoro, necessitando a seconda degli elementi trattati di specifiche professionalità che difficilmente possono ricadere in una singola persona.

L'ottimizzazione di un sito è funzionale al suo posizionamento nelle pagine di risposta dei motori, che a sua volta è funzionale alla visibilità dei prodotti/servizi venduti.


* 1 L'ottimizzazione per Google
* 2 Buone pratiche per l'ottimizzazione delle pagine
* 3 Ottimizzazione per file PDF
* 4 Note
* 5 Voci correlate


L'ottimizzazione per Google

Google introdusse un elemento di novità nell'approccio al problema dell'indicizzazione del web, il PageRank, algoritmo di valutazione della rilevanza di una pagina basato su concetti matematici che l'inventore di Ethernet, Bob Metcalfe, sintetizzò con il termine network effect: una rete è tanto più utile quanto più elevato è il numero dei suoi utenti. Google indicizza una pagina basandosi sui suoi contenuti e sui link che puntano ad essa. Di conseguenza, anche i principali motori di ricerca moderni hanno iniziato ad impiegare tecniche di indicizzazione più raffinate per produrre risultati di maggiore qualità[1].

Buone pratiche per l'ottimizzazione delle pagine

Per quanto riguarda la struttura HTML, è buona norma:

* Inserire i contenuti importanti all'inizio del codice HTML;
* Usare I tag HTML il più possibile attinenti alla struttura dei contenuti presentati (semantico) e verificare sempre che il codice delle pagine sia formalmente valido[2]. Può essere utile confrontarsi con le specifiche WCAG[3] per rendere i contenuti meglio "accessibili" anche per i crawler;
* Differenziare opportunamente i titoli delle varie pagine di un sito, renderli chiari e coerenti con il contenuto della pagina: dovrebbero contenere le parole chiave di maggior peso;
* Evitare di inviare informazioni incontrollate o inutili (potenzialmente dannose) tramite tag : i browser le ignorano, i crawler no[4];
* Evitare l'utilizzo di JavaScript per gestire la navigazione, perché il crawler non interpreta gli script e non seguirà questi collegamenti. Usare invece collegamenti standard inserendo tag con l'attributo . I browser delle ultime generazioni non avranno problemi a gestire link contenenti sia un indirizzo in href che una chiamata a JavaScript in un gestore di evento onClick: se quest'ultima è ritenuta indispensabile, è possibile inserirla ed essa verrà eseguita prima del collegamento vero e proprio[senza fonte]. È importante ricordarsi di inserire comunque anche il collegamento tramite l'attributo href, a beneficio di browser non standard, browser accessibili, e crawler.

Riguardo alla gestione del server e degli URL, invece, è opportuno:

* Possibilmente, scegliere anche l'URL della pagina in modo che contenga le parole chiave più probabili, ovvero che sia descrittivo e possibilmente somigliante al titolo della pagina stessa;
* Evitare se possibile l'invio di parametri per un'eventuale applicazione lato server tramite l'inserimento di un'interrogazione (query) nell'URL della pagina, ossia la presenza di coppie parametro=valore dopo un punto di domanda, dopo l'indirizzo della pagina (http://www.sito.it/percorso/pagina?parametri=valori). Alcuni motori di ricerca scaricheranno e indicizzeranno solo la pagina base, senza tener conto della query;
o inoltre, se l'interrogazione contiene informazioni specifiche sulla sessione (per esempio Session ID, che cambiano per ogni visitatore) nemmeno Google ottiene un URL univoco per la pagina, e può trarne le più disparate conclusioni negative. Per questo tipo di informazioni è opportuno usare i cookie[5];
* Evitare l'utilizzo di redirect non HTTP (attraverso tag ), perché non è detto che il motore di ricerca li segua. È anche diffusa l'idea che la loro presenza possa penalizzare il ranking di una pagina[6]. Attuare invece ogni redirezione con una risposta HTTP di reindirizzamento (codici 3xx);
o inoltre, ogni redirezione effettuata tramite tag è contraria ai checkpoint 7.4 e 7.5 delle WCAG 1.0[3];
* Evitare assolutamente di servire contenuti differenziati ai crawler (Cloaking) tentando di riconoscerne la stringa di User agent o l'IP del bot che scansiona le nostre pagine. È una pratica dannosa che espone al rischio concreto di cancellazione dagli indici dei motori;
* Implementare i file robots.txt e sitemap.xml per indicare ai crawler dei motori di ricerca quali contenuti indicizzare e quali escludere dal processo di indicizzazione.

Ottimizzazione per file PDF

L'ottimizzazione dei documenti in formato PDF prevede alcuni interventi al momento della creazione del file.

Gli elementi più importanti da compilare correttamente ai fini del posizionamento sulle SERP di un documento PDF sono:

* il nome del file, se è composto da più chiavi utilizzare il trattino per separarle; ad esempio, se il file PDF parla di animali domestici utilizzeremo il seguente nome file: animali-domestici.pdf
* le proprietà interne al documento: cliccare su "File" – "Proprietà" e compilare necessariamente "Titolo", "Oggetto" (che sarebbe la description), "Autore" (potete mettere il nome del sito) e "Parole chiave".
* Il titolo all’interno del documento: se il documento non dovesse avere un titolo, sarà Google ad attribuirne uno. Meglio, quindi, indicare il titolo che si vuole dare al documento utilizzando per il font: Verdana, Italico e Centrato.

Per quanto riguarda l'inserimento di un link cliccabile all'interno delle pagine, si noti che un file pdf viene letto da Google come una sorta di pagina web a sé stante e risulta, pertanto, un backlink al proprio sito. L'importante è tematizzare il link, cioè inserire l’esatta pagina di riferimento. Per esempio, se abbiamo un PDF che parla di animali domestici su un portale di animali, sarà meglio inserire il link alla pagina che parla esattamente di quelli domestici.

Note

1. ^ Storia breve del posizionamento SEO
2. ^ (EN) Il controllo ufficiale di validità del W3C:[1]
3. ^ a b (EN) Le specifiche ufficiali WCAG 1.0 del W3C: [2]
4. ^ (IT). Sul rapporto fra tag e motori di ricerca: [3]
5. ^ (EN) . Sull'uso dei Session ID in PHP nell'interrogazione: [4]
6. ^ (EN) Ricerca su Google di meta refresh SEO: [5]

Voci correlate

* Marketing dei motori di ricerca
* Posizionamento sui motori di ricerca
* PageRank
* Google
* Meta tag
* Accessibilità (informatica)

Nessun commento:

Posta un commento