Nel lontano 16 ottobre 2006, Rand Fishkin (aka Randfish), CEO di SEOmoz, definì quello che secondo lui era l’algoritmo di ranking (classificazione, posizionamento) di Google:
Punteggio di Google = (Punteggio relativo all’utilizzo delle parole chiave * 0,3) + (Importanza del dominio * 0,25) + (PageRank * 0,25) + (Link in ingresso * 0,25) + (Dati degli utenti * 0,1) + (Qualità del contenuto * 0,1) + (Spinte manuali) – (Penalizzazioni automatiche e manuali)
In questo algoritmo, i fattori nell’utilizzo delle parole chiave (Keywords), sono:
- Parole chiave nel tag del titolo
- Parole chiave nei tag degli header
- Parole chiave nel testo del documento
- Parole chiave nei link interni che puntano alla pagina
- Parole chiave nel nome di dominio e/o nell’indirizzo della pagina (URL)
- Storia della registrazione
- Età del dominio
- Importanza dei link che puntano al dominio
- Rilevanza del dominio sull’argomento basata sui link in entrata ed in uscita
- Utilizzo storico & pattern dei link verso il dominio
- Età dei link
- Qualità dei domini che mandano il link
- Qualità delle pagine che mandano il link
- Testo dei link
- Valutazione della quantità/peso dei link (Pagerank o sue variazioni)
- Rilevanza sull’argomento delle pagine/siti che mandano i link
- Storia della percentuale dei click (CTR) sulla pagina nei risultati dei motori di ricerca (SERP)
- Tempo speso dagli utenti sulla pagina
- Numero di ricerche per URL/nome del dominio
- Storia delle visite/utilizzo dell’URL/nome del dominio degli utenti che Google può monitorare (toolbar, wifi, analytics, ecc.)
- Potenzialmente dato a mano per le ricerche e per le pagine più popolari
- Fornite da valutatori interni di Google
- Algoritmi automatizzati per valutare il testo (qualità, leggibilità, ecc.)
- Storia delle ricerche effettuate
- Storia dei siti, pagine visitati
- Modifiche alle query (e analisi)
- Scopo delle ricerche (informazioni, navigazione)
- Dati espliciti (preferiti, reader, wiki)
- Interazione con la pubblicità
- Frequenza di navigazione nell’arco della giornata
- PageRank personalizzato (yahoo e google)
- Interazioni tra documenti e SERP
- Anchor text con keyword nei link da siti esterni. Importanza: 73%
- Popolarità e autorevolezza dei link esterni (quantità/qualità dei link esterni). Importanza: 71%
- Dominio bannato dall’indice di Google per spam web. Importanza: 70%
- Codice paese dell’estensione del dominio (es.: .co.uk, .de, .fr, .com.au, etc.). Importanza: 69%
- Cloaking con intento malevolo/manipolatorio. Importanza: 68%
- Differenziazione delle fonti di link (link da molti domini diversi). Importanza: 67%
- Presenza di parole chiave nel tag Title. Importanza: 66%
- Fiducia del dominio basata sulla distanza di link da domini fidati (es.: TrustRank, Domain mozTrust, etc.). Importanza: 66%
- Posizionamento del dominio penalizzato su Google per spam web. Importanza: 65%
- Originalità e unicità del contenuto. Importanza: 65%
- TrustRank specifico della pagina (se quella singola pagina ha guadagnato link da fonti fidate). Importanza: 65%
- Popolarità globale dei link del dominio, basata su algoritmi (es.: PageRank, MozRank, StaticRank, etc.). Importanza: 64%
- Diversità dei link (intesa come numero/varietà di domini unici che linkano a pagine del nostro dominio). Importanza: 64%
- Link da siti che sono considerati autorevoli in argomenti specifici e simili al nostro (come per l’algoritmo Hilltop ). Importanza: 64%
- I link sono pagati piuttosto che ottenuti spontaneamente. Importanza: 63%
- Posizione della parola chiave nel titolo: keyword posta come prima parola del titolo. Importanza: 63%
- Lingua del contenuto usata sul sito. Importanza: 63%
- PageRank. Importanza: 63%
- Parole chiave nel nome del dominio. Importanza: 60%
- Link da altri domini dello stesso paese. Importanza: 60%
- Rilevanza dell’argomento trattato dalle fonti di link esterni (i link esterni vengono da siti/pagine che hanno rilevanza con l’argomento della mia pagina). Importanza: 58%
- Localizzazione geografica dell’indirizzo IP del server che ospita il dominio. Importanza: 57%
- Acquistare link. Link acquisiti da venditori di link conosciuti. Importanza: 56%
- Anchor text con keyword nei link interni. Importanza: 55%
- Revisione manuale da parte di personale di Google e/o revisori di qualità. Importanza: 53%
- Il dominio contiene link ad un quantitativo significativo di siti web che fanno spam. Importanza: 52%
- Crescita nel tempo dei link al dominio (la quantità/qualità dei link guadagnati nel tempo e la loro distribuzione temporale). Importanza: 52% – (brevetto Google) se i link si ottengono troppo in fretta è segno di una crescita non naturale ma fatta ad arte per migliorare il posizionamento. Penalità e sandbox se è un nuovo sito?
- Architettura del sito (struttura gerarchica e chiara). Importanza: 52%
- Destinazione geografica impostata all’interno degli strumenti per webmaster di Google (paese dei visitatori del sito). Importanza: 52%
- Link DALLA PAGINA verso siti/pagine che fanno spam. Importanza: 51%
- Cloaking per User Agent. Importanza: 51%
- Posizione della pagina in relazione alla struttura del sito. Regola dei 3 click massimi per raggiungere la pagina. Importanza: 51%
- Popolarità dei link interni (contando solo i link provenienti da pagine interne verso la pagina principale o homepage). Importanza: 51%
- Frequenti interruzioni a livello server e inaccessibilità del sito. Importanza: 51%
- Freschezza del contenuto (data di creazione della pagina). Importanza: 50%
- Keyword nel tag H1. Importanza: 49%
- Nascondere il testo con sfondo dello stesso colore. Importanza: 49%
- Link dal nostro dominio a siti/pagine che fanno spam. Importanza: 48%
- Link da domini con estensioni particolari (es.: .edu, .gov, .mil, .ac.uk, etc.). Importanza: 47%
- Uso nella pagina di keyword negli anchor text dei link interni. Importanza:47%
- Uso nella pagina di keyword negli anchor text dei link esterni. Importanza: 46%
- Cloaking indirizzo IP. Importanza: 46%
- Eccessive ripetizioni dello stesso anchor text in una percentuale/quantità troppo alta di link esterni verso il nostro sito/pagina. Importanza: 46%
- Keyword nella PRIMA parola del tag H1. Importanza: 45%
- Keyword usata nelle prime 50-100 parole della pagina. Importanza: 45%
- Registrazione del sito con Google Local. Importanza: 45%
- Nascondere del testo via CSS, impostando l’offset in un’area della pagina non visibile. Importanza: 44%
- Numero eccessivo di parametri negli URL dinamici. Importanza: 43%
- Keyword nel sotto dominio (es.: keyword.seomoz.org). Importanza: 42%
- Storia del tasso di Click-Through nelle SERP all’URL esatto della pagina. Importanza: 42% – (brevetto Google). Quanti sono i click alla pagina?
- Il dominio non ha ancora guadagnato link fidati. Importanza: 41%
- Acquisizione di link grazie a campagne di scambio link e “bait link” (trucchi per guadagnare link). Importanza: 41%
- Cross linking interno. Importanza: (41%)
- Keyword stuffing nel testo della pagina (troppe keyword = spamdexing). Importanza: 41%
- Troppi link da siti ospitati all’interno dello stesso blocco di indirizzi IP. Importanza: 41%
- Address in On-Page Text Content. Importanza: 41% (purtroppo mi sfugge il senso di questo fattore)
- Nascondere del testo via CSS, comando display:none; styling. Importanza: 40%
- Storia dei cambiamenti di contenuto della pagina (quanto spesso viene modificato il contenuto della pagina). Importanza: 39% – (brevetto Google) – Troppo non va bene
- Keyword stuffing nel tag Title. Importanza: 39%
- Storia del tasso di Click-Through nelle SERP all’URL esatto del dominio. Importanza: 39%
- Keyword usata nell’URL come nome della pagina (es.: seomoz.org/folder/keyword.html). Importanza: 38% Google non si “affida” più a questo tag ma lo usa spesso
- Keyword usata nell’URL come cartella che contiene la pagina (es.: seomoz.org/keyword/page.html). Importanza: 37%
- Keyword stuffing nell’URL. Importanza: 37%
- I link sono ottenuti grazie a campagne manipolate con widget/badge. Importanza: 37%
- Cloaking via JavaScript/Rich Media Support Detection. Importanza: 37%
- Link a siti/pagine fidati e autorevoli. Importanza: 37%
- Durata della registrazione del dominio. 1 anno? 5 anni?. Importanza: 37% – (brevetto Google) 5 anni è meglio di 1
- Query di ricerca relative al dominio o alla marca associata. Importanza: 36%
- Storia della registrazione del dominio (da quanto tempo con stesso proprietario, numero di rinnovi, etc.). Importanza: 36%
- Cloaking via cookie detection. Importanza: 36%
- Link ALLA pagina da siti/pagine che fanno spam. Importanza: 36%
- I link sono ottenuti da directory che vendono link di bassa qualità. Importanza: 36%
- Numero eccessivo di link da siti posseduti dallo stesso registrant. Importanza: 36%
- Keyword usata in altri tag intestazione diversi da H1 (da
a
). Importanza: 35%
- Indirizzo associato nel dominio (inteso come indirizzo fisico del proprietario del dominio). Importanza: 35%
- Link al dominio da siti/pagine che fanno spam. Importanza: 34%
- Cloaking con l’intento di migliorare l’esperienza di navigazione degli utenti. Importanza: 33%
- Parole chiave nel tag Alt delle immagini -. Importanza: 33%
- Link acquisiti da campagne virali manipolate (cfr. alberi di Natale di Blogbabel). Importanza: 33%
- Keyword usata nel nome dell’immagine contenuta nella pagina (es.: keyword.jpg). Importanza: 33%
- Keyword usate nel testo della pagina. Importanza: 33%
- URL dinamici e URL statici. Importanza: 33%
- Uso di “raffinamenti” nelle query di ricerca. Importanza: 32%
- Server/Hosting Uptime (se Google non trova il tuo sito, alla lunga viene cancellato dall’indice). Importanza: 32%
- Sovra-ottimizzazione degli anchor text nei link interni. Importanza: 32%
- Uso di “Poison” Keywords negli anchor tex dei link esterni (quali sono quelle italiane? Forse: link, reciproci, clicca, etc.). Importanza: 32%
- Link acquisiti comprando vecchi domini ed effettuando il redirect. Importanza: 32%
- Hosting. Quali altri domini sono ospitati sullo stesso host. Importanza: 31%
- Modifiche sulla proprietà del dominio. Importanza: 31%
- Inclusioni di feed su Google news. Importanza: 31%
- Lunghezza dell’URL da mantenere al minimo. Importanza: 30%
- Localizzazione geografica dei visitatori del sito. Importanza: 30%
- Uso del sitemap XML. Importanza: 29%
- Uso di anchor text nei link interni nel footer. Importanza: 27%
- Keyword nei tag o . Importanza: 26%
- Keyword stuffing nel tag Meta Description. Importanza: 26%
- Tempo medio delle visite sulla pagina. Importanza: 26%
- Uso di HTML razionale (influenza indiretta nel senso di aumento del click-through). Importanza:25%
- Storia del proprietari del dominio. Importanza: 25%
- Quantità e qualità dei link No follow alla pagina. Importanza: 25%
- Keyword density della pagina trai il 5-20%. (formula: numero di parole chiave usate ÷ numero totale delle parole sulla pagina). Importanza: 25% (alcuni riportano l’influenza dell’argomento: la percentuale di keyword stuffing varia a seconda dell’argomento trattato)
- PageRank sculpting: abuso del No follow nei link interni. Importanza: 24%
- Registrazione del dominio con Google Local. Importanza: 24%
- Link acquisiti comprando vecchi domini ed aggiungendo link. Importanza: 24%
- Citazioni del dominio nel testo, anche in assenza di link diretti. Importanza: 24%
- Inclusione dei feed del dominio in Google Blog Search. Importanza: 24%
- Citazioni/riferimenti al dominio nella directory di Yahoo!. Importanza: 24%
- Geo-Tagging of Pages via Meta Data (e.g. Dublin Core Meta Data Initiative). Importanza: 24% (non capisco il significato di questo fattore)
- Citazioni/riferimenti al dominio su DMOZ.org. Importanza: 23%
- Keyword usata nei tag degli elenchi puntati (
- ) sulla pagina. Importanza: 23%
- Esistenza del tag Meta Description. Importanza: 22%
- Keyword usata nei parametri dell’URL (es.: seomoz.org/page.html?keyword). Importanza: 22%
- Link ottenuti grazie ai forum (link nella firma, lasciare link nei messaggi, etc.). Importanza: 22%
- Citazioni/riferimenti al dominio in Wikipedia. Importanza: 22%
- Uso dei feed sul dominio. Importanza: 21%
- Citazioni/riferimenti al dominio nel Librarian’s Internet Index – Lii.org. Importanza: 21%
- Keyword usata nei tag o . Importanza: 21%
- Percentuale di link Followed in rapporto a quelli Nofollowed che puntano al dominio. Importanza: 21%
- Presenza del dominio/pagina su Delicious. Importanza: 21%
- Tag Title eccessivamente lungo. Importanza: 21% (il Title tag deve contenere tra i 10 e i 60 caratteri, senza includere caratteri speciali)
- Presenza del dominio/pagina su SearchWiki di Google (voti, quotazioni, commenti). Importanza: 19%
- Presenza del dominio/pagina su StumbleUpon. Importanza: 19%
- Parole chiave nel tag Meta Description (Non Meta Keywords ed entro i 200 caratteri). Importanza: 19%
- Registrazione del dominio con gli strumenti per webmaster di Google. Importanza: 18%
- Attivazione del Google Image Labeler. Importanza: 17%
- Percentuale di link Follow in relazione a quelli No follow che puntano alla pagina. Importanza: 17%
- Presenza del dominio/pagina su Twitter. Importanza: 17%
- Conformità dell’HTML agli standard W3C. Importanza: 16%
- Keyword stuffing nel tag Meta Keywords. Importanza: 15%
- LinkedIn Data About the Domain or Page. Importanza: 15%
- Uso di certificati sul dominio nelle transazioni HTTPS. Importanza: 14%
- Validità degli indirizzi e-mail, numeri di telefono, etc. sulle informazioni del dominio (whois). Importanza: 13%
- Citazioni/riferimenti al dominio su Google Knol. Importanza: 13%
- Uso di elementi Flash (o altri plugin). Importanza: 13%
- Keyword usata nell’estensione del file della pagina (es.: seomoz.org/page.keyword). Importanza: 12%
- Presenza del dominio/pagina su Facebook. Importanza: 12%
- Presenza del dominio/pagina su MySpace. Importanza: 11%
- Uso di pubblicità nella pagina. Importanza: 11%
- Riferimenti/link al dominio su Gmail. Importanza: 9%
- Uso di Google AdSense nella pagina. Importanza: 8%
- Keyword usata nei tag di commento. Importanza: 6%
- Uso di Google AdSense nel dominio. Importanza: 5%
- Uso di Google AdWords per annunci che puntano al dominio. Importanza: 5%
- Alexa Rank del dominio. Importanza: 5%
- Compete.com Rank del dominio. Importanza: 5%
- Keyword usata nel tag Meta Keywords. Importanza: 5%
- Uso delle applicazioni Google sul dominio. Importanza: 3%
- Uso di tag intestazione nell’URL
- Sinonimi relativi al tema del sito/pagina
- Posizione del link (footer, barra di navigazione, corpo del testo)
- Il sito è in un dominio o in un sotto dominio
- File JS
- Velocità di JS
- Uso di CSS esterni
- CSS codificato all’interno della pagina HTML o incluso o su un file esterno
- Navigabilità e architettura o avere 800 link nel template della pagina
- % della pagina modificata
- Sinonimi relativi al tema della pagina/sito
- Prossimità della grafica a supporto del testo
- Risoluzione/qualità delle immagini
- Tag e commenti nei video
- Riferimenti nei social network
- Numero di link interni alla pagina
- Anchor text del PRIMO link
- Anzianità del sito. Più vecchio è meglio è. L’opposto della sandbox – (brevetto Google).
- Rilevanza del contenuto della pagina
- Attributo Title del link
- Tag Alt di immagini con link
- Autorevolezza del dominio (.edu, .gov)
- Effetto Sandbox (probabilmente la stessa importanza che ha l’anzianità del dominio)
- Personalizzazione della ricerca disabilitata (Caffeine)
- Numeri di impression che riceve il dominio nelle SERP di Google. Especially when that number spikes, it’s been mentioned in patents as a possible spam signal.
- Link JavaScript
- Interazione con l’utente/soddisfazione con i risultati ottenuti
- Qualità delle pubblicità contenute nel sito
- Velocità di caricamento della pagina (Caffeine)
- Vicinanza delle keyword (per 2 o più keyword)
- Link non funzionanti (controllali con Dead-Links)
- Stabilità dei link nel tempo
- Numero di link nella pagina inferiore a 100
- Estensione del dominio (.gov, .org, .com)
- Dimensioni della pagina sotto i 100 Kb (meglio sotto i 40 Kb)
- Trattini nell’URL (1 o 2 ok, più di 4 inizia a sembrare spam, 10 è considerato sicuramente spam)
- Anzianità della pagina in relazione all’anzianità del sito e alle altre pagine
- Pagina senza testo e contenente solo elementi grafici
- Link a siti di scarsa qualità (es.: siti scambio link)
- Redirect via metatag refresh
- Utilizzare immagini/testo non propri (violazioni del copyright)
- Link di un pixel
- Pagine gateway e doorway
- Uso di frasi associate a tecniche di spam conosciute (brevetto Google)
- Anzianità del link. Vecchio = buono – (brevetto di Google)
- Frequenza delle modifiche su anchor text. Eccessive modifiche = non buono – (brevetto di Google)
- Link da siti “esperti” – (brevetto di Google) Algoritmo Hilltop
- Tematizzazione del sito
- Tempo trascorso sulla pagina
- Bookmark – la pagina viene inserita nei preferiti? Buono
- Traffico del sito – (brevetto di Google) – traffico in aumento = buono
- Ordine delle keyword (due o più keyword)
- Dimensione del sito (Google ama i siti grandi)
- Pagine con frame
- Posizione del link nella pagina referrer
- Link in mappe cliccabili
- La categoria di Dmoz coerente con quella del sito
- Sito elencato in altre directory come About, Looksmart, etc.
- Modalità di abbandono della pagina (bottone back, click su link, etc.)
- 65-100% = importanza molto alta
- 55-64% = importanza alta
- 45-54% = importanza moderata
- 35-44% = importanza bassa
- 25-34% = importanza minima
- 0-24% = importanza davvero minima

0 commenti:
Posta un commento