PageRank
Un concetto molto importante nell'ambito del Search Engine Optimization e' quello di PageRank. Da Wikipedia: "Il PageRank e' un algoritmo di analisi che assegna un peso numerico ad ogni elemento di un collegamento ipertestuale d'un insieme di documenti, come ad esempio il World Wide Web, con lo scopo di quantificare la sua importanza relativa all'interno della serie. L'algoritmo puo' essere applicato a tutte le collezioni di entita' con reciproche citazioni e riferimenti. Il peso numerico che assegna ad un dato elemento E e' chiamato anche il PageRank di E, contrassegnato da PR(E). Il processo PageRank e' stato sviluppato all’universita' di Stanford da Larry Page e Sergey Brin intorno al 1976. Ai fini del PageRank la qualita' di una pagina e' determinata dal numero di link entranti in essa e di conseguenza dalla qualita' delle pagine che la puntano. La formula originale pubblicata da Larry Page e Sergey Brin, inventori del search engine Google, che risale al 1998 e':
PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn)
Dove: PR(A) e' il PageRank della pagina A, n e' il numero delle pagine che linkano la pagina A, PR(T1) - PR(Tn) sono i valori di PageRank delle n pagine T1 - Tn che linkano la pagina A, C(T1) - C(Tn) sono il numero di link in uscita presenti nelle pagine T1-Tn, d e' un fattore correttivo di attenuazione che puo' assumere valori fra 0 e 1, la d sta per dumping factor settato in modo opportuno tra 0.1 e 0.2 che solitamente vale 0.15 Da questa formula risalta in modo piu' o meno evidente che il PageRank di ogni pagina e' influenzato dal PageRank delle pagine che hanno un link a questa stessa pagina. Se poi osserviamo la sottoformula PR(Tn)/C(Tn) possiamo notare che il PageRank di una pagina Tn che ha un link alla pagina A non aumenta il PR di questa di una quantita' direttamente proporzionale al PageRank della pagina Tn ma di un valore che dipende dai numero dei link in uscita presenti in quest’ultima. Quindi se una pagina web ha tanti link uscenti aumenterà di una quantita' minore il PageRank della pagina A; la conseguenza di tale formula e' quindi che una pagina puo' avere un alto PR se riceve anche un solo link da una pagina ad alto PR cioè da un documento importante o da un organismo riconosciuto, ugualmente puo' averlo alto se molte pagine anche a basso PageRank hanno un link verso essa. Si puo' notare che a differenza dell'indice di prestigio classico, il PageRank di un nodo viene ripartito nei suoi archi uscenti. Quindi il PageRank puo' essere pensato come il flusso di un liquido che si conserva ad ogni nodo: la quantita' che arriva dagli archi entranti e' pari a quella che lascia il nodo attraverso gli archi uscenti. segue

