Posts Etiquetados ‘Foro’

Volviendo a las fuentes: algunas consideraciones sobre el Pagerank

13 04 2010 por Stasieniuk | No han Comentado | Escrito en Articulos, Bloggers, SEO
Pagerank

Pagerank

Volviendo al blog luego de varios meses sin escribir, les comento que estoy tratando de volver a las fuentes. Sucede que desde noviembre de 2009 -justo cuando escribíamos un artículo sobre nuestro boom de tráfico- el crecimiento se estancó. Es cierto que no hemos bajado, pero teníamos una tasa de crecimiento de las visitas en nuestra red de blogs tan importante, que mes a mes doblábamos el tráfico y ahora ese crecimiento es casi nulo. Es cierto también que hay factores externos que coadyuvan para que el crecimiento se desacelere, y es cierto que también hay un techo, pero considero que ese techo aún está lejos. Resumiendo… quiero encontrar los factores SEO que puedan estar deteniendo ese crecimiento, ya que en cuanto a lo puramente relativo a los contenidos no puede encontrarse el motivo. Y esto es así porque lejos de bajar el ritmo de publicaciones, lo hemos aumentado y hemos aumentado la calidad de las mismas, ya que sumamos una nueva editora a la plantilla el 2 de enero.

Y como considero que la fuente de esta desaceleración del crecimiento está motivada por factores SEO, me estoy planteando volver a las fuentes. Y entonces por donde empiezo… Desde 0. Borrón y cuenta nueva y a aprender de nuevo COMO FUNCIONA GOOGLE. Y entre lo que hay que aprender de nuevo es saber que es el pagerank, como funciona, y luego… realmente… es importante el Pagerank para posicionar? Pero como decía, empiezo a volver a las fuentes, y comienzo citando un extracto de un artículo muy bueno de Maldita Internet

El sistema de ranking: Pagerank

Para ordenar documentos (decidir su importancia respecto de una consulta) Google utiliza un algoritmo propio denominado PageRank. El algoritmo de PageRank está basado en el grafo de enlaces de la web que como tal es un recurso sumamente importante y largamente ignorado en la mayoría de los buscadores. Google dispone de tablas con miles de millones de enlaces de la forma (docID desde-docID hasta), lo cual constituye una buena representación de la web como un grafo de enlaces.

El concepto básico del algoritmo PageRank es que una página es más importante en la medida en que mas páginas apuntan hacia ella. El algoritmo de PageRank extiende este concepto computando no solamente la cantidad de enlaces, sino también normalizando de acuerdo a la cantidad de enlaces en una página, y propagando infinitamente de forma tal que la importancia de una página depende de: cuantas páginas apuntan a ella, de la cantidad de enlaces en estas páginas, y de cuantas y que tan importantes son las páginas que apuntan a las que apuntan a la página. El algoritmo se resume así:

Asumimos que una página “A” tiene páginas T1..Tn que la apuntan. El parámetro d es un parámetro probabilístico que vale entre 0 y 1. Google usa d=0.85. Se define C(A) como la cantidad de enlaces que salen de la página (A). El PageRank de A se calcula como PR(A)=(1-d)+d(PR(T1)/C(T1)+ … + PR(Tn)/C(Tn))

Notar que los PageRanks forman una distribución probabilística sobre las páginas, la suma de los PageRanks de todas las páginas da 1. El PageRank de una página puede calcularse usando un simple algoritmo iterativo, el PageRank de 26 millones de páginas se puede calcular en pocas horas en una maquina modesta. Dadas n páginas se comienza con PR(Ai)=1/n y luego simplemente se corren x pasadas del algoritmo que calcula el PageRank de cada página hasta que los valores se estabilizan, esta es una técnica comúnmente usada en algoritmia para simplificar algoritmos recursivos.

Justificación intuitiva

El método de PageRank puede verse como un modelo del comportamiento del usuario. Supongamos que tenemos a un navegador aleatorio (random surfer) que dada una página aleatoria elige enlaces y clickea sin usar el botón back, pero eventualmente se aburre y comienza desde otra página aleatoria. ¡La probabilidad de que el visitante llegue a una página es su PageRank!. Y el valor d es la probabilidad de que en una página dada el visitante se aburra y empiece de nuevo desde otra página.

Bueno, como siempre, cualquier descubrimiento que haga seguramente lo publicaré aquí en el blog y probablemente en mi nuevo experimento con dominios raros, el Foro para Bloggers que de paso invito a que lo visiten.

Etiquetas: , , , , , , , , , , , , , , ,