Eduardo Rodes Pastor Pablo Rubio Arias 2º Bach. A.

Post on 09-Jan-2015

7 views 2 download

Transcript of Eduardo Rodes Pastor Pablo Rubio Arias 2º Bach. A.

Eduardo Rodes Pastor Pablo Rubio Arias

2º Bach. A

Google es el motor de búsqueda más utilizado en el mundo, y ya su nombre se suele asociar con internet. La razón de que sea tan famoso es su algoritmo de clasificación: el PageRank, que ordena las páginas para hacer la búsqueda más efectiva.

¿Cómo funciona el algoritmo PageRank?

B-A-C-E-D

En nuestro ejemplo, hemos usado una web hipotética con 5 páginas (Wikipedia, Desmotivaciones, Youtube, Facebook y la página web del instituto) Agrupamos los datos en esta tabla:

1

0

0

0 0

0

0

0

0

00

00

0 1 1

1 1

11

1

1

1

1

1

Youtube tiene enlaces a wikipedia: ponemos un 1

Wikipedia no tiene enlaces a Desmotivaciones: ponemos un 0

También ponemos 0 en las celdas donde coincida la misma páginaRellenamos el resto de la tabla:

Lo transformamos en una matriz A, sumamos sus columnas y dividimos cada término por la suma de la columna donde este, obteniendo A’:

( )( )0

0

0

1/2

1/2

0

0

0

1

0

0

1/3

1/3

1/3

0

1/4

1/4

1/4

0

1/4

0

1/2

0

0

1/2

Ahora tenemos que calcular un vector “v” que representa los valores del PageRank de cada página. Como no sabemos cuanto vale, usamos incógnitas:

Y lo llevamos a un problema de autovectores y autovalores, que es:

Para calcular λ hace falta hacer el determinante de A’–λId e igualarlo a 0.Como salen varias soluciones, se coge la de valor absoluto más alto, y como casi siempre obtendremos que λ = 1, usamos ese valor y sustituimos:

a= Wikipediab= Desmotivacionesc= Youtubed= Facebooke= IES Sta. Mª Alarcos

Y vemos que el órden en el que aparecerán las páginas será: Facebook, Youtube, Wikipedia, IES Sta. Mª Alarcos y Desmotivaciones.

Este ejemplo solo tenía 5 páginas que no tienen casi relación, pero Google trabaja con millones, y en una búsqueda ordena esas páginas en función de la cantidad de enlaces que llegan a ellas.