Eduardo Rodes Pastor Pablo Rubio Arias 2º Bach. A.

7
Eduardo Rodes Pastor Pablo Rubio Arias 2º Bach. A

Transcript of Eduardo Rodes Pastor Pablo Rubio Arias 2º Bach. A.

Page 1: Eduardo Rodes Pastor Pablo Rubio Arias 2º Bach. A.

Eduardo Rodes Pastor Pablo Rubio Arias

2º Bach. A

Page 2: Eduardo Rodes Pastor Pablo Rubio Arias 2º Bach. A.

Google es el motor de búsqueda más utilizado en el mundo, y ya su nombre se suele asociar con internet. La razón de que sea tan famoso es su algoritmo de clasificación: el PageRank, que ordena las páginas para hacer la búsqueda más efectiva.

¿Cómo funciona el algoritmo PageRank?

Page 3: Eduardo Rodes Pastor Pablo Rubio Arias 2º Bach. A.

B-A-C-E-D

Page 4: Eduardo Rodes Pastor Pablo Rubio Arias 2º Bach. A.

En nuestro ejemplo, hemos usado una web hipotética con 5 páginas (Wikipedia, Desmotivaciones, Youtube, Facebook y la página web del instituto) Agrupamos los datos en esta tabla:

1

0

0

0 0

0

0

0

0

00

00

0 1 1

1 1

11

1

1

1

1

1

Youtube tiene enlaces a wikipedia: ponemos un 1

Wikipedia no tiene enlaces a Desmotivaciones: ponemos un 0

También ponemos 0 en las celdas donde coincida la misma páginaRellenamos el resto de la tabla:

Lo transformamos en una matriz A, sumamos sus columnas y dividimos cada término por la suma de la columna donde este, obteniendo A’:

( )( )0

0

0

1/2

1/2

0

0

0

1

0

0

1/3

1/3

1/3

0

1/4

1/4

1/4

0

1/4

0

1/2

0

0

1/2

Page 5: Eduardo Rodes Pastor Pablo Rubio Arias 2º Bach. A.

Ahora tenemos que calcular un vector “v” que representa los valores del PageRank de cada página. Como no sabemos cuanto vale, usamos incógnitas:

Y lo llevamos a un problema de autovectores y autovalores, que es:

Para calcular λ hace falta hacer el determinante de A’–λId e igualarlo a 0.Como salen varias soluciones, se coge la de valor absoluto más alto, y como casi siempre obtendremos que λ = 1, usamos ese valor y sustituimos:

a= Wikipediab= Desmotivacionesc= Youtubed= Facebooke= IES Sta. Mª Alarcos

Page 6: Eduardo Rodes Pastor Pablo Rubio Arias 2º Bach. A.

Y vemos que el órden en el que aparecerán las páginas será: Facebook, Youtube, Wikipedia, IES Sta. Mª Alarcos y Desmotivaciones.

Este ejemplo solo tenía 5 páginas que no tienen casi relación, pero Google trabaja con millones, y en una búsqueda ordena esas páginas en función de la cantidad de enlaces que llegan a ellas.

Page 7: Eduardo Rodes Pastor Pablo Rubio Arias 2º Bach. A.