Análisis y construcción de redes complejas

66
1 1 Analizando y creando redes sociales Juan Julián Merelo Guervós Depto. Arquitectura y Tecnología de Computadores Universidad de Granada [email protected] http://atalaya.blogalia.com

description

Para una lección en los cursos de verano de la Universidad de Extremadura

Transcript of Análisis y construcción de redes complejas

Page 1: Análisis y construcción de redes complejas

11

Analizando y creando redes sociales

Juan Julián Merelo GuervósDepto. Arquitectura y Tecnología de Computadores

Universidad de [email protected]

http://atalaya.blogalia.com

Page 2: Análisis y construcción de redes complejas

22

Introducción

¿Qué son las redes complejas?

El porqué de las redes complejas

Comportamiento a gran escala

Comportamiento de cada nodo

Redes sociales en Internet

Page 3: Análisis y construcción de redes complejas

33

Notas históricas

Page 4: Análisis y construcción de redes complejas

44

De qué va esto

Las redes complejas tienen características específicas

Los sistemas complejos pueden ser representados mediante redes

Page 5: Análisis y construcción de redes complejas

55

Nudos y mallas

Los elementos de una red son nodos y las conexiones entre ellos aristas o arcos.

Page 6: Análisis y construcción de redes complejas

66 Internet topology

Redes a cascoporro

Las aristas o arcos pueden ser físicos, virtuales o referirse a una relación

Page 7: Análisis y construcción de redes complejas

77

Tipos de grafos

Dirigidos/adirigidos

Geodésicas

Componentes/cliques

Grado

Page 8: Análisis y construcción de redes complejas

88

Grafos aleatorios

Se generan aleatoriamente

Tienen pinta de maraña

Pero no son muy realistas

Page 9: Análisis y construcción de redes complejas

99

Liándose como la zapatilla de un romano

La evolución de una red aleatoria va creando un componente principal y eventualmente un grafo conectado

Page 10: Análisis y construcción de redes complejas

1010

Una red compleja es como un toro

Una red permite entender, visualizar y cuantificar conjuntos conectados de agentes

Page 11: Análisis y construcción de redes complejas

1111

Por eso hay redes

Son una metáfora actual e intuitiva para percibir muchos fenómenos

Page 12: Análisis y construcción de redes complejas

1212

¿Quieres ser un superhéroe?

Alberich, y luego Gleiser, han investigado el Universo Marvel

Page 13: Análisis y construcción de redes complejas

1313

El culebrón del verano

Page 14: Análisis y construcción de redes complejas

1414

¿Qué hago ahora?

La visualización es un reto.

Y un problema np-completo.

Page 15: Análisis y construcción de redes complejas

1515

Vamos con una red

Page 16: Análisis y construcción de redes complejas

1616

Redes contra redes

Page 17: Análisis y construcción de redes complejas

1717

¿Para qué queremos esto?

Analizar cuantitativamente fenómenos complejos

Correlacionar medidas con resultado

Predecir los resultados futuros

Page 18: Análisis y construcción de redes complejas

1818

¿Es este tu amiguito?

Obtener los datos no es trivial.

Mediante encuestas, en entornos físicos.

Más generalmente, usando programas que analicen documentos o páginas web

Page 19: Análisis y construcción de redes complejas

1919

Procesar los datos

23 -

Reina

Pepe

9 - T

orre

s Fer

nand

o

8 - X

avi H

erná

ndez

22 -

de la

Red

Rub

én

6 - I

niest

a And

rés

15 -

Sergio

Ram

os

10 -

Fàbre

gas

Cesc

7 - V

illa D

avid

20 -

Juan

ito

12 -

Santi C

azor

la

1 - C

asilla

s Ik

er

18 -

Arbelo

a Álva

ro

2 - A

lbiol

Raúl

17 -

Güiz

a Dan

iel

11 -

Capde

vila

Joan

21 -

Silva

David

16 -

Sergio

Gar

cía

14 -

Xabi A

lonso

4 - M

arch

ena

Carlos

19 -

Senna

Mar

cos

3 - F

erna

ndo

Navar

ro

5 - P

uyol

Carles

0

5

10

15

20

25

30

35

40

45

50

23 - Reina Pepe

8 - Xavi Hernández

6 - Iniesta Andrés

10 - Fàbregas Cesc

20 - Juanito

1 - Casillas Iker

2 - Albiol Raúl

11 - Capdevila Joan

16 - Sergio García

4 - Marchena Carlos

3 - Fernando Navarro

Pases totales

Eurocopa 2008

23 - Reina Pepe

9 - Torres Fernando

8 - Xavi Hernández

22 - de la Red Rubén

6 - Iniesta Andrés

15 - Sergio Ramos

10 - Fàbregas Cesc

7 - Villa David

20 - Juanito

12 - Santi Cazorla

1 - Casillas Iker

18 - Arbeloa Álvaro

2 - Albiol Raúl

17 - Güiza Daniel

11 - Capdevila Joan

21 - Silva David

16 - Sergio García

14 - Xabi Alonso

4 - Marchena Carlos

19 - Senna Marcos

3 - Fernando Navarro

5 - Puyol Carles

Jugadores

Jug

ad

ore

s

Pases

Page 20: Análisis y construcción de redes complejas

2020

Visualizando la red

Uso de programas tales como el Pajek

También Netdraw, Visone....

Page 21: Análisis y construcción de redes complejas

2121

Primeras impresiones

¿La red está conectada?

¿Cómo están repartidos los enlaces?

¿Cuál es el diámetro?

Page 22: Análisis y construcción de redes complejas

2222

Segundas impresiones

¿Todos los nodos son alcanzables?

Transitividad Coeficiente de

clústering.

Page 23: Análisis y construcción de redes complejas

2323

En la red de traspasos

Está conectada 90 nodos Distancia media:

4.297 Coeficiente de

clustering: 0.059 Centralización:

4.12%

Page 24: Análisis y construcción de redes complejas

2424

Aparecen las leyes de potencia

y=k*x^-b Una representación log-log

muestra una línea recta Y= número de enlaces X= orden, frecuencia,

tamaño... Se reproduce en cantidades

derivadas: visitas, ventas, resultados...

Page 25: Análisis y construcción de redes complejas

2525

Leyes de potencia en el grado

P(k) ≈ k-

Donde k es el grado del vértice

Page 26: Análisis y construcción de redes complejas

2626

Lo que lleva a un comportamiento libre de

escala No hay número de

enlaces preferido En redes aleatorias la

distribución es de Poisson Por lo que no hay una

escala preferida Muchos enlaces son

improbables, pero posibles.

Page 27: Análisis y construcción de redes complejas

2727

¿Por qué aparecen las leyes de potencia?

Enlazado preferencial (Barábasi)

No siempre se cumple Efecto San Mateo

Los mejores consiguen más Otros modelos: log-normal,

exponencial estirada, Weibull.

Page 28: Análisis y construcción de redes complejas

2828

Se habla de club de ricos cuando los vértices con muchos enlaces solo se enlazan entre si

Estos ricos, como lo viven

Page 29: Análisis y construcción de redes complejas

2929

También hay redes antisociales

El grado de asortatividad depende de la red.

En el caso de los superhéroes, son disortativos.

Page 30: Análisis y construcción de redes complejas

3030

¿Y por qué deberían de importarme?

Distribuciones 80/20 (Pareto)

Listas-A Cola larga Condensado de

Bose-Einstein Monopolios

naturales

Page 31: Análisis y construcción de redes complejas

3131

Qué pequeño es el mundo

Las redes mundo-pañuelo necesitan pocos enlaces para conectarlo todo

Coeficiente alto de clustering Escalado logarítmico de la

longitud de camino con el tamaño.

Page 32: Análisis y construcción de redes complejas

3232

Empequeñeciendo el mundo

A partir de una red regular, con pocos enlaces.

Page 33: Análisis y construcción de redes complejas

3333

Redes complejas

Agrupamiento (clustering)

Enlazado preferencial

Leyes de potencias

Mundo pequeño

Componente gigante

Modularidad

Page 34: Análisis y construcción de redes complejas

3434

¿Y qué pasa con los nodos?

Miden la relevancia de un nodo (o enlace) dentro de la red.

Basadas en geodésicas Cercanía Intermediación (betweenness)

Basadas en el grado (o flujo) Centralidad de flujo Índice de poder de Bonacich Centralidad de eigenvalores

Page 35: Análisis y construcción de redes complejas

3535

En medio, como el jueves

El grado de intermediación mide la frecuencia con la que un nodo aparece en las geodésicas.

Si es alta controla el flujo de información.

kj jk

jikBETi g

gC

#

#

Número de geodésicas del nodo j al k que pasan por el nodo i.

Número de geodésicas del nodo j al nodo k.

Page 36: Análisis y construcción de redes complejas

3636

Traspasos de la liga

Page 37: Análisis y construcción de redes complejas

3737

Nos estamos acercando

La centralidad de cercanía mide cómo de cerca está un nodo del resto.

jij

CLOi dC

1

Longitud de la geodésica del nodo i al nodo k.

Page 38: Análisis y construcción de redes complejas

3838

Hay que tirar

Los nodos con alta cercanía son los primeros que consiguen nueva información (y los más eficientes para diseminarla).

Page 39: Análisis y construcción de redes complejas

3939

We got the power

El indice de poder de Bonacich mide la importancia de los vecinos de un nodo

Los que tienen un valor alto, pueden influenciar la red directa o indirectamente.

j

POWjij

POWi CAC

Matriz de adyacencias

Menor que el recíproco del eigenvalor mayor

Page 40: Análisis y construcción de redes complejas

4040

El poder para el atleti

Atlético

Villarreal

Racing

Mallorca

Espanyol

Recreativo

Málaga

Osasuna

Valladolid

Getafe

Numancia

Barcelona

Athletic

Celta

Poli Ejido

Al

mería

Sevilla

Betis

Valencia

Granada 74

Elche

Eibar

Racing de Ferrol

Real Sociedad

Murcia

Sporting

Borussia

Castilla

Alavés

0

2

4

6

8

10

12

14

Bonacich Power

Traspasos liga

Equipos

Po

we

r

Page 41: Análisis y construcción de redes complejas

4141

Centros y autoridades

En grafos dirigidos, importa los que reciben enlaces (autoridades) y los que los emiten (hubs)

Page 42: Análisis y construcción de redes complejas

4242

¿Y Google, qué opina de esto?

Los buenos hubs apuntan a buenas autoridades y viceversa.

El pagerank de Google se basa en el mismo concepto

Page 43: Análisis y construcción de redes complejas

4343

La autoridad reside en los reyes

AutoridadHub

Autoridad+Hub

Autoridad+Hub

Page 44: Análisis y construcción de redes complejas

4444

Todos los nodos son iguales

La centralidad de Eigenvector es una suma ponderada de los caminos que se originan en un nodo

Si tienen valor alto, pueden influenciar la red a través de múltiples caminos

j

EIGjij

EIGi CAC Reciprocal of the

largest eigenvalue

Page 45: Análisis y construcción de redes complejas

4545

Llegando por varios sitios al gol

Page 46: Análisis y construcción de redes complejas

4646

Fluyendo por el campo

La intermediación de flujo asimila una red a un sistema de tuberías.

Influye la centralidad, pero también la posición en los caminos entre dos vértices

Page 47: Análisis y construcción de redes complejas

4747

Eurocopa 2004: centralidad de flujo

FBC = 12.17 FBC = 7.39

Rusia 2 : 1 Grecia

Vladislav_RADIMOV

Dmitri_SYCHEV

Andrei_KARIAKA

Igor_SEMSHOV

Rolan_GUSEV

Dmitri_BULYKIN

Viacheslav_MALAFEEV

Roman_SHARONOV

Aleksandr_ANYUKOV

Dmitri_ALENICHEV

Vadim_EVSEEV

Dmitri_SENNIKOV

Dmitri_KIRICHENKO

Aleksei_BUGAYEV

Antonios_NIKOPOLIDIS

Giourkas_SEITARIDIS

Stylianos_VENETIDISTraianos_DELLAS

Angelos_BASINAS

Theodoros_ZAGORAKIS

Angelos_CHARISTEAS

Vassilios_TSIARTAS

Themistoklis_NIKOLAIDIS

Panagiotis_FYSSAS

Zisis_VRYZAS

Mihalis_KAPSIS

Konstantinos_KATSOURANIS

Dimitrios_PAPADOPOULOS

Page 48: Análisis y construcción de redes complejas

4848

Study 1: Flow Betweenness

(b= 0.10; BETA= 0.33)

Page 49: Análisis y construcción de redes complejas

4949

Gente a puñaos

Las redes complejas (y las sociales) tienden a formar clusters, grupos, comunidades o módulos.

Page 50: Análisis y construcción de redes complejas

5050

La red de las redes sociales

Page 51: Análisis y construcción de redes complejas

5151

La red tiene estructura

Red de colaboración científica en el Santa Fe

Institute

(ejemplo de [Girvan, Newman 2002; cond-mat/0112110])

Page 52: Análisis y construcción de redes complejas

5252

Experiencias intracorpóreas

Biochemical Journal www.biochemj.org

Biochem. J. (2004) 381, 1-12

Gráfico de sinergia de factores de

transcripción in S. cerevisiae

Page 53: Análisis y construcción de redes complejas

5353

Red de metaheurísticas

Page 54: Análisis y construcción de redes complejas

5454

¿Cómo hallamos la estructura de la red?

Problema de particionado de grafos

No se conoce el número de comunidades

Dos formas de atacarlo Aglomerativa Divisiva

Page 55: Análisis y construcción de redes complejas

5555

Divide y vencerás

(ejemplo de [Newman, Girvan, 2004; cond-mat/0308217])

Los enlaces entre comunidades tienen

alto betweenness

Page 56: Análisis y construcción de redes complejas

5656

Atacando la red

Cuando se eliminan las aristas con alta intermediación aparece un dendrograma

Page 57: Análisis y construcción de redes complejas

5757

Network structure

• A modularity measure:

r srs

Cr Csrs

ij A

A

e i j j

iji ea

i

ii iaeQ 2

fraction of edges between communities i and j

fraction of edges connecting to community i

fraction of edges within a community

expected value

Page 58: Análisis y construcción de redes complejas

5858

Red de coautorías en computación evolutiva

Comunidad de mayor tamaño

Page 59: Análisis y construcción de redes complejas

5959

¿Y en el fútbol?

Page 60: Análisis y construcción de redes complejas

6060

Redes sociales en internet

Tratan de usar los mecanismos naturales de las redes como una propuesta de ocio en Internet

Lo más entretenido es añadir “amigos”

Page 61: Análisis y construcción de redes complejas

6161

La red es una red de por si

Es inevitable crear una red social cuando se está en Internet

El API del grafo social de Google sirve para eso

Page 62: Análisis y construcción de redes complejas

6262

Los amigos de mis amigos son mis amigos

Microformatos (XFN)

Friend of a Friend – FOAF

Web semántica – RDF.

Mejor que aplicaciones cerradas

Page 63: Análisis y construcción de redes complejas

6363

Y todo esto, ¿pa qué?

La red social en internet refleja patrones de difusión de información

Y su estudio permite hallar la jerarquía personal

Page 64: Análisis y construcción de redes complejas

6464

Y, eventualmente, vender la moto

En el márketing viral, la gente se encargar de difundir un mensaje

Permiten una segmentación más fina de la población

Page 65: Análisis y construcción de redes complejas

6565

El fútbol es así

Las macromedidas de la red permiten compararlas y hacerse una idea general de las mismas.

Los índices de centralidad permiten medir la posible influencia de un nodo en otros.

Las redes pueden usarse en múltiples ámbitos

Page 66: Análisis y construcción de redes complejas

6666

Eso es todo

¡Muchas gracias!¡Muchas gracias!