Análisis y construcción de redes complejas

Post on 16-Dec-2014

2.993 views 4 download

description

Para una lección en los cursos de verano de la Universidad de Extremadura

Transcript of Análisis y construcción de redes complejas

11

Analizando y creando redes sociales

Juan Julián Merelo GuervósDepto. Arquitectura y Tecnología de Computadores

Universidad de Granadajj@merelo.net

http://atalaya.blogalia.com

22

Introducción

¿Qué son las redes complejas?

El porqué de las redes complejas

Comportamiento a gran escala

Comportamiento de cada nodo

Redes sociales en Internet

33

Notas históricas

44

De qué va esto

Las redes complejas tienen características específicas

Los sistemas complejos pueden ser representados mediante redes

55

Nudos y mallas

Los elementos de una red son nodos y las conexiones entre ellos aristas o arcos.

66 Internet topology

Redes a cascoporro

Las aristas o arcos pueden ser físicos, virtuales o referirse a una relación

77

Tipos de grafos

Dirigidos/adirigidos

Geodésicas

Componentes/cliques

Grado

88

Grafos aleatorios

Se generan aleatoriamente

Tienen pinta de maraña

Pero no son muy realistas

99

Liándose como la zapatilla de un romano

La evolución de una red aleatoria va creando un componente principal y eventualmente un grafo conectado

1010

Una red compleja es como un toro

Una red permite entender, visualizar y cuantificar conjuntos conectados de agentes

1111

Por eso hay redes

Son una metáfora actual e intuitiva para percibir muchos fenómenos

1212

¿Quieres ser un superhéroe?

Alberich, y luego Gleiser, han investigado el Universo Marvel

1313

El culebrón del verano

1414

¿Qué hago ahora?

La visualización es un reto.

Y un problema np-completo.

1515

Vamos con una red

1616

Redes contra redes

1717

¿Para qué queremos esto?

Analizar cuantitativamente fenómenos complejos

Correlacionar medidas con resultado

Predecir los resultados futuros

1818

¿Es este tu amiguito?

Obtener los datos no es trivial.

Mediante encuestas, en entornos físicos.

Más generalmente, usando programas que analicen documentos o páginas web

1919

Procesar los datos

23 -

Reina

Pepe

9 - T

orre

s Fer

nand

o

8 - X

avi H

erná

ndez

22 -

de la

Red

Rub

én

6 - I

niest

a And

rés

15 -

Sergio

Ram

os

10 -

Fàbre

gas

Cesc

7 - V

illa D

avid

20 -

Juan

ito

12 -

Santi C

azor

la

1 - C

asilla

s Ik

er

18 -

Arbelo

a Álva

ro

2 - A

lbiol

Raúl

17 -

Güiz

a Dan

iel

11 -

Capde

vila

Joan

21 -

Silva

David

16 -

Sergio

Gar

cía

14 -

Xabi A

lonso

4 - M

arch

ena

Carlos

19 -

Senna

Mar

cos

3 - F

erna

ndo

Navar

ro

5 - P

uyol

Carles

0

5

10

15

20

25

30

35

40

45

50

23 - Reina Pepe

8 - Xavi Hernández

6 - Iniesta Andrés

10 - Fàbregas Cesc

20 - Juanito

1 - Casillas Iker

2 - Albiol Raúl

11 - Capdevila Joan

16 - Sergio García

4 - Marchena Carlos

3 - Fernando Navarro

Pases totales

Eurocopa 2008

23 - Reina Pepe

9 - Torres Fernando

8 - Xavi Hernández

22 - de la Red Rubén

6 - Iniesta Andrés

15 - Sergio Ramos

10 - Fàbregas Cesc

7 - Villa David

20 - Juanito

12 - Santi Cazorla

1 - Casillas Iker

18 - Arbeloa Álvaro

2 - Albiol Raúl

17 - Güiza Daniel

11 - Capdevila Joan

21 - Silva David

16 - Sergio García

14 - Xabi Alonso

4 - Marchena Carlos

19 - Senna Marcos

3 - Fernando Navarro

5 - Puyol Carles

Jugadores

Jug

ad

ore

s

Pases

2020

Visualizando la red

Uso de programas tales como el Pajek

También Netdraw, Visone....

2121

Primeras impresiones

¿La red está conectada?

¿Cómo están repartidos los enlaces?

¿Cuál es el diámetro?

2222

Segundas impresiones

¿Todos los nodos son alcanzables?

Transitividad Coeficiente de

clústering.

2323

En la red de traspasos

Está conectada 90 nodos Distancia media:

4.297 Coeficiente de

clustering: 0.059 Centralización:

4.12%

2424

Aparecen las leyes de potencia

y=k*x^-b Una representación log-log

muestra una línea recta Y= número de enlaces X= orden, frecuencia,

tamaño... Se reproduce en cantidades

derivadas: visitas, ventas, resultados...

2525

Leyes de potencia en el grado

P(k) ≈ k-

Donde k es el grado del vértice

2626

Lo que lleva a un comportamiento libre de

escala No hay número de

enlaces preferido En redes aleatorias la

distribución es de Poisson Por lo que no hay una

escala preferida Muchos enlaces son

improbables, pero posibles.

2727

¿Por qué aparecen las leyes de potencia?

Enlazado preferencial (Barábasi)

No siempre se cumple Efecto San Mateo

Los mejores consiguen más Otros modelos: log-normal,

exponencial estirada, Weibull.

2828

Se habla de club de ricos cuando los vértices con muchos enlaces solo se enlazan entre si

Estos ricos, como lo viven

2929

También hay redes antisociales

El grado de asortatividad depende de la red.

En el caso de los superhéroes, son disortativos.

3030

¿Y por qué deberían de importarme?

Distribuciones 80/20 (Pareto)

Listas-A Cola larga Condensado de

Bose-Einstein Monopolios

naturales

3131

Qué pequeño es el mundo

Las redes mundo-pañuelo necesitan pocos enlaces para conectarlo todo

Coeficiente alto de clustering Escalado logarítmico de la

longitud de camino con el tamaño.

3232

Empequeñeciendo el mundo

A partir de una red regular, con pocos enlaces.

3333

Redes complejas

Agrupamiento (clustering)

Enlazado preferencial

Leyes de potencias

Mundo pequeño

Componente gigante

Modularidad

3434

¿Y qué pasa con los nodos?

Miden la relevancia de un nodo (o enlace) dentro de la red.

Basadas en geodésicas Cercanía Intermediación (betweenness)

Basadas en el grado (o flujo) Centralidad de flujo Índice de poder de Bonacich Centralidad de eigenvalores

3535

En medio, como el jueves

El grado de intermediación mide la frecuencia con la que un nodo aparece en las geodésicas.

Si es alta controla el flujo de información.

kj jk

jikBETi g

gC

#

#

Número de geodésicas del nodo j al k que pasan por el nodo i.

Número de geodésicas del nodo j al nodo k.

3636

Traspasos de la liga

3737

Nos estamos acercando

La centralidad de cercanía mide cómo de cerca está un nodo del resto.

jij

CLOi dC

1

Longitud de la geodésica del nodo i al nodo k.

3838

Hay que tirar

Los nodos con alta cercanía son los primeros que consiguen nueva información (y los más eficientes para diseminarla).

3939

We got the power

El indice de poder de Bonacich mide la importancia de los vecinos de un nodo

Los que tienen un valor alto, pueden influenciar la red directa o indirectamente.

j

POWjij

POWi CAC

Matriz de adyacencias

Menor que el recíproco del eigenvalor mayor

4040

El poder para el atleti

Atlético

Villarreal

Racing

Mallorca

Espanyol

Recreativo

Málaga

Osasuna

Valladolid

Getafe

Numancia

Barcelona

Athletic

Celta

Poli Ejido

Al

mería

Sevilla

Betis

Valencia

Granada 74

Elche

Eibar

Racing de Ferrol

Real Sociedad

Murcia

Sporting

Borussia

Castilla

Alavés

0

2

4

6

8

10

12

14

Bonacich Power

Traspasos liga

Equipos

Po

we

r

4141

Centros y autoridades

En grafos dirigidos, importa los que reciben enlaces (autoridades) y los que los emiten (hubs)

4242

¿Y Google, qué opina de esto?

Los buenos hubs apuntan a buenas autoridades y viceversa.

El pagerank de Google se basa en el mismo concepto

4343

La autoridad reside en los reyes

AutoridadHub

Autoridad+Hub

Autoridad+Hub

4444

Todos los nodos son iguales

La centralidad de Eigenvector es una suma ponderada de los caminos que se originan en un nodo

Si tienen valor alto, pueden influenciar la red a través de múltiples caminos

j

EIGjij

EIGi CAC Reciprocal of the

largest eigenvalue

4545

Llegando por varios sitios al gol

4646

Fluyendo por el campo

La intermediación de flujo asimila una red a un sistema de tuberías.

Influye la centralidad, pero también la posición en los caminos entre dos vértices

4747

Eurocopa 2004: centralidad de flujo

FBC = 12.17 FBC = 7.39

Rusia 2 : 1 Grecia

Vladislav_RADIMOV

Dmitri_SYCHEV

Andrei_KARIAKA

Igor_SEMSHOV

Rolan_GUSEV

Dmitri_BULYKIN

Viacheslav_MALAFEEV

Roman_SHARONOV

Aleksandr_ANYUKOV

Dmitri_ALENICHEV

Vadim_EVSEEV

Dmitri_SENNIKOV

Dmitri_KIRICHENKO

Aleksei_BUGAYEV

Antonios_NIKOPOLIDIS

Giourkas_SEITARIDIS

Stylianos_VENETIDISTraianos_DELLAS

Angelos_BASINAS

Theodoros_ZAGORAKIS

Angelos_CHARISTEAS

Vassilios_TSIARTAS

Themistoklis_NIKOLAIDIS

Panagiotis_FYSSAS

Zisis_VRYZAS

Mihalis_KAPSIS

Konstantinos_KATSOURANIS

Dimitrios_PAPADOPOULOS

4848

Study 1: Flow Betweenness

(b= 0.10; BETA= 0.33)

4949

Gente a puñaos

Las redes complejas (y las sociales) tienden a formar clusters, grupos, comunidades o módulos.

5050

La red de las redes sociales

5151

La red tiene estructura

Red de colaboración científica en el Santa Fe

Institute

(ejemplo de [Girvan, Newman 2002; cond-mat/0112110])

5252

Experiencias intracorpóreas

Biochemical Journal www.biochemj.org

Biochem. J. (2004) 381, 1-12

Gráfico de sinergia de factores de

transcripción in S. cerevisiae

5353

Red de metaheurísticas

5454

¿Cómo hallamos la estructura de la red?

Problema de particionado de grafos

No se conoce el número de comunidades

Dos formas de atacarlo Aglomerativa Divisiva

5555

Divide y vencerás

(ejemplo de [Newman, Girvan, 2004; cond-mat/0308217])

Los enlaces entre comunidades tienen

alto betweenness

5656

Atacando la red

Cuando se eliminan las aristas con alta intermediación aparece un dendrograma

5757

Network structure

• A modularity measure:

r srs

Cr Csrs

ij A

A

e i j j

iji ea

i

ii iaeQ 2

fraction of edges between communities i and j

fraction of edges connecting to community i

fraction of edges within a community

expected value

5858

Red de coautorías en computación evolutiva

Comunidad de mayor tamaño

5959

¿Y en el fútbol?

6060

Redes sociales en internet

Tratan de usar los mecanismos naturales de las redes como una propuesta de ocio en Internet

Lo más entretenido es añadir “amigos”

6161

La red es una red de por si

Es inevitable crear una red social cuando se está en Internet

El API del grafo social de Google sirve para eso

6262

Los amigos de mis amigos son mis amigos

Microformatos (XFN)

Friend of a Friend – FOAF

Web semántica – RDF.

Mejor que aplicaciones cerradas

6363

Y todo esto, ¿pa qué?

La red social en internet refleja patrones de difusión de información

Y su estudio permite hallar la jerarquía personal

6464

Y, eventualmente, vender la moto

En el márketing viral, la gente se encargar de difundir un mensaje

Permiten una segmentación más fina de la población

6565

El fútbol es así

Las macromedidas de la red permiten compararlas y hacerse una idea general de las mismas.

Los índices de centralidad permiten medir la posible influencia de un nodo en otros.

Las redes pueden usarse en múltiples ámbitos

6666

Eso es todo

¡Muchas gracias!¡Muchas gracias!