Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion...

26
Topologia aplicada a la ciencia de datos Luis Alexandher V.G. FES Acatlan November 14, 2018 Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 1 / 26

Transcript of Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion...

Page 1: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Topologia aplicada a la ciencia de datos

Luis Alexandher V.G.

FES Acatlan

November 14, 2018

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 1 / 26

Page 2: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Topologia

Definicion

Rama de las matematicas que estudia las propiedades cualitativas de losespacios topologicos

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 2 / 26

Page 3: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Clasico ejemplo

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 3 / 26

Page 4: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Topologia algebraica

Definicion

Forma de relacionar la topologia con el algebra

Componentes conexas

”Pedazos”

Agujeros

Nos interesa estudiar agujeros de los espacios topologicos (dimension0,1,2)

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 4 / 26

Page 5: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Homologia persistente

Datos

Vectores ∈ Rn

Definicion (homologia persistente)

Medir las caracteristicas topologicas de nuestros datos por medio de unmetodo algebraico (detectar los agujeros)

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 5 / 26

Page 6: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Complejo simplicial

A nuestros vectores (datos) les asociaremos un espacio topologico llamadocomplejo simplicial

Definicion (complejo simplicial)

Es un tipo particular de espacio topolgico construido mediante el pegadode puntos, segmentos de linea, triangulos, tetraedros

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 6 / 26

Page 7: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Complejo simplicial

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 7 / 26

Page 8: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

De datos a complejos simpliciales

1.- Cada punto (dato) sera el centro de un circulo de radio r2.- Cuando dos circulos se intersectan se dibuja una linea que une a cadapunto3.- Las lineas son las aristas y los puntos nuestros vertices.

Asi hemos formado nuestro complejo simplicial

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 8 / 26

Page 9: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Ejemplo

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 9 / 26

Page 10: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Ejemplo

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 10 / 26

Page 11: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Ejemplo

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 11 / 26

Page 12: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Ejemplo

Para una r ”chica”

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 12 / 26

Page 13: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Ejemplo

Para una r muy grande

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 13 / 26

Page 14: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Todas las r posibles

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 14 / 26

Page 15: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

”Vida” de agujeros

ESTO ES LA HOMOLOGIA PERSISTENTE

Persistencia de los agujeros. ”Nace” en r1 y muere en r2, es decir, ”vive”un tiempo (r1, r2)

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 15 / 26

Page 16: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Homologia persistente: Nos interesan los agujeros que mas PERSISTEN

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 16 / 26

Page 17: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Codigo de barras asociado

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 17 / 26

Page 18: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Diagrama de persistencia

Diagrama de persistencia (arriba) y codigo de barras asociado (abajo)

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 18 / 26

Page 19: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

En nuestro diagrama vemos que un agujero persiste y el espacio topologicomas simple que tiene un agujero es el circulo.

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 19 / 26

Page 20: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Un algoritmo

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 20 / 26

Page 21: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Como curiosidad

Definicion: Sea T un conjunto ordenado. Un modulo de persistencia Vsobre T es una familia indexada de transformaciones lineales deΛ−modulos {Vs |s ∈ T} y una familia doblemente indexada detransformaciones lineales {v ts : Vs → Vt |s ≤ t} tales que v tr ◦ v rs = v tscuando s ≤ r ≤ t. Ademas v tt = idVt .

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 21 / 26

Page 22: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Otros ejemplos

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 22 / 26

Page 23: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

En R3

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 23 / 26

Page 24: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

En R3

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 24 / 26

Page 25: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

Referencias

[1] Un rol para la curva de Betti en problemas de ciencia de datos, RfaelJose Gonzalez de Gouveia, Tesis para obtener el grado de maestro enciencias.[2] Analisis topologico de datos: Robusticidad y analisis de sensibilidad dealgoritmos, Jesus Manuel Perez Angulo, Tesis para obtener el grado demaestro en ciencias.[3] Barcodes: The persistent topology of data, Robert Ghrist[4] Aspectos computacionales del ”Analisis topologico de datos”, FranciscoValiente Castro

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 25 / 26

Page 26: Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion (homologia persistente) Medir las caracteristicas topologicas de nuestros datos por

FIN

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 26 / 26