Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

146
Enfoque Estadístico del Aprendizaje y el Descubrimiento 2019 Diego Kozlowski – [email protected] Juan Barriola – [email protected] María Eugenia Szretter – [email protected] Andrés Farall – [email protected]

Transcript of Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Page 1: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Enfoque Estadístico del Aprendizaje y el Descubrimiento

2019

Diego Kozlowski – [email protected] Barriola – [email protected]ía Eugenia Szretter – [email protected]és Farall – [email protected]

Page 2: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Programa de la Materia

Andrés

Andrés

Maru

Page 3: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Objetivos Principales del Curso

• Ofrecer un enfoque Estadístico de las técnicas de Regresión

• Brindar herramientas aplicadas• Posicionarse en un contexto científico

e interdisciplinario• Enseñar una amplia variedad de

técnicas implementadas en R• Utilizar conjuntos de datos reales• No profundizar en la matemática

sobre la cual se basan los métodos

Page 4: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

“Un Modelo Lineal No Se Le Niega a Nadie”

• Avanzamos de lo simple a lo complejo.• Un modelo simple sirve como

“benchmark” contra el que comparar el resultado de modelos más complejos.

• Un modelo simple permite interpretar la mecánica de las relaciones entre variables.

Page 5: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

El Contexto Tecnológico

• Capacidad de Cálculo• Capacidad de Almacenamiento• Velocidad en la Transmisión de Datos• Ciencia de Datos• Machine Learning• Data Mining• Big Data• Optimización

Page 6: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Que pasó con la Capacidad de Cálculo ?

Millones de Instrucciones por Segundo

Page 7: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Que pasó con la Capacidad de Almacenamiento ?

Compound Agregation Growing Rate

Page 8: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Que pasó con la Capacidad de Transmisión de Datos (Ancho de

Banda) ?

Page 9: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Porque R ?• Código Abierto (GNU-GPL V 3)• Gratuito (GNU-GPL V 3)• Multiplataforma (Windows, Linux, MAC/OS)• Comunitario (>9.700 paquetes al 2017)• Orientado a objetos• Especializado en el análisis de datos• Potentes gráficos• Flexible (interprete)• Alto nivel de expresión• Fuerte aceptación/intervención académica• Facil integración vertical (stack)

Page 10: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Que es Ciencia de Datos ?

WordCloud de los Componentes de la Ciencia de Datos

Page 11: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Estadística• Basada en la Teoría de Probabilidades.• Formalizó el concepto de incertidumbre en las

mediciones/estimaciones.• Condicionada por la escacez de datos (N >

30 ?)• Herramientas/conceptos básicos utilizados:

– Modelo probabilístico– Población / Muestra– Variable Aleatoria– Verosimilitud– Inferencia– Significancia / P-valor– Intervalos de Confianza– Test de Hipótesis– Interpretabilidad

Componente Determinístico

Componente Aleatorio

Page 12: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Machine Learning

• Enfoque derivado de la Computación• Entrenaminto de Algoritmos• Inteligencia Artificial• Reinforcment learning• Evaluation and Testing• Heurísticas

Crisis del 2007/08

Page 13: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Big Data

• Que hacer con volúmenes inmensos de datos ?

• Como almacenarlos ?• Como modificar/crear/adaptar

algoritmos para hacer eficaces (o aumentar la eficiencia) de los métodos de estimación/medición.

Page 14: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Data Mining• Que patrones pueden extrarse de los

datos ?• Data Analysis y Analytics en gran

escala• Versión antigua del Data Science•

Evolución de los Términos en la Literatura(N-gram viewer)

Page 15: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Optimización• Fuerza Bruta• Random Optimization (Luus-Jaakola)• Gradient Descent• Newton-Rapson (Quasi)• Simulated Annealing• Optimización Lineal/Cuadrática

con/sin restricciones (Simplex Like Methods)

• EM (Expectation Maximization)• Algoritmos Genéticos

Page 16: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Taxonomía Basica de los Métodosen la Ciencia de Datos

• Métodos Supervisados– Clasificación

• CART• Support Vrctor Machines

– Regresión• Modelos Lineales• Redes Neuronales

• Métodos No Supervisados– Análisis Factorial

• Componentes Principales• Análisis de Correspondencia

– Segmentación• K-medias• Clusterización Jerarquica• GMM

Page 17: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Supervisado Vs. No SupervisadoEspacio de probabilidad conjunto

Variables Explicativas o Features

Variables Respuesta o Target

Page 18: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Regresión Vs. Clasificación

Sólo Features

Relación entre Target y Features

Page 19: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

?

Page 20: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

GeoReferenciación Automática

Visible image from Open Street Map

NDVI image (2014-10-16)

Point of interest

?

Page 21: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Symbolic Data Analysis (Estadística de Objetos?)

?

Page 22: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Repaso

Basado en el curso de Ciencia de Datos con R Fundamentos Estadísticos

por M. Sued, A. Bianco y M. Valdora

Page 23: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Teoría de Probabilidades

Page 24: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Función de Probabilidad

Page 25: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Concepto de Independencia

Probabilidad Condicional

Page 26: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Teorema de BayesS

A1

A2

A5

A4 A3

Inversión del Condicional

Page 27: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Variables AleatoeiasUna Variable Aleatoria es una función definida sobre el espacio muestral que toma valores en los reales:

Conjunto de valores de la Variable Aleatoria

Elementos del Espacio Muestral

Evento de Interes

Valor puntual

Page 28: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

La Función de Distribución

x

-3 -2 -1 0 1 2 3

0.0

0.2

0.4

0.6

0.8

1.0

Page 29: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

La Función de Densidad

Page 30: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

La Normal Univariada

Page 31: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Esperanza y Varianza

Page 32: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Covarianza y Correlación

• Medidas de asociación lineal entre variables (x e y)

Covarianza Empírica

Correlación

Desvios

Medias

1),(1 yx

Page 33: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Asociación Vs. Correlación

Cor(x,y) = 0.9 Cor(x,y) = 0.05

x

y

-1.0 -0.5 0.0 0.5 1.0

-1.0

-0.5

0.0

0.5

1.0

x

y

-1.0 -0.5 0.0 0.5 1.0

-1.0

-0.5

0.0

0.5

1.0

Page 34: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Tchevichev

Ley de los Grandes Números

Promedio

Page 35: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Valores de la Variable

Media poblacional

Promedio muestral

Ejemplo de Ley delos Grandes Números

n

valo

r d

e la

ob

serv

aci

ón

0 10 20 30 40 50

12

34

5

Page 36: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Teorema Central del Límite

Función de Distribución Normal

Promedio de Variables Aleatorias

Variables Independiantes e Identicamente Distribuidas

Page 37: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Ejemplo del Teorema Central

Xi P(xi)

1 0.5

2 0.2

3 0.3

(X1+x2)/2 P((X1+x2)/2)

2/2 0.5*0.53/2 0.5*0.2 +

0.2*0.54/2 0.5*0.3 +

0.2*0.2 + 0.3*0.5

5/2 0.2*0.3 + 0.3*0.2

6/2 0.3*0.31 2 3

0.0

0.1

0.2

0.3

0.4

0.5

Page 38: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Distribución de (x1+x2+…+x20)/20

Probabilidad

1.15 1.

21.

25 1.31.

35 1.41.

45 1.51.

55 1.6

1.65 1.

71.

75 1.8

1.85 1.

91.

95 2 2.05 2.

12.

15 2.22.

25 2.32.

35 2.42.

45 2.52.

55

0.0

0.0

20

.04

0.0

60

.08

0.1

0

Page 39: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Inferencia estadística

Trata de estimar o inferir mediante una muestra (aleatoria) el valor (desconocido) de un parámetro poblacional

Page 40: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Probabilidad e Inferencia, el problema de la “Inversión”

Proporción poblacional de bolitas rojas

Muestra

Aleatoria Estimador

Estim

ació

n

Proporción muestralde bolitas rojas

Page 41: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Inferencia Estadística

22

Familias No/Semi Paramétricas

EstimaciónModelo

Paramétrico

EstimaciónModelo

Paramétrico

Universo de Posibilidades DGP’s

VerdaderoDGP

Datos

Familia de modelos elegida

Page 42: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Aproximadores Universales (ANN - MLP)

VerdaderoDGP

Datos

AjusteCorrecto

Sobreajuste

Modelos Potencialmente Entrenables

Zona de Modelos

que Interpolan a

los Datos

Page 43: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

La población (N=100)

Media poblacional=0.47

Eje de valores

x

Ind

ice

(o

tra

va

ria

ble

)

0.0 0.2 0.4 0.6 0.8 1.0

02

04

06

08

01

00

Poblacion

Page 44: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

La muestra (n=10)

Media poblacional=0.47Media muestral=0.43 x

Ind

ice

(o

tra

va

ria

ble

)

0.0 0.2 0.4 0.6 0.8 1.0

02

04

06

08

01

00

Page 45: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

El estimador y la estimación

Dados las variables aleatorias: x1, x2 … x10

¿ Que tan bueno es ?¿ Cuales son sus propiedades?

Dados los datos: x1, x2 … x10

43.010101010

1021

10

1 xxxxi

i

x

101010101021

10

1 xxxxi

i

x

Page 46: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Repito el experimento 10000 veces

Min. st Qu. Median Mean 3rd Qu. Max. 0.15705 0.40697 0.46900 0.46879 0.53011 0.82568

Insesgado

Desvío= 0.09

Media poblacional= 0.468

x

0.2 0.4 0.6 0.8

01

23

4

Page 47: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Propiedades de los Estimadores

• Consistencia

• Insesgadez

• Error Cuadrático Medio

=

Parámetro

Estimador

Sesgo^2Varianza-( )2

Page 48: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

VerosimilitudParámetros

Variables Aleatorias

Observaciones están fijas !!!

Los Parámetros varían !!!

Page 49: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Estimador de Máxima-Verosimilitud

Page 50: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Ejemplo de Verosimilitud 30 realizaciones X ~ N ( 0 , 1)

Media verdadera= 0

Media estimada MV= 0.37

Función de Verosimilitud (Normal) basada en los 30 x’s fijos

Parámetros de la Distribución Normal

Page 51: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Selección de Modelos

Page 52: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Intervalos de confianza

Dado un parámetro poblacional desconocido, buscamos un intervalo (dependiente de la muestra) que con alta probabilidad contenga al verdadero valor del parámetro.

Page 53: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Intervalos de confianza

Fijo

Aleatorio

Límite inferior Límite superior

95.011 nn xxDxxIP

parámetrocon población una

de eprovenient aleatoria muestra Dados 1 nxx

si 0.95 confianza de intervaloun es , 11 nn xxDxxI

Page 54: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Intervalos de confianza: Ejemplo

x

Imdi

ce

0.0 0.2 0.4 0.6 0.8 1.0

020

4060

8010

0

La población

Media poblacional = 0.47

Page 55: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Propongo un intervalo de confianza (cualquiera)

=

Dada una muestra aleatoria de dos elementos x1 y x2

¿ Con que probabilidad cubre a la verdadera media poblacional (0.47)?

0.12

, 0.1-2

2121

xxxx

nn xxDxxI 11 ,

Page 56: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Dos realizaciones del intervalo de confianza (cualquiera)

x

Imdi

ce

0.0 0.2 0.4 0.6 0.8 1.0

020

4060

8010

0

Si cubreNo cubre

Media poblacional = 0.47

Page 57: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Repito el experimento 10000 veces

Repetición Cubre ?

1 NO

2 NO

3 SI

4 NO

… …

10000 NO

Proporción de intervalos que cubren = 0.3503

Page 58: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

¿ Que pasa si tomo tamaño de muestra = 4 ?

Proporción de intervalos que cubren = 0.4871

Proporción de intervalos que cubren = 0.6543

¿ Que pasa si tomo tamaño de muestra = 8 ?

¿ Que pasa si tomo tamaño de muestra = 8 y longitud de intervalo

=0.4 ?Proporción de intervalos que cubren = 0.8558

Page 59: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Test de Hipótesis

Es un mecanismo para decidir acerca de la validez de una hipótesis, controlando la probabilidad de rechazar la misma siendo que esta es verdadera.

Page 60: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Intuitivamente

Nos paramos en la hipótesis que queremos validar y pensamos los diferentes escenarios posibles con sus probabilidades (según la hipótesis)

Si la realidad se corresponde con un escenario que bajo la hipótesis es poco probable, rechazamos la hipótesis

Page 61: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Gráficamente

HIP

OT

ES

IS H

0

ESCENARIO 3

ESCENARIO 4

ESCENARIO 5

ESCENARIO 2

ESCENARIO 1 0.30

0.02

0.40

0.03

0.25

RECHAZO H0

RECHAZO H0

Page 62: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Receta para armar un Test de Hipótesis

• Definir la Hipótesis nula (H0)• Elegir un estadístico que mida o refleje el

alejamiento de la evidencia de H0• Definir un valor de probabilidad (α) por ) por

debajo del cual creamos que los eventos son suficientemente “raros”

• Evaluar el estadístico en los datos y comparar la probabilidad de un resultado como ese o “mas extremo” con α) por

Page 63: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

H0: Juan NO es adivino

x

x

Z = Cantidad de aciertos 10 6

x

xP(Z >= 10) == 1/1024 = 0.000977

P(Z >= 6) = = 0.377

Page 64: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Potencia, Específicidad y ErroresModelo

Estimador

Error Tipo 1

Error Tipo 2

Contra mayor, rechazo si supera el umbral

Page 65: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

La Virtud y El Problema de la Consistencia

La distribución se degenera hacia μ0

La distribución se degenera hacia μA

Valor poblacionalteórico μ0

Valor poblacional real μA

Page 66: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

El p-valor

• Concepto fundamental de la Estadística que cuantifica objetivamente la evidencia acerca de la validez de una hipótesis.

• Específicamente, mide en base a las observaciones el graodo de “compatibilidad” de una hipótesis en términos del comportamiento distribucional de un estimador /estadístico.

Page 67: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Gráficamente

Probabilidad de observar “algo tan o mas extremo” que lo observado basado en la muestra

Valor observado del estadístico (estimación)

Distribución del Estadístico bajo la Hipótesis

Evidencia a favor H0 Evidencia contra H0

Page 68: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Para que sirve el Enfoque Estadístico ?

• OVBIO: Para cuantificar la incertidumbre de las estimaciones.

• • OVBIO: Para completar la falta de

información con “relaciones” matemáticas razonables/justificadas.

• NO TAN OVBIO: Para Modelar correctamente los fenómenos de interes, discriminando las relaciones “concomitantes” de aquellas que son “esenciales”

Page 69: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Precios en miles de u$s

Los Agentes Inmobiliarios venden sus casas mas caras que las de

sus clientes ?

Claramente, venden SUS casas mas caras

Page 70: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Problema de Especificación

El factor (D/V) NO es significativo

Page 71: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Que Está Pasando ?

Nada por explicar en los residuos

Despues del ajuste queda mucha estructura en los residuos

Page 72: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Likelihood de los Datos bajo el Modelo

Inferencia Bayesiana

Parámetros aleatorios

Distribución Prior

Observaciones

Distribución Posterior de los Parámetros considerando: Prior + Datos

Mecanismo de Actualización de la Distr. de los Parámetros

Distribución Marginal de las Observaciones

Page 73: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Distribución Binomial

Cual es la probabilidad de observar k éxitos en

n intentos ?

Page 74: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

DistribuciónBeta

Cual es la probabilidad de

una probabilidad ?

Page 75: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Ejemplo Sencillo: Binomial y Beta

Evento dicotómico

# de exitos

# de casos

1 p0 1-p

Page 76: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

La información

Var 1 … Var j … Var pInd 1 X1,1 X1,j X1,p

…Ind i Xi,1 Xi,j Xi,p

…Ind n Xn,1 Xn,j Xn,p

MediciónP > 1 => multivariado

Page 77: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Las variables (columnas)

• Características o atributos cambiantes de los individuos que interesa analizar.

• Elementos sobre los cuales se miden los atributos.

Los individuos (filas)

Page 78: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Estadísticos básicos

Var 1 … Var j … Var p

MediasX1 Xj Xp

Vector de medias

Matriz de varianzas y covarianzas

ppp

p

p

VarianzaCovarianza

Page 79: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Resumen de Información

Var 1 … Var j … Var p

Ind 1 X1,1 X1,j X1,p

Ind i Xi,1 Xi,j Xi,p

Ind n Xn,j Xn,j Xn,p

Técnicas FactorialesComponentes Principales – Análisis Factorial – Análisis de Correspondencia

TécnicasdeSegmentaciónClusterización jerárquica– Métodos de Partición (K-medias)

Page 80: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Analisis Factorial

No observable

Factores o variables latentes

Observable

Variables o atributos

MedicionMedicion

InferenciaInferencia

Page 81: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Estadística Descriptiva y Análisis Exploratorio de Datos

Objetivos:• Conocer los datos• Descubrir patrones• Verificar la existencia de patrones• Entender los patrones• Resumir información• Hallar asociaciones de variables• Detectar anomalías

Page 82: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Las variables• Categóricas o cualitativas

– Color de pelo– Tipo de auto– Sexo

• Ordinales– Calificación de examen (A, B, C, D y E)– Etapa de una enfermedad (etapa I, II o III)

• Discretas– Cantidad de hijos

• Continuas– Salario– Peso– Edad– Tiempo

In

form

aci

ón

In

form

aci

ón

Page 83: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Descripciones multivariadas

• Tablas cruzadas• Gráficos de dispersión (scatterplot)• Hexbin• Estimación de densidad por nucleo• Gráficos de mosaico (mossaic plot)• Gráficos de estrella (star plots)• Caras

Page 84: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Tablas cruzadas (cross tabulation) o de Contingencia

NO SI Total

NO 258 280 538

SI 184 719 903

Total 442 999 1441

Tuvoen cuentala GARANTIA

Tuvo en cuenta el CONSUMO

Total de casos

Totales marginales

Obsrvaciones conjuntas

Page 85: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Gráficos de mosaicos

Proporciones marginales

Proporciones condicionales

Page 86: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Sobrevivientes del Titanic

Total de casos = 2201

Page 87: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Mosaico del Titanic

Page 88: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Gráfico de dispersión (X,Y)

Dos variables Mediciónes

Page 89: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Grafico Contour

Curvas de nivel

Page 90: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Gráfico “CoPlot”

Tres variables

Page 91: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

CoPlotDe

Temperaturas

Page 92: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Gráfico de dispersiónMuchos puntos superpuestos

edad

KM

x m

es

0 20 40 60

020

00

400

060

00

800

0

Page 93: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Gráfico hexbin

Mayor concentración

edad

KM

x m

es

0 20 40 60

02

00

04

00

06

00

08

00

0

1 2 3 4 5 6 7 8 91011121314151617181920

Counts

Page 94: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Gráfico hexbin

cantidad de personas en la familia

cant

ida

d d

e a

uto

s

2 4 6 8 10 12

24

68

1

20

40

60

80

100

120

140

160

180

200

220

240

242

Counts

Page 95: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Gráfico de dispersión (X,Y,Z)

Page 96: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Campo medio de diferencias entre R4 y control para el

periodo 2046-2050

Page 97: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Estimación de densidad por núcleos (Bivariado)

Posibles clusters

Page 98: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Múltiples BoxplotsTresvariables

Page 99: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Boxplot condicionaado a una variable continuaDos

variables

Page 100: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Gráficos de Violin

Stock index

Page 101: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Boxplot + Scatterplot

Page 102: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

GrafosNodos Aristas

Page 103: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Gráfico de barras 3D

Dosvariablescategóricas

Page 104: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Gráficos de elipsesCorrelaciones

Page 105: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Gráfico de densidad para datos angulares (Viento)

Page 106: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Bagplot (2D Boxplot)Tresvariables

Page 107: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Datos de galletitas

Page 108: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Gráficos de estrellas (1)

Page 109: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Gráficos de estrellas (2)

Page 110: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Gráficos de caras (1)

Page 111: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Gráficos de caras (2)

Page 112: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Ternary Plot

Tres variables sumando constante

Page 113: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Presencia de bacterias en 3 habitats

Page 114: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Diagramas de Arco(Los Miserables, Victor Hugo)

Protagonistas en el libro por orden de aparición

Capítulos del libro

Conexión por aparición en el mismo capítulo

Page 115: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Gráficos CIRCO

Categorías

Relaciones entre Categorías

Page 116: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Correlaciones Ordenadas por Segmentación

Page 117: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Curvas de Andrews

Page 118: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages
Page 119: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Benchmarking en Regresión

Page 120: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Benchmrking en Clasificación• Accuracy

• Sensibilidad

• Especificidad

• False Discovery Rate

• Presición

• Area bajo la curva

Page 121: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Coeficiente Kappa de Cohen

Accuracy Obtenida

Accuracy que se obtendría por AZAR

Page 122: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Curvas ROC

• Método gráfico que muestra el desempeño de un procedimiento de Clasificación.

• Contempla la asimetría en el error.• Sólo viable en casos de

procedimientos con Scores continuos• Interpretación Probabilística: Es la

Probabilidad que una Observación Positiva (tomada al azar) tenga un score mayor que una Observación Negativa (tomada al azar).

Page 123: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

c = 3c = 4

c

TPR

FPR

FPRTPR

FPR

TPR

Curva ROC

Curva de peor desempeño

c = 3c =

4

Area bajo la curva (AUC)

Distribución del score de la Población TP

Distribución del score de la Población TN

Page 124: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages
Page 125: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Tradeoff Sesgo - Varianza

ErrorCuadráticoMedio

Complejidad del modelo (k)

Mayor Sesgo

Mayor Varianza

Curva verdadera

Curva muestral

Page 126: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Ajuste de Y = f(X) + ε = Ln(10*X+1) + ε

f(x) Curva real (NO observable)

f(x) Curva estimada, modelo lineal

Observaciones (34)

^

f(3) real

f(3) estimado

^

30 2 4 6 8 10

x

-20

24

6

Y

Page 127: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Ajuste de Y = f(X) + ε = Ln(10*X+1) + ε

f(x) Curva estimada, polinomio grado 10

^

3x

Y

0 2 4 6 8 10

-20

24

6

Page 128: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Tradeoff Sesgo - Varianza

Complejidad del Modelo = Grados del Polinomio

Complejidad (k)

Va

rianz

a

2 4 6 8 10

0.0

10.

02

0.0

30.

04

0.0

5

Complejidad (k)

Se

sgo

2 4 6 8 10

0.0

0.0

50.

10

0.1

5

Page 129: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Curva de Error Cuadrático Medio

Modelo óptimo,polinomio de grado 3

Polinomio de grado 10

Polinomio grado 1, modelo lineal

Complejidad (k)

Err

or

Cu

ad

ratic

o M

ed

io

2 4 6 8 10

0.0

50

.10

0.1

5

Page 130: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

x

efe

0 2 4 6 8 10

-20

24

6

x

efe

0 2 4 6 8 10

-20

24

6

x

efe

0 2 4 6 8 10

-20

24

6

Complejidad k=2Polinomio grado 1

Complejidad k=4Polinomio grado 3

Complejidad k=11Polinomio grado 10

Tradeoff Sesgo-Varianza

Mayor Sesgo

Mayor Varianza

Page 131: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Overfitting (sobreajuste)• Efecto nocivo que proviene de ajustar

modelos con mas complejidad (menos parsimonia) que la que la cantidad de información muestral admite.

• Resultado de la ALTA VARIABILIDAD del estimador.

• Es MUCHO mas común que el SUBAJUSTE.

• Estamos geneticamenteProgrmadospara el OVERFITING !

Page 132: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Solución al Overfitting

• Usar modelos poco complejos (mas parsimoniosos)

• Partir la muestra: Entrenamiento / Testeo

• Usar validación cruzada• Bootstrap y Bagging• Usar técnicas de “Shrinkage”, como:

– Ridge Regression– LASSO Regression– Penalización o Regularización

Page 133: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

LM ANN

Page 134: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Meta - Heurísticas

ErrorCuadráticoMedio

Complejidad del modelo (k)

Bagging Boosting

Curva verdadera

Curva muestral

Page 135: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Bagging (Bootstrap Aggregating)

• Se basa en PROMEDIAR los resultados de iterar la aplicación de modelos COMPLEJOS, “bootstrapeando” la muestra de entrenamiento.

• Esta técnica reduce la VARIANZA típico de los modelos COMPLEJOS.

Page 136: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Intuición del Bagging en Clasificación

Población (Universo de observaciones)

Errores del Predictor 1

Errores del Predictor 2

Errores del Predictor 3

Los circulos de colores representan a las observaciones en las que los predictores erran.

Con 3 predictores COMPLEJOS (insesgados y muy variables) e INDEPENDIENTES

El PROMEDIO de los 3 predicores NO ERRA !!!

Error +Acierto +Acierto = Acierto

Page 137: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Boosting

• Se basa en RE-ENTRENAR iterativamente modelos SIMPLES aumentando la ponderación de las observaciones PEOR predichas.

• Esta técnica reduce el SESGO típico de los modelos SIMPLES.

Page 138: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Intuición del Boosting en Clasificación

Población (Universo de observaciones)

Errores del Predictor 1

Errores del Predictor 2

Errores del Predictor 3

Los circulos de colores representan a las observaciones en las que los predictores erran.

Con 3 predictores SIMPLES (sesgados y poco variables) e INDEPENDIENTES

El PROMEDIO de los 3 predicores NO ERRA !!!

Error +Acierto +Acierto = Acierto

Page 139: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

En la Práctica: Boosting en Clasificación

Errores del Predictor 1

Errores del Predictor 2

Errores del Predictor 3

Con 3 predictores SIMPLES (sesgados y poco variables) que NO SON INDEPENDIENTES

¿ Como SEPARAMOS las regiones de ERROR de los predictores?

El PROMEDIO de los 3 predicores ERRA !!!

Error +Error +Error = Error

Page 140: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

K vecinos mas cercanos (KNN)

• Dada una nueva observación X0, la clasifico en aquella población que posee una representación mayoritaria entre los K vecinos mas cercanos a X0.

M

x0

K = 3

Page 141: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

Ejemplo gráfico

Page 142: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

TRAIN / TEST

TRAIN / TEST

Page 143: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

LOOCVLOOCV

Page 144: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages

LOOCV Versus TRAIN/TEST

K-fold CVK-fold CV

Page 145: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages
Page 146: Enfoque Estadístico del Aprendizaje y el ... - GitHub Pages