Tema1 ud1-b

36
Probabilidades y Estadística I TEMA 1 El análisis estadístico de datos

Transcript of Tema1 ud1-b

Probabilidades y Estadística I

TEMA 1

El análisis estadístico de datos

Probabilidades y Estadística I

Esquema inicial

1. Introducción. 2. Variables y datos. Tipos de datos. 3. Descripción de datos mediante tablas 4. Descripción de datos mediante gráficos. 5. Introducción al análisis exploratorio de datos.

Probabilidades y Estadística I

Esquema inicial

1. Introducción. 2. Variables y datos. Tipos de datos. 3. Descripción de datos mediante tablas. 4. Descripción de datos mediante gráficos. 5. Introducción al análisis exploratorio de datos.

Probabilidades y Estadística I

1. Introducción

Seis objetivos de la Estadística Descriptiva

A. Recoger y organizar datos (observaciones)

(1/2)

B. Esquematizar el comportamiento de los datos mediante tablas, gráficos o dibujos (patrones)

C. Resumir la información en unos pocos datos representativos (síntesis)

Probabilidades y Estadística I

1. Introducción

Seis objetivos de la Estadística Descriptiva

(2/2)

D. Analizar la relación de dependencia entre las componentes de datos multidimensionales (causalidad)

E. Interpretar la información obtenida (aprendizaje)

F. Técnicas de visualización para datos multivariantes (visualización)

Probabilidades y Estadística I

Esquema inicial

1. Introducción. 2. Variables y datos. Tipos de datos. 3. Descripción de datos mediante tablas. 4. Descripción de datos mediante gráficos. 5. Introducción al análisis exploratorio de datos.

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Enunciados genéricos

(1/7)

Sea x1, x2,….., xn un conjunto de n valores numéricos

Sea (x1, y1), (x2, y2),….., (xn, yn)

Sea 1 1 1 2 2 21 2 1 2 1 2( , ,..., ), ( , ,..., ),......, ( , ,..., )n n n

m m mx x x x x x x x x

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Glosario de términos

(2/7)

1. Población (universo, colectivo)

2. Muestra

4. Modalidades

5. Variables estadísticas

3. Carácter Cualitativo

Cuantitativo

Discreta

Continua Modalidades = Rango

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Glosario de términos

(3/7)

1. Población (universo, colectivo)

2. Muestra

4. Modalidades

5. Variables estadísticas

3. Carácter Cualitativo

Cuantitativo

Discreta

Continua Modalidades = Rango

Cuantificación Medida nominal

Medida ordinal

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Glosario de términos

(4/7)

1. Población (universo, colectivo)

2. Muestra

4. Modalidades

5. Variables estadísticas

3. Carácter Cualitativo

Cuantitativo

Discreta

Continua Modalidades = Rango

Medida de intervalo

Medida de razón

Probabilidades y Estadística I

Medida Operaciones posibles

Requisitos Ejemplo.

Nominal Verificar la igualdad de dos modalidades.

Posibilidad de permutar

modalidades

Estado civil, Sexo, nacionalidad.

Ordinal Verificar si una modalidad es mayor

que otra.

Mantenimiento del orden

Gravedad de una lesión.

De intervalo Comparar las diferencias entre dos

modalidades. Unidad constante Temperatura.

De razón Establecer razones entre modalidades Existencia de cero

absoluto Peso, altura...

2. Variables y datos. Tipos de datos (5/7)

Caracteres cualitativos

Caracteres cuantitativos

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos (6/7)

MEDIDA NOMINAL

Relaciones entre medidas

MEDIDA ORDINAL

MEDIDA DE INTERVALO

MEDIDA DE RAZÓN ⊃ ⊃ ⊃

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

NOTACIÓN

(7/7)

1. Población (universo, colectivo)

2. Muestra

4. Modalidades

5. Variables estadísticas

3. Carácter

P

M ⊆ P

C

C1, C2,…., Ck

X

x’1, x’2,…., x’k k valores diferentes

Probabilidades y Estadística I

Esquema inicial

1. Introducción. 2. Variables y datos. Tipos de datos. 3. Descripción de datos mediante tablas (caso unidimensional) 4. Descripción de datos mediante gráficos. 5. Introducción al análisis exploratorio de datos.

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (1/8)

SERIE 1 3, 3, 3, 3, 3, 3, 3, 3, 3, 3

SERIE 2 2, 4, 6, 8, 10, 12

SERIE 3 1, 2, 2, 3, 3, 3, 4, 4, 4, 4

PATRONES NUMÉRICOS

SERIE 4 1, 2, 1, 1, 2, 3, 2, 1, 1, 1

Cte = 3

Xn = 2n n = 1,2,3....

n veces el número “n”

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (2/8)

PATRONES NUMÉRICOS

SERIE 4 Seis “1” Tres “2” Un “3”

REPETICIONES (Tablas)

REPETICIONES (Gráficos)

Probabilidades y Estadística I

Modalidad Frecuencia absoluta

Frecuencia absoluta acumulada

Frecuencia relativa

Frecuencia relativa acumulada

x’ 1 n 1 N 1 =n 1 f 1 = n 1 / n F 1 = f 1

x’ 2 n 2 N 2 =n 1 + n 2 f 2 = n 2 / n F 2 = f 1 + f 2

... ... ... ... ...

x’ i n i N i = n j j

i

= ∑

1 f 1 = n i / n F i = f j

j

i

= ∑

1

...

...

...

...

...

x’ k n k N k = ∑ =

k

j j n

1 f k = n k / n F k = f j

j

n

= ∑

1 = 1

TOTALES n 1

3. Descripción de datos mediante tablas (3/8)

DATOS UNIDIMENSIONALES

Probabilidades y Estadística I

MUESTRA: 20 Alumnos con la asignatura “Probabilidad y Estadística” aprobada

POBLACIÓN: Alumnos de la Facultad de Informática

VARIABLE ESTADÍSTICA: X ≡ nº de convocatorias

RANGO: Rg X = {1,2,3,......}

SERIE: 5, 3, 1, 2, 1, 3, 1, 3, 5, 1, 2, 1, 1, 1, 2, 4, 5, 1, 2, 1

SERIE ORDENADA: 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 5, 5, 5

3. Descripción de datos mediante tablas (4/8)

EJEMPLO 1

Probabilidades y Estadística I

Nº deconvocatorias

Frecuenciaabsoluta

Frecuencia absolutaacumulada

Frecuenciarelativa

Frecuencia relativaacumulada

1 9 9 9/20 = 0.45 0.45

2 4 13 0.20 0.65

3 3 16 0.15 0.80

4 1 17 0.05 0.85

5 3 20 0.15 1

TOTALES 20 1

3. Descripción de datos mediante tablas (5/8)

EJEMPLO 1

Probabilidades y Estadística I

MUESTRA: 20 Alumnos presentados a una convocatoria de la asignatura “Probabilidades y Estadística”

POBLACIÓN: Alumnos de la Facultad de Informática

VARIABLE ESTADÍSTICA: X ≡ calificación en “P y E”

RANGO: Rg X = [0,10]

SERIE: 5.12, 7, 8.62, 6, 2.88, 7.33, 2.08, 2.75, 5.25, 5, 6.88, 5.83, 5, 3.38, 6.25, 6.12, 6, 4.62, 6.62, 8.5

SERIE ORDENADA: 2.08, 2.75, 2.88, 3.88, 4.62, 5, 5, 5.12, 5.25, 5.83, 6, 6, 6.12, 6.25, 6.62, 6.88, 7, 7.33, 8.5, 8.62

3. Descripción de datos mediante tablas (6/8)

EJEMPLO 2

Probabilidades y Estadística I

Calificaciones(clases)

Marcas declase

Frecuenciaabsoluta

Frecuencia absolutaacumulada

Frecuenciarelativa

Frecuencia relativaacumulada

[ 0, 1 ] 0.5 0 0 0 0

( 1, 2 ] 1.5 0 0 0 0

( 2, 3 ] 2.5 3 3 0.15 0.15

( 3, 4 ] 3.5 1 4 0.05 0.20

( 4, 5 ] 4.5 3 7 0.15 0.35

( 5, 6 ] 5.5 5 12 0.25 0.60

( 6, 7 ] 6.5 5 17 0.25 0.85

( 7, 8 ] 7.5 1 18 0.05 0.90

( 8, 9 ] 8.5 2 20 0.10 1

( 9, 10 ] 9.5 0 20 0 1

TOTALES 20 1

3. Descripción de datos mediante tablas (7/8)

EJEMPLO 2

MODALIDADES x’i

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (8/8)

AGRUPAMIENTO EN CLASES

Probabilidades y Estadística I

Esquema inicial

1. Introducción. 2. Variables y datos. Tipos de datos. 3. Descripción de datos mediante tablas. 4. Descripción de datos mediante gráficos (caso unidimensional) 5. Introducción al análisis exploratorio de datos.

Probabilidades y Estadística I

No presentados Aprobados Suspensos

34,09%

48,86%

17,05%

4. Descripción de datos mediante gráficos (1/13)

Medidas nominales. Datos categóricos

1. Diagrama de sectores

VARIABLE ESTADÍSTICA

DISCRETA

Probabilidades y Estadística I

Frec

uenc

ias A

bsol

utas

Continentes

0

10

20

30

40

50

Europa América Asia Africa Oceanía

4. Descripción de datos mediante gráficos (2/13)

Medidas nominales. Datos categóricos

2. Diagrama de rectángulos

VARIABLE ESTADÍSTICA

DISCRETA

Probabilidades y Estadística I 0 10 20 30 40 50

España

Francia

Italia

Bélgica

3. Pictogramas

4. Descripción de datos mediante gráficos (3/13)

Medidas nominales. Datos categóricos

3. Pictogramas

VARIABLE ESTADÍSTICA

DISCRETA

Probabilidades y Estadística I

Medidas ordinales e intervalar/razón

1. Diagrama de barras

4. Descripción de datos mediante gráficos (4/13)

Representación diferencial

VARIABLE ESTADÍSTICA

DISCRETA

Probabilidades y Estadística I

Medidas ordinales e intervalar/razón

2. Función de distribución escalonada

4. Descripción de datos mediante gráficos (5/13)

Representación integral

VARIABLE ESTADÍSTICA

DISCRETA

Probabilidades y Estadística I

4. Descripción de datos mediante gráficos (6/13)

Medidas intervalar/razón

1. Histogramas (polígono de frecuencias)

VARIABLE ESTADÍSTICA

CONTÍNUA

Representación diferencial

Probabilidades y Estadística I

4. Descripción de datos mediante gráficos (7/13)

Medidas intervalar/razón

2. Diagrama tallo-hoja 44, 45, 46, 46, 47, 48, 49, 50, 50, 50, 52, 52, 52, 52, 53, 53, 53, 54, 54, 54, 55, 55, 55, 55, 56, 56, 56, 57, 60, 60, 60, 60 ,60, 61, 61, 62, 62, 63, 64, 64, 64, 65, 65, 65, 66, 67, 68, 68, 68, 70, 70, 70, 70, 71, 72, 72, 74, 75, 80, 93.

Análisis Exploratorio de Datos

Probabilidades y Estadística I

Stem-and-Leaf Display for IPC: unit = 1,0 1|2 represents 12,0

10 0|1222333344 (9) 0|555556779 5 1| 5 1|5

HI|16,3 20,1 32,7 40,5 4 [3’5,4’5)

VALORES ATÍPICOS POR EXCESO

FRECUENCIAS ABSOLUTAS ACUMULADAS

4. Descripción de datos mediante gráficos (8/13)

Probabilidades y Estadística I

IPC

Frec

. Abs

ol

0 4 8 12 16 0

2

4

6

8

10

4. Descripción de datos mediante gráficos (9/13)

Histograma vs. Tallo-hoja

Probabilidades y Estadística I

0 1 2 3 4 0

0,2

0,4

0,6

0,8

1 1,2

4. Descripción de datos mediante gráficos (10/13)

Catálogo de perfiles

Perfil de datos sin tratar

Probabilidades y Estadística I

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

Forma de campana

4. Descripción de datos mediante gráficos (11/13)

Catálogo de perfiles

Probabilidades y Estadística I

0 10 20 30 40 50 600

0,02

0,04

0,06

0,08

0,1

Asimétrico desplazado a la dcha

0 1 2 3 40

0,2

0,4

0,6

0,8

1

1,2

4. Descripción de datos mediante gráficos (12/13)

Catálogo de perfiles

Probabilidades y Estadística I

4. Descripción de datos mediante gráficos (13/13)

Medidas intervalar/razón

3. Función de distribución (polígono acumulativo)

VARIABLE ESTADÍSTICA

CONTÍNUA