MIN 220 Semana2b

21
MIN-220 Simulación Semana 2 Elementos de Probabilidades y Estadística Profesor: Víctor Encina M. [email protected]

description

Simulación.

Transcript of MIN 220 Semana2b

MIN-220 Simulación

Semana 2 Elementos de Probabilidades y Estadística

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de Chile

Profesor: Víctor Encina M. [email protected]

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de ChileHoy: Estadística

• Generalidades • Estudio Estadístico • Variables Estadísticas • Representación Gráfica • Funciones de probabilidad y densidad • Estadígrafos

– Tendencia Central – Localización – Dispersión

• Estimadores estadísticos • Covarianza y Correlación

MIN-220 Simulación 2

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de ChileGeneralidades

Estadística La ESTADÍSTICA es una rama del método científico que se ocupa del manejo de datos empíricos para hacerlos comprensibles

Las ESTADÍSTICAS (en plural) son el conjunto de datos observados o registrados respecto de alguna población objeto de estudio

En Estadística se estudian propiedades de POBLACIONES, es decir, del conjuntos de elementos que la componen. Las propiedades que caracterizan a los INDIVIDUOS u OBSERVACIONES particulares de la población, se denominan VARIABLES ESTADÍSTICAS.

3 MIN-220 Simulación MIN-220 Simulación

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de Chile

4 MIN-220 Simulación MIN-220 Simulación

Estudio Estadístico

Definir la Población

Recolectar Datos

¿Censo o Muestra?

Describir los Datos

¿Tablas, Gráficos,

Estadígrafos?

Decisiones Pronósticos

Interpretación

¿Modelo?

Inferencia Estadística

Estadística Descriptiva

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de ChileVariables Estadísticas

5

Las Poblaciones pueden estudiarse o representarse por: • Variables Cualitativas

– Nominales: Categorías, i.e.: género, estado civil, nacionalidad, color, tamaño, etc.

– Ordinales: Propiedades cualitativas a las cuales se les asigna un código numérico que se puede ordenar, i.e.: clasificación de hoteles, obras musicales o de cine con 1 a 5 estrellas, etc.

• Variables Cuantitativas – Discretas: Propiedades que se representan por conjuntos finitos de números

enteros o infinitos pero numerables, i.e.: cantidad de hijos, notas 1 a 7, alumnos por curso, año de ingreso, etc.

– Continuas: Propiedades que se representan por números reales o por conjuntos de elementos no numerables i.e.: edad, notas 0 a 100%, puntaje PSU, renta, etc.

Las variables cuantitativas se pueden transformar en variables cualitativas nominales u ordinales, pero no se puede hacer lo contrario, excepto para efectos de codificarlas.

MIN-220 Simulación

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de ChileGráficas de

Distribución de Frecuencia

6

• Frecuencia Absoluta – Es la cantidad de veces

que se repite u observa una determinada propiedad de los individuos de la población en estudio.

– Normalmente se representa como un diagrama de barras

MIN-220 Simulación

Cantidad de hijos 0 1 2 3 4 5 6 7 8

Frecuencia Absoluta 92 138 230 138 46 46 23 14 4

HISTOGRAMA

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de ChileGráficas de

Distribución de Frecuencia

7

• Frecuencia Relativa – Es la proporción en que se repite

u observa una determinada propiedad de los individuos de la población en estudio.

– Normalmente se expresa en porcentaje

– Sirve para comparar distintas poblaciones con diferente cantidad de observaciones en que los valores absolutos no son comparables

MIN-220 Simulación

HISTOGRAMA Cantidad de hijos 0 1 2 3 4 5 6 7 8 TOTAL

Frecuencia Absoluta 92 138 230 138 46 46 23 14 4 731

Frecuencia Relativa 12,6% 18,9% 31,5% 18,9% 6,3% 6,3% 3,1% 1,9% 0,5% 100%

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de ChileGráficas de

Distribución de Frecuencia

8

• Frecuencia Acumulada – Se obtiene simplemente

sumando las frecuencias de cada propiedad a todas las anteriores

– No se usa en variables nominales, porque la suma no tiene sentido

– Sirve para responder preguntas como que proporción de la población está sobre o bajo cierta condición.

MIN-220 Simulación

Cantidad de hijos 0 1 2 3 4 5 6 7 8 TOTAL

Frecuencia Absoluta 92 138 230 138 46 46 23 14 4 731

Frecuencia Relativa 12,6% 18,9% 31,5% 18,9% 6,3% 6,3% 3,1% 1,9% 0,5% 100%

Frecuencia Acumulada 12,6% 31,5% 62,9% 81,8% 88,1% 94,4% 97,5% 99,5% 100,0%

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de ChileGráficas de

Distribución de Frecuencia

9

• Las variables continuas se “discretizan” en clases, tramos o rangos • Las barras quedan en contacto

MIN-220 Simulación

Clase 0<x≤2 2<x≤4 4<x≤6 6<x≤8 8<x≤10 10<x≤12 12<x≤14 14<x≤16 16<x≤18

Centro de clase 1 3 5 7 9 11 13 15 17

Frecuencia Absoluta 2291 1077 684 462 228 115 69 53 21 5000

Frecuencia Relativa 46% 22% 14% 9% 5% 2% 1% 1% 0% 100%

Frecuencia Acumulada 46% 67% 81% 90% 95% 97% 99% 100% 100%

Fallas por lote 20 de unidades

TOTAL

0%

10%

20%

30%

40%

50%

1 3 5 7 9 11 13 15 17

Fre

cue

nci

a R

ela

tiva

Unidades

Fallas por lote 20 de unidades

0%

20%

40%

60%

80%

100%

120%

1 3 5 7 9 11 13 15 17

Fre

cue

nci

a A

cum

ula

da

Unidades

Fallas por lote 20 de unidades

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de Chile

Probabilidad Acumulada y Densidad de Probabilidad

10

• En general, las curva de probabilidad acumulada se denomina “función de probabilidad” y se representa por:

• A su vez, la derivada de

se denomina “densidad de probabilidad” y se representa por:

MIN-220 Simulación

𝐹𝑋 𝑥 = 𝑃𝑟𝑜𝑏 𝑋 ≤ 𝑥

𝐹𝑋(𝑥)

𝑓𝑋 𝑥 =𝑑𝐹𝑋(𝑥)

𝑑𝑥

𝐹𝑋 𝑥 = 𝑃𝑟𝑜𝑏 𝑋 ≤ 𝑥

𝑓𝑋 𝑥 =𝑑𝐹𝑋(𝑥)

𝑑𝑥

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de Chile

Caracterización numérica de muestras y poblaciones

11 MIN-220 Simulación

En estadística se definen ciertos indicadores numéricos para representar algunas características de las poblaciones o sus muestras. En el caso de las muestras, dichos indicadores se

denominan “estadígrafos” En el caso de las poblaciones, se llaman “parámetros

estadísticos”.

Los indicadores más usados son los de: Tendencia central Localización Dispersión

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de Chile

Estadígrafos de tendencia central

12 MIN-220 Simulación

El principal indicador de tendencia central es…

– Valor Esperado = Media = μ:

• Representa el valor medio de la v.a. X

Otros estimadores de tendencia central son: – Mediana: Valor que divide

la muestra o población en iguales cantidades de especímenes con valor mayor y menor a la mediana

– Moda: Es el valor “más frecuente” , el que más se repite

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de Chile

Un caso particular de E(X) es el de una v.a. equiprobable en que la media es el simple PROMEDIO

Estadígrafos de tendencia central

13 MIN-220 Simulación

𝐸 𝑋 = 𝑥 ∙ 𝑓𝑋 𝑥 ∞

−∞

∙ 𝑑𝑥

Si X es una v.a. discreta

Media o Esperanza de X Si X es v.a. continua:

𝐸 𝑋 = 𝑥𝑖 ∙ 𝑝𝑋 (𝑥𝑖)

𝑖

En que:

𝑝𝑋 𝑥𝑖 = 𝑃𝑟𝑜𝑏 𝑋 = 𝑥𝑖

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de Chile Estadígrafos de localización

14 MIN-220 Simulación

• Cuantiles: Valores que dividen el conjunto de datos en partes iguales – Cuartiles (1/4): Cada parte 25% – Quintiles (1/5): Cada parte 20% – Deciles (1/10): Cada parte 10%

• Multi-modas: Valores que representan una o más “modas” en una misma distribución. – Conviene descubrir las variables

y distribuciones uni-modales que la componen.

Distribución multimodal

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de Chile

Estadígrafos de dispersión o “variabilidad”

15 MIN-220 Simulación

El principal indicador de dispersión es…

– La desviación estándar = σ:

• Representa la “diferencia media” respecto de la media μ

Otros estimadores de dispersión son: – Rango:

• Diferencia entre el mayor y menor valor de la variable

– Rango intercuartil (RIC):

• Diferencia entre tercer y primer cuartil (Q3-Q1)

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de Chile Estadígrafos de dispersión

16 MIN-220 Simulación

Si X es una v.a. discreta

Varianza de X: Media de la diferencia cuadrática

En que:

𝑝𝑋 𝑥𝑖 = 𝑃𝑟𝑜𝑏 𝑋 = 𝑥𝑖

𝜎𝑋2 = 𝐸 𝑥 − 𝐸(𝑋) 2 = 𝐸 𝑥 − 𝜇𝑋 2

𝜎𝑋2 = 𝑥𝑖 − 𝐸 𝑋

2

𝑖

∙ 𝑝𝑋 𝑥𝑖

Si X es una v.a. continua

𝜎𝑋2 = 𝑥 − 𝐸 𝑋

2∞

−∞

∙ 𝑓𝑋 𝑥 ∙ 𝑑𝑥

Desviación estándar: …es la raíz cuadrada de la varianza.

𝜎𝑋 = 𝜎𝑋2

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de Chile Estimadores estadísticos

17 MIN-220 Simulación

Siendo X una v.a. con n observaciones independientes: x1, x2, x3… se definen los 2 siguientes estimadores estadísticos:

De la media

De la varianza

𝑋 𝑛 = 𝑥𝑖

𝑛1

𝑛≈ 𝜇

𝑆𝑋2 𝑛 =

𝑥𝑖 − 𝑋 (𝑛) 2𝑛1

𝑛 − 1≈ 𝜎2

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de Chile Covarianza y correlación

18 MIN-220 Simulación

La covarianza de 2 variables aleatorias X e Y es una “medida” de dependencia lineal entre ambas.

La Covarianza es positiva si una de las 2 variables toma valores grandes o pequeños la otra también lo hace:

𝑐𝑜𝑣 𝑋, 𝑌 = 𝐸 𝑋 − 𝜇𝑋 ∙ 𝑌 − 𝜇𝑌

La Covarianza es negativa si una de las 2 variables toma valores grandes o pequeños la otra hace lo contrario:

𝑋 > 𝜇𝑥 , 𝑌 > 𝜇𝑌 𝑋 < 𝜇𝑥 , 𝑌 < 𝜇𝑌

𝑋 > 𝜇𝑥 , 𝑌 < 𝜇𝑌 𝑋 < 𝜇𝑥 , 𝑌 > 𝜇𝑌

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de Chile Covarianza y correlación

19 MIN-220 Simulación

Se denomina coeficiente de correlación a la razón entre covarianza y el producto de desviaciones estándar:

El coeficiente de correlación toma valores entre

𝜌𝑋 ,𝑌 =𝑐𝑜𝑣(𝑋, 𝑌)

𝜎𝑋 ∙ 𝜎𝑌

−1 ≤ 𝜌𝑋 ,𝑌 ≤ +1

𝜌𝑋 ,𝑌 ≈ +1

𝜌𝑋 ,𝑌 ≈ −1

Fuertemente correlacionadas positivamente

𝜌𝑋 ,𝑌 = 0 No hay Correlación

Fuertemente correlacionadas negativamente

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de Chile Distribución Normal

20 MIN-220 Simulación

MIN-102 Industria Minera

Semana 2 Elementos de Probabilidades y Estadística

Carrera de Ingeniería Civil de MinasCampus San Joaquín, Santiago de Chile

Profesor: Víctor Encina M. [email protected]