Estadística Inferencial I Unidad I II versión 1

54
Estadística Inferencial I Ingeniería Industrial Unidad I: Distribuciones Fundamentales para el Muestreo

Transcript of Estadística Inferencial I Unidad I II versión 1

Page 1: Estadística Inferencial I Unidad I II versión 1

Estadística Inferencial IIngeniería Industrial

Unidad I: DistribucionesFundamentales para

el Muestreo

Page 2: Estadística Inferencial I Unidad I II versión 1

Breve introducción a la inferenciaestadística

• Los medidas de tendencia central, en particular la media sólo cambia en la notación. Las medidas de dispersión (varianza y desviación estándar), cambian.

• s -> desviación estándar muestral.• s -> desviación estándar poblacional.• s 2-> varianza muestral.• s 2-> varianza poblacional.

Page 3: Estadística Inferencial I Unidad I II versión 1

Media poblacional (m)

• Si x1, x2, . . . xN representan la totalidad de las N observaciones de una población, entonces la media poblacional es:

Page 4: Estadística Inferencial I Unidad I II versión 1

Media muestral

• Si x1, x2, . . . xn representan la totalidad de las n observaciones de una muestra, entonces la media muestral es:

Page 5: Estadística Inferencial I Unidad I II versión 1

Varianza poblacional

• Si x1, x2, . . . xN representan la totalidad de las N observaciones de una población, entonces la varianza poblacional es:

Page 6: Estadística Inferencial I Unidad I II versión 1

Varianza muestral

• Si x1, x2, . . . xn representan la totalidad de las n observaciones de una muestra, entonces la media muestral es:

Page 7: Estadística Inferencial I Unidad I II versión 1

Desviación estándard poblacional

Page 8: Estadística Inferencial I Unidad I II versión 1

Desviación estándard muestral

Page 9: Estadística Inferencial I Unidad I II versión 1

Ejercicio

• En la tabla mostrada a continuación se presentan los salarios que disfrutan los jugadores de Los Angeles Lakers de la NBA, calcular las medidas de tendencia central y dispersión necesarias, además de hacer un histograma, una ojiva y un diagrama de caja.

Page 10: Estadística Inferencial I Unidad I II versión 1

EjercicioNo. Nombre Posición Edad Estatura Peso Colegio Salario

5 Steve Blake PG 32 6-3 172 Maryland $4,000,000

24 Kobe Bryant SG 34 6-6 205 $27,849,149

6 Earl Clark SF 25 6-10 225 Louisville $1,240,000

21 Chris Duhon PG 30 6-1 190 Duke $3,500,000

3 Devin Ebanks SF 23 6-9 215 West Virginia $1,054,389

16 Pau Gasol PF 32 7-0 250 $19,000,000

27 Jordan Hill C 25 6-10 235 Arizona $3,563,600

12 Dwight Howard C 27 6-11 265 $19,536,360

4 Antawn Jamison PF 36 6-9 235 North Carolina $854,389

20 Jodie Meeks SG 25 6-4 208 Kentucky $1,500,000

1 Darius Morris PG 22 6-4 190 Michigan $962,195

10 Steve Nash PG 38 6-3 178 Santa Clara $8,900,000

50 Robert Sacre C 23 7-0 260 Gonzaga $473,604

15 Metta World Peace SF 33 6-7 260 St. John's $7,258,960

Page 11: Estadística Inferencial I Unidad I II versión 1

Conceptos básicos• Ejercicio. Se tiene un par de dados, los cuales

se lanzan y todo el universo de resultados es el siguiente

dado 2dado 1

1 2 3 4 5 61 2 3 4 5 6 72 3 4 5 6 7 83 4 5 6 7 8 94 5 6 7 8 9 105 6 7 8 9 10 116 7 8 9 10 11 12

Page 12: Estadística Inferencial I Unidad I II versión 1

Distribución muestral de la media

• Calculando la media para todos los resultados posibles, resulta

Dado 1Dado 2 1 1,5 2 2,5 3 3,5

1,5 2 2,5 3 3,5 42 2,5 3 3,5 4 4,5

2,5 3 3,5 4 4,5 53 3,5 4 4,5 5 5,5

3,5 4 4,5 5 5,5 6

Page 13: Estadística Inferencial I Unidad I II versión 1

Datos de la distribución de medias

n= 36Moda= 3,5

Mediana= 3,5Media= 3,5

Pos 1er Q= 9,25Pos 3er Q= 27,75

1er Q= 2,53er Q= 4,5

Page 14: Estadística Inferencial I Unidad I II versión 1

Distribución muestral de la media

La gráfica anterior muestra un histograma con forma de distribución normal.

Page 15: Estadística Inferencial I Unidad I II versión 1

Diagrama de caja del ejercicio

Page 16: Estadística Inferencial I Unidad I II versión 1

Distribuciones de muestreo

Muestra n

Muestra 1

Población

Muestra 2

Estadístico

Page 17: Estadística Inferencial I Unidad I II versión 1

Estadístico

• Es una medida (de tendencia central o dispersión) calculada de una muestra.

• El estadístico tiene variación dependiendo de la muestra y se considera una variable aleatoria.

Page 18: Estadística Inferencial I Unidad I II versión 1

Distribuciones de muestreo

• Son distribuciones de probabilidad asociadas al estadístico analizado.

• En la repetición del muestreo nos señalan que valores del estadístico puede ocurrir y la frecuencia con la que esto sucede.

Page 19: Estadística Inferencial I Unidad I II versión 1

Distribución de muestreo para un estadístico

• Mendenhall et. al. (2009). Es la distribución de probabilidad para los posibles valores del estadístico que resultan cuando son seleccionadas repetidamente muestras aleatorias de tamaño n de la población.

Page 20: Estadística Inferencial I Unidad I II versión 1

Teorema de límite central para una media

• Walpole [9].Se tiene la media de una muestra aleatoria de tamaño n que se toma de una población con media μ y varianza finita σ2 entonces la forma límite de la distribución de

• Cuando n-> ∞, es la distribución normal estándard

Page 21: Estadística Inferencial I Unidad I II versión 1

Ejemplo

• Lind et. al. Página 299. De acuerdo con un estudio del Internal Revenue Service, los contribuyentes tardan 330 minutos en promedio en preparar, copiar y archivar en un medio electrónico la forma fiscal 1040. Esta distribución de tiempos se rige por una distribución normal, y la desviación estándar es de 80 minutos.

Page 22: Estadística Inferencial I Unidad I II versión 1

Ejemplo

• Un organismo de control selecciona una muestra aleatoria de 40 consumidores.1. ¿Cuál es la probabilidad de que la media de la

muestra sea mayor que 320 minutos?2. ¿Cuál es la probabilidad de que la media de la

muestra este entre 320 y 350 minutos?3. ¿Cuál es la probabilidad de que la media de la

muestra sea superior a 350 minutos?

Page 23: Estadística Inferencial I Unidad I II versión 1

Ejercicio

• Un horno de tratamientos térmicos entrega engranes de acero SAE 8620 con una dureza superficial promedio de 58 en la escala Rockwell C. La desviación estándar es s=15

Page 24: Estadística Inferencial I Unidad I II versión 1

Ejemplo

– ¿Cuál es la probabilidad de que una muestra aleatoria de 40 de estos engranes tenga una dureza superficial promedio mayor a 60? – ¿La probabilidad de tener una dureza

superficial promedio entre 57 y 61? – ¿La probabilidad de una dureza superficial

promedio menor a 56 ?

Page 25: Estadística Inferencial I Unidad I II versión 1

A partir de las expresiones

𝑃ቀ−𝑧𝛼 2ൗ�< 𝑍< 𝑧𝛼 2ൗ�ቁ= 1− 𝛼

𝑃ቌ−𝑧𝛼 2ൗ�< 𝑋− 𝜇𝜎ξ𝑛ൗ�< 𝑧𝛼 2ൗ�ቍ= 1−𝛼

Se puede calcular el tamaño de la muestra considerando el error (e) usando la siguiente fórmula:

𝑛 = 𝑧𝛼 2ൗ�𝜎𝑒 ൨2

Page 26: Estadística Inferencial I Unidad I II versión 1

Teorema límite central diferencia de medias

• Walpole [9]. Si se sacan al azar muestras independientes de tamaños n1 y n2 de dos poblaciones discretas o continuas, con medias μ1 y μ2 y varianzas σ2

1y σ22 respectivamente,

entonces la distribución muestral de la diferencia de medias está distribuida aproximadamente en forma normal con media y varianzas:

Page 27: Estadística Inferencial I Unidad I II versión 1

Teorema límite central 2 medias

• Es aproximadamente la distribución normal estándar

Page 28: Estadística Inferencial I Unidad I II versión 1

Ejemplo

• [Walpole, ejercicio 6-14]. La calificación promedio para estudiantes de primer año en una prueba de aptitudes, en cierta universidad, es 540, con una desviación estándar de 50. ¿Cuál es la probabilidad de que dos grupos de estudiantes seleccionados aleatoriamente, consistentes en 32 y 50 estudiantes, respectivamente, difiera en sus calificaciones promedio por

Page 29: Estadística Inferencial I Unidad I II versión 1

Ejercicio

a) más de 20 puntosb) Una cantidad entre 5 y 10 puntos?

Datos:

Page 30: Estadística Inferencial I Unidad I II versión 1

Distribución c2

• Teorema,Walpole [9]. Si s2 es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene la varianza σ2, entonces el estadístico:

tiene una distribución c2 con n = n − 1 grados de libertad.

Page 31: Estadística Inferencial I Unidad I II versión 1

Distribución c2

• La distribución c2 posee las siguientes propiedades, Bowerman [1]:

• 1) La curva es sesgada a la derecha..• 2) La curva solo tiene valores positivos.• 3) Depende de los grados de libertad n.

Page 32: Estadística Inferencial I Unidad I II versión 1

Distribución c2

• Ejemplo. Walpole, ejercicio propuesto 1, página 237. Para una distribución c2 encuentre.– c 0.025

2 cuando n=15;

– c 0.012 Cuando n=7;

– c 0.052 Cuando n=24;

– c 0.9952 Cuando n=9;

– c 0.992 Cuando n=3;

Page 33: Estadística Inferencial I Unidad I II versión 1

En Excel

Usar comando prueba.chi(valora, grados de libertad n)

Page 34: Estadística Inferencial I Unidad I II versión 1

Ejemplo

• Walpole, ejercicio propuesto 5, página 237. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal con varianza s2=6, tenga una varianza s2

– mayor a 9.1;– Entre 3.462 y 10.745.

Page 35: Estadística Inferencial I Unidad I II versión 1

Encontrando la probabilidad a

Usar comando distr.chi(valor c2, grados de libertad)

Page 36: Estadística Inferencial I Unidad I II versión 1

Distribución t (Student)

• La distribución t posee las siguientes propiedades, Bowerman [1]:

1) La curva es simétrica y en forma de campana x = μ..

2) La curva es simétrica con respecto a la media μ = 0.

3) La desviación estándar siempre es σ > 1, y depende de los grados de libertad n.

Page 37: Estadística Inferencial I Unidad I II versión 1

Distribución t

Page 38: Estadística Inferencial I Unidad I II versión 1

Distribución t

Page 39: Estadística Inferencial I Unidad I II versión 1

Distribución t

Desarrollando

Page 40: Estadística Inferencial I Unidad I II versión 1

Distribución t

Page 41: Estadística Inferencial I Unidad I II versión 1

Distribución t

Resulta en

Page 42: Estadística Inferencial I Unidad I II versión 1

Distribución t

• Ejemplo. Walpole, ejercicio propuesto 8, página 238. Para una distribución t encuentre.

– t0.025 cuando n=14;

– -t0.01 cuando n=10;

– t0.05 cuando n=7.

Page 43: Estadística Inferencial I Unidad I II versión 1

Ejemplo

• Walpole, ejercicio propuesto 12, página 238. Una compañía manufacturera asegura que las baterías utilizadas en sus juegos electrónicos duran un promedio de 30 horas. Para conservar este promedio se prueban 16 baterías mensualmente. Si el valor calculado de t cae entre –t0.025 y t0.025, la compañía esta satisfecha con la afirmación.

Page 44: Estadística Inferencial I Unidad I II versión 1

Ejemplo

• ¿Qué conclusión sacaría la empresa con una muestra que tiene una media muestral de 27.5 horas y una desviación estándar s=5 horas? Suponga que la distribución de las duraciones de la batería es aproximadamente normal.

Page 45: Estadística Inferencial I Unidad I II versión 1

Distribución F

• La distribución F se define como la relación de dos variables aleatorias c2 independientes (U y V), cada una dividida por su número de grados de libertad, esto se puede escribir

Page 46: Estadística Inferencial I Unidad I II versión 1

Distribución F

• donde U y V son variables aleatorias independientes que tienen una distribución c2 con n1 y n2 grados de libertad, respectivamente

Page 47: Estadística Inferencial I Unidad I II versión 1

Distribución F

• La distribución F posee las siguientes propiedades, Bowerman [1]:

1) La curva es sesgada a la derecha.2) La curva solo tiene valores positivos.3) Depende de los grados de libertad n1 y n2

Page 48: Estadística Inferencial I Unidad I II versión 1

Distribución F

• Teorema. Walpole[9]. Si se escribe fa (n1 , n2 ) para fa con n1 y n2 grados de libertad, se obtiene:

Page 49: Estadística Inferencial I Unidad I II versión 1

Distribución F

• Teorema. Walpole[9]. Si s21 y s2

2 son las varianzas de variables aleatorias independientes de tamaños n1 y n2 que se sacan de poblaciones normales con varianzas, respectivamente entonces

tiene una distribución F con n1 = n1 − 1 y

n2 = n2 − 1.

Page 50: Estadística Inferencial I Unidad I II versión 1

Distribución F

• Ejemplo. Walpole, ejercicio propuesto 15, página 238. Para una distribución F encuentre:– f0.05 con n1=7 y n2=5;

– f0.05 con n1=15 y n2=7;

– f0.01 con n1=24 y n2=19;

– f0.95 con n1=19 y n2=24;

– f0.99 con n1=28 y n2=12.

Page 51: Estadística Inferencial I Unidad I II versión 1

Bibliografía y referencias

• Anderson, David R.; Sweeney, Dennis J.; Williams, Thomas A. (2012). Estadística para negocios y economía. 11a.edición. Cengage Learning Latinoamerica. México.

• Bowerman, Bruce L., O’Connell, Richard T., Murphree, Emily S. (2009). Business Statistics in Practice. 5th. Edition. McGraw-Hill Irwin. New York, U.S.A.

Page 52: Estadística Inferencial I Unidad I II versión 1

Bibliografía y referencias

• Bowerman, Bruce L., O’Connell, Richard T., Koehler, Anne B. (2006). Pronósticos, Series de Tiempo y regresión. 4a. Edición. Thomson Learning. México.

• Gutiérrez Pulido, Humberto; De la Vara Salazar, Román. (2008). Análisis y Diseño de Experimentos.2ª. edición McGraw-Hill/Interamericana. México.

Page 53: Estadística Inferencial I Unidad I II versión 1

Bibliografía y referencias

• Lind, Douglas, Marchal, William G., Wathen, Samuel, A. (2008). Estadística aplicada a los negociosy la economía. 15ª edición. McGraw-Hill Interamericana. México.

• Mendenhall, William, Robert J. Beaver, Barbara M. Beaver. (2006). Introducción a la probabilidad y estadística. 13ª. Edición. Cengage Learning. México.

Page 54: Estadística Inferencial I Unidad I II versión 1

Bibliografía y referencias

• Walpole, Roland E.; Raymond H. Myers, Sharon L. Myers, Keying Ye (2012). Probabilidad y Estadística. 9ª. Edición. Pearson Educación de México. México