Estadística Inferencial I Unidad I II versión 1

Post on 27-Nov-2015

355 views 0 download

Transcript of Estadística Inferencial I Unidad I II versión 1

Estadística Inferencial IIngeniería Industrial

Unidad I: DistribucionesFundamentales para

el Muestreo

Breve introducción a la inferenciaestadística

• Los medidas de tendencia central, en particular la media sólo cambia en la notación. Las medidas de dispersión (varianza y desviación estándar), cambian.

• s -> desviación estándar muestral.• s -> desviación estándar poblacional.• s 2-> varianza muestral.• s 2-> varianza poblacional.

Media poblacional (m)

• Si x1, x2, . . . xN representan la totalidad de las N observaciones de una población, entonces la media poblacional es:

Media muestral

• Si x1, x2, . . . xn representan la totalidad de las n observaciones de una muestra, entonces la media muestral es:

Varianza poblacional

• Si x1, x2, . . . xN representan la totalidad de las N observaciones de una población, entonces la varianza poblacional es:

Varianza muestral

• Si x1, x2, . . . xn representan la totalidad de las n observaciones de una muestra, entonces la media muestral es:

Desviación estándard poblacional

Desviación estándard muestral

Ejercicio

• En la tabla mostrada a continuación se presentan los salarios que disfrutan los jugadores de Los Angeles Lakers de la NBA, calcular las medidas de tendencia central y dispersión necesarias, además de hacer un histograma, una ojiva y un diagrama de caja.

EjercicioNo. Nombre Posición Edad Estatura Peso Colegio Salario

5 Steve Blake PG 32 6-3 172 Maryland $4,000,000

24 Kobe Bryant SG 34 6-6 205 $27,849,149

6 Earl Clark SF 25 6-10 225 Louisville $1,240,000

21 Chris Duhon PG 30 6-1 190 Duke $3,500,000

3 Devin Ebanks SF 23 6-9 215 West Virginia $1,054,389

16 Pau Gasol PF 32 7-0 250 $19,000,000

27 Jordan Hill C 25 6-10 235 Arizona $3,563,600

12 Dwight Howard C 27 6-11 265 $19,536,360

4 Antawn Jamison PF 36 6-9 235 North Carolina $854,389

20 Jodie Meeks SG 25 6-4 208 Kentucky $1,500,000

1 Darius Morris PG 22 6-4 190 Michigan $962,195

10 Steve Nash PG 38 6-3 178 Santa Clara $8,900,000

50 Robert Sacre C 23 7-0 260 Gonzaga $473,604

15 Metta World Peace SF 33 6-7 260 St. John's $7,258,960

Conceptos básicos• Ejercicio. Se tiene un par de dados, los cuales

se lanzan y todo el universo de resultados es el siguiente

dado 2dado 1

1 2 3 4 5 61 2 3 4 5 6 72 3 4 5 6 7 83 4 5 6 7 8 94 5 6 7 8 9 105 6 7 8 9 10 116 7 8 9 10 11 12

Distribución muestral de la media

• Calculando la media para todos los resultados posibles, resulta

Dado 1Dado 2 1 1,5 2 2,5 3 3,5

1,5 2 2,5 3 3,5 42 2,5 3 3,5 4 4,5

2,5 3 3,5 4 4,5 53 3,5 4 4,5 5 5,5

3,5 4 4,5 5 5,5 6

Datos de la distribución de medias

n= 36Moda= 3,5

Mediana= 3,5Media= 3,5

Pos 1er Q= 9,25Pos 3er Q= 27,75

1er Q= 2,53er Q= 4,5

Distribución muestral de la media

La gráfica anterior muestra un histograma con forma de distribución normal.

Diagrama de caja del ejercicio

Distribuciones de muestreo

Muestra n

Muestra 1

Población

Muestra 2

Estadístico

Estadístico

• Es una medida (de tendencia central o dispersión) calculada de una muestra.

• El estadístico tiene variación dependiendo de la muestra y se considera una variable aleatoria.

Distribuciones de muestreo

• Son distribuciones de probabilidad asociadas al estadístico analizado.

• En la repetición del muestreo nos señalan que valores del estadístico puede ocurrir y la frecuencia con la que esto sucede.

Distribución de muestreo para un estadístico

• Mendenhall et. al. (2009). Es la distribución de probabilidad para los posibles valores del estadístico que resultan cuando son seleccionadas repetidamente muestras aleatorias de tamaño n de la población.

Teorema de límite central para una media

• Walpole [9].Se tiene la media de una muestra aleatoria de tamaño n que se toma de una población con media μ y varianza finita σ2 entonces la forma límite de la distribución de

• Cuando n-> ∞, es la distribución normal estándard

Ejemplo

• Lind et. al. Página 299. De acuerdo con un estudio del Internal Revenue Service, los contribuyentes tardan 330 minutos en promedio en preparar, copiar y archivar en un medio electrónico la forma fiscal 1040. Esta distribución de tiempos se rige por una distribución normal, y la desviación estándar es de 80 minutos.

Ejemplo

• Un organismo de control selecciona una muestra aleatoria de 40 consumidores.1. ¿Cuál es la probabilidad de que la media de la

muestra sea mayor que 320 minutos?2. ¿Cuál es la probabilidad de que la media de la

muestra este entre 320 y 350 minutos?3. ¿Cuál es la probabilidad de que la media de la

muestra sea superior a 350 minutos?

Ejercicio

• Un horno de tratamientos térmicos entrega engranes de acero SAE 8620 con una dureza superficial promedio de 58 en la escala Rockwell C. La desviación estándar es s=15

Ejemplo

– ¿Cuál es la probabilidad de que una muestra aleatoria de 40 de estos engranes tenga una dureza superficial promedio mayor a 60? – ¿La probabilidad de tener una dureza

superficial promedio entre 57 y 61? – ¿La probabilidad de una dureza superficial

promedio menor a 56 ?

A partir de las expresiones

𝑃ቀ−𝑧𝛼 2ൗ�< 𝑍< 𝑧𝛼 2ൗ�ቁ= 1− 𝛼

𝑃ቌ−𝑧𝛼 2ൗ�< 𝑋− 𝜇𝜎ξ𝑛ൗ�< 𝑧𝛼 2ൗ�ቍ= 1−𝛼

Se puede calcular el tamaño de la muestra considerando el error (e) usando la siguiente fórmula:

𝑛 = 𝑧𝛼 2ൗ�𝜎𝑒 ൨2

Teorema límite central diferencia de medias

• Walpole [9]. Si se sacan al azar muestras independientes de tamaños n1 y n2 de dos poblaciones discretas o continuas, con medias μ1 y μ2 y varianzas σ2

1y σ22 respectivamente,

entonces la distribución muestral de la diferencia de medias está distribuida aproximadamente en forma normal con media y varianzas:

Teorema límite central 2 medias

• Es aproximadamente la distribución normal estándar

Ejemplo

• [Walpole, ejercicio 6-14]. La calificación promedio para estudiantes de primer año en una prueba de aptitudes, en cierta universidad, es 540, con una desviación estándar de 50. ¿Cuál es la probabilidad de que dos grupos de estudiantes seleccionados aleatoriamente, consistentes en 32 y 50 estudiantes, respectivamente, difiera en sus calificaciones promedio por

Ejercicio

a) más de 20 puntosb) Una cantidad entre 5 y 10 puntos?

Datos:

Distribución c2

• Teorema,Walpole [9]. Si s2 es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene la varianza σ2, entonces el estadístico:

tiene una distribución c2 con n = n − 1 grados de libertad.

Distribución c2

• La distribución c2 posee las siguientes propiedades, Bowerman [1]:

• 1) La curva es sesgada a la derecha..• 2) La curva solo tiene valores positivos.• 3) Depende de los grados de libertad n.

Distribución c2

• Ejemplo. Walpole, ejercicio propuesto 1, página 237. Para una distribución c2 encuentre.– c 0.025

2 cuando n=15;

– c 0.012 Cuando n=7;

– c 0.052 Cuando n=24;

– c 0.9952 Cuando n=9;

– c 0.992 Cuando n=3;

En Excel

Usar comando prueba.chi(valora, grados de libertad n)

Ejemplo

• Walpole, ejercicio propuesto 5, página 237. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal con varianza s2=6, tenga una varianza s2

– mayor a 9.1;– Entre 3.462 y 10.745.

Encontrando la probabilidad a

Usar comando distr.chi(valor c2, grados de libertad)

Distribución t (Student)

• La distribución t posee las siguientes propiedades, Bowerman [1]:

1) La curva es simétrica y en forma de campana x = μ..

2) La curva es simétrica con respecto a la media μ = 0.

3) La desviación estándar siempre es σ > 1, y depende de los grados de libertad n.

Distribución t

Distribución t

Distribución t

Desarrollando

Distribución t

Distribución t

Resulta en

Distribución t

• Ejemplo. Walpole, ejercicio propuesto 8, página 238. Para una distribución t encuentre.

– t0.025 cuando n=14;

– -t0.01 cuando n=10;

– t0.05 cuando n=7.

Ejemplo

• Walpole, ejercicio propuesto 12, página 238. Una compañía manufacturera asegura que las baterías utilizadas en sus juegos electrónicos duran un promedio de 30 horas. Para conservar este promedio se prueban 16 baterías mensualmente. Si el valor calculado de t cae entre –t0.025 y t0.025, la compañía esta satisfecha con la afirmación.

Ejemplo

• ¿Qué conclusión sacaría la empresa con una muestra que tiene una media muestral de 27.5 horas y una desviación estándar s=5 horas? Suponga que la distribución de las duraciones de la batería es aproximadamente normal.

Distribución F

• La distribución F se define como la relación de dos variables aleatorias c2 independientes (U y V), cada una dividida por su número de grados de libertad, esto se puede escribir

Distribución F

• donde U y V son variables aleatorias independientes que tienen una distribución c2 con n1 y n2 grados de libertad, respectivamente

Distribución F

• La distribución F posee las siguientes propiedades, Bowerman [1]:

1) La curva es sesgada a la derecha.2) La curva solo tiene valores positivos.3) Depende de los grados de libertad n1 y n2

Distribución F

• Teorema. Walpole[9]. Si se escribe fa (n1 , n2 ) para fa con n1 y n2 grados de libertad, se obtiene:

Distribución F

• Teorema. Walpole[9]. Si s21 y s2

2 son las varianzas de variables aleatorias independientes de tamaños n1 y n2 que se sacan de poblaciones normales con varianzas, respectivamente entonces

tiene una distribución F con n1 = n1 − 1 y

n2 = n2 − 1.

Distribución F

• Ejemplo. Walpole, ejercicio propuesto 15, página 238. Para una distribución F encuentre:– f0.05 con n1=7 y n2=5;

– f0.05 con n1=15 y n2=7;

– f0.01 con n1=24 y n2=19;

– f0.95 con n1=19 y n2=24;

– f0.99 con n1=28 y n2=12.

Bibliografía y referencias

• Anderson, David R.; Sweeney, Dennis J.; Williams, Thomas A. (2012). Estadística para negocios y economía. 11a.edición. Cengage Learning Latinoamerica. México.

• Bowerman, Bruce L., O’Connell, Richard T., Murphree, Emily S. (2009). Business Statistics in Practice. 5th. Edition. McGraw-Hill Irwin. New York, U.S.A.

Bibliografía y referencias

• Bowerman, Bruce L., O’Connell, Richard T., Koehler, Anne B. (2006). Pronósticos, Series de Tiempo y regresión. 4a. Edición. Thomson Learning. México.

• Gutiérrez Pulido, Humberto; De la Vara Salazar, Román. (2008). Análisis y Diseño de Experimentos.2ª. edición McGraw-Hill/Interamericana. México.

Bibliografía y referencias

• Lind, Douglas, Marchal, William G., Wathen, Samuel, A. (2008). Estadística aplicada a los negociosy la economía. 15ª edición. McGraw-Hill Interamericana. México.

• Mendenhall, William, Robert J. Beaver, Barbara M. Beaver. (2006). Introducción a la probabilidad y estadística. 13ª. Edición. Cengage Learning. México.

Bibliografía y referencias

• Walpole, Roland E.; Raymond H. Myers, Sharon L. Myers, Keying Ye (2012). Probabilidad y Estadística. 9ª. Edición. Pearson Educación de México. México