Tarea de Estadistica

17
1° Tema: Combinaciones Formulación del problema Un grupo escolar consta de 16 alumnos. Es necesario formar simultáneamente 3 equipos con ellos, uno de 5 alumnos para ir a la Cruz Roja, otro de 3 alumnos para visitar el Hospital y el tercero de 2 alumnos para ir al Banco. ¿De cuántas maneras se pueden distribuir? Planteamiento El primer equipo de 5 alumnos se puede seleccionar de entre los 16 que hay en el grupo escolar; una vez formado ese primer equipo, quedan solamente 11 alumnos de entre los cuales debe integrarse el segundo equipo con tres de ellos; una vez formado ese segundo equipo, quedan solamente 8 alumnos de entre los cuales debe integrarse el tercer equipo con dos de ellos. Solución De manera que 16C 5 × 11 C 3 × 8 C 2 16 ! 5 !( 16 5) ! x 11 ! 3 ! ( 11 3) ! x 8 ! 8 ! ( 82) ! = 4368 ×165 × 28 = 20 180 160 Interpretación de resultados: Se puede distribuir de 20 180 160 maneras para formar los equipos. 2° Tema: Variable Aleatoria Formulación del problema

description

ESTADISTICA

Transcript of Tarea de Estadistica

Page 1: Tarea de Estadistica

1° Tema: Combinaciones

Formulación del problema

Un grupo escolar consta de 16 alumnos. Es necesario formar simultáneamente 3 equipos con ellos, uno de 5 alumnos para ir a la Cruz Roja, otro de 3 alumnos para visitar el Hospital y el tercero de 2 alumnos para ir al Banco. ¿De cuántas maneras se pueden distribuir?

Planteamiento

El primer equipo de 5 alumnos se puede seleccionar de entre los 16 que hay en el grupo escolar; una vez formado ese primer equipo, quedan solamente 11 alumnos de entre los cuales debe integrarse el segundo equipo con tres de ellos; una vez formado ese segundo equipo, quedan solamente 8 alumnos de entre los cuales debe integrarse el tercer equipo con dos de ellos.

Solución

De manera que

16C5 ×11 C3 × 8C2

16 !5! (16−5)!

x11!

3! (11−3)!x

8 !8 !(8−2)!

= 4368 ×165 × 28 = 20 180 160

Interpretación de resultados:

Se puede distribuir de 20 180 160 maneras para formar los equipos.

2° Tema: Variable Aleatoria

Formulación del problema

En el punto de partida de un laberinto hay tres orificios iguales A, B y C. Si la rata eligeA vuelve al punto de partida después de recorrer dos metros. Si elige B recorre cinco metros y vuelve al mismo punto. Si elige C sale al exterior recorriendo un metro. ¿Por término medio que distancia recorre una rata antes de salir, si siempre elige un orificio distinto de los seleccionados en veces anteriores?

Page 2: Tarea de Estadistica

Planteamiento

Los itinerarios que pueden darse con las distancias recorridas en cada caso, son (A, B, C) 8, (B, A, C) 8, (A, C) 3, (B, C) 6, (C) 1.

Solución:

Sus probabilidades serían:

P (A, B, C) = P (A) · P (B/A) · P(C/A∩B) = 1/3 · 1/2 · 1 = 1/6P (B, A, C) = P (B) · P (A/B) · P(C/B∩A) = 1/3 · 1/2 · 1 = 1/6P (A, C) = P (A) · P (C/A) = 1/3 · 1/2 = 1/6P (B, C) = P (B) · P(C/B) = 1/3 · 1/2 = 1/6P(C) = 1/3

En consecuencia la distancia media recorrida será:E[D] = 8 · 1/3 + 6 · 1/6 + 3 · 1/6 + 1 · 1/3 = 4,5

Interpretación de resultados:

La distancia que al menos recorrerá antes de salir será 4,50 metros

3° Tema: Modelo de distribución Binomial

Formulación del problema

La probabilidad de que un alumno de pregrado repita el curso de estadística es de 0.3. Elegimos 20 alumnos al azar. ¿Cuál es la probabilidad de que haya exactamente 4 alumnos que repitan el curso?

Planteamiento

Es una distribución binomial, el alumno repite o pasa el curso.Consideramos suceso éxito el que nos preguntan El alumno repite el curso P(A) = p = 0,3 El alumno no repite el curso P (Ā) = 1- p = q = 1 - 0,3 =0,7

Elegimos 20 alumnos n= 20

Es una distribución binomial de parámetros n= 20, p = 0,3

B (n, p) ---------B (20; 0,3)

La probabilidad de que haya exactamente 4 alumnos repetidores x = 4

Page 3: Tarea de Estadistica

Solución:

P ( x=k )=(nk) . pk .qn−k k = 4; n = 20; p =0,3;q = 0,5

P ( x=4 )=(204 ). (0,3)4 .¿

(nk)= n!k ! (n−k )! Números combinatorios (204 )= 20!

4 !(20−4 )! = 4845

P ( x=4 )=(204 ). (0,3)4 .¿ = P (x= 4) = 4845. (0,3)4 .¿ = 0, 13

Interpretación de resultados:

La probabilidad de que haya exactamente 4 alumnos que repitan el curso es 0, 13

4° Tema: Modelo de distribución Normal

Formulación del problema

En una ciudad se estima que la temperatura máxima en el mes de Abril sigue una distribución normal, con media 23° y desviación típica 5°. Calcular el número de días del mes en los que se espera alcanzar máximas entre 21° y 27°.

Planteamiento

Sabemos que Z=x−µσ

Como x1 = 21 y x2= 27 entonces la P(x1 ≤ X ≤ x2) μ = 23° y σ = 5°

Solución:

P (21 ≤ X ≤ 27) = P (21−235

≤ Z ≤ 27−235

)

P (21 ≤ X ≤ 27) = P (−25

≤ Z ≤ 45

) = P (- 0.4 ≤ Z ≤ 0.8)

= P (- 0.4 ≤ Z ≤ 0.8) = P (Z ≤ 0.8) – [1 - P (Z ≤ 0.4)]

Page 4: Tarea de Estadistica

= P (Z ≤ 0.8) + P (Z ≤ 0.4) – 1 = 0.7881 + 0.6554 -1 = 0.4435

= 0.4435 * 30 días = 13. 3 días

Interpretación de resultados:

El número de días del mes de Abril en los que se espera alcanzar temperaturas máximas de entre 21° y 27° es de 13 días.

5° Tema: Distribuciones muestrales de diferencia de proporciones

Formulación del problema

Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5 objetos fabricados por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada máquina:

Datos:

P1= 36

= 0.5 y n1 = 120 objetos

P2= 25

= 0.4 y n2 = 120 objetos

Planteamiento

a. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 2 rebase a la máquina 1 en por lo menos 0.10?

P (p2 – p1 ≥ 0.10)

Solución:

Z=(p2−p1 )−(P2−P1)

√ P1.q1n1+P2.q2

n2

=0.0958−(−0.10)

√ (0.50) .(0.50)120

+(0.40) .(0.60)

120

=3.06

Page 5: Tarea de Estadistica

0.10−( 0.5120 )=0.0958

Z= 3.06 ------ P (Z= 3.06) = 0.0011

Interpretación de resultados:

La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo menos 10% a favor de la máquina 2 es de 0.0011.

Planteamiento

b. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 1 rebase a la máquina 2 en por lo menos 0.15?

P (p1 – p2 ≥ 0.15)

Solución:

Z=(p1−p2 )−(P1−P2)

√ P1.q1n1+P2.q2

n2

=0.1458−0.10

√ (0.50) .(0.50)120

+(0.40) .(0.60)

120

=0.72

0.15−( 0.5120 )=0.1458

Z= 0.72 ----- P (Z= 0.72) = 0.2357

Interpretación de resultados:

Page 6: Tarea de Estadistica

La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo menos 15% a favor de la máquina 1 es de 0.2357.

6° Tema: Intervalo de confianza para la diferencia de medias

Formulación del problema

Se realizó un experimento para comparar el tiempo promedio requerido por el cuerpo humano para absorber dos medicamentos, A y B. Suponga que el tiempo necesario para que cada medicamento alcance un nivel específico en el torrente sanguíneo se distribuye normalmente. Se eligieron al azar a doce personas para ensayar cada fármaco registrándose el tiempo en minutos que tardó en alcanzar un nivel específico en la sangre. Calcule un intervalo de confianza del 95% para la diferencia del tiempo promedio. Suponga varianzas iguales.

Medicamento A Medicamento BnA = 12 nB = 12X A =26.8 X B = 32.6

SA2= 15.57 SB

2 = 17.54

Solución:

sp=√ S A2 (n A−1 )+SB2 (nB−1 )

nA+nB−2=√ 15.57 (12−1 )+17.54 (12−1 )

12+12−2

sp=4.07

µB- µA=¿ (X B - X A) ± tsp√ 1nA + 1nBµB- µA=¿ (32.6 – 26.8) ± (2.074).(4.07).√ 112 + 1

12

2.35≤µB- µA≤ 9.25

Page 7: Tarea de Estadistica

Interpretación de resultados:

Con un nivel confianza del 95% se sabe que el tiempo promedio para alcanzar un nivel específico es mayor para el medicamento B.

7° Tema: Tamaño de muestra cuando no se conoce la varianza poblacional

Formulación del problema

Los siguientes datos son los pesos en gramos de 16 bolsas de cierto material plástico que se seleccionan en un depósito con el propósito de verificar el peso promedio: 506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496.

a) Si el peso de cada bolsa es una v.a. normal con desviación típica de 5 gramos, obtener los intervalos de confianza al 90, 95 y 99% para la media del peso de las bolsas.

b) Determinar el tamaño muestral, n, necesario para que la longitud del intervalo, con α = 0,05, sea menor o igual a una unidad.

Planteamiento

Sea la v.a. X = “peso en gramos”, X tiene distribución N (µ, 52).

a) Teniendo en cuenta que:n = 16, X= 503,76 y σ = 5

Sustituyendo estos valores en la expresión del intervalo para la media de una población normal,con 𝛔 conocida, obtenemos:

1-α z α2

intervalo

0,90 1,64 [501,7; 505,8]

0,95 1,96 [501,3; 506,2]

0,99 2,58 [500,5; 506,9]

b) El tamaño muestral necesario para que la longitud del intervalo (L) sea menor o igual ala unidad, con un nivel α = 0,05, es:

Page 8: Tarea de Estadistica

n≥4 Zα /2

2 . σ2

L2 =4 ¿¿ = 384.16

Es decir, n≥385

Si, para los datos del ejemplo anterior, 𝛔 fuese desconocida:

Obtener los intervalos de confianza al 90, 95 y 99% para la media del peso de las bolsas(Suponer que la población es normal)

b) Determinar el tamaño muestral, n, necesario para que la longitud del intervalo, con α =0,05, sea menor o igual a una unidad.

Planteamiento

a) Dado que 𝛔 es desconocida, reemplazando su valor por S = 6,2022 y utilizándola distribución t con 15 grados de libertad en vez de la distribución normal estándar, se obtienen los nuevos intervalos presentados en la siguiente tabla:

1-α t α2

intervalo

0,90 1.753 [501,03; 506,47]

0,95 2.131 [500,45; 507,05]

0,99 2.947 [499,18; 508,32]

b) El tamaño muestral resultante en este caso, tomando como estimación de 𝛔 el valor calculado con la muestra dada y reemplazando t15, α /2 por Z α /2, es:

n≥4 Zα /2

2 . S2

L2 =4 ¿¿ = 591.103

Por tanto, n≥592

Interpretación de resultados:

Observar que en este caso se necesita un tamaño muestral bastante mayor que el obtenido en en el planteamiento anterior

Page 9: Tarea de Estadistica

8° Tema: Prueba de hipótesis para variables cualitativas

Formulación del problema

La empresa ENTEL, desea comparar los gastos diarios de transporte del equipo de ventas y del

personal de cobranza. Recopiló la siguiente información muestral (importe en dólares).

Ventas ($) 131 135 146 165 136 142

Cobranza ($) 130 102 129 143 149 120 139

Al nivel de significancia de 0,10, puede concluirse que los gastos medios diarios del equipo de

ventas son mayores? cuál es el valor p?

Planteamiento

Prueba de hipótesis

H0: u1 ≤ u2

H1: u1 > u2

VENTAS COBRANZAS

131 130

135 102

146 129

165 143

136 149

142 120

139

142,5 130,28 promedio

12,24 15,78 Desviación st

n=6 n=7Numero de

datos

Page 10: Tarea de Estadistica

a) Esta es una prueba a una sola cola

b) se establece la regla de decisión

Si Z > que el valor crítico, se rechaza la hipótesis nula y se acepta H1

c) se calcula el valor estadístico de prueba

Datos:

n1=6 n2=7

Prom.1= 142.5 Prom.2= 130.3

S1=12,2 S2=15,8

α= 0.10 t (0.10)=1.363Grados de libertad = 6+7 – 2 =11

Solución:

S2=S12 (n1−1 )+S22 (n2−1 )

n1+n2−2

Sp2=148.84 (6−1 )+249.64 (7−1 )

6+7−2=744.2+1497.84

11

Sp2=203.82

t=X 1−X2

√Sσ2( 1n1+ 1n2

¿)=142.5−130.3

√203.82( 16 +17¿)=

12.27.819

¿¿

t=1.56

d) La decisión con respecto a la hipótesis nula t calculado en 1.56 es mayor que 1.363, se rechaza la hipótesis nula

1.363

Page 11: Tarea de Estadistica

Interpretación de resultados:

Por lo tanto se rechaza la hipótesis nula y se concluye que los gastos medios diarios de las ventas realizadas son mayores.

9° Tema: Análisis de varianza de doble vía

Formulación del problema

Se está investigando cual es el efecto de tres tipos de abono sobre dos tipos de suelo. Se espera que el efecto de los distintos abonos se manifieste de forma diferente dependiendo del tipo de suelo. Para el presente estudio tomaremos dos tipos de suelo, ácido y alcalino y tres tipos de abono que denotaremos con A, B y C. Tenemos así dos factores (suelo y abono) con 2 y 3 nivelesRespectivamente, que resultan en 6 combinaciones. Tomaremos un diseño factorial con dos factores y tres réplicas en cada una de las combinaciones de los niveles de los dos factores.

Planteamiento

Las hipótesis de que los distintos factores no producen ningún efecto y de que no existe interacción se contrastan mediante el análisis de la varianza de dos vías con interacción, comparando la variabilidad entre los niveles del factor A, la variabilidad entre los niveles del factor B,C, y la variabilidad debida a la interacción con la variabilidad dentro de los grupos o residual.

Sum. de cuadrados

Media de cuadrados

SUELO 1 18, 000 18, 000ABONO 2 48, 000 24, 000SUELO*ABONO 2 144, 000 72, 000RESIDUAL 12 106, 000 8, 833

A B C

Acido8 10 84 8 60 6 4

Alcalino14 4 1510 2 126 0 9

Page 12: Tarea de Estadistica

SUELO *ABONO

Cantidad media Desviación standar

Error. std

ACIDO, A 3 4,000 4,000 2,309ACIDO, B 3 8,000 2,000 1,155ACIDO, C 3 6,000 2,000 1,155

ALCALINO, A 3 10,000 4,000 2,309ALCALINO,B 3 2,000 2,000 1,155ALCALINO,C 3 12,000 3,000 1,732

Interpretación de resultados:

La respuesta es un índice de abundancia de una determinada especie tras la aplicación de los distintos abonos.

10° Tema: Regresión y Correlación

Formulación del problema

Un centro comercial sabe en función de la distancia, en kilómetros, a la que se sitúe de un

núcleo de población, acuden los clientes, en cientos, que figuran en la tabla:

Nº de Clientes (X)

Distancia (Y)

8 157 196 254 232 341 40

Page 13: Tarea de Estadistica

Calcular el coeficiente de correlación lineal.

Si el centro comercial se sitúa a 2 km, ¿cuántos clientes puede esperar? Si desea recibir a 500 clientes, ¿a qué distancia del núcleo de población debe situarse?

Planteamiento

Solución:

X=286

= 4.67 Y=1566

= 26

x i y i x i ·y i x i2 y i

2

8 15 120 64 225

7 19 133 49 361

6 25 150 36 625

4 23 92 16 529

2 34 68 4 1 156

1 40 40 1 1 600

28 156 603 170 4 496

Page 14: Tarea de Estadistica

σ X2 = 1706

−4.672=6.53 σ Y2=

44966

−262=73.33

σ X=√6.53=2.55 σ Y=√73.33=8.56

σ XY=6036

−4.677=−20.92

r=−20.922.55∗8.56

=−0.96

Correlación negativa muy fuerte, muestra absoluta dependencia inversa

x−4.67=−20.9273.33

( y−26 ) x=−0.29 y+12.09

x=−0.29∗2+12.09=1151clientes

y−26=−20.926.53

( x−4.67 ) y=−3.2 x+40.96

y=−3.2∗5+40.96=24.96 km

Interpretación de resultados:

Se demuestra que la distancia con el número de clientes guardan una relación inversa a menor distancia mayor es el número de clientes que se espera que lleguen al centro comercial.