Tarea de Estadistica
-
Upload
marco-antonio-noa -
Category
Documents
-
view
84 -
download
1
description
Transcript of Tarea de Estadistica
1° Tema: Combinaciones
Formulación del problema
Un grupo escolar consta de 16 alumnos. Es necesario formar simultáneamente 3 equipos con ellos, uno de 5 alumnos para ir a la Cruz Roja, otro de 3 alumnos para visitar el Hospital y el tercero de 2 alumnos para ir al Banco. ¿De cuántas maneras se pueden distribuir?
Planteamiento
El primer equipo de 5 alumnos se puede seleccionar de entre los 16 que hay en el grupo escolar; una vez formado ese primer equipo, quedan solamente 11 alumnos de entre los cuales debe integrarse el segundo equipo con tres de ellos; una vez formado ese segundo equipo, quedan solamente 8 alumnos de entre los cuales debe integrarse el tercer equipo con dos de ellos.
Solución
De manera que
16C5 ×11 C3 × 8C2
16 !5! (16−5)!
x11!
3! (11−3)!x
8 !8 !(8−2)!
= 4368 ×165 × 28 = 20 180 160
Interpretación de resultados:
Se puede distribuir de 20 180 160 maneras para formar los equipos.
2° Tema: Variable Aleatoria
Formulación del problema
En el punto de partida de un laberinto hay tres orificios iguales A, B y C. Si la rata eligeA vuelve al punto de partida después de recorrer dos metros. Si elige B recorre cinco metros y vuelve al mismo punto. Si elige C sale al exterior recorriendo un metro. ¿Por término medio que distancia recorre una rata antes de salir, si siempre elige un orificio distinto de los seleccionados en veces anteriores?
Planteamiento
Los itinerarios que pueden darse con las distancias recorridas en cada caso, son (A, B, C) 8, (B, A, C) 8, (A, C) 3, (B, C) 6, (C) 1.
Solución:
Sus probabilidades serían:
P (A, B, C) = P (A) · P (B/A) · P(C/A∩B) = 1/3 · 1/2 · 1 = 1/6P (B, A, C) = P (B) · P (A/B) · P(C/B∩A) = 1/3 · 1/2 · 1 = 1/6P (A, C) = P (A) · P (C/A) = 1/3 · 1/2 = 1/6P (B, C) = P (B) · P(C/B) = 1/3 · 1/2 = 1/6P(C) = 1/3
En consecuencia la distancia media recorrida será:E[D] = 8 · 1/3 + 6 · 1/6 + 3 · 1/6 + 1 · 1/3 = 4,5
Interpretación de resultados:
La distancia que al menos recorrerá antes de salir será 4,50 metros
3° Tema: Modelo de distribución Binomial
Formulación del problema
La probabilidad de que un alumno de pregrado repita el curso de estadística es de 0.3. Elegimos 20 alumnos al azar. ¿Cuál es la probabilidad de que haya exactamente 4 alumnos que repitan el curso?
Planteamiento
Es una distribución binomial, el alumno repite o pasa el curso.Consideramos suceso éxito el que nos preguntan El alumno repite el curso P(A) = p = 0,3 El alumno no repite el curso P (Ā) = 1- p = q = 1 - 0,3 =0,7
Elegimos 20 alumnos n= 20
Es una distribución binomial de parámetros n= 20, p = 0,3
B (n, p) ---------B (20; 0,3)
La probabilidad de que haya exactamente 4 alumnos repetidores x = 4
Solución:
P ( x=k )=(nk) . pk .qn−k k = 4; n = 20; p =0,3;q = 0,5
P ( x=4 )=(204 ). (0,3)4 .¿
(nk)= n!k ! (n−k )! Números combinatorios (204 )= 20!
4 !(20−4 )! = 4845
P ( x=4 )=(204 ). (0,3)4 .¿ = P (x= 4) = 4845. (0,3)4 .¿ = 0, 13
Interpretación de resultados:
La probabilidad de que haya exactamente 4 alumnos que repitan el curso es 0, 13
4° Tema: Modelo de distribución Normal
Formulación del problema
En una ciudad se estima que la temperatura máxima en el mes de Abril sigue una distribución normal, con media 23° y desviación típica 5°. Calcular el número de días del mes en los que se espera alcanzar máximas entre 21° y 27°.
Planteamiento
Sabemos que Z=x−µσ
Como x1 = 21 y x2= 27 entonces la P(x1 ≤ X ≤ x2) μ = 23° y σ = 5°
Solución:
P (21 ≤ X ≤ 27) = P (21−235
≤ Z ≤ 27−235
)
P (21 ≤ X ≤ 27) = P (−25
≤ Z ≤ 45
) = P (- 0.4 ≤ Z ≤ 0.8)
= P (- 0.4 ≤ Z ≤ 0.8) = P (Z ≤ 0.8) – [1 - P (Z ≤ 0.4)]
= P (Z ≤ 0.8) + P (Z ≤ 0.4) – 1 = 0.7881 + 0.6554 -1 = 0.4435
= 0.4435 * 30 días = 13. 3 días
Interpretación de resultados:
El número de días del mes de Abril en los que se espera alcanzar temperaturas máximas de entre 21° y 27° es de 13 días.
5° Tema: Distribuciones muestrales de diferencia de proporciones
Formulación del problema
Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5 objetos fabricados por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada máquina:
Datos:
P1= 36
= 0.5 y n1 = 120 objetos
P2= 25
= 0.4 y n2 = 120 objetos
Planteamiento
a. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 2 rebase a la máquina 1 en por lo menos 0.10?
P (p2 – p1 ≥ 0.10)
Solución:
Z=(p2−p1 )−(P2−P1)
√ P1.q1n1+P2.q2
n2
=0.0958−(−0.10)
√ (0.50) .(0.50)120
+(0.40) .(0.60)
120
=3.06
0.10−( 0.5120 )=0.0958
Z= 3.06 ------ P (Z= 3.06) = 0.0011
Interpretación de resultados:
La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo menos 10% a favor de la máquina 2 es de 0.0011.
Planteamiento
b. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 1 rebase a la máquina 2 en por lo menos 0.15?
P (p1 – p2 ≥ 0.15)
Solución:
Z=(p1−p2 )−(P1−P2)
√ P1.q1n1+P2.q2
n2
=0.1458−0.10
√ (0.50) .(0.50)120
+(0.40) .(0.60)
120
=0.72
0.15−( 0.5120 )=0.1458
Z= 0.72 ----- P (Z= 0.72) = 0.2357
Interpretación de resultados:
La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo menos 15% a favor de la máquina 1 es de 0.2357.
6° Tema: Intervalo de confianza para la diferencia de medias
Formulación del problema
Se realizó un experimento para comparar el tiempo promedio requerido por el cuerpo humano para absorber dos medicamentos, A y B. Suponga que el tiempo necesario para que cada medicamento alcance un nivel específico en el torrente sanguíneo se distribuye normalmente. Se eligieron al azar a doce personas para ensayar cada fármaco registrándose el tiempo en minutos que tardó en alcanzar un nivel específico en la sangre. Calcule un intervalo de confianza del 95% para la diferencia del tiempo promedio. Suponga varianzas iguales.
Medicamento A Medicamento BnA = 12 nB = 12X A =26.8 X B = 32.6
SA2= 15.57 SB
2 = 17.54
Solución:
sp=√ S A2 (n A−1 )+SB2 (nB−1 )
nA+nB−2=√ 15.57 (12−1 )+17.54 (12−1 )
12+12−2
sp=4.07
µB- µA=¿ (X B - X A) ± tsp√ 1nA + 1nBµB- µA=¿ (32.6 – 26.8) ± (2.074).(4.07).√ 112 + 1
12
2.35≤µB- µA≤ 9.25
Interpretación de resultados:
Con un nivel confianza del 95% se sabe que el tiempo promedio para alcanzar un nivel específico es mayor para el medicamento B.
7° Tema: Tamaño de muestra cuando no se conoce la varianza poblacional
Formulación del problema
Los siguientes datos son los pesos en gramos de 16 bolsas de cierto material plástico que se seleccionan en un depósito con el propósito de verificar el peso promedio: 506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496.
a) Si el peso de cada bolsa es una v.a. normal con desviación típica de 5 gramos, obtener los intervalos de confianza al 90, 95 y 99% para la media del peso de las bolsas.
b) Determinar el tamaño muestral, n, necesario para que la longitud del intervalo, con α = 0,05, sea menor o igual a una unidad.
Planteamiento
Sea la v.a. X = “peso en gramos”, X tiene distribución N (µ, 52).
a) Teniendo en cuenta que:n = 16, X= 503,76 y σ = 5
Sustituyendo estos valores en la expresión del intervalo para la media de una población normal,con 𝛔 conocida, obtenemos:
1-α z α2
intervalo
0,90 1,64 [501,7; 505,8]
0,95 1,96 [501,3; 506,2]
0,99 2,58 [500,5; 506,9]
b) El tamaño muestral necesario para que la longitud del intervalo (L) sea menor o igual ala unidad, con un nivel α = 0,05, es:
n≥4 Zα /2
2 . σ2
L2 =4 ¿¿ = 384.16
Es decir, n≥385
Si, para los datos del ejemplo anterior, 𝛔 fuese desconocida:
Obtener los intervalos de confianza al 90, 95 y 99% para la media del peso de las bolsas(Suponer que la población es normal)
b) Determinar el tamaño muestral, n, necesario para que la longitud del intervalo, con α =0,05, sea menor o igual a una unidad.
Planteamiento
a) Dado que 𝛔 es desconocida, reemplazando su valor por S = 6,2022 y utilizándola distribución t con 15 grados de libertad en vez de la distribución normal estándar, se obtienen los nuevos intervalos presentados en la siguiente tabla:
1-α t α2
intervalo
0,90 1.753 [501,03; 506,47]
0,95 2.131 [500,45; 507,05]
0,99 2.947 [499,18; 508,32]
b) El tamaño muestral resultante en este caso, tomando como estimación de 𝛔 el valor calculado con la muestra dada y reemplazando t15, α /2 por Z α /2, es:
n≥4 Zα /2
2 . S2
L2 =4 ¿¿ = 591.103
Por tanto, n≥592
Interpretación de resultados:
Observar que en este caso se necesita un tamaño muestral bastante mayor que el obtenido en en el planteamiento anterior
8° Tema: Prueba de hipótesis para variables cualitativas
Formulación del problema
La empresa ENTEL, desea comparar los gastos diarios de transporte del equipo de ventas y del
personal de cobranza. Recopiló la siguiente información muestral (importe en dólares).
Ventas ($) 131 135 146 165 136 142
Cobranza ($) 130 102 129 143 149 120 139
Al nivel de significancia de 0,10, puede concluirse que los gastos medios diarios del equipo de
ventas son mayores? cuál es el valor p?
Planteamiento
Prueba de hipótesis
H0: u1 ≤ u2
H1: u1 > u2
VENTAS COBRANZAS
131 130
135 102
146 129
165 143
136 149
142 120
139
142,5 130,28 promedio
12,24 15,78 Desviación st
n=6 n=7Numero de
datos
a) Esta es una prueba a una sola cola
b) se establece la regla de decisión
Si Z > que el valor crítico, se rechaza la hipótesis nula y se acepta H1
c) se calcula el valor estadístico de prueba
Datos:
n1=6 n2=7
Prom.1= 142.5 Prom.2= 130.3
S1=12,2 S2=15,8
α= 0.10 t (0.10)=1.363Grados de libertad = 6+7 – 2 =11
Solución:
S2=S12 (n1−1 )+S22 (n2−1 )
n1+n2−2
Sp2=148.84 (6−1 )+249.64 (7−1 )
6+7−2=744.2+1497.84
11
Sp2=203.82
t=X 1−X2
√Sσ2( 1n1+ 1n2
¿)=142.5−130.3
√203.82( 16 +17¿)=
12.27.819
¿¿
t=1.56
d) La decisión con respecto a la hipótesis nula t calculado en 1.56 es mayor que 1.363, se rechaza la hipótesis nula
1.363
Interpretación de resultados:
Por lo tanto se rechaza la hipótesis nula y se concluye que los gastos medios diarios de las ventas realizadas son mayores.
9° Tema: Análisis de varianza de doble vía
Formulación del problema
Se está investigando cual es el efecto de tres tipos de abono sobre dos tipos de suelo. Se espera que el efecto de los distintos abonos se manifieste de forma diferente dependiendo del tipo de suelo. Para el presente estudio tomaremos dos tipos de suelo, ácido y alcalino y tres tipos de abono que denotaremos con A, B y C. Tenemos así dos factores (suelo y abono) con 2 y 3 nivelesRespectivamente, que resultan en 6 combinaciones. Tomaremos un diseño factorial con dos factores y tres réplicas en cada una de las combinaciones de los niveles de los dos factores.
Planteamiento
Las hipótesis de que los distintos factores no producen ningún efecto y de que no existe interacción se contrastan mediante el análisis de la varianza de dos vías con interacción, comparando la variabilidad entre los niveles del factor A, la variabilidad entre los niveles del factor B,C, y la variabilidad debida a la interacción con la variabilidad dentro de los grupos o residual.
Sum. de cuadrados
Media de cuadrados
SUELO 1 18, 000 18, 000ABONO 2 48, 000 24, 000SUELO*ABONO 2 144, 000 72, 000RESIDUAL 12 106, 000 8, 833
A B C
Acido8 10 84 8 60 6 4
Alcalino14 4 1510 2 126 0 9
SUELO *ABONO
Cantidad media Desviación standar
Error. std
ACIDO, A 3 4,000 4,000 2,309ACIDO, B 3 8,000 2,000 1,155ACIDO, C 3 6,000 2,000 1,155
ALCALINO, A 3 10,000 4,000 2,309ALCALINO,B 3 2,000 2,000 1,155ALCALINO,C 3 12,000 3,000 1,732
Interpretación de resultados:
La respuesta es un índice de abundancia de una determinada especie tras la aplicación de los distintos abonos.
10° Tema: Regresión y Correlación
Formulación del problema
Un centro comercial sabe en función de la distancia, en kilómetros, a la que se sitúe de un
núcleo de población, acuden los clientes, en cientos, que figuran en la tabla:
Nº de Clientes (X)
Distancia (Y)
8 157 196 254 232 341 40
Calcular el coeficiente de correlación lineal.
Si el centro comercial se sitúa a 2 km, ¿cuántos clientes puede esperar? Si desea recibir a 500 clientes, ¿a qué distancia del núcleo de población debe situarse?
Planteamiento
Solución:
X=286
= 4.67 Y=1566
= 26
x i y i x i ·y i x i2 y i
2
8 15 120 64 225
7 19 133 49 361
6 25 150 36 625
4 23 92 16 529
2 34 68 4 1 156
1 40 40 1 1 600
28 156 603 170 4 496
σ X2 = 1706
−4.672=6.53 σ Y2=
44966
−262=73.33
σ X=√6.53=2.55 σ Y=√73.33=8.56
σ XY=6036
−4.677=−20.92
r=−20.922.55∗8.56
=−0.96
Correlación negativa muy fuerte, muestra absoluta dependencia inversa
x−4.67=−20.9273.33
( y−26 ) x=−0.29 y+12.09
x=−0.29∗2+12.09=1151clientes
y−26=−20.926.53
( x−4.67 ) y=−3.2 x+40.96
y=−3.2∗5+40.96=24.96 km
Interpretación de resultados:
Se demuestra que la distancia con el número de clientes guardan una relación inversa a menor distancia mayor es el número de clientes que se espera que lleguen al centro comercial.