“Año de la Inversión para el Desarrollo Rural y la Seguridad Alimentaria”
UUnniivveerrssiiddaadd NNaacciioonnaall MMaayyoorr ddee
SSaann MMaarrccooss
((UUnniivveerrssiiddaadd ddeell PPeerrúú,, DDEECCAANNAA DDEE AAMMÉÉRRIICCAA))
FFAACCUULLTTAADD DDEE CCIIEENNCCIIAASS EECCOONNÓÓMMIICCAASS
CUURRSSOO : ESTADÍSTICA III
PROFESOR : ISABEL LÁZARO ARANDA
INTEGRANTES: MONTES PAUCAR ROLLER HINO
FASANANDO CHÁVEZ REITER ANTONIO
Ciudad Universitaria, 11 de Julio del 2013
Con mucho aprecio para la
profesora Isabel Lázaro que con su experiencia en la materia nos forja
para ser economistas que el mundo necesita y no economistas que el
mundo espera.
Ciudad Universitaria, 11 de Julio del 2013
Trabajo de Aplicación 1) Nombre del Tema
‘’Influencia de la alimentación en el rendimiento académico en la facultad de administración de las bases 2009, 2010 y 2011’’
2) Objetivos - Dar a conocer el nivel de ingreso disponible de los estudiantes de la facultad de economía y el
tiempo que le dedican a los estudios y trabajo.
- Verificar si existe una relación entre el ingreso disponible y las horas de estudio que le
dedican a la facultad.
- Observar si existe relación entre trabajo y rendimiento académico.
- El propósito de este estudio fue investigar la influencia de la alimentación en el rendimiento
académico de los estudiantes de la facultad de administración bases 2009, 2010 y 2011. El
estudio se llevó a cabo en una muestra representativa de 100 alumnos que llevan la carga
académica regular correspondiente.
Para analizar la variable independiente, hábitos alimenticios, se desarrollan indicadores que
representan elementos implícitos de la variable, los cuales son: horario de alimentación, tipos
de alimentos que se consume, consumo de comida rápida, cantidad de comida que se
consume, y el fenómeno del ayuno. La variable de rendimiento académico incluye los
indicadores: calificaciones, carga académica, horarios de estudio y estrés. Para evaluar dichos
indicadores, se distribuyó una encuesta que incluye diversos ítems correspondientes a cada
uno de ellos, del cual se obtuvieron resultados que demostraban que, a pesar de tener el
conocimiento de los elementos y la necesidad de llevar adecuados hábitos alimenticios, los
estudiantes no siempre los ponen en práctica, pero a la vez, no se encontró evidencia de que
esto tenga efecto alguno sobre su rendimiento académico. Por muchos años se han llevado a
cabo varios estudios científicos alrededor de un tema que indudablemente plantea muchas
interrogantes que hasta el momento no se han podido despejar, refiriéndose al tema sobre la
relación que tienen los hábitos alimenticios y el rendimiento académico, y ciertos fenómenos
que otros han tomado en cuenta como factores que pueden llegar a influir en estos.
La investigación de la influencia de los alimentos en la salud es un ámbito en el que
administraciones públicas y organismos internacionales están volcando cada día más sus
esfuerzos, desarrollando directrices, normativas y políticas al respecto. Para la Organización
Mundial de la Salud (OMS), la alimentación resulta determinante en la prevención de las
enfermedades que constituyen la primera causa de muerte en los países desarrollados. Sin
embargo, a pesar de las campañas informativas y las acciones puestas en marcha por
instituciones de salud pública, aún existen numerosas propuestas sin base científica que
confunden y desinforman a los consumidores. Los estudiantes que buscan superar sus
exámenes finales deberían tener más cuidado con lo que comen, ya que una nueva
investigación ha desvelado una evidente correlación entre una dieta sana y mejores notas.
3) Variables
3.1) Cualitativas
1.- Sexo
2.- Lugar de residencia
3.- Trabajo
4.- Estado civil
5.- Deficiencia o enfermedad
6.- Interferencias en tu rendimiento académico
7.- Alimentación completa
8.- Nivelación en los cursos de carrera
9.- Rendimiento académico
10.- Alimentación fuera de las horas
11.- Servicio de la universidad
12.- Dieta
3.2) Cuantitativas
13.- N° Tiempo que le dedicas a la ingestión de alimentos
14.- N° de horas de trabajo
15.- Ingreso personal mensual
16.- Ingreso familiar mensual
17.- N° de horas de estudio (semanal)
18.- Edad
19.- Gasto personal mensual
20.- Gasto familiar
21.- Tiempo que viaja para llegar a la universidad (minutos)
22.- Horas de descanso
23.- N° de cursos que lleva
24.- Tiempo de preparación o compra de almuerzo
4) Diseño de la encuesta.
Datos Generales.
1) Sexo: Masculino Femenino
2) Edad
3) ¿Actualmente trabajas?
4) ¿Cuántas horas a la semana le dedicas a estudiar?
5) ¿Has tenido alguna deficiencia o enfermedad estomacal?
Si
No
6) Si la respuesta fue Sí ¿Cuántas veces esto ha interferido en tu rendimiento académico?
7) ¿Cuánto es tu ingreso personal mensual?
8) ¿Cuánto es tu gasto personal mensual?
“Año de la inversión para el desarrollo rural y la seguridad alimentaria”
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMÉRICA)
9) ¿Cómo calificarías tu rendimiento académico?
Bueno
Regular
10) ¿Comes tus tres comidas al día?
Si
No
11) ¿Estás nivelado en los cursos de tu ciclo?
Si
No
12) ¿Vas al comedor frecuentemente?
Si
No
13) ¿Además de las 3 comidas al día, ingieres algo más?
Si
No
14) ¿Lugar de Nacimiento?
Capital
Provincia
15) ¿Lugar de Residencia?
Distrito Populoso
Distrito Residencial
16) ¿Vives en pensión?
Si
No
17) ¿Qué tipo de dieta sigues?
Saludable
Poco saludable
18) ¿Cuánto tiempo te demoras en llegar a la universidad?
1 hora
Más de 1 hora
19) ¿Cuál es tu ingreso familiar mensual?
20) ¿A cuánto asciende su gasto familiar mensual?
21) ¿Cuánto tiempo al día consumes en la ingestión de alimentos?
22) ¿Cuánto tiempo le dedicas a tu descanso?
23) ¿Qué cantidad de cursos llevas actualmente?
24) ¿Cuánto en promedio gastas en la preparación o compra de tu almuerzo?
5) Diseño Muestral
5.1) Marco Muestral Para los objetivos planteados en la primera parte de este trabajo, se eligieron 3 bases
de la facultad de administración de la Universidad Nacional Mayor de San Marcos, para evaluar
en ellas a los estudiantes y estudiarlas como diferentes estratos. Dichas bases son la base
2009, la base 2010 y la base 2011.
Para obtener el número total de estudiantes que hay en las bases anteriormente mencionadas
nosotros hemos pedido dicha información a la escuela de administración.
5.2) Piloto Para la determinación del tamaño de muestra óptimo, realizamos primero una encuesta
piloto, con una sola pregunta para 100 estudiantes de cada base elegidos completamente al
azar. La única pregunta que les hicimos fue la referente a su ingreso o presupuesto mensual.
De esta manera preguntamos a 300 estudiantes de las bases mencionadas anteriormente,
obteniendo los siguientes resultados:
Sea
Población de la base 09 N1=265 Población de la base 10 N2=273 Población de la base 11 N3=383 Población total NT=921
NOTA: Los datos(N) son reales
6) Datos de las bases
Base 09
350 120 250 300 450 400 480 320 490
180 210 270 240 400 650 370 210 260
230 300 250 300 350 550 290 480 350
280 600 300 300 500 450 410 320 270
360 40 180 400 300 300 190 340 340
450 500 350 400 300 250 400 240 280
220 100 250 300 500 400 190 210 180
250 380 300 350 350 330 390 300 310
350 400 230 400 600 430 180 410 400
380 300 280 650 600 520 510 300 310
300 250 290 190 430 320 240 480 270
450
338.8
N=265
Base 10
350 500 310 270 100 180 450 270 500
500 450 400 320 280 170 380 350 480
100 240 350 280 150 230 420 500 300
250 360 300 320 230 260 370 350 420
270 400 370 700 250 170 230 500 200
320 480 150 400 270 190 300 200 250
600 500 420 300 120 280 350 380 280
200 340 300 420 200 480 450 400 460
400 300 500 180 150 310 200 350 450
500 240 600 250 350 340 420 500 350
250 200 350 480 510 270 180 620 260
330
N=273
Base 11
420 800 200 120 600 230 500 330 450
260 80 180 100 400 200 410 350 440
180 240 250 310 480 180 350 450 560
450 300 250 80 450 300 240 350 340
320 500 100 150 600 450 100 600 280
280 180 200 60 420 550 400 150 320
200 600 150 150 300 250 430 160 310
200 350 200 250 550 200 650 340 210
350 150 200 150 620 350 250 210 230
330 250 150 500 450 200 300 350 300
290 460 220 290 580 170 310 170 190
280
N=383
230 300 250 300 350 550 290 480 350
280 600 300 300 500 450 410 320 270
360 40 180 400 300 300 190 340 340
450 500 350 400 300 250 400 240 280
220 100 250 300 500 400 190 210 180
250 380 300 350 350 330 390 300 310
350 400 230 400 600 430 180 410 400
380 300 280 650 600 520 510 300 310
300 250 290 190 430 320 240 480 270
450
350 500 310 270 100 180 450 270 500
500 450 400 320 280 170 380 350 480
100 240 350 280 150 230 420 500 300
250 360 300 320 230 260 370 350 420
270 400 370 700 250 170 230 500 200
320 480 150 400 270 190 300 200 250
600 500 420 300 120 280 350 380 280
200 340 300 420 200 480 450 400 460
400 300 500 180 150 310 200 350 450
500 240 600 250 350 340 420 500 350
250 200 350 480 510 270 180 620 260
330
420 800 200 120 600 230 500 330 450
260 80 180 100 400 200 410 350 440
180 240 250 310 480 180 350 450 560
450 300 250 80 450 300 240 350 340
320 500 100 150 600 450 100 600 280
280 180 200 60 420 550 400 150 320
200 600 150 150 300 250 430 160 310
200 350 200 250 550 200 650 340 210
350 150 200 150 620 350 250 210 230
330 250 150 500 450 200 300 350 300
290 460 220 290 580 170 310 170 190
280
- Juntamos estratos.
Estratos hN h
2
hS
Base 09 265 338.8 5185.82
Base 10 273 336.6 5559.57
Base 11 383 312.9 5911.67
- Error relativo de muestreo máximo permisible y nivel de confianza.
Error relativo de muestreo máximo
permisible
Nivel de confianza
90% 95% 99%
1% Roller Montes Paucar
240 255 272
3% Reiter Fasanando Chávez
93 117 157
5% Kevin Monteza Pacheco
42 56 85
Afijación de Neyman:
1
h hh L
h h
h
N Sn n
N S
Trabajaremos con el 99% de confianza y un error relativo máximo permisible del 3%:
√
√ √ √
n1=44
√
√ √ √
n2=47
√
√ √ √
n3=68
Por lo tanto, para ejecutar la encuesta, se trabajará con el siguiente tamaño de muestra para cada estrato:
Base 09: n=44
Base 10: n=47
Base 11: n=68
Luego de haber hecho la afijación de Neyman obtenemos los valores óptimos para poder hacer nuestra encuesta.
MONTES PAUCAR ROLLER HINO
VARIABLES
- CONSIDERACION DEL RENDIMIENTO ACADÉMICO
- HORAS DE ESTUDIO SEMANAL
Análisis de la variable como consideras tu rendimiento académico en la universidad
- Prueba de hipótesis para la proporción poblacional
Analizando la población 2, es decir, la base 09, tenemos este dato inicial, el cual representa la proporción muestra de alumnos que piensa que su promedio es bueno es 0.32. Con esto, formularemos nuestra hipótesis que dice que el promedio de lo de alumnos de la base 09 debería de ser de 0.50 con un nivel de confianza del 95%.
1) Planteamiento de la hipótesis:
2) Función Pivotal:
ˆ(0,1)
ˆ ˆ(1 )
p pZ N
p p
n
Utilizamos esa función pivotal dado que no conocemos la proporción poblacional.
√
3) Nivel de significación:
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z = -1.64 Z = -1.14
5) Toma de decisiones:
Se observa que Z esta en la RA, se acepta la hipótesis nula y tenemos que la proporción poblacional de alumnos de la base 09 que piensa que su promedio académico es bueno es igual al 0.4
- Prueba de hipótesis para la diferencia de proporciones poblacionales
Analizando las poblaciones de la base 10 y 11 de la facultad de Administración, tenemos que la proporción de alumnos que piensa que su promedio es bueno es igual a 0.27 y 0.26 respectivamente. Con esto formulamos nuestra hipótesis que las proporciones poblaciones de ambas bases son iguales y como hipótesis alternativa, que la proporción poblacional de alumnos de la base 10 que tiene esta opinión con respecto a su promedio es mayor que la de base 11. Px= base 11 Py= base 11 0
1) Planteamiento de la hipótesis:
0
1
:
:
x y
x y
H P P
H P P
2) Función Pivotal:
ˆ ˆ( ) ( )(0,1)
(1 )(1 )
x y x y
y yx x
x y
p p P PZ N
P PP P
n n
√
3) Nivel de significación:
5% 1.64Z
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z=0.12 Z = 1.64
5) Toma de decisiones:
Tenemos que Z se encuentra en la RA. Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la proporción poblacional de alumnos de la base 10 que piensa que su promedio es bueno es igual al de los alumnos de la base 11.
- Prueba de Independencia (no paramétrica).
En esta sección vamos a analizar si la opinión respecto a como consideran su promedio los alumnos de la base 09 respecto al sexo de los mismos. Por lo tanto, nuestra hipótesis nula la opinión que tiene los alumnos con respecto a sus promedios con relación al sexo. Todo esto con un nivel de significación del 1%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación:
Como consideras
tu promedio
Sexo
Masculino
Femenino
Bueno 8 6 regular 16 14 Total 24 20
1) Planteamiento de la hipótesis:
: El rendimiento académico y el sexo son independientes
: están relacionados o son dependientes 2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
Donde tenemos que: F = 2 (número de filas) C=2 (número de columnas)
3) Nivel de significación:
[ ] [
]=0.01
x=6.63
Frecuencias esperadas:
Como consideras
tu promedio
Sexo
Masculino
Femenino
Bueno 8 7 regular 16 13 Total 24 20
Calculo de Q:
2
1
( )ki i
i i
o eQ
e
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
……0.22Q=6.63
5) Toma de decisiones:
Tenemos que Q se encuentra en RA. Por lo tanto, se acepta la hipótesis nula. Entonces aceptamos que el rendimiento académico y el sexo son independientes.
- Prueba de Homogeneidad (no paramétrica).
En esta sección vamos a analizar si los alumnos de las bases 09, 10 y 11 si son homogéneas con respecto a su rendimiento académico. Todo esto con un nivel de significación del 5%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación:
Opinión sobre el destino de dicho aporte
Bases
Base 09 Base 10 Base 11 Total
Bueno 14 13 18 45 regular 30 34 50 114 Total 44 47 68 159
1) Planteamiento de la hipótesis:
{
2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
3) Nivel de significación:
[ ] [
]
x=5.99
Frecuencias esperadas:
Calculo de Q:
2
1
( )ki i
i i
o eQ
e
Opinión sobre el
destino de dicho aporte
Bases
Base 09 Base 10 Base 11 Total
Bueno 13 13 20 45 Regular 31 34 48 114
Total 44 47 68 159
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
0.39 5.99
5) Toma de decisiones:
Tenemos que Q se encuentra en la RA. Por lo tanto, se aceptar la hipótesis nula. Entonces aceptamos que los alumnos de las bases 09, 10 y 11 son homogéneos con respecto a su rendimiento académico.
Análisis de la variable horas de estudio semanal
- Prueba de hipótesis para la media poblacional.
Analizando la población de la base 09, tenemos la siguiente información para la variable horas
de estudio semanal con esto, formularemos nuestra hipótesis que dice que media poblacional de las horas de estudio semanal deben ser 10.
1) Planteamiento de la hipótesis:
{
2) Función Pivotal:
(0,1)X
Z NS n
√ √
⁄
3) Nivel de significación: 5% 1.64Z
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z = 1.64Z=4.46
5) Toma de decisiones:
Tenemos que Z=4.46. Por lo tanto, se rechazamos la hipótesis nula y tenemos que las horas de estudio semanal son mayoras que de 10.
- Prueba de hipótesis para la diferencia de medias poblacionales.
Analizando las bases 10 y 11, es decir, tenemos que la media muestral y la varianza muestral
de las horas es estudio es:
respectivamente.
Con esto formulamos nuestra hipótesis que ambas son bases son iguales y como hipótesis alternativa, que la media poblacional de la base 10 es mayor que el de la base 11.
1) Planteamiento de la hipótesis:
0
1
:
:
x y
x y
H
H
2) Función Pivotal:
( ) ( )
√
√
3) Nivel de significación:
5% 1.64Z
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z = 0.42 Z = 1.64
5) Toma de decisiones:
Tenemos que Z se encuentra en RA. Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que las medias poblaciones del número de horas de estudio de los alumnos de la base 10 y 11 son iguales.
- Prueba de hipótesis para la varianza poblacional.
De los datos que obtuvimos en la encuesta, tenemos que la varianza muestral del número de
horas de estudio de los alumnos de la base 09 es entonces planteamos la hipótesis
nula que la varianza horas de estudio mensual es igual a 20, y como hipótesis alternativa, que ésta es diferente de 20. Todo esto con un nivel de significación del 5%.
1) Planteamiento de la hipótesis:
{
2) Función Pivotal:
22
( 1)2
( 1)n
n SV X
3) Nivel de significación: 5%
[ ⁄
⁄
]
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
V = 54.39 63
5) Toma de decisiones:
Tenemos que V pertenece a la RA. Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza del número de horas de estudio debe de ser 20. De los datos que obtuvimos en la encuesta, tenemos que la varianza muestral del número de
horas de estudio de los alumnos de la base 10 es entonces planteamos la
hipótesis nula que la varianza horas de estudio mensual es igual a 20, y como hipótesis alternativa, que ésta es diferente de 20. Todo esto con un nivel de significación del 5%.
1) Planteamiento de la hipótesis:
{
2) Función Pivotal:
22
( 1)2
( 1)n
n SV X
3) Nivel de significación: 5%
[ ⁄
⁄
]
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
29.2 V = 55.36
5) Toma de decisiones:
Tenemos que V se encuentra en la RA. Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza del número de horas de estudio debería de ser 20.
De los datos que obtuvimos en la encuesta, tenemos que la varianza muestral del número de
horas de estudio de los alumnos de la base 11 es entonces planteamos la
hipótesis nula que la varianza horas de estudio mensual es igual a 20, y como hipótesis alternativa, que ésta es diferente de 20. Todo esto con un nivel de significación del 5%.
1) Planteamiento de la hipótesis:
{
2) Función Pivotal:
22
( 1)2
( 1)n
n SV X
3) Nivel de significación: 5%
[ ⁄
⁄
]
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
V = 66.50 91.5
5) Toma de decisiones:
Tenemos que V se encuentra en la RA. Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza del número de horas de estudio debería de ser 20. Finalmente tenemos que la varianza de esta variable es igual en todos los estratos.
- Prueba de Independencia (no paramétrica).
En esta sección vamos a analizar si existe interdependencia entre el sexo y las horas de estudio semanal de la base 09 de la facultas de ciencias económicas. Para lo cual la variable horas de estudio se categorizado de la siguiente manera: muchas (16-a mas) regulares (9-15) y pocas de (0-8) horas. Todo esto con un nivel de significación del 1%.
1) Planteamiento de la hipótesis:
{
2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
Donde tenemos que: F = 3(número de filas) C= 2(número de columnas)
3) Nivel de significación:
[ ] [
]
X=9.21
Horas de estudio semanal
Sexo
Masculino Femenino Total
Muchas 8 7 15
Regular 10 12 22
Pocas 6 1 7
Total 24 20 44
Frecuencias esperadas:
Calculo de Q:
2
1
( )ki i
i i
o eQ
e
4.) Determinación de la región crítica (RR) y la región de aceptación (RA):
3.06 Q = 9.21
5.) Toma de decisiones: Tenemos que X se encuentra en la RA. Por lo tanto, se acepta la hipótesis nula. Entonces aceptamos que el sexo y las horas de estudio son independientes.
- Prueba de Homogeneidad (no paramétrica).
Horas de estudio semanal
Sexo
Masculino Femenino Total
Muchas 8 7 15
Regular 12 10 22
Pocas 4 3 7
Total 24 20 44
En esta sección vamos a analizar si los alumnos de las bases 09, 10 y 11 con respecto a las horas de estudio si existe homogeneidad. Todo esto con un nivel de significación del 5%.
1) Planteamiento de la hipótesis:
{
2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
3) Nivel de significación:
[ ] [
]
X=9.49
Frecuencias esperadas:
Horas de estudio
Bases
Base 09 Base 10 Base 11 Total
Muchas 15 16 24 55 Regular 22 27 38 87 Pocas 7 4 6 17 Total 44 47 68 159
Horas de estudio
Bases
Calculo de Q:
2
1
( )ki i
i i
o eQ
e
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
1.37 Q =9.49
Base 09 Base 10 Base 11 Total
Muchas 15 16 24 55 Regular 24 26 37 87 Pocas 5 5 7 17 Total 44 47 68 159
5) Toma de decisiones:
Témenos que Q se encuentra en la RA. Por lo tanto, se acepta la hipótesis nula. Entonces aceptamos que los alumnos de las bases 09, 10 y 11 son homogéneas con respecto a las horas de estudio
- Análisis de Varianza (ANAVA).
En esta sección si las horas de estudio para las tres bases es el mismo o si es diferente en al menos una de las tres bases Para esto usaremos el análisis de varianza, y todo esto con un nivel de significación del 5%. Suponemos que estamos en un caso en que las poblaciones son normales homoscedásticas, en otras palabras, que las varianzas poblacionales para las 3 bases son iguales.
1) Planteamiento de la hipótesis:
0 1 2 3
1 1
:
: No todos los son iguales
H
H
2) Determinación del nivel de confianza.
1 (2,725)5% 3.02F
3) Formulación de la función pivotal.
2
( 1)
( 1, )2
( )
( 1)
( )
k
k n k
n k
X k CMCF F
X n k CME
1
SCCCMC
k
Cuadrado medio entre tratamientos (columnas)
SCE
CMEn k
Cuadrado medio dentro de los tratamientos (error)
4) Construcción de la tabla de análisis de varianza (ANAVA).
M1 M2 M3 Total
Total 589 687 968 2244
in 44 47 68 159
iX 13.38 14.61 14.23 14.08
2
i in X 7877.07 10032.25 13769.52 31678.84
Suma de cuadrados:
∑
Con estos datos, realizamos nuestra tabla de análisis de varianza:
Fuente de variación
Suma de cuadrados Grados
de libertad
Cuadrado medio
Razón 0H
Entre tratamiento
s (columnas)
∑
1
2
g k
g
3.46 i
Dentro de los
tratamientos (error)
Total
∑∑
5) Determinación de la región crítica (RR) y la región de aceptación (RA)
F =3.023.46
6) Toma de decisiones:
Tenemos que X pertenece a la RR. Por lo tanto rechazamos la hipótesis nula. Concluimos que las tres bases tienen diferentes horas de estudio semanal.
- Prueba de la bondad de ajuste (no paramétrica).
En esta sección verificaremos las notas promedio de los alumnos de la base 10 si sigue una distribución de normal con un nivel de significación del 5%. Para esto usaremos los datos que obtuvimos en la encuesta, los cuales se presentan a continuación:
Número de escalas
Número de alumnos
[0-10> 14 [10-15> 16 [15-20> 13 [20-25> 4
Total 47 Además, tenemos que :
1) Planteamiento de la hipótesis:
{
2) Función Pivotal:
22
( 1)
1
( )ki i
k m
i i
o eQ X
e
3) Nivel de significación:
[ ] [
]
X=5.99
Frecuencias esperadas:
iP io
2( )i i
i
o e
e
[0-10> [-2.9,-0.94> 0.17174 8.07178 14 [10-15>
[-0.94,0.077> 0.35827 16.83869 16
[15-20>
[0.077,1.097> 0.33245 15.62515 13
[20-25>
[1.097,2.11> 0.11824 5.55728 4
1 47
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
5.3342 5.99
5) Toma de decisiones:
Témenos que Q pertenece a RA. Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que las horas de estudio semanal de los alumnos de la base 10 sigue una distribución de probabilidad de tipo Normal, lo cual se podía ver a simple vista ya que no existía simetría en las frecuencias de los datos.
VARIABLES
- TIEMPO DE VIAJE A LA UNIVERSIDAD (CUANTITATIVA)
- SERVICIO DE LA UNIVERSIDAD (CUALITATIVA)
Análisis Estadístico
- Prueba de Hipótesis de la Media.
Analizando la muestra del estrato 1, Alumnos de la base 09 de la Facultad de Administración, obtenemos como dato inicial una media muestral 159091.42X minutos y una desviación
estándar muestral de 11424426.21S minutos. Con esto, formulamos nuestra hipótesis nula que dice que la media poblacional del tiempo de viaje a la Universidad es igual a 45 minutos, con un nivel de confianza del 95%.
1) Planteamiento de Hipótesis:
45:
45:
1
0
H
H
2) Función Pivotal:
(0,1)X
Z NS n
89.044/11424426.21
45159091.4200
ZZ
3) Nivel de Significación:
5% 1.64Z
4) Determinación de la Región Crítica (RR) y la Región de Aceptación (RA):
Z = -1.64 Z = -0.89
5) Toma de Decisiones:
Tenemos que RAZZZ 00 64.189.0 . Por lo tanto, se acepta la hipótesis nula y
tenemos que la media poblacional del tiempo de viaje a la Universidad es igual a 45 minutos.
- Prueba de Hipótesis de la Diferencia de Medias.
Analizando los estratos 1 y 3, es decir, los alumnos de la base 09 y 11 de la Facultad de Administración, tenemos que la media muestral y la desviación estándar muestral del tiempo de
viaje a la Universidad para las 2 bases es respectivamente: 159091.42X , 11424426.21xS ,
101449.37Y , 35090795.22yS . Con esto, formulamos nuestra hipótesis nula que las medias
poblacionales de ambas bases son iguales con un nivel de confianza del 95%.
1) Planteamiento de Hipótesis:
yx
yx
H
H
:
:
1
0
2) Función Pivotal:
)1,0(11
2
)1()1(
)()(
22N
nnnn
SnSn
YXZ
yxyx
yyxx
yx
21.6
69
1
44
1
26944
5630862.499)169(8113107.445)144(
101449.37159091.4200
ZZ
3) Nivel de Significación:
5% 1.64Z
4) Determinación de la Región Crítica (RR) y la Región de Aceptación (RA):
Z = 1.64 Z = 6.21
5) Toma de Decisiones:
Tenemos que RRZZZ 00 64.121.6 . Por lo tanto, la hipótesis nula se rechaza,
entonces, las medias poblacionales del tiempo de viaje de la base 09 y 11 respectivamente son diferentes. Siendo la media poblacional de la base 09 mayor que la media poblacional de la base 11.
- Prueba de Hipótesis de la Proporción.
Analizando el estrato 2, es decir, la base 10 de la Facultad de Administración, tenemos como dato inicial que la proporción de alumnos que utiliza los servicios de la Universidad es 5.0ˆ p .
Con esto, formulamos nuestra hipótesis nula que nos dice que la proporción poblacional de alumnos que utilizan los servicios de la Universidad es del 45% con un nivel de confianza del 95%
1) Planteamiento de la Hipótesis:
45.0:
45.0:
1
0
PH
PH
2) Función Pivotal:
ˆ(0,1)
ˆ ˆ(1 )
p pZ N
p p
n
68.0
47
)5.01(5.0
45.05.000
ZZ
3) Nivel de Significación:
5% 1.64Z
4) Determinación de la Región Crítica (RR) y la Región de Aceptación (RA):
Z = 0.68 Z =1.64
5) Toma de Decisiones:
Tenemos que RAZZZ 00 64.168.0 . Por lo tanto, aceptamos la hipótesis nula y
tenemos que la proporción poblacional de alumnos de la base 10 que utilizan los servicios universitarios es del 50%.
- Prueba de Hipótesis para la Diferencia de Proporciones.
Analizando los estratos 1 y 3, es decir, los alumnos de la base 09 y 11 de la Facultad de Administración, tenemos que la proporción de alumnos que utiliza los servicios de la
Universidad es 57.0ˆ xp y 49.0ˆ yp . Con esto, formulamos nuestra hipótesis que nos dice que
las proporciones poblacionales de ambas bases son iguales con un nivel de confianza del 95%.
1) Formulación de hipótesis:
yx
yx
PPH
PPH
:
:
1
0
2) Función Pivotal:
ˆ ˆ( ) ( )(0,1)
(1 )(1 )
x y x y
y yx x
x y
p p P PZ N
P PP P
n n
83.0
69
)49.01(49.0
44
)57.01(57.0
)49.057.0(00
ZZ
3) Nivel de Significación:
5% 1.64Z
4) Determinación de la Región Crítica (RR) y la Región de Aceptación (RA):
Z = 0.83 Z = 1.64
5) Toma de Decisiones:
Tenemos que RAZZZ 00 64.183.0 . Por lo tanto, aceptamos la hipótesis nula y
tenemos que las proporciones poblacionales de las bases 09 y 11 de la Facultad de Administración son iguales al tratarse de servicios universitarios.
- Prueba de Hipótesis de la Varianza.
Analizando la muestra del estrato 1, Alumnos de la base 09 de la Facultad de Administración, obtenemos como dato inicial una desviación estándar muestral de 11424426.21S minutos. Con esto, formulamos nuestra hipótesis nula que dice que la desviación estándar poblacional es igual a 22 minutos, con un nivel de confianza del 95%.
1) Formulación de Hipótesis:
484:
484:
2
1
2
0
H
H
2) Función Pivotal:
22
( 1)2
( 1)n
n SV X
607.39484
8113107.445)144(00
VV
3) Nivel de Significación:
8.26%5 2
)43(,025.0 X
4) Determinación de la Región Crítica (RR) y la Región de Aceptación (RA):
V = 26.8 V = 39.607
5) Toma de Decisiones:
Tenemos que RRVVV 00 8.26607.39 . Por lo tanto, rechazamos la hipótesis nula y
tenemos que varianza poblacional de la base 10 de la Facultad de Administración es mayor a 484 minutos.
- Prueba de la Bondad de Ajuste.
Verificamos si la variable “tiempo de viaje a la Universidad” de la base 10 de la Facultad de Administración sigue una distribución Normal con un nivel de significación del 5%. Así, obtenemos como dato inicial la media muestral 148936.44X y desviación estándar
58604679.22S .
Tiempo de viaje a la Universidad
Número de alumnos
[ 0 , 20 > 1
[ 20 , 40 > 22
[ 40 , 60 > 12
[ 60 , 80 > 7
[80,100 > 3
[ 100 ,120 ] 2
47
1) Formulación de la Hipótesis:
H0: El tiempo de viaje a la Universidad sigue una distribución Normal H1: El tiempo de viaje a la Universidad no sigue una distribución Normal
2) Función Pivotal:
22
( 1)
1
( )ki i
k m
i i
o eQ X
e
3) Nivel de Significación:
05.0%5 2
1
2
)1( xXPxXP mk
x = 3.84
4) Frecuencias Esperadas:
[ , XA LX [ Z , ZA L iP ii Pe 47 io 2( )i i
i
o e
e
[ 0 , 40 > [ -1.95, -0.18> 0.40692 19.12524 23 0.7850236
[ 40 , 60 > [-0.18, 0.70> 0.32632 15.33704 12 0.7260746
[ 60 , 80 > [0.70,1.59> 0.18491 8.69077 7 0.3289355
[ 80 , 120 ] [1.59 , 3.36> 0.08186 3.84742 5 0.3452809
1 47 Q = 2.1853
5) Determinación de la Región Crítica (RR) y la Región de Aceptación (RA):
Q = 2.1853 Q =3.84
6) Toma de Decisiones:
Tenemos que RAQQQ 00 84.31853.2 . Por lo tanto, aceptamos la hipótesis nula y
decimos que la variable “tiempo de viaje a la Universidad” posee una distribución Normal para la base 09 de la Facultad de Administración.
- Prueba de Independencia.
En esta sección vamos a analizar si existe interdependencia entre el tiempo de viaje a la Universidad y el uso de los servicios universitarios por parte de la base 11 de la Facultad de Administración. Todo esto con un nivel de significación del 1%. La información de la encuesta se muestra a continuación:
Uso de los servicios
universitarios
Tiempo de viaje a la Universidad
[0, 20 > [ 20 ,40
> [ 40 , 60 > [ 60 , 80] [ 80 , 120 ] Total
Si 2 19 9 2 1 33
No 3 15 11 6 1 36
Total 5 34 20 8 2 69
1) Planteamiento de la Hipótesis: H0: El tiempo de viaje a la Universidad y el uso de los servicios universitarios son independientes. H1: El tiempo de viaje a la Universidad está relacionado con el uso de los servicios universitarios.
2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
Donde: F = número de filas C = número de columnas
3) Nivel de Significación:
01.0%1 2
4
2
)1)(1( xXPxXP CF
x = 13.3
4) Frecuencias Esperadas:
Uso de los servicios
universitarios
Tiempo de viaje a la Universidad
[0, 20 > [ 20 ,40
> [ 40 , 60 > [ 60 , 80] [ 80 , 120 ] Total
Si 2 16 10 4 1 33
No 3 18 10 4 1 36
Total 5 34 20 8 2 69
8875.20 Q
5) Determinación de la Región Crítica (RR) y la Región de Aceptación (RA):
Q = 2.8875 Q =13.3
6) Toma de Decisiones:
Tenemos que RAQQQ 00 3.138875.2 . Por lo tanto, se acepta la hipótesis nula y se
puede afirmar que el tiempo de viaje y el uso de los servicios universitarios son independientes entre si para la base 11 de la Facultad de Administración.
- Prueba de Homogeneidad.
En esta sección vamos a analizar si las base 09,10 y 11 de la Facultad de Administración son homogéneas con respecto al uso de los servicios universitarios. Todo esto con un nivel de significación del 5%. La información de la encuesta se presenta a continuación:
Servicios Universitarios
Bases
Base 09 Base 10 Base 11 Total
Si 25 24 34 83
No 19 23 35 77
Total 44 47 69 160
1) Planteamiento de la Hipótesis: H0: Las tres bases son homogéneas respecto al uso de los servicios universitarios. H1: Las tres bases son heterogéneas respecto al uso de los servicios universitarios.
2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
Donde: F = número de filas C = número de columnas
3) Nivel de Significación:
05.0%5 2
2
2
)1)(1( xXPxXP CF
x = 5.99
4) Frecuencias esperadas:
Servicios Universitarios
Bases
Base 09 Base 10 Base 11 Total
Si 23 24 36 83
No 21 23 33 77
Total 44 47 69 160
60.00 Q
5) Determinación de la Región Crítica (RR) y la Región de Aceptación (RA):
Q = 0.60 Q = 5.99
6) Toma de Decisiones:
Tenemos que RAQQQ 00 99.560.0 . Por lo tanto, se acepta la hipótesis nula y
afirmamos que las 3 bases de la Facultad de Administración en estudio, son homogéneas con respecto a los servicios universitarios utilizados por sus alumnos.
- Análisis de la Varianza.
En esta sección analizaremos si el tiempo promedio de viaje a la Universidad en las tres bases es el mismo o si es diferente en por lo menos una base. Para esto usaremos en análisis de la varianza, todo esto con un nivel de significación del 5%. Suponemos, en este caso, que contamos con poblaciones homoscedásticas, en otras palabras, que las varianzas poblacionales de las tres bases son iguales.
1) Planteamiento de la Hipótesis:
0 1 2 3
1 1
:
: No todos los son iguales
H
H
2) Determinación del Nivel de Significación:
0017.3%5 )157,2(1 F
3) Formulación de la Función Pivotal:
2
( 1)
( 1, )2
( )
( 1)
( )
k
k n k
n k
X k CMCF F
X n k CME
1
SCCCMC
k
Cuadrado medio entre tratamientos (columnas)
SCE
CMEn k
Cuadrado medio dentro de los tratamientos (error)
4) Construcción de la tabla de análisis de la varianza (ANAVA):
Base 09 Base 10 Base 11 Total
Total 1855 2075 2560 6490
in 44 47 69 160
iX 42.159091 44.148936 37.101449 40.5625
2
i in X 78205.11397 91609.04185 94979.70874 264793.8646
625.263250)5625.40(160 22 Xn
Suma de Cuadrados:
375.78149625.2632503414001 1
22
k
i
n
j ij
i
XnXSCT
2396.1543625.2632508646.2647932
1
2 XnXnSCC
k
i ii
Con estos datos, realizamos nuestra tabla de análisis de varianza:
Fuente de variación
Suma de cuadrados Grados
de libertad
Cuadrado medio
Razón 0H
Entre tratamientos (columnas)
2
1
2 XnXnSCCk
i ii
2396.1543SCC
1
2
g k
g
6198.771
1
CMC
k
SCCCMC
58.10
0
F
CME
CMCF
i
Dentro de los
tratamientos (error) 1354.76606
2396.1543375.78149
SCE
SCE
SCCSCTSCE
157
g
kng
9372.487
CME
kn
SCECME
Total
k
i
n
j ij
i
XnXSCT1 1
22
375.78149SCT
159g
5) Determinación de la Región Crítica (RR) y la Región de Aceptación (RA): F = 1.58 F = 3.0017
6) Toma de Decisiones:
Tenemos que RAFFF 00 0017.358.1 . Por lo tanto, aceptamos la hipótesis nula y
podemos afirmar que el promedio de tiempo de viaje a la Universidad por parte de las tres bases es el mismo.
VARIABLES
- NÚMERO DE HORAS DEDICADAS A ESTUDIAR (SEMANAL) - SITUACIÓN LABORAL
Análisis de la variable número de horas dedicadas a estudiar (semanal).
- Prueba de hipótesis para la media poblacional.
Analizando la población del estrato 1, es decir, la base 09, tenemos la siguiente información para la variable número de horas (por semana) dedicadas a estudiar : media 13.39 y varianza 24.78 Con esto, formularemos nuestra hipótesis que dice que media poblacional del número de horas (por semana) dedicadas a estudiar es igual a 14.
1) Planteamiento de la hipótesis:
H0: U = 13
H1: U >13 prueba unilateral derecha.
2) Función Pivotal:
(0,1)X
Z NS n
Z0 =
√ √
⁄
Z0 = 0.519685 0.52 Z0 = 0.52
3) Nivel de significación:
= 0.05 Z95% = 1.65
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z = 0.52 Z0= 1.65
5) Toma de decisiones:
Como Z0 = 0.52< Z = 1.65 Z0 RA Entonces se acepta la hipótesis nula y se rechaza la hipótesis alternativa, es decir, la cual se tiene que el verdadero decir que los alumnos de la base 09 estudian 13 horas semanales.
- Prueba de hipótesis para la diferencia de medias poblacionales.
Analizando los estratos 1 y 2, es decir, los alumnos de la base 09 y de la base 10, tenemos que la media muestral y la varianza muestral de la variable número de horas (por semana) dedicadas a estudiar para las 2 bases es respectivamente: ( media 13.39 y varianza 24.78) base 10 y (media 14.62 y varianza 23.56) base 11 Con esto formulamos nuestra hipótesis que las medias poblaciones de ambas bases son iguales y como hipótesis alternativa, que la media poblacional de la variable número de horas (por semana) dedicadas a estudiar mayor en la base 10.
1) Planteamiento de la hipótesis:
0
1
:
:
x y
x y
H
H
2) Función Pivotal:
Z0 =
√
Z0 = -1.192177 -1.19 Z0 = -1.19
3) Nivel de significación:
= 0.05 Z95% = 1.65
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z0 = -1.65 Z = -1.19
5) Toma de decisiones:
Como T0 = -1.19> T 95%= -1.65 T0 RA
Tenemos que 0 05.74 1.64Z Z Z RR . Por lo tanto, rechazamos la hipótesis nula.
- Prueba de hipótesis para la varianza poblacional.
De los datos que obtuvimos en la encuesta, tenemos que (para cada una de las 3 bases involucradas en nuestro estudio): - La varianza muestral del número de escalas que deberían haber para el aporte en la base 09 es 24.78 entonces planteamos la hipótesis nula que la varianza poblacional del número de horas (por semana) dedicadas a estudiar es igual a 23, y como hipótesis alternativa, que ésta sea diferente a 23. Todo esto con un nivel de significación del 5%.
1) Planteamiento de la hipótesis:
H0:
H1:
2) Función Pivotal: 2
2
( 1)2
( 1)n
n SV X
V0 =
X2
(43)
V0 =46.328
3) Nivel de significación:
= 5% X2(
= X2
(0.025)(43) = 26.78
X2(
= X2 = (0.975)(43) = 62.99
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
26.78 V0 =46.33 62.99
5) Toma de decisiones:
Tenemos que 26.78< V0 = 46.33< 62.99 V0 RA .Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza poblacional del número de horas (por semana) dedicadas a estudiar por su cuenta es igual a 23. - La varianza muestral del número de horas (por semana) dedicadas a estudiar en la base 10 es 23.56, entonces planteamos la hipótesis nula que la varianza poblacional del número de horas (por semana) dedicadas a estudiar por su cuenta es igual a 25, y como hipótesis alternativa, que ésta sea diferente a 25. Todo esto con un nivel de significación del 5%.
1) Planteamiento de la hipótesis:
H0: U = 25
H1: U 25
2) Función Pivotal:
22
( 1)2
( 1)n
n SV X
V0 =
X2
(46)
V0 =43.35
3) Nivel de significación: 5%
= 5% X2(
= X2
(0.025)(46) = 29.16
X2(
= X2 = (0.975)(46) = 66.62
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
29.16 V = 43.35 66.62
5) Toma de decisiones:
Tenemos que 29.16< V0 = 43.35< 66.62 V0 RA .Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza poblacional del número de horas (por semana) dedicadas a estudiar por su cuenta es igual a 25. - La varianza muestral del número de horas (por semana) dedicadas a estudiar en la base 11 es 19.56, entonces planteamos la hipótesis nula que la varianza poblacional del número de horas (por semana) dedicadas a estudiar por su cuenta es igual a 18, y como hipótesis alternativa, que ésta sea diferente a 18. Todo esto con un nivel de significación del 5%.
1) Planteamiento de la hipótesis:
H0: U = 18
H1: U 18
2) Función Pivotal:
22
( 1)2
( 1)n
n SV X
V0 =
X2
(67)
V0 =72.80
3) Nivel de significación:
= 5% X2(
= X2
(0.025)(67) = 46.26
X2(
= X2 = (0.975)(67) = 91.51
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
46.26 V = 72.8091.51
5) Toma de decisiones:
Tenemos que 46.26< V0 = 72.80< 91.51 V0 RA .Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza poblacional del número de horas (por semana) dedicadas a estudiar por su cuenta es igual a 18.
- Prueba de la bondad de ajuste (no paramétrica).
En esta sección verificaremos si el número de horas (por semana) dedicadas a estudiar en la base 09 sigue una distribución de tipo Normal con un nivel de significación del 5%. Para esto usaremos los datos que obtuvimos en la encuesta, los cuales se presentan a continuación:
Número de horas dedicadas a estudiar Tipos de estudiantes
[ 5 , 10> Estudiante poco interesado
[ 10 , 15> Estudiante en vías de superarse
[ 15 , 20> Estudiante regular
[ 20 , 25 > Estudiante muy interesado
Tipos de estudiantes Número de alumnos
Estudiante poco interesado
7
Estudiante en vías de superarse
18
Estudiante regular 12
Estudiante muy interesado
7
44
Además, tenemos que:
Media 13.39 y varianza 24.78
1) Planteamiento de la hipótesis:
H0: el número de horas (por semana) dedicadas a estudiar sigue una distribución de probabilidad de tipo normal. H1: el número de horas (por semana) dedicadas a estudiar no sigue una distribución de probabilidad de tipo normal.
2) Función Pivotal:
22
( 1)
1
( )ki i
k m
i i
o eQ X
e
3) Nivel de significación:
2 2
( 1) 25% 0.05
5.99
k mP X x P X x
x
Frecuencias esperadas:
Tipos de estudiantes io iP
2( )i i
i
o e
e
Estudiante poco interesado
7 0.1590 6.996
0.0000022870
Estudiante en vías de superarse
18 0.4090 17.996
0.0000008891
Estudiante regular
12 0.2727 11.999
0.0000000833
Estudiante muy interesado
7 0.1590 6.996
0.0000022870
44
1 Q=0.0000055465
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Q = 0.0000055465 5.99
5) Toma de decisiones:
Tenemos que Q0 = 0.0000055465 <5.99 Q0 RA
Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que el número de horas (por semana) dedicadas a estudiar en la base 09 sigue una distribución de probabilidad de tipo Normal.
- Prueba de Independencia (no paramétrica).
En esta sección vamos a analizar si existe interdependencia entre el número de horas (por semana) dedicadas a estudiar y el rendimiento académico. Todo esto con un nivel de significación del 1%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación:
rendimiento académico
Número de horas (por semana) dedicadas a estudiar
[ 5,10> [10,15> [ 15,20> [ 20,25> Total
Buena 0 5 4 5 14
Regular 7 13 8 2 30
Total 7 18 12 7 44
1) Planteamiento de la hipótesis:
H0: el número de horas (por semana) dedicadas a estudiar y el rendimiento académico son independientes H1: están relacionados o son dependientes
2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
Donde tenemos que: F = 2 (número de filas) C= 4 (número de columnas)
3) Nivel de significación:
2 2
( 1)( 1) 81% 0.01
20.1
F CP X x P X x
x
[ ] [
]
x =13.3 Frecuencias esperadas:
rendimiento académico
Número de horas (por semana) dedicadas a estudiar
[ 5,10 > [10,15> [ 15,20 > [ 20,25 > Total
Buena 2.23 5.73 3.82 2.23 14
Regular 4.77 12.27 8.18 4.77 30
Total 7 18 12 7 44
Calculo de :
2
1
( )ki i
i i
o eQ
e
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Q = 8.48 13.3
5) Toma de decisiones:
Tenemos que Q0 = 8.48 <13.3 Q0 RA. Por lo tanto, se acepta la hipótesis nula. Entonces
aceptamos que entre el número de horas (por semana) dedicadas a estudiar por su cuenta y el rendimiento académico de la base 10 son independientes.
- Análisis de Varianza (ANAVA).
En esta sección analizaremos si el promedio del número de horas (por semana) dedicadas a estudiar por su cuenta en las 3 bases es el mismo o si es diferente en por lo menos en una base. Para esto usaremos el análisis de varianza, y todo esto con un nivel de significación del 5%. Suponemos que estamos en un caso en que las poblaciones son normales homoscedásticas, en otras palabras, que las varianzas poblacionales para las 3 facultades son iguales.
2.23 0.09 0.01 3.45
1.04 0.04 0.00 1.61
8.48
1) Planteamiento de la hipótesis:
0 1 2 3
1 1
:
: No todos los son iguales
H
H
2) Determinación del nivel de confianza.
1 (2,725)5% 3.01F
3) Formulación de la función pivotal.
2
( 1)
( 1, )2
( )
( 1)
( )
k
k n k
n k
X k CMCF F
X n k CME
1
SCCCMC
k
Cuadrado medio entre tratamientos (columnas)
SCE
CMEn k
Cuadrado medio dentro de los tratamientos (error)
4) Construcción de la tabla de análisis de varianza (ANAVA).
2 2728(20.94) 319216.06nX
nX=159*14.08=2238.72 Suma de cuadrados:
M1 M2 M3 Total
Total 265 273 383 921
44 47 68 159
13.39 14.62 14.23 14.08
7888.8524 10045.987 13769.517 31704.356
in
iX
2
i in X
Con estos datos, realizamos nuestra tabla de análisis de varianza:
Fuente de variación
Suma de cuadrados Grados
de libertad
Cuadrado medio Razón 0H
Entre tratamientos (columnas)
1
2
g k
g
i
Dentro de los
tratamientos (error)
SCE=SCT-SCC SCE=32995.28-29465.64 SCE=3529.64
Total
5) Determinación de la región crítica (RR) y la región de aceptación (RA):
3.01F = 651.03
6) Toma de decisiones:
Tenemos que . Por lo tanto rechazamos la hipótesis nula. Concluimos que en las 3 bases, el número promedio del número de horas (por semana) dedicadas a estudiar es diferente.
Análisis de la variable Situación Laboral
- Prueba de hipótesis para la proporción poblacional.
Analizando la población de la base 11 tenemos este dato inicial, el cual representa la
proporción muestral de alumnos que tienen un trabajo es: .Con esto, formularemos nuestra hipótesis que dice que la proporción poblacional de alumnos que tienen un trabajo es igual a 0.20 con un nivel de confianza del 95%.
1) Planteamiento de la hipótesis:
2) Función Pivotal:
ˆ(0,1)
ˆ ˆ(1 )
p pZ N
p p
n
Utilizamos esa función pivotal dado que no conocemos la proporción poblacional.
3) Nivel de significación:
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z = -1.65Z = -0.899
5) Toma de decisiones:
Tenemos que . Por lo tanto, se acepta la hipótesis nula y tenemos que la proporción poblacional de alumnos que tienen trabajo es 0.2.
- Prueba de hipótesis para la diferencia de proporciones poblacionales.
Analizando los estratos de la base 09 y la base 11 tenemos que la proporción de alumnos que trabajan es respectivamente 0.41 y 0.16. Con esto formulamos nuestra hipótesis que las proporciones poblaciones de ambas son iguales y como hipótesis alternativa, que la proporción poblacional de alumnos de la base 09 que tiene esta respuesta es mayor que la base 11.
1) Planteamiento de la hipótesis:
0
1
:
:
x y
x y
H P P
H P P
2) Función Pivotal:
ˆ ˆ( ) ( )(0,1)
(1 )(1 )
x y x y
y yx x
x y
p p P PZ N
P PP P
n n
3) Nivel de significación:
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z = 1.65Z = 3.09
5) Toma de decisiones:
Tenemos que . Por lo tanto, se rechaza la hipótesis nula, entonces, rechazamos que la proporción poblacional de alumnos de la base 09 que trabajan es igual que la base 11.
- Prueba de Independencia (no paramétrica).
En esta sección vamos a analizar si la situación laboral de los alumnos de la base 09 depende del género de éstos mismos. Por lo tanto, nuestra hipótesis nula será que la situación laboral de los alumnos depende del género de éstos mismos. Todo esto con un nivel de significación del 1%.
Género Situación Laboral
Trabaja No trabaja Total
Masculino 17 7 24
Femenino 12 8 20
Total 29 15 44
1) Planteamiento de la hipótesis:
0
1
: La situación laboral de los alumnos y el género
de éstos mismos son independientes
: Estan relacionados o son dependientes
H
H
2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
3) Nivel de significación:
2 2
( 1)( 1) 11% 0.01
6.63
F CP X x P X x
x
Frecuencias esperadas:
Género
Situación Laboral
Trabaja No trabaja Total
Masculino 16 8 24
Femenino 13 7 20
Total 29 15 44
Calculo de Q:
2
1
( )ki i
i i
o eQ
e
0.08 0.20
0.12 0.17
Qo = 0.57
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Q = 0.57 6.63
5) Toma de decisiones:
Tenemos que . Por lo tanto, se acepta la hipótesis nula. Entonces aceptamos que la situación laboral de los alumnos en la base 09 y el género de éstos mismos son independientes.
- Prueba de Homogeneidad (no paramétrica).
En esta sección vamos a analizar si los alumnos de la base 09, base 10 y de la base 11 son homogéneos con respecto a la situación laboral de los alumnos en estas 3 bases. Todo esto con un nivel de significación del 5%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación:
Situación Laboral BASES
Base 09 Base 10 Base 11 Total
Trabaja 29 10 11 50
No Trabaja 15 37 57 109
Total 44 47 68 159
1) Planteamiento de la hipótesis:
H0 = las tres bases son homogéneas respecto a la situación laboral de los alumnos de cada base H1= las tres bases son heterogéneas respecto a la situación laboral de los alumnos de cada base
2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
3) Nivel de significación:
2 2
( 1)( 1) 25% 0.05
5.99
F CP X x P X x
x
Frecuencias esperadas:
Situación Laboral
BASES
Base 09 Base 10 Base 11 Total
Trabaja 13.84 14.78 21.38 50
No Trabaja
30.16 32.22 46.62 109
Total 44 47 68 159
Calculo de Q
:
2
1
( )ki i
i i
o eQ
e
16.62 1.55 5.04
7.62 0.71 2.31
Qo = 33.85
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
5.99 Qo = 33.85
5) Toma de decisiones:
Tenemos que . Por lo tanto, se rechaza la hipótesis nula. Entonces rechazamos que los alumnos de las tres bases son homogéneos con respecto a la situación laboral de los alumnos.
VARIABLES
- UN ANÁLISIS DE LA VARIABLE LUGAR DE RESIDENCIA - EDAD DE LA PERSONA ENCUESTADA
Análisis de la variable Lugar de Residencia de los Alumnos de la Facultad de Ciencias Administrativas
- Prueba de hipótesis para la proporción poblacional.
Analizando la población del estrato 1, es decir, los alumnos de la base 2009, tenemos este dato inicial, el cual representa la proporción muestral de alumnos que viven en un lugar de residencia populoso o residencial: ˆ 0.56p . Con esto, formularemos nuestra hipótesis que dice
que la proporción poblacional de alumnos que dicen que viven en distritos populosos es de 0.70 con un nivel de confianza del 95%.
1) Planteamiento de la hipótesis:
0
1
: 0.70
: 0.70
H p
H p
2) Función Pivotal:
ˆ(0,1)
ˆ ˆ(1 )
p pZ N
p p
n
Utilizamos esa función pivotal dado que no conocemos la proporción poblacional.
0 0
0.56 0.701.76
0.56(1 0.56)
44
Z Z
3) Nivel de significación:
5% 1.65Z
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z = -1.65 Z = -1.76
5) Toma de decisiones:
Tenemos que 0 01.65 1.76Z Z Z RA . Por lo tanto, se acepta la hipótesis nula y
tenemos que la proporción poblacional de alumnos que viven en distritos residenciales es de 0.70
- Prueba de hipótesis para la diferencia de proporciones poblacionales.
Analizando los estratos 2 y 3, es decir, los alumnos de la base 2010 y de los de la base 2011, tenemos que la proporción de alumnos que viven en zonas residenciales es respectivamente 0.47 y 0.43. Con esto formulamos nuestra hipótesis que las proporciones poblaciones de ambas facultades son iguales y como hipótesis alternativa, que la proporción poblacional que los alumnos de la base 2010 tiene mayor número de personas que viven en distritos residenciales que la base 2011.
1) Planteamiento de la hipótesis:
0
1
:
:
x y
x y
H P P
H P P
2) Función Pivotal:
ˆ ˆ( ) ( )(0,1)
(1 )(1 )
x y x y
y yx x
x y
p p P PZ N
P PP P
n n
0 0
(0.47 0.43)0.42
0.47(0.53) 0.43(0.57)
47 68
Z Z
3) Nivel de significación:
5% 1.65Z
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z=0.42 Z = 1.65
5) Toma de decisiones:
Tenemos que 0 00.42 1.65Z Z Z RA . Por lo tanto, se acepta la hipótesis nula, entonces,
aceptamos que la proporción poblacional de alumnos de la base 2010 que vive en distritos residenciales es igual que la de la base 2011.
- Prueba de Independencia (no paramétrica).
En esta sección vamos a analizar si la opinión que tienen los alumnos de la facultad de Administración con respecto a que viven en un distrito residencial y el Ingreso disponible. Por lo tanto, nuestra hipótesis nula será que si la opinión que tienen los alumnos. Todo esto con un nivel de significación del 1%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación:
Distrito Recidencial
Ingreso Personal Mensual
[ 0;200 > [ 200;300 > [ 300; 450> [ 450;600> Total
Si 3 4 6 2 15
No 5 9 13 2 29
Total 8 13 19 4 44
1) Planteamiento de la hipótesis:
0
1
: La opinión que tienen los alumnos respecto al lugar de residencia y su ingreso disponible
: Estan relacionados o son dependientes
H
H
2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
Donde tenemos que: F = 2 (número de filas) C= 4 (número de columnas)
3) Nivel de significación:
2 2
( 1)( 1) 31% 0.01
11.3
F CP X x P X x
x
Frecuencias esperadas:
Calculo de Q:
2
1
( )ki i
i i
o eQ
e
2 2 2 2 2 2
0
2 2
(3 6) (5 2) (4 5) (9 8) (6 11) (13 8)
6 2 5 8 11 8
(2 3) (2 1)
3 1
Q
0 13.06Q
Distrito Recidencial
Ingreso Personal Mensual
[ 0;200 > [ 200;300 > [ 300; 450> [ 450;600> Total
Si 6 5 11 3 15
No 2 8 8 1 29
Total 8 13 19 4 44
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
……….. 11.3 Q = 13.06
5) Toma de decisiones:
Tenemos que 0 013.06 11.3Q Q RR . Por lo tanto, se rechaza la hipótesis nula. Entonces el
ingreso personal disponible para cada alumno de la base 2010 es independiente de que sí viven en un distrito residencial.
Análisis de la variable Edad - Prueba de hipótesis para la media poblacional. Analizando la población del estrato 1, es decir, la base 2009, tenemos la siguiente información
para la variable número de escalas que deberían existir para el aporte: 20.18X
2 1.97S . Con esto, formularemos nuestra hipótesis que dice que media poblacional de los alumnos de la base 2009 es 20 años.
1) Planteamiento de la hipótesis:
0
1
: 20
: 20
H
H
2) Función Pivotal:
(0,1)X
Z NS n
0 0
20.18 200.85
1.97 44Z Z
3) Nivel de significación: 5% 1.65Z
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z =0.85 Z = 1.65
5) Toma de decisiones:
Tenemos que 0 00.85 1.65Z Z Z RR . Por lo tanto, se acepta la hipótesis nula y tenemos
que la media poblacional de los alumnos de la base 2009 es igual a 20 años.
- Prueba de hipótesis para la diferencia de medias poblacionales.
Analizando los estratos 1 y 2, es decir, los alumnos de las facultades de Administración e Ingeniería Industrial, tenemos que la media muestral y la varianza muestral del número de
escalas que deberían existir para el aporte para las 2 facultades es respectivamente: 20.18X
2 1.97xS y 17.87Y
2 0.54yS
Con esto formulamos nuestra hipótesis que las medias poblaciones de ambas facultades son iguales y como hipótesis alternativa, que la media poblacional de alumnos de Administración que tiene esta opinión es mayor que la de Ingenierita Industrial.
1) Planteamiento de la hipótesis:
0
1
:
:
x y
x y
H
H
2) Función Pivotal:
2 2
0 0
( ) ( )(0,1)
( 1) ( 1) 1 1
2
20.18 17.879.93
(44 1)1.97 (47 1)0.54 1 1
44 47 2 44 47
x y
x x y y
x y x y
X YZ N
n S n S
n n n n
Z Z
3) Nivel de significación:
5% 1.65Z
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z = 1.65 Z = 9.93
5) Toma de decisiones:
Tenemos que 0 09.93 1.65Z Z Z RR . Por lo tanto, se rechaza la hipótesis nula,
entonces, no aceptamos que las medias poblaciones de las edades en las base 2009 y 2010 sean iguales.
- Prueba de hipótesis para la varianza poblacional.
De los datos que obtuvimos en la encuesta, tenemos que la varianza muestral de las edades
de los estudiantes de la base 2009 es 2 1.97xS , entonces planteamos la hipótesis nula que la
varianza poblacional de las edades de los estudiantes de la base 2009 es igual a 2, y como hipótesis alternativa, que ésta es diferente de 2. Todo esto con un nivel de significación del 5%.
1) Planteamiento de la hipótesis:
2
0
2
1
: 2
: 2
H
H
2) Función Pivotal:
22
( 1)2
( 1)n
n SV X
2
0 0 02
0
( 1) (44 1)1.9721.015
2
n SV V V
3) Nivel de significación: 5%
2 2
/2,( 1) 1 /2,( 1)
2 2
0.025,44 0.975,44
0.95
27.6 60.5
n nP X V X
X X
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
V=21.015 60.5
5) Toma de decisiones:
Tenemos que 0 021.015 60.5V V RA . Por lo tanto, se aprueba la hipótesis nula, entonces,
aceptamos que la varianza poblacional de número de escalas que deberían haber para el aporte es igual a 2. - La varianza muestral de las edades de los estudiantes en la facultad de Administración de la
base 2010 es 2 0.54S , entonces planteamos la hipótesis nula que la varianza poblacional de
número de escalas que deberían haber para el aporte es igual a 1, y como hipótesis alternativa, que ésta es diferente de 8. Todo esto con un nivel de significación del 5%.
1) Planteamiento de la hipótesis:
2
0
2
1
: 1
: 1
H
H
2) Función Pivotal:
22
( 1)2
( 1)n
n SV X
2
0 0 02
0
( 1) (47 1)0.5424.84
1
n SV V V
3) Nivel de significación: 5%
2 2
/2,( 1) 1 /2,( 1)
2 2
0.025,46 0.975,46
0.95
29.2 66.6
n nP X V X
X X
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
V = 24.84 29.2
5) Toma de decisiones:
Tenemos que 0 024.84 29.2V V RA . Por lo tanto, se acepta la hipótesis nula, entonces,
aceptamos que la varianza poblacional de las edades de los estudiantes de alumnos de la base 2010 es de 2. - La varianza muestral del número de escalas que deberían haber para el aporte en la facultad
de Administración de la base 2011 es 2 1.53S , entonces planteamos la hipótesis nula que la varianza poblacional de número de escalas que deberían haber para el aporte es igual a 2, y como hipótesis alternativa, que ésta es diferente de 2. Todo esto con un nivel de significación del 5%.
1) Planteamiento de la hipótesis:
2
0
2
1
: 2
: 2
H
H
2) Función Pivotal:
22
( 1)2
( 1)n
n SV X
2
0 0 02
0
( 1) (68 1)1.5321.255
2
n SV V V
3) Nivel de significación: 5%
2 2
/2,( 1) 1 /2,( 1)
2 2
0.025,67 0.975,67
0.95
46.3 91.5
n nP X V X
X X
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
V=21.255 46.3
5) Toma de decisiones:
Tenemos que 0 021.255 46.3V V RA . Por lo tanto, se acepta la hipótesis nula, entonces,
aceptamos que la varianza poblacional de número de escalas que debería haber para el aporte es igual a 2. Finalmente, tenemos que la varianza poblacional de esta variable sería igual para la los alumnos de la base 2009 y la 2011.
- Prueba de la bondad de ajuste (no paramétrica).
En esta sección verificaremos si la variable edad en la base 2011 de la facultad de Administración sigue una distribución de tipo Normal con un nivel de significación del 5%. Para esto usaremos los datos que obtuvimos en la encuesta, los cuales se presentan a continuación:
Edades Número de alumnos
[ 16,17 > 1
[ 17,18 > 13
[ 18,19 > 24
[ 19,20 > 9
Total 46
Además, tenemos que: 17.9X
2 0.54xS
1) Planteamiento de la hipótesis:
0
1
: El número de rango de edades sigue una distribucion de probabilidad de tipo Normal
: El número de rango de edades no sigue una distribucion de probabilidad de tipo Normal
H
H
2)
Función Pivotal:
22
( 1)
1
( )ki i
k m
i i
o eQ X
e
3) Nivel de significación:
2 2
( 1) 15% 0.05
3.84
k mP X x P X x
x
Frecuencias esperadas:
[ , XA LX [ Z , ZA L iP 46i ie P io 2( )i i
i
o e
e
[ 16,17 > [ -2.59 ,-1.22 > 0.10546 4.8512 1 3.0573
[ 17,18 > [ -1.22 , 0.14 > 0.45262 20.8205 13 2.9375
[ 18,19 > [ 0.14 , 1.50 > 0.37752 17.3659 24 2.5343
[ 19,20 > [ 1.50 , 2.86 > 0.0644 2.9624 9 12.3051
Total 1 46 20.8342Q
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
3.84 Q = 20.8342
5) Toma de decisiones:
Tenemos que 0 020.8342 3.84Q V RR . Por lo tanto, se rechaza la hipótesis nula,
entonces, aceptamos que la edad no sigue una distribución de probabilidad de tipo Normal, lo cual se podía ver a simple vista ya que no existía simetría en las frecuencias de los datos.
- Prueba de Independencia (no paramétrica).
En esta sección vamos a analizar si existe interdependencia entre las escalas de edades de la base 2009 y si viven en un distrito residencial el cual está dividido en: SI y NO, este análisis se llevara con una confianza del 99% de significación:
Distrito Residencial
Edad
[ 16,17 > [ 17,18 > [ 18,19 > [ 19,20 > Total
Si 3 4 6 2 15
No 5 9 13 2 29
Total 8 13 19 4 44
1) Planteamiento de la hipótesis:
0
1
: La edad de los estudiantes de la base 2010 y el lugar
de residencia de los mismos son independientes
: Estan relacionados o son dependientes
H
H
2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
Donde tenemos que: F = 2 (número de filas) C= 4 (número de columnas)
3) Nivel de significación:
2 2
( 1)( 1) 31% 0.01
11.3
F CP X x P X x
x
Frecuencias esperadas:
Distrito Residencial
Edad
[ 17,19 > [ 19,21 > [ 21,23 > [ 23,25 > Total
Si 1 5 4 3 15
No 0 8 20 6 32
Total 1 13 24 9 47
Calculo de Q:
2
1
( )ki i
i i
o eQ
e
2 2 2 2 2 2 2
0
(0 1) (7 5) (6 8) (3 4) (21 20) (5 3) (4 6)
1 5 8 4 20 3 6Q
0 4.6Q
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Q = 4.6 11.3
5) Toma de decisiones:
Tenemos que 0 04.6 11.2Q Q RA . Por lo tanto, se acepta la hipótesis nula. Entonces
aceptamos que la edad de los estudiantes y sí viven en un distrito residencia son independientes.
- Análisis de Varianza (ANAVA).
En esta sección analizaremos si el promedio de la edad de los estudiantes en las 3 bases de la
facultad de Administración es mismo o si es diferente en por lo menos 1 facultad. Para esto
usaremos el análisis de varianza, y todo esto con un nivel de significación del 5%. Suponemos
que estamos en un caso en que las poblaciones son normales homoscedásticas, en otras
palabras, que las varianzas poblacionales para las 3 bases son iguales.
1) Planteamiento de la hipótesis:
0 1 2 3
1 1
:
: No todos los son iguales
H
H
2) Determinación del nivel de confianza.
1 (2,156)5% 3.0017F
3) Formulación de la función pivotal.
2
( 1)
( 1, )2
( )
( 1)
( )
k
k n k
n k
X k CMCF F
X n k CME
1
SCCCMC
k
Cuadrado medio entre tratamientos (columnas)
SCE
CMEn k
Cuadrado medio dentro de los tratamientos (error)
4) Construcción de la tabla de análisis de varianza (ANAVA).
M1 M2 M3 Total
Total 192 95 73 1206
in 44 47 68 159
iX 20.18 17.9 16.76 54.84
2
i in X 17918.226 15059.27 19101.037 52078.532
2 2159(54.84) 478180.6704nX
Suma de cuadrados:
2 2
1 1
2 2
1
24336 478180.67 453844.67
52078.53 478180.67 426102.138
ink
ij
i j
k
i i
i
SCT X nX
SCC n X nX
Con estos datos, realizamos nuestra tabla de análisis de varianza:
Fuente de variación
Suma de cuadrados Grados
de libertad
Cuadrado medio
Razón 0H
Entre tratamientos (columnas)
2 2
1
426102.138
k
i i
i
SCC n X nX
SCC
1
2
g k
g
1
179.76
SCCCMC
k
CMC
0
0 31
CMCF
CME
F
i
Dentro de los
tratamientos (error)
4560.92 359.51
27742.532
SCE SCT SCC
SCE
SCE
156
g n k
g
5.80
SCECME
n k
CME
Total
2 2
1 1
311698 307137.08
4560.92
ink
ij
i j
SCT X nX
SCT
SCT
727g
5) Determinación de la región crítica (RR) y la región de aceptación (RA):
3.0017 F = 31
6) Toma de decisiones:
Tenemos que 0 031 3.0017F F RR . Por lo tanto rechazamos la hipótesis nula. Concluimos
que en las bases, el promedio de edades es significativamente diferente.
FASANANDO CHÁVEZ REITER ANTONIO
VARIABLES: -NÚMERO DE CURSOS QUE LLEVAN -SERVICIOS CON LOS QUE CUENTA EN SU VIVIENDA
Análisis de la variable servicios con los que cuenta en casa
- Prueba de hipótesis para la proporción poblacional.
Analizando la población del estrato 2, es decir, la base 11, tenemos este dato inicial, el cual
representa la proporción muestral de alumnos que cuenta con todos los servicios en casa: pˆ=
0.9371 Con esto, formularemos nuestra hipótesis que dice que la proporción poblacional de
alumnos que cuenta con todos los servicios en casa es igual a 0.9633 con un nivel de
confianza del 95%.
1) Planteamiento de la hipótesis:
Ho: p= 0.9633
H1: p<0.9633
2) Función Pivotal:
ˆ(0,1)
ˆ ˆ(1 )
p pZ N
p p
n
Utilizamos esa función pivotal dado que no conocemos la proporción poblacional.
√
= -0.9685
3) Nivel de significación:
α= 5%, entonces
α
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z = -1.65 Z = -0.9685
5) Toma de decisiones:
Tenemos que Zo= -0.9685 >Z= -1.65, entonces Zo RA. Por lo tanto, se acepta la hipótesis nula y tenemos que la proporción poblacional de alumnos que cuenta con todos los servicios en su casa es igual a 0.9633.
- Prueba de hipótesis para la diferencia de proporciones poblacionales.
Analizando los estratos 1 y 3, es decir, los alumnos de las bases 09 y 11, tenemos que la
proporción de alumnos que cuenta con todos los servicios en casa es , respectivamente. Con esto planteamos nuestra hipótesis que las proporciones poblaciones de ambas bases son iguales, así como también la hipótesis alternativa, que la proporción poblacional de alumnos de la base 09 que tiene esta opinión es mayor que la de la base 11.
1) Planteamiento de la hipótesis:
0
1
:
:
x y
x y
H P P
H P P
2) Función Pivotal:
ˆ ˆ( ) ( )
(0,1)(1 )(1 )
x y x y
y yx x
x y
p p P PZ N
P PP P
n n
√
= 0.3156
3) Nivel de significación:
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z = 0.3159 Z = 1.65
5) Toma de decisiones:
Tenemos que . Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la proporción poblacional de alumnos de la base 10 que cuenta con todos los servicios en casa es la misma que la proporción de los alumnos de la base12.
- Prueba de Independencia (no paramétrica).
En esta sección vamos a analizar si existe dependencia entre la variable servicios de casa con el ingreso en el estrato 3, es decir la base 12; o bien también demostrar si existe independencia. Todo esto con un nivel de significación del 1%.
INGRESOS
SERVICIOS QUE TIENE EN CASA
TODOS PRINCIPALES TOTAL
ALTOS 42 1 45
BAJOS 20 3 23
TOTAL 62 4 68
1) Planteamiento de la hipótesis:
2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
Donde tenemos que:
F = 2 (número de filas) C= 2(número de columnas)
3) Nivel de significación:
( ) (
)
X= 6.63
Frecuencias esperadas: INGRESOS
SERVICIOS QUE TIENE EN CASA
TODOS PRINCIPALES TOTAL
ALTOS 41 3 45
BAJOS 21 1 23
TOTAL 62 4 68
Nota: aproximaremos los resultados para evitar los decimales.
Calculo de Q:
2
1
( )ki i
i i
o eQ
e
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Q = 5.405 6.63
5) Toma de decisiones:
Tenemos que . Por lo tanto, se acepta la hipótesis nula. Entonces aceptamos que la no existe relación entre el nivel de ingresos y los servicios con los que cuenta en casa.
- Prueba de Homogeneidad (no paramétrica).
En esta sección analizaremos si los alumnos de las base 2010, 2011 y 2012, son homogéneos con respecto a los servicios con los que cuenta un estudiante en su casa. Todo esto con un nivel de significación del 5%.
SERVICIOS CON LOS QUE CUENTA EL ESTUDIANTE EN CASA
BASES
BASE 09 BASE10 BASE11 TOTAL
TODOS 42 43 64 149
PRINCIPALES 2 4 4 10
TOTAL 44 47 68 159
1) Planteamiento de la hipótesis:
2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
3) Nivel de significación:
(
)
X=5.99
Frecuencias esperadas: SERVICIOS CON LOS QUE CUENTA EL ESTUDIANTE EN CASA
BASES
BASE 09 BASE10 BASE11 TOTAL
TODOS 41 44 64 149
PRINCIPALES 3 3 4 10
TOTAL 44 47 68 159
Nota: redondeamos los resultados para evitar los decimales.
Calculo de Q:
2
1
( )ki i
i i
o eQ
e
Q= 0.71378
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Q = 0.71378 5.99
5) Toma de decisiones:
Tenemos que . Por lo tanto, se acepta la hipótesis nula. Entonces aceptamos que los alumnos de las bases 2012, 2011 y 2012 con respecto a los servicios con los que cuenta un estudiante en su casa.
Análisis de la variable Número de cursos que levan los estudiantes de las base 2009, 2010 y 2011.
- Prueba de hipótesis para la media poblacional.
Analizando la población del estrato 1, es decir, la base 10, tenemos la siguiente información
para la variable número de cursos que llevan los estudiantes de estas 3 bases: Con esto, formularemos nuestra hipótesis que dice que media poblacional del número de cursos que llevan los estudiantes es 6, frente a la alternativa de que sean menos que 6.
1) Planteamiento de la hipótesis
2) Función Pivotal:
(0,1)X
Z NS n
Z=-4.24 3) Nivel de significación:
5% 1.64Z
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z=-4.24 Z=-1.64
5) Toma de decisiones:
Tenemos que . Por lo tanto, se rechaza la hipótesis nula y tenemos que la media poblacional del número de cursos que llevan los estudiantes de la base 10 es menor que 6
- Prueba de hipótesis para la diferencia de medias poblacionales.
Analizando los estratos 1 y 2, es decir, los alumnos de las bases 2009 y 2010, tenemos que la media muestral y la varianza muestral del número de cursos que llevan los alumnos de dichas
bases son: y
, respectivamente.
Con esto formulamos nuestra hipótesis que las medias poblaciones de ambas bases son iguales y como hipótesis alternativa, que la media poblacional de alumnos de la base 09 es mayor que la media de los de la base 10.
1) Planteamiento de la hipótesis:
0
1
:
:
x y
x y
H
H
2) Función Pivotal:
√
3) Nivel de significación:
5% 1.64Z
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z = -8.13 Z = 1.64
5) Toma de decisiones:
Tenemos que . Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que las medias poblaciones del número de cursos que llevan los estudiantes de las bases 2009 y 2010 son iguales.
- Prueba de hipótesis para la varianza poblacional.
- La varianza muestral del número de cursos que llevan los alumnos de la base 11 es
, entonces planteamos la hipótesis nula que la varianza poblacional del número de cursos es igual a 6, y como hipótesis alternativa, que ésta es diferente de 6. Todo esto con un nivel de significación del 5%.
1) Planteamiento de la hipótesis:
2)
Función Pivotal: 2
2
( 1)2
( 1)n
n SV X
V= 45.33
3) Nivel de significación: 5%
X
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
V=45.33 66.6
5) Toma de decisiones:
Tenemos que . Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza poblacional de número de cursos que llevan los alumnos de la base 11 es igual a 4.
- Prueba de la bondad de ajuste (no paramétrica).
En esta sección verificaremos si el número de cursos que llevan los alumnos de la base 10 sigue una distribución de tipo Normal con un nivel de significación del 5%. Número de cursos que lleva Alumnos
3 3
4 4
5 9
6 28
Además, tenemos que:
1) Planteamiento de la hipótesis:
2)
Función Pivotal: 2
2
( 1)
1
( )ki i
k m
i i
o eQ X
e
3) Nivel de significación:
( )
X= 3.84
4) Frecuencias esperadas:
Número de cursos
FRECUENCIAS Z P
3 3 -2.64 0.00415 0.1826 43.471
4 4 -1.55 0.05057 2.22508 1.416
5 9 -0.45 0.30313 13.33772 1.411
6 28 0.65 0.64215 28.2546 0.002
TOTAL 44 1 44 46.3
3.84 Q = 46.3
5) Toma de decisiones:
Tenemos que . Por lo tanto, se rechaza la hipótesis nula, entonces, aceptamos que el número de cursos que llevan los alumnos de la base 10 no tienen una distribución normal.
- Prueba de Independencia (no paramétrica).
En esta sección vamos a analizar si existe interdependencia entre el número de cursos que llevan los estudiantes y si desempeñan alguna actividad laboral en la base 10. Con un nivel de significación del 1%. TRABAJO
NÚMERO DE CURSOS QUE LLEVA
3 4 5 6 TOTAL
SÍ 3 3 4 8 18
NO 0 1 5 20 26
TOTAL 3 4 9 28 44
1) Planteamiento de la hipótesis:
2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
Donde tenemos que: F = 2 (número de filas) C= 4 (número de columnas)
3) Nivel de significación:
( )
X=11.3
Frecuencias esperadas: TRABAJO
NÚMERO DE CURSOS QUE LLEVA
3 4 5 6 TOTAL
SÍ 1 2 4 11 18
NO 2 2 5 17 26
TOTAL 3 4 9 28 44
Calculo de Q: 2
1
( )ki i
i i
o eQ
e
ó
Q=8.347593583 APROXIMANDO:
Q=8.35
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Q=8.35 11.3
5) Toma de decisiones:
Tenemos que Q=8.35 . Por lo tanto, se acepta la hipótesis nula. Entonces aceptamos que el número de cursos que llevan los estudiantes de la base 2010 y la actividad laboral son independientes.
- Análisis de Varianza (ANAVA).
En esta sección analizaremos si el promedio del número cursos que llevan los estudiantes de las 3 bases es mismo o si es diferente en por lo menos 1 base. Para esto usaremos el análisis de varianza, y todo esto con un nivel de significación del 5%. Suponemos que estamos en un caso en que las poblaciones son normales homoscedásticas, en otras palabras, que las varianzas poblacionales para las 3 facultades son iguales.
1) Planteamiento de la hipótesis:
0 1 2 3
1 1
:
: No todos los son iguales
H
H
2) Determinación del nivel de confianza
3) Formulación de la función Pivotal
2
( 1)
( 1, )2
( )
( 1)
( )
k
k n k
n k
X k CMCF F
X n k CME
1
SCCCMC
k
Cuadrado medio entre tratamientos (columnas)
SCE
CMEn k
Cuadrado medio dentro de los tratamientos (error)
4) Construcción de la tabla de análisis de varianza (ANAVA).
M1 M2 M3 Total
Total 232 268 405 905
in 44 47 68 159
iX 5.41 5.70 6 5.703
2
i in X 1287.8 1527.03 2448 5262.83
∑∑
Suma de cuadrados
∑∑
∑
SCE=47.17
Con estos datos, realizamos nuestra tabla de análisis de varianza:
Fuente de variación
Suma de cuadrados Grados
de libertad
Cuadrado medio
Razón 0H
Entre tratamientos (columnas)
SCC=91.48 1
2
g k
g
CMC=45.74
i
Dentro de los tratamientos
(error) SCE=47.17
CME=0.3024
Total SCT=138.65 g=158
5) Determinación de la región crítica (RR) y la región de aceptación (RA):
3 F = 151.26
6) Toma de decisiones:
Tenemos que . Concluimos que en las 3
bases, el número promedio de cursos que llevan los estudiantes de las 3 bases es significativamente diferente.
VARIABLES -LUGAR DE ORIGEN -SITUACION LABORAL ACTUAL
- Prueba de hipótesis para la proporción poblacional.
Analizando la población del estrato 1, es decir, los alumnos de la base 10 de la facultad de economía, tenemos este dato inicial, el cual representa la proporción muestral de alumnos que tienen su lugar de origen en una provincia del país: ˆ 0.57p .Con esto, formularemos nuestra
hipótesis que dice que la proporción poblacional de alumnos que son de un lugar de origen, provincia, es igual a 0.5 con un nivel de confianza del 95%.
1) Planteamiento de la hipótesis:
0
1
: 0.5
: 0.5
H p
H p
2) Función Pivotal:
ˆ(0,1)
ˆ ˆ(1 )
p pZ N
p p
n
Utilizamos esa función pivotal dado que no conocemos la proporción poblacional.
√
3) Nivel de significación:
α = 5%; Z = 1.64
4) Determinación de la región crítica y la región de aceptación
Z = 0.938 Z = 1.64
5) Toma de decisiones:
Tenemos que Z₀=0.938<Z=1.96 →Z₀ є RA, por lo tanto, se acepta la hipótesis nula y tenemos que más del 50% de los alumnos tienen como lugar de origen una provincia del país.
- Prueba de hipótesis para la diferencia de proporciones poblacionales.
Analizando los estratos 1 y 2, es decir, los alumnos de la base 09 y 10 de la facultad de economía; tenemos que la proporción de alumnos que tienen como lugar de origen provincia son 0.57 y 0.4 respectivamente. Con esto formulamos nuestra hipótesis, que las proporciones poblacionales de ambas bases son iguales y como hipótesis alternativa, que la proporción poblacional de alumnos de la base 09 que poseen como lugar de origen provincia, es mayor que la de la base 10.
1) Planteamiento de hipótesis
0
1
:
:
x y
x y
H P P
H P P
2) Función Pivotal
ˆ ˆ( ) ( )(0,1)
(1 )(1 )
x y x y
y yx x
x y
p p P PZ N
P PP P
n n
√
3) Nivel de significación
5% 1.64Z
4) Determinación de la región critica(RR) y la región de aceptación (RA)
Z = 1.64 Z = 1.605
5) Toma de decisiones
Tenemos que Z₀=1.605< Z=1.64 → Z₀ є RA. Por lo tanto, se rechaza la hipótesis nula, entonces, aceptamos que la proporción de alumnos que
Tienen como lugar de origen provincia es mayor en la base 09 respecto a la base 10.
- Prueba de Independencia (no paramétrica).
En esta sección analizaremos si la situación laboral (trabajan o no) de los alumnos de las diferentes bases depende del lugar de origen (provincia o capital).siendo una hipótesis valida analizaremos la relación entre estas 2 variables. Por lo tanto, nuestra hipótesis nula será que la situación laboral actual de los alumnos de la base 10 depende de su lugar del lugar de origen todo esto con un nivel de significación del 1%.
lugar de origen
Horas de trabajo capital provincia Total
si trabaja 17 22 39
no trabaja 70 50 120
total 87 72 159
1) Planteamiento de hipótesis
H : la situación laboral (trabajan o no) de los alumnos de las diferentes bases de la facultad de economía y el lugar de origen de los mismos son independientes.
H₁: las variables antes mencionadas están relacionadas o son dependientes.
2) Función Pivotal
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
3) Nivel de significación
α = 1% → [ ] [
] ]
lugar de origen
Horas de trabajo capital Provincia Total
si trabaja 21 18 39
no trabaja 66 54 120
total 87 72 159
Q = 2.1895
4) Determinación de la región critica (RR) y la región de aceptación (RA):
Q = 2.1895 9.21
5) Toma de decisiones:
Tenemos que Q = 2.1895 < 9.21 → Q є RA. Por lo tanto se acepta la hipótesis. Entonces aceptamos que existe una relación entre la situación laboral y el lugar de origen, es decir, son independientes.
- Prueba de Homogeneidad (no paramétrica).
En esta sección vamos a analizar si los alumnos de las diferentes bases (09, 10 y 11) son homogéneos con respecto al lugar de origen. Todo con un nivel de significación del 1%.
Lugar de origen BASE 09 BASE10 BASE11 TOTAL
capital 19 28 40 87
provincia 25 19 28 72
TOTAL 44 47 68 159
1) Planteamiento de la hipótesis:
H : las tres bases son homogéneas respecto al lugar de origen
: las tres bases son heterogéneas respecto al lugar de origen
2) Función Pivotal:
2
2
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
3) Nivel de significación:
α = 1% → [ ] [
]
X = 9.21 Frecuencias esperadas Lugar de origen BASE 09 BASE10 BASE11 TOTAL
capital 24 26 37 87
provincia 20 21 31 72
TOTAL 44 47 68 159
Calculo de Q:
2
1
( )ki i
i i
o eQ
e
Q = 2.9196
1) Determinación del área critica (RR) y la región de aceptación (RA):
Q = 2.9196 9.21
4) Toma de decisiones:
Tenemos que Q = 2.9196 > 9.21 → Q є RR. Por lo tanto, se acepta la hipótesis nula. Entonces aceptamos que los alumnos de las bases 09, 10 y 11 son homogéneos con respecto a su lugar de origen.
ANALISIS DE LA VARIABLE SITUACION LABORAL ACTUAL (TRABAJA O NO) - Prueba de hipótesis para la media poblacional
Analizando la población de alumnos de la facultad de economía (de las bases 10, 11 y 12) tenemos la siguiente información para la variable número de horas que trabajan los alumnos:
= 4.67, S2 = 2.068. Con esto formularemos nuestra hipótesis que dice que la media poblacional del número de horas de trabajo que debe ser es 4.
1) Planteamiento de hipótesis:
0
1
: 4
: 4
H
H
2) Función pivotal
(0,1)X
Z NS n
Utilizamos esa función pivotal dado que:
√ √
3) Nivel de significación:
5% 1.64Z
4) Determinación de la región critica (RR)Y la región de aceptación (RA):
Z=1.64 Z =2.9096
5) Toma de decisión
Tenemos que Z =-2.9096 > Z = 1.64 → Z є RR. Por lo tanto, se rechazara la hipótesis nula y tenemos que la media poblacional del número de horas que deberían de trabajares mayor a 4 horas diarias
- Prueba de hipótesis para la diferencia de medias poblacionales.
Analizando los estratos 1 y 2 es decir, los alumnos de las bases 09 y 10 de la facultad de Administración, tenemos que la media muestral y la varianza muestral del número de horas de los alumnos de economía que trabajan de ambas bases son respectivamente:
= 4.39, S²x = 1.02 y = 5.20, S²y = 1.76. Con esto formulamos nuestra hipótesis que las medias poblacionales de ambas bases son iguales y como hipótesis alternativa que la media poblacional de alumnos de la base 10 es mayor que el de la base 09. 1) Planteamiento de la hipótesis:
0
1
:
:
x y
x y
H
H
2) Función pivotal:
Z =-1.679
3) Nivel de significación:
α = 5% → Zα = 1.64
4) Determinación de la región critica (RR) y la región de aceptación (RA)
Z =-1.679 Z=1.64
5) Toma de decisiones
Tenemos que = -1.679 → є RA. Por lo tanto, se acepta la hipótesis nula, entonces aceptamos que las medias poblacionales respecto al número de horas que trabajan los alumnos que labora actualmente de las bases 09 y 10 son iguales.
- Prueba de hipótesis para la varianza poblacional.
De los datos que obtuvimos en la encuesta, tenemos que (para cada una de las 3 bases involucradas en nuestro estudio): - La varianza muestral del número de horas de trabajo por parte de los alumnos de la base 09 que actualmente laboran es S²x = 1.02, entonces planteamos la hipótesis nula que la varianza poblacional del número de horas que deberían de realizar es igual a 1, y como hipótesis alternativa, que ésta es diferente de 1. Todo esto con un nivel de significación del 5%.
1) Planteamiento de la hipótesis:
2
0
2
1
: 1
: 1
H
H
2)
Función Pivotal:
22
( 1)2
( 1)n
n SV X
3) Nivel de significación: 5%
P [V ≥ 0.05, 17] = 0.95
0.05, 17
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
V = 17.34
5) Toma de decisiones:
Tenemos que V = 17.34 al estar en la RR Por lo tanto, se rechaza la hipótesis nula, entonces, aceptamos que la varianza poblacional de número de horas de trabajo que deberían darse para el trabajo es mayor de 1.
VARIABLES:
-NÚMERO DE HORAS DEDICADAS AL OCIO (SEMANAL) - GÉNERO
Análisis de la variable Número de horas dedicadas al ocio (semanal).
- Prueba de hipótesis para la media poblacional.
Analizando la población del estrato 1, es decir, la base 09, tenemos la siguiente información para la variable número de horas (por semana) dedicadas al ocio: media 7.64 y varianza 4.84. Con esto, formularemos nuestra hipótesis que dice: ¿Qué media poblacional del número de horas (por semana) dedicadas a estudiar es igual a 8.
1) Planteamiento de la hipótesis:
H0: µ = 7 horas
H1: µ >7 horas prueba unilateral derecha.
2) Función Pivotal:
(0,1)X
Z NS n
Z0 =
√ √
⁄=
Z0 = 2.050277143 2.05 Z0 = 2.05
3) Nivel de significación:
= 0.05 Z95% = 1.65
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z = 2.05 Z0 = 1.65
5) Toma de decisiones:
Como Z = 2.05 < Z0 = 1.65 Z0 RA Entonces se acepta la hipótesis nula y se rechaza la hipótesis alternativa, es decir, de lo cual concluyo que los alumnos de la base 09 tienen 7 horas de ocio a la semana.
- Prueba de hipótesis para la diferencia de medias poblacionales.
Analizando los estratos 1 y 2, es decir, los alumnos de la base 09 y de la base 10, tenemos que la media muestral y la varianza muestral de la variable número de horas (por semana) dedicadas al Ocio para las 2 bases es respectivamente: (media 7.64 y varianza 4.84) base 09 y (media 8.06 y varianza 5.54) base 10 Con esto formulamos nuestra hipótesis que las medias poblaciones de ambas bases son iguales y como hipótesis alternativa, que la media poblacional de la variable número de horas (por semana) dedicadas al Ocio es mayor en la base 10.
1) Planteamiento de la hipótesis:
0
1
:
:
x y
x y
H
H
2) Función Pivotal:
Z0 =
√
Z0 = -0.8798395576 -0.88
Z0 = -0.88
3) Nivel de significación:
= 0.05 Z95% = 1.65
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z = -1.65 Z0 = -0.88
5.) Toma de decisiones:
Tenemos que Z0 = -0.88 > Z 95%= -1.65 Z0 RA. Por lo tanto, aceptamos la hipótesis nula, de que el número de horas (por semana) promedio dedicadas al Ocio de los alumnos de la base 09 es igual al promedio de horas de Ocio de los alumnos de la Base 10.
- Prueba de hipótesis para la varianza poblacional.
De los datos que obtuvimos en la encuesta, tenemos que (para cada una de las 3 bases involucradas en nuestro estudio): - La varianza muestral del promedio de horas de horas de ocio de la base 10 es 4.84 entonces planteamos la hipótesis nula que la varianza poblacional del número de horas (por semana) dedicadas al Ocio es igual a 5, y como hipótesis alternativa, que ésta sea diferente de 5. Todo esto con un nivel de significación del 5%.
1) Planteamiento de la hipótesis:
H0:
H1:
2) Función Pivotal: 2
2
( 1)2
( 1)n
n SV X
V0 =
X2
(43)
V0 =41.624
3) Nivel de significación:
= 5% X2(
= X2
(0.025)(43) = 24.43
X2(
= X2 = (0.975)(43) = 59.34
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
24.43 V0 =41.64 59.34
5) Toma de decisiones:
Tenemos que 24.43 < V0 = 41.64 < 59.34 V0 RA. Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza poblacional del número de horas promedio (por semana) dedicadas al Ocio de los alumnos de la Base 09 es igual a 5. - La varianza muestral del número de horas (por semana) dedicadas al Ocio en la base 11 es 5.54, entonces planteamos la hipótesis nula que la varianza poblacional del número de horas (por semana) dedicadas al ocio es igual a 6, y como hipótesis alternativa, que ésta sea diferente a 6. Todo esto con un nivel de significación del 5%. 1) Planteamiento de la hipótesis:
H0: µ = 6
H1: µ 6
2) Función Pivotal:
22
( 1)2
( 1)n
n SV X
V0 =
X2
(46)
V0 =42.4733
3) Nivel de significación: 5%
= 5% X2(
= X2
(0.025)(46) = 32.36
X2(
= X2 = (0.975)(46) = 71.42
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
32.36 V = 42.47 71.42
5) Toma de decisiones:
Tenemos que 32.36 < V0 = 42.47 < 71.42 V0 RA. Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza poblacional del número de horas (por semana) dedicadas al Ocio es igual a 6.
- La varianza muestral del número de horas (por semana) dedicadas al Ocio en la base 12 es 7.93, entonces planteamos la hipótesis nula que la varianza poblacional del número de horas (por semana) dedicadas al Ocio es igual a 8, y como hipótesis alternativa, que ésta sea diferente a 8. Todo esto con un nivel de significación del 5%. 1) Planteamiento de la hipótesis:
H0: µ = 8
H1: µ 8
2) Función Pivotal:
22
( 1)2
( 1)n
n SV X
V0 =
X2
(67)
V0 = 48.58
3) Nivel de significación:
= 5% X2(
= X2
(0.025)(67) = 48.76
X2(
= X2 = (0.975)(67) = 95.02
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
V0 = 48.58 48.76 95.02
5) Toma de decisiones:
Tenemos que 48.76 < V0 = 48.58 < 95.02 V0 RA . Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza poblacional del número de horas (por semana) dedicadas al Ocio 8.
Análisis de la variable Opinión acerca de la procedencia del aporte
- Prueba de hipótesis para la proporción poblacional.
Analizando la población del estrato 2, es decir, la base 10 de la facultad de ciencias económicas, tenemos este dato inicial, el cual representa la proporción muestral de alumnos que piensa que el aporte debería ser completamente voluntario: ˆ 0.36p .Con esto,
formularemos nuestra hipótesis que dice que la proporción poblacional de alumnos que piensa que el aporte debería ser completamente voluntario es igual a 0.40 con un nivel de confianza del 95%.
1) Planteamiento de la hipótesis:
0
1
: 0.40
: 0.40
H p
H p
2) Función Pivotal:
ˆ(0,1)
ˆ ˆ(1 )
p pZ N
p p
n
Utilizamos esa función pivotal dado que no conocemos la proporción poblacional.
0 0
0.36 0.401.39
0.36(1 0.36)
278
Z Z
3) Nivel de significación:
5% 1.64Z
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z = -1.64Z = -1.39
5) Toma de decisiones:
Tenemos que 0 01.39 1.64Z Z Z RA . Por lo tanto, se acepta la hipótesis nula y
tenemos que la proporción poblacional de alumnos que piensa que el aporte debería destinarse a la mejora de la calidad educativaes igual a 0.40
- Prueba de hipótesis para la diferencia de proporciones poblacionales.
Analizando los estratos 1 y 2, es decir, los alumnos de la base 09 y base 10 de la facultad de ciencias económicas, tenemos que la proporción de alumnos que piensa que el aporte debería ser voluntario es respectivamente 0.47 y 0.43. Con esto formulamos nuestra hipótesis que las proporciones poblaciones de ambas facultades son iguales y como hipótesis alternativa, que la proporción poblacional de alumnos de la base 10, que tiene esta opinión es mayor que los de la base 10.
1) Planteamiento de la hipótesis:
0
1
:
:
x y
x y
H P P
H P P
2) Función Pivotal:
ˆ ˆ( ) ( )(0,1)
(1 )(1 )
x y x y
y yx x
x y
p p P PZ N
P PP P
n n
0 0
(0.47 0.43)0.95
0.47(0.53) 0.43(0.57)
284 278
Z Z
3) Nivel de significación:
5% 1.64Z
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z=0.95Z = 1.64
5) Toma de decisiones:
Tenemos que 0 00.95 1.64Z Z Z RA . Por lo tanto, se acepta la hipótesis nula, entonces,
aceptamos que la proporción poblacional de alumnos de la facultad de Administración que piensa que el aporte debería ser completamente voluntario es igual que la de la base 10.
- Prueba de Independencia (no paramétrica).
En esta sección vamos a analizar si la opinión que tienen los alumnos de la base 10 de Ciencias Administrativas respecto a qué debería destinarse el aporte depende de su opinión respecto a la calidad educativa de su respectiva facultad. Por lo tanto, nuestra hipótesis nula será que si la opinión que tienen los alumnos respecto a qué debería destinarse el aporte depende de su opinión acerca de la disponibilidad de invertir en la mejora de su facultad. Todo esto con un nivel de significación del 1%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación:
Opinión sobre la calidad
educativa
Opinión sobre el origen de dicho aporte
Porcentaje
de mensualidad
en secundaria
Porcentaje del ingreso
actual
Completamente Voluntario
Otros Total
Si 36 54 53 19 162
No 24 24 43 25 116
Total 60 78 96 44 278
1) Planteamiento de la hipótesis:
0
1
: La opinión que tienen los alumnos respecto a si desean invertir o no y el origen de dicho aporte
: Estan relacionados o son dependientes
H
H
2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
Donde tenemos que: F = 2 (número de filas) C= 4 (número de columnas)
3) Nivel de significación:
2 2
( 1)( 1) 41% 0.01
13.3
F CP X x P X x
x
Frecuencias esperadas:
Calculo de Q: 2
1
( )ki i
i i
o eQ
e
2 2 2 2 2 2
0
2 2
(36 35) (54 45) (53 56) (19 26) (24 25) (24 33)
35 45 56 26 25 33
(43 40) (25 18)
40 18
Q
Opinión sobre la calidad
educativa
Opinión sobre el origen de dicho aporte
Porcentaje
de mensualidad
en secundaria
Porcentaje del ingreso
actual
Completamente Voluntario
Otros Total
Si 35 45 56 26 162
No 25 33 40 18 116
Total 60 78 96 44 278
0 17.18Q
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
………..Q =13.3 17.8
5) Toma de decisiones:
Tenemos que 0 017.18 13.3Q Q RR . Por lo tanto, se rechaza la hipótesis nula. Entonces
aceptamos que la opinión que tienen los alumnos respecto a qué debería destinarse el aporte y la opinión respecto a la calidad educativa de su respectiva base no son independientes.
- Prueba de Homogeneidad (no paramétrica).
En esta sección vamos a analizar si los alumnos de las facultades de la base10, base 11 y base 12 son homogéneos con respecto a su la opinión que tienen los alumnos respecto al origen del aporte a invertir. Todo esto con un nivel de significación del 5%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación: Opinión sobre el destino de dicho
aporte
Facultades
Administración Sociales Industrial Total
Porcentaje de la mensualidad en secundaria
69 63 39 171
Porcentaje del ingreso actual
85 71 37 193
Completamente voluntario
104 100 78 282
Otros 25 44 13 82
Total 283 278 167 728
1) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
2) Nivel de significación:
2 2
( 1)( 1) 65% 0.05
12.6
F CP X x P X x
x
Frecuencias esperadas: Opinión sobre el destino de dicho
aporte
Facultades
Administración Sociales Industrial Total
Porcentaje de la mensualidad en secundaria
66 65 39 171
Porcentaje del ingreso actual
75 74 44 193
Completamente voluntario
110 108 65 282
Otros 32 31 19 82
Total 283 278 167 728
Calculo de Q:
2
1
( )ki i
i i
o eQ
e
2 2 2 2 2 2
0
2 2 2 2 2 2
(69 66) (63 65) (39 39) (85 75) (71 74) (37 44)
66 65 39 75 74 44
(105 110) (100 108) (78 65) (25 32) (44 31) (13 19)
110 108 65 32 31 19
Q
0 15.02Q
3) Determinación de la región crítica (RR) y la región de aceptación (RA):
12.6Q =41.28
4) Toma de decisiones:
Tenemos que 0 015.02 12.6Q Q RR . Por lo tanto, se rechaza la hipótesis nula. Entonces
aceptamos que los alumnos de las facultades de la base 09, base 10 y base 11 son heterogéneos con respecto a su la opinión respecto a la procedencia de dicho aporte.
Análisis de la variable porcentaje del ingreso mensual que se debería aportar
- Prueba de hipótesis para la media poblacional.
Analizando la población del estrato 2, es decir, la facultad de base 10, tenemos la siguiente información para la variable porcentaje del ingreso mensual que s deberían existir para el
aporte: 8.79X 2 18.67S . Con esto, formularemos nuestra hipótesis que dice que media poblacional del porcentaje del ingreso mensual que deberían existir para el aporte es igual a 09.
1) Planteamiento de la hipótesis:
0
1
: 10
: 10
H
H
2) Función Pivotal:
(0,1)X
Z NS n
0 0
8.79 101.49
18.67 278Z Z
3) Nivel de significación: 5% 1.64Z
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z = -1.49 Z = 1.64
5) Toma de decisiones:
Tenemos que 0 01.49 1.64Z Z Z RA . Por lo tanto, se acepta la hipótesis nula y
tenemos que la media poblacional del porcentaje del ingreso mensual que se debería aportar es 10.
- Prueba de hipótesis para la diferencia de medias poblacionales.
Analizando los estratos 1 y 3, es decir, los alumnos de la base 10 y base 12 , tenemos que la media muestral y la varianza muestral del porcentaje del ingreso mensual que se debería
aportar para las 2 bases es respectivamente: 9.26X 2 21.26xS y 9.61Y 2 20.42yS
Con esto formulamos nuestra hipótesis que las medias poblaciones de ambas facultades son iguales y como hipótesis alternativa, que la media poblacional de alumnos de base 10 que tiene esta opinión es mayor que la de la base 12.
1) Planteamiento de la hipótesis:
0
1
:
:
x y
x y
H
H
2) Función Pivotal:
22
0 0
( ) ( )(0,1)
9.26 9.610.55
21.26 20.42
144 79
x y
yx
x y
X YZ N
n n
Z Z
3) Nivel de significación:
5% 1.64Z
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z = -0.55 Z = 1.64
5) Toma de decisiones:
Tenemos que 0 00.55 1.64Z Z Z RA . Por lo tanto, se acepta la hipótesis nula,
entonces, aceptamos que las medias poblaciones del porcentaje del ingreso mensual que se debería aportar en las facultades de Administración e Ingeniería Industrial son iguales.
- Prueba de hipótesis para la varianza poblacional.
De los datos que obtuvimos en la encuesta, tenemos que la varianza muestral del porcentaje
del ingreso mensual que se debería aportar en base 09 es 2 21.26xS , entonces planteamos la
hipótesis nula que la varianza poblacional del porcentaje del ingreso mensual para el aporte es igual a 1, y como hipótesis alternativa, que ésta es diferente de 1. Todo esto con un nivel de significación del 5%.
1) Planteamiento de la hipótesis:
2
0
2
1
: 20
: 20
H
H
2) Función Pivotal:
22
( 1)2
( 1)n
n SV X
2
0 0 02
0
( 1) (284 1)21.26300.83
20
n SV V V
3) Nivel de significación: 5%
2 2
/2,( 1) 1 /2,( 1)
2 2
0.025,284 0.975,284
0.95
247.98 328
n nP X V X
X X
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
V = 300.83 328
5) Toma de decisiones:
Tenemos que 0 0300.83 328V V RA . Por lo tanto, se acepta la hipótesis nula, entonces,
aceptamos que la varianza poblacional porcentaje del ingreso mensual que se debería aportar es 20. De los datos que obtuvimos en la encuesta, tenemos que la varianza muestral del porcentaje
del ingreso mensual que se debería aportar en la base 10 es 2 18.67xS , entonces planteamos
la hipótesis nula que la varianza poblacional del porcentaje del ingreso mensual para el aporte es igual a 20, y como hipótesis alternativa, que ésta es menor que 20. Todo esto con un nivel de significación del 5%.
1) Planteamiento de la hipótesis:
0 0
1 1
: 20
: 20
H H
H H
2) Función Pivotal:
22
( 1)2
( 1)n
n SV X
2
0 0 02
0
( 1) (278 1)18.67258.58
20
n SV V V
3) Nivel de significación: 5%
2 2
/2,( 1) 1 /2,( 1)
2 2
0.025,278 0.975,138
0.95
237.46 321.96
n nP X V X
X X
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
237.46V = 258.58
5) Toma de decisiones:
Tenemos que 0 0258.58 237.45Q Q RR . Por lo tanto, se acepta la hipótesis nula,
entonces, aceptamos que la varianza poblacional porcentaje del ingreso mensual que se debería aportar es 20.
De los datos que obtuvimos en la encuesta, tenemos que la varianza muestral del porcentaje
del ingreso mensual que se debería aportar en la base 12 es 2 22.42xS , entonces planteamos
la hipótesis nula que la varianza poblacional del porcentaje del ingreso mensual para el aporte es igual a 20, y como hipótesis alternativa, que ésta es mayor que 20 . Todo esto con un nivel de significación del 5%.
1) Planteamiento de la hipótesis:
2
0
2
1
: 20
: 20
H
H
2) Función Pivotal:
22
( 1)2
( 1)n
n SV X
2
0 0 02
0
( 1) (167 1)22.42186.09
20
n SV V V
3) Nivel de significación: 5%
2 2
/2,( 1) 1 /2,( 1)
2 2
0.025,167 0.975,167
0.95
137.34 198.20
n nP X V X
X X
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
V = 186.09 198.20
5) Toma de decisiones:
Tenemos que 0 0186.09 198.20V V RA . Por lo tanto, se acepta la hipótesis nula, entonces,
aceptamos que la varianza poblacional porcentaje del ingreso mensual que se debería aportar es 20.
Finalmente tenemos que la varianza de esta variable es igual en todos los estratos.
- Prueba de Independencia (no paramétrica).
En esta sección vamos a analizar si existe interdependencia entre el porcentaje del ingreso mensual para aportar y el nivel del ingreso personal disponible de los encuestados en la base 11. Para esto se hizo una re categorización en ésta última variable de la siguiente manera: porcentaje bajo (de 0 5), Ingresos medios (de 6a 10) e Ingresos altos (de 11 a más). Todo esto con un nivel de significación del 1%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación:
1) Planteamiento de la hipótesis:
0
1
: El número de escalas que debería haber para el aporte y el nivel del ingreso
personal disponible de los encuestados son independientes
: Estan relacionados o son dependientes
H
H
2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
Donde tenemos que: F = 3 (número de filas) C= 5 (número de columnas)
3) Nivel de significación:
Ingresos
Porcentaje del ingreso mensual que se debería aportar
Bajos Medios Altos Total
Bajos 21 25 7 53
Medios 19 15 9 43
Altos 23 29 18 70
Total 63 69 34 166
2 2
( 1)( 1) 41% 0.01
13.3
F CP X x P X x
x
Frecuencias esperadas:
Ingresos
Porcentaje del ingreso mensual que se debería aportar
Bajos Medios Altos Total
Bajos 20 22 11 53
Medios 16 18 9 43
Altos 27 29 14 70
Total 63 69 34 166
Calculo de Q:
2
1
( )ki i
i i
o eQ
e
2 2 2 2 2 2
0
2 2 2
(21 20) (25 22) (7 11) (19 16) (18 15) (9 9)
20 22 11 16 15 9
(23 27) (29 29) (18 14)
27 29 14
Q
0 4.81Q
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
4.81 Q = 13.3
5) Toma de decisiones:
Tenemos que 0 04.81 13.3X X Z RA . Por lo tanto, se acepta la hipótesis nula. Entonces
aceptamos que el promedio del ingreso mensual que se destina al aporte y el nivel del ingreso personal disponible de los encuestados en la base 12 son independientes.
- Prueba de Homogeneidad (no paramétrica).
En esta sección vamos a analizar si los alumnos de las bases 09, base 10 y base 11 son homogéneos con respecto a su la opinión que tienen los alumnos respecto al origen del aporte a invertir. Todo esto con un nivel de significación del 5%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación:
1) Planteamiento de la hipótesis:
Ho: las 3 bases son homogéneas respecto al porcentaje del ingreso mensual del aporte a invertir H1: las tres bases son heterogéneas respecto al porcentaje del ingreso mensual del aporte a invertir
2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
3) Nivel de significación:
Porcentaje del ingreso mensual que se debería destinar para el
aporte
Bases
Base 10 Base 11 Base 12 Total
Bajo porcentaje 113 97 63 273
Mediano porcentaje
126 71 69 266
Alto porcentaje 44 110 34 188
Total 283 278 166 727
2 2
( 1)( 1) 45% 0.05
9.49
F CP X x P X x
x
Frecuencias esperadas:
Calculo de Q:
2
1
( )ki i
i i
o eQ
e
2 2 2 2 2 2
0
2 2 2
(113 106) (97 104) (63 62) (126 104) (71 102) (69 61)
106 104 62 104 102 61
(44 73) (110 72) (34 43)
73 72 43
Q
0 49.53Q
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Porcentaje del ingreso mensual que se debería destinar para el
aporte
Bases
Base 09 Base 10 Base 11 Total
Bajo porcentaje 106 104 62 273
Mediano porcentaje
104 102 61 266
Alto porcentaje 73 72 43 188
Total 283 278 166 727
Q =9.49 49.53
5) Toma de decisiones:
Tenemos que 0 049.53 9.49Q Q RR . Por lo tanto, se rechaza la hipótesis nula. Entonces
aceptamos que los alumnos de la base 09, base 10 y base 11 son homogéneos con respecto al porcentaje del ingreso mensual que se debería aportar.
- Análisis de Varianza (ANAVA).
En esta sección analizaremos si el porcentaje del ingreso que debería haber para el aporte en las tres bases es mismo o si es diferente en por lo menos 1 facultad. Para esto usaremos el análisis de varianza, y todo esto con un nivel de significación del 5%. Suponemos que estamos en un caso en que las poblaciones son normales homoscedásticas, en otras palabras, que las varianzas poblacionales para las 3 bases son iguales.
1) Planteamiento de la hipótesis:
0 1 2 3
1 1
:
: No todos los son iguales
H
H
2) Determinación del nivel de confianza.
1 (2,725)5% 3.02F
3) Formulación de la función pivotal.
2
( 1)
( 1, )2
( )
( 1)
( )
k
k n k
n k
X k CMCF F
X n k CME
1
SCCCMC
k
Cuadrado medio entre tratamientos (columnas)
SCECME
n k
Cuadrado medio dentro de los tratamientos (error)
4) Construcción de la tabla de análisis de varianza (ANAVA).
M1 M2 M3 Total
Total 2629.84 2443.62 1595.26 6667.72
in 284 278 166 728
iX 9.26 8.79 9.61 9.16
2
i in X 24352.32 21479.42 15330.45 61162.19
2 2728(9.16) 61083.28nX
Suma de cuadrados:
2 2
1 1
2 2
1
75950 61083.28 14866.72
61162.19 61083.28 78.91
ink
ij
i j
k
i i
i
SCT X nX
SCC n X nX
Con estos datos, realizamos nuestra tabla de análisis de varianza:
Fuente de variación
Suma de cuadrados Grados
de libertad
Cuadrado medio
Razón 0H
Entre tratamientos (columnas)
2 2
1
3755.56 3521.40
78.91
k
i i
i
SCC n X nX
SCC
SCC
1
2
g k
g
1
39.46
SCCCMC
k
CMC
0
0 1.93
CMCF
CME
F
i
Dentro de los
tratamientos (error)
14866.72 78.91
14787.81
SCE SCT SCC
SCE
SCE
725
g n k
g
20.4
SCECME
n k
CME
Total
2 2
1 1
75950 61083.28
14866.72
ink
ij
i j
SCT X nX
SCT
SCT
727g
5) Determinación de la región crítica (RR) y la región de aceptación (RA):
1.93 F =3.02
6) Toma de decisiones:
Tenemos que 0 01.93 3.02X X Z RA . Por lo tanto aceptamos la hipótesis nula.
Concluimos que en las 3 bases, el número promedio de escalas que deberían existir para dicho pago son iguales.
- Prueba de la bondad de ajuste (no paramétrica).
En esta sección verificaremos si pago porcentual del ingreso que debería haber para el aporte en la base 11 sigue una distribución de tipo Chi-Cuadrado con un nivel de significación del 5%. Para esto usaremos los datos que obtuvimos en la encuesta, los cuales se presentan a continuación:
Número de Escalas
Número de alumnos
5 129
10 103
15 30
20 16
Total 278
Además, tenemos que: 8.8X 2 18.67xS
1) Planteamiento de la hipótesis:
0
1
: El número de escalas que debería haber para el aporte
sigue una distribucion de probabilidad de tipo normal
: El número de escalas que debería haber para el aporte
no sigue una distribu
H
H
cion de probabilidad de tipo normal
2) Función Pivotal:2
2
( 1)
1
( )ki i
k m
i i
o eQ X
e
3) Nivel de significación:
2 2
( 1) 35% 0.05
7.81
k mP X x P X x
x
Frecuencias esperadas:
X
x
iP 278i ie P io 2( )i i
i
o e
e
5 -0.88 0.18943 52.66 129 110.67
10 0.28 0.32083 89.19 103 2.14
15 1.43 0.31338 87.12 30 36.58
20 2.59 0.17636 49.03 16 12.23
1 79 24.5557Q
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
5) Toma de decisiones:
Tenemos que 0 0161.62 7.81Q V RR . Por lo tanto, se rechaza la hipótesis nula, entonces,
aceptamos que el porcentaje del presupuesto mensual que deberían haber para el aporte no sigue una distribución de probabilidad de tipo Normal, lo cual se podía ver a simple vista ya que no existía simetría en las frecuencias de los datos. 8.1. Estimación y Prueba de Hipótesis de la media Ejercicio 1: Una encuesta por muestreo aplicada a 44 alumnos de la facultad de Ciencias Económicas de la base 2010 de la UNMSM, revela que el gasto personal mensual es de S/. 264.25, con una desviación estándar de S/.91.80.Docimar la hipótesis de que el verdadero gasto personal medio de los estudiantes de la UNMSM, es de S/.200, frente a la alternativa de que fue mayor que S/.200. Utilizar un nivel de significación del 1%.Solución:
1) PLANTEAMOS LA HIPÓTESIS
2) FORMULAMOS LA FUNCIÓN PIVOTAL
No se conoce la varianza poblacional
Muestra grande
Z = -
√
⁄ N (0,1)
VALOR CALCULADO:
Ho: µ=200 H1: µ>200
Zo = -
√
⁄ =
√ ⁄
= 8.83
3) ESPECIFICAMOS EL NIVEL DE SIGNIFICACIÓN:
α= 1% Z (0.99)= 2.58
4) DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA REGIÓN DE
ACEPTACIÓN (RA)
RA RR
2.58
5) TOMA DE DECISIONES
Tenemos que: Zo = 8.83 2.58; Zo Є RR luego, rechazamos la hipótesis Ho, por lo tanto, la media poblacional es mayor a S/.200.
Ejercicio 2: Una encuesta por muestreo aplicada a 159 alumnos de la facultad de Ciencias Económicas de la UNMSM, revela que el gasto personal mensual es de S/.251.24, con una desviación estándar de S/.105.43.Docimar la hipótesis de que el verdadero gasto personal medio de los estudiantes de la UNMSM, es de S/.200, frente a la alternativa de que fue mayor que S/.200. Utilizar un nivel de significación del 1%. Solución:
1) PLANTEAMOS LA HIPÓTESIS
2) FORMULAMOS LA FUNCIÓN PIVOTAL
No se conoce la varianza poblacional
Ho: µ=200 H1: µ>200
Muestra grande
Z = -
√
⁄ N (0,1)
VALOR CALCULADO: Zo = -
√
⁄ =
√ ⁄
= 6.13
3) ESPECIFICAMOS EL NIVEL DE SIGNIFICACIÓN:
α= 1% Z 0.99=2.58
4) DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA REGIÓN DE
ACEPTACIÓN (RA)
RA
RR
2.58
5) TOMA DE DECISIONES
Tenemos que: Zo = 6.13 >2.58 Zo Є RR luego, rechazamos la hipótesis Ho, por lo tanto, la media poblacional es mayor que S/.200. 8.2. Estimación y Prueba de Hipótesis de la diferencia de medias Ejercicio 1: Se propone estudiar una nueva base la 2011 para saber cuál es el ingreso familiar mensual, respecto a la base 2010. Para estudiar la nueva base 2011 realizamos una encuesta a 47
alumnos, y los resultados fueron X=248.51, Y=264.25, 8426.75 ¿Diría Ud. que la base 2011 tiene un gasto más significativo o mayor?
Solución: 1. PLANTEAMOS LA HIPÓTESIS
Ho: µx =µy H1: µx <µy
2. FORMULAMOS LA FUNCIÓN PIVOTAL
No se conocen las varianzas poblacionales
Muestras grandes
Se supone Poblaciones Normales Homocedásticas
FP =
√
N (0, 1)
Valor calculado:
Zo=
√
= =
√
= -0.77
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
α= 1% Z0.01= -2.58
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA RR
-2.58
5. TOMA DE DECISIONES
Tenemos que: Zo = -0.77> -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. No existe diferencia significativa entre ambas bases. La base 2011 no tiene un mayor gasto respecto a la base 2010.
Ejercicio 2: Se propone estudiar una nueva base la 2012 para saber cuál es el ingreso familiar mensual, respecto a la base 2010. Para estudiar la nueva base 2012 realizamos
una encuesta a 69 alumnos, y los resultados fueron X=244.71, Y=264.25, 8426.75 ¿Diría Ud. que la base 2012 tiene un gasto más significativo o mayor? Solución:
6. PLANTEAMOS LA HIPÓTESIS
Ho: µx =µy H1: µx <µy
7. FORMULAMOS LA FUNCIÓN PIVOTAL
No se conocen las varianzas poblacionales
Muestras grandes
Se supone Poblaciones Normales Homocedásticas
FP =
√
N (0, 1)
Valor calculado:
Zo=
√
= =
√
= -0.99
8. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
α= 1% Z0.01= -2.58
9. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA RR
-2.58
10. TOMA DE DECISIONES
Tenemos que: Zo = -0.99> -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. No existe diferencia significativa entre ambas bases. La base 2012 no tiene un gasto más significativo respecto a la base 2010.
8.3. Estimación y Prueba de Hipótesis de la proporción Ejercicio 1: La fracción de respuestas sobre el tipo de vivienda “propia” de cierta encuesta realizada en la facultad de Ciencias Económicas de la UNMSM fue de 0.90. Una nueva encuesta asegura que los resultados son menores. Con la muestra que se proporciona se hace la encuesta y se obtiene que 137estudiantes cuentan con vivienda “propia” de un total de 159 encuestados. Contrastar si la nueva encuesta es segura o no, con un 1% de significación.
Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: p =0.9 H1: p <0.90
2. FORMULAMOS LA FUNCIÓN PIVOTAL
Z =
√
N (0, 1)
Si se supone verdadera la hipótesis nula Ho: p=po
Zo=
√
=
√
= -1.67
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
α= 1% Z0.01= -2.58
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA
-2.58
5. TOMA DE DECISIONES
Tenemos que: Zo = -1.67>-2.58 Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto, la nueva encuesta no tiene respuestas confiables respecto si los estudiantes cuentan con vivienda “propia”.
Ejercicio 2: La fracción de respuestas sobre el tipo de vivienda “alquilado” de cierta encuesta realizada en la facultad de Ciencias Económicas de la UNMSM fue de 0.20. Una nueva encuesta asegura que los resultados son menores. Con la muestra que se proporciona se hace la encuesta y se obtiene que 22estudiantes cuentan con vivienda “alquilada” de un total de 159 encuestados. Contrastar si la nueva encuesta es segura o no, con un 1% de significación.
. Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: p =0.20 H1: p <0.20
2. FORMULAMOS LA FUNCIÓN PIVOTAL
Z =
√
N (0, 1)
Si se supone verdadera la hipótesis nula Ho: p=po
Zo=
√
= =
√
= -0.86
2. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
α= % Z0.01= -2.5
3. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA
-2.58
5. TOMA DE DECISIONES
Tenemos que: Zo = -0.86<-2.58 Zo Є RR. Por lo tanto rechazamos el Ho.
Por lo tanto, la nueva encuesta no tiene respuestas confiables respecto si los estudiantes cuentan con vivienda “alquilada”.
8.4. Estimación y Prueba de Hipótesis de la diferencia de proporciones Ejercicio 1: Se realizó una encuesta a los estudiantes de la base 2010 sobre el tipo de vivienda, en una muestra de 44 se obtuvo que el 84% cuentan con vivienda “propia”, también se realizó la misma encuesta a la base 2012 con una muestra de 68 y se obtuvo que el 88% cuentan con vivienda “propia”. De acuerdo con estas respuestas y con un nivel de significación del 1%, ¿podría rechazarse la hipótesis acerca del tipo de vivienda que presentan los estudiantes de dicha facultad? Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: PX = Py H1: Px<Py Px: respuestas “propia” de la base 2010 Py: respuestas “propia” de la base 2011
2. FORMULAMOS LA FUNCIÓN PIVOTAL
Z =
√
N (0, 1)
Zo=
√
= -0.57
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
α= 1% Z0.01= -2.58
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA
-2.58
5. TOMA DE DECISIONES
Tenemos que: Zo = -0.57> -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto, puede afirmarse que al nivel del 1%, la encuesta no es significativamente buena ya que no se acerca a la realidad.
Ejercicio 2: Se realizó una encuesta a los estudiantes de la base 2011 sobre el tipo de vivienda, en una muestra de 47 se obtuvo que el 85% cuentan con vivienda “propia”, también se realizó la misma encuesta a la base 2010 con una muestra de 44 y se obtuvo que el 84% cuentan con vivienda “propia”. De acuerdo con estas respuestas y con un nivel de significación del 1%, ¿podría rechazarse la hipótesis acerca del tipo de vivienda que presentan los estudiantes de dicha facultad? Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: PX = Py H1: Px>Py Px: respuestas “propia” de la base 2011 Py: respuestas “propia” de la base 2010
2. FORMULAMOS LA FUNCIÓN PIVOTAL
Z =
√
N (0, 1)
Zo=
√
= 0.13
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
α= 1% Z0.01= -2.58
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA
-2.58
5. TOMA DE DECISIONES
Tenemos que: Zo = -0.13> -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto, puede afirmarse que al nivel del 1%, la encuesta no es significativamente buena ya que no se acerca a la realidad.
8.5. Estimación y Prueba de Hipótesis de la Varianza Ejercicio 1: En la facultad de Ciencias Económicas de la UNMSM, se plantea la hipótesis de que la desviación estándar de los gastos personales mensuales es de S/.100. En una muestra de 159 alumnos elegidos al azar, con una varianza de S/.11115.78. Con estos datos, ¿se justifica la suposición que la desviación estándar verdadera es S/.100? Use el nivel de significación del 1%, y suponga que la distribución de la actitud en un simulacro de sismo es normal. Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: = S/.10000
H1: ≠ S/.10000
2. FORMULAMOS LA FUNCIÓN PIVOTAL
V =
Vo=
= 175.63
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA
67.3 140.2
5. TOMA DE DECISIONES
Tenemos que: [67.3- 140.2]; Vo=175.63;Zo Є RR. Por lo tanto rechazamos el Ho, la varianza poblacional es ≠ S/.10000.
Ejercicio 2:
En la facultad de Ciencias Económicas de la UNMSM de la base 2011, se plantea la hipótesis de que la desviación estándar es de S/.100. En una muestra de 47 alumnos elegidos al azar, con una varianza de S/.10686.34. Con estos datos, ¿Se justifica la suposición que la desviación estándar verdadera es de S/.900? Use el nivel de significación del 1%, y suponga que la distribución de los ingresos mensuales familiares es normal.
1. PLANTEAMOS LA HIPÓTESIS
Ho: = S/.10000
H1: ≠ S/.10000
2. FORMULAMOS LA FUNCIÓN PIVOTAL
V =
Vo=
= 49.16
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA
74.2 129.6
5. TOMA DE DECISIONES
Tenemos que: [74.2- 129]; Vo=49.16;Zo Є RR. Por lo tanto rechazamos el Ho, la varianza poblacional es ≠ S/.10000.
8.7. Prueba de Independencia Ejercicio 1: Se seleccionan aleatoriamente 44 estudiantes de la base 2010de la facultad de Ciencias Económicas de la UNMSM, y se les aplica una encuesta, para verificar si existe razón, al creer que los estudiantes que incurren en altos gastos por lo general cuentan con vivienda propia, y que los estudiantes que incurren en bajos gastos a menudo cuentan con vivienda alquilada. Los resultados obtenidos de la encuesta se muestran en el siguiente cuadro: (altos: mayor a 200; bajos: menor igual a 200)
GASTOS Rendimiento académico
PROPIA ALQUILADO TOTAL
ALTOS 26 3 29
BAJOS 13 2 15
TOTAL 39 5 44
Utilice un nivel de significación del 1%
1. PLANTEAMOS LA HIPÓTESIS
Ho: el gasto y tipo de viviendason independientes. H1: Están relacionados o son dependientes.
2. FORMULAMOS LA FUNCIÓN PIVOTAL
∑
Donde: F = Número de filas C = Número de columnas Oi =Frecuencias observadas ℮i = Frecuencias esperadas
3. NIVEL DE SIGNIFICACIÓN
α =1% ; P ( (
)
X= 6.63
Las frecuencias esperadas:
INGRESOS Rendimiento académico
BUENO REGULAR TOTAL
ALTOS 26 3 29
BAJOS 13 2 15
TOTAL 39 5 44
P=
{proporción de estudiantes con buenos rendimientos}
26(
= 8.32 {número de estudiantes con altos ingresos que presentan
buenos rendimientos}
CÁLCULO DE Q:
Q=∑
Q=
Q= 0.434
4. REGIÓN CRITICA O RECHAZO(RR) Y REGIÓN DE ACEPTACIÓN (RA)
RA
6.63
5. DESICIÓN:
Puesto que Q= 0.0< 6.63 → Q Є RA Aceptamos la hipótesis Ho. Por lo tanto, el gasto personal y tipo de vivienda son independientes.
8.8. Prueba de Homogeneidad
Ejercicio 1: Se efectuó un estudio a tres bases de la Facultad de Ciencias Económicas de la UNMSM: Base 2009, Base 2010 y Base 2011, para determinar el tipo de vivienda de los alumnos, como “propia” o “alquilada”. Una muestra aleatoria de 159 alumnos ha dado los resultados de la siguiente tabla. A partir de estos datos, determinar si las tres bases son homogéneas con respecto a su tipo de vivienda. Utilice el nivel de significación del 1%.
RENDIMIENTO ACADEMICO
BASES TOTAL
BASE 09 BASE 10 BASE 11
PROPIA 37 40 60 137
ALQUILADA 7 7 8 22
TOTAL 44 47 68 159
1. PLANTEAMOS LA HIPÓTESIS
Ho: Las tres bases son homogéneas con respecto al tipo de vivienda con el que disponen. H1: Las tres bases no son homogéneas con respecto al tipo de vivienda con el que disponen.
2. FORMULAMOS LA FUNCIÓN PIVOTAL
∑
Donde: F = Número de filas C = Número de columnas Oi =Frecuencias observadas ℮i = Frecuencias esperadas
3. NIVEL DE SIGNIFICACIÓN
α =1% ; P ( (
)
X= 9.21
Las frecuencias esperadas:
RENDIMIENTO ACADEMICO
BASES TOTAL
BASE 09 BASE 10 BASE 11
PROPIA 38 40 59 137
ALQUILADA 6 7 9 22
TOTAL 44 47 68 159
P=
{Proporción de alumnos que presentan vivienda “propia”}
44(
12.32{Número de alumnos de la Base 10 que presentan vivienda
“propia”}
CÁLCULO DE Q:
Q=∑
Q=
Q= 0.32
4. REGIÓN CRITICA O RECHAZO(RR) Y REGIÓN DE ACEPTACIÓN (RA)
RA
9.21
5. DESICIÓN:
Puesto que Q= 0.32< 9.21 → Q Є RA Aceptamos la hipótesis Ho. Por lo tanto, las tres bases son homogéneas con respecto al tipo de vivienda que el que disponen.
8.9. Análisis de Varianza
En esta sección analizaremos si el promedio del gasto personal mensual en la Facultad de Ciencias Económicas de la UNMSM es el mismo o si es diferente en por lo menos en 1 de las 3 bases encuestadas. Para esto usaremos el análisis de varianza, y todo esto con un nivel de significación del 5%. Suponemos que estamos en un caso en que las poblaciones son normales homoscedásticas, en otras palabras, que las varianzas poblacionales para las 3 bases son iguales.
1) Planteamiento de la hipótesis:
0 1 2 3
1 1
:
: No todos los son iguales
H
H
2) Determinación del nivel de confianza.
1 (2,725)5% 3.0016 F
3) Formulación de la función pivotal.
2
( 1)
( 1, )2
( )
( 1)
( )
k
k n k
n k
X k CMCF F
X n k CME
1
SCCCMC
k
Cuadrado medio entre tratamientos (columnas)
SCECME
n k
Cuadrado medio dentro de los tratamientos (error)
4.) Construcción de la tabla de análisis de varianza (ANAVA).
Base 2009 Base 2010 Base 2011 Total
Total 11627 11680 14572 37879
in 44 47 58 159
iX 264.25 248.51 251.24 764
2
i in X 3072434.8 2902589.35 3661049.18 9636073.33
8.1. Estimación y Prueba de Hipótesis de la media Ejercicio 1: Una encuesta por muestreo aplicada a 159 alumnos de la facultad de Ciencias Económicas de la UNMSM, revela que el ingreso promedio familiar es de S/. 1724.72, con una desviación estándar de S/.954.12.Docimar la hipótesis de que el verdadero ingreso familiar medio de los estudiantes de la UNMSM, es de S/.1500, frente a la alternativa de que fue mayor que S/.1500. Utilizar un nivel de significación del 1%. Solución:
6) PLANTEAMOS LA HIPÓTESIS
7) FORMULAMOS LA FUNCIÓN PIVOTAL
No se conoce la varianza poblacional
Muestra grande
Ho: µ=1500 H1: µ>1500
Z = -
√
⁄ N (0,1)
VALOR CALCULADO: Zo = -
√
⁄ =
√ ⁄
= 2.96
8) ESPECIFICAMOS EL NIVEL DE SIGNIFICACIÓN:
α= 1% Z 0.99=2.58
9) DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
10)
RA
RR
2.58
11) TOMA DE DECISIONES
Tenemos que: Zo = 2.96> 2.58Zo Є RR luego, rechazamos la hipótesis Ho, por lo tanto, la media poblacional es mayor que S/.1500. Ejercicio 2: Una encuesta por muestreo aplicada a 68 alumnos de la facultad de Ciencias Económicas de la base 2012 de la UNMSM, revela que el ingreso promedio familiar es de S/. 1655.74, con una desviación estándar de S/.1082.74.Docimar la hipótesis de que el verdadero ingreso familiar medio de los estudiantes de la UNMSM, es de S/.1500, frente a la alternativa de que fue mayor que S/.1500. Utilizar un nivel de significación del 1%. Solución:
1) PLANTEAMOS LA HIPÓTESIS
2) FORMULAMOS LA FUNCIÓN PIVOTAL
No se conoce la varianza poblacional
Muestra grande
Z = -
√
⁄ N (0,1)
VALOR CALCULADO:
Zo = -
√
⁄ =
√ ⁄
= 0.65
3) ESPECIFICAMOS EL NIVEL DE SIGNIFICACIÓN:
α= 1% Z (0.99)= 2.58
4) DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA RR 2.58
5) TOMA DE DECISIONES
Tenemos que: Zo = 0.65<2.58; Zo Є RA luego, aceptamos la hipótesis Ho, por lo tanto, la media poblacional es igual a 1500 grados.
Ho: µ=1600 H1: µ>1600
8.2. Estimación y Prueba de Hipótesis de la diferencia de medias Ejercicio 1: Se propone estudiar una nueva base la 2012 para saber cuál es el ingreso familiar mensual, respecto a la base 2010. Para estudiar la nueva base 2012 realizamos
una encuesta a 69 alumnos, y los resultados fueron X=1655.74, Y=1760, 540986.05 ¿Diría Ud. que la base 2012 tiene un mejor ingreso? Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: µx =µy H1: µx <µy
2. FORMULAMOS LA FUNCIÓN PIVOTAL
No se conocen las varianzas poblacionales
Muestras grandes
Se supone Poblaciones Normales Homocedásticas
FP =
√
N (0, 1)
Valor calculado:
Zo=
√
= =
√
= -0.61
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
α= 1% Z0.01= -2.58
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA RR
-2.58
5. TOMA DE DECISIONES
Tenemos que: Zo = -0.61> -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. No existe diferencia significativa entre ambas bases. La base 2012 no tiene un mejor ingreso respecto a la base 2010.
Ejercicio 2: Se propone estudiar una nueva base la 2011 para saber cuál es el ingreso familiar mensual, respecto a la base 2010. Para estudiar la nueva base 2011 realizamos
una encuesta a 47 alumnos, y los resultados fueron X=1791.49, Y=1760, 540986.05 ¿Diría Ud. que la base 2011 tiene un mejor ingreso? Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: µx =µy H1: µx <µy
2. FORMULAMOS LA FUNCIÓN PIVOTAL
No se conocen las varianzas poblacionales
Muestras grandes
Se supone Poblaciones Normales Homocedásticas
FP =
√
N (0, 1)
Valor calculado:
Zo=
√
= =
√
= 0.18
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
α= 1% Z0.01= -2.58
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA RR
-2.58
5. TOMA DE DECISIONES
Tenemos que: Zo = 0.18> -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. No existe diferencia significativa entre ambas bases. La base 2011 no tiene un mejor ingreso respecto a la base 2010.
8.3. Estimación y Prueba de Hipótesis de la proporción Ejercicio 1: La fracción de respuestas sobre el estado civil “soltero” de cierta encuesta realizada en la facultad de Ciencias Económicas de la UNMSM fue de 0.993. Una nueva encuesta asegura que los resultados son menores. Con la muestra que se proporciona se hace la encuesta y se obtiene que 157estudiantes presentanun estado civil de “soltero” de un total de 159 encuestados. Contrastar si la nueva encuesta es segura o no con el estado civil de los estudiantes de dicha facultad con un 1% de significación.
Solución: 6. PLANTEAMOS LA HIPÓTESIS
Ho: p =0.993 H1: p <0.993
7. FORMULAMOS LA FUNCIÓN PIVOTAL
Z =
√
N(0, 1)
Si se supone verdadera la hipótesis nula Ho: p=po
Zo=
√
=
√
= -0.91
8. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
α= 1% Z0.01= -2.58
9. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA
-2.58
10. TOMA DE DECISIONES
Tenemos que: Zo = -0.91>-2.58 Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto, la nueva encuesta no tiene respuestas confiables respectoal estado civil que presentan los estudiantes.
Ejercicio 2: La fracción de respuestas sobre el estado civil “soltero” de cierta encuesta realizada en la facultad de Ciencias Económicas de la UNMSM de la Base 2010 fue de 0.99. Una nueva encuesta asegura que los resultados son menores. Con la muestra que se proporciona se hace la encuesta y se obtiene que 42estudiantes presentan un estado civil de “soltero” de un total de 44 encuestados. Contrastar si la nueva encuesta es segura o no con el estado civil de los estudiantes de dicha facultad con un 1% de significación. Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: p =0.99 H1: p <0.99
2. FORMULAMOS LA FUNCIÓN PIVOTAL
Z =
√
N (0, 1)
Si se supone verdadera la hipótesis nula Ho: p=po
Zo=
√
= =
√
= -2.67
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
α= % Z0.01= -2.58
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA
-2.58
5. TOMA DE DECISIONES
Tenemos que: Zo = -2.67<-2.58 Zo Є RR. Por lo tanto rechazamos el Ho. Por lo tanto, la nueva encuesta si tiene respuestas confiables respecto al estado civil que presentan los estudiantes.
8.4. Estimación y Prueba de Hipótesis de la diferencia de proporciones Ejercicio 1: Se realizó una encuesta a los estudiantes de la base 2010 sobre su estado civil, en una muestra de 44 se obtuvo que el 95% presenta un estado civil de “soltero”, también se realizó la misma encuesta a la base 2012 con una muestra de 68 y se obtuvo que el 100% presentan un estado civil de “soltero”. De acuerdo con estas respuestas y con un nivel de significación del 1%, ¿podría rechazarse la hipótesis acerca del estado civil que presentan los estudiantes de dicha facultad? Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: PX = Py H1: Px<Py Px: respuestas “soltero” de la base 2010 Py: respuestas “soltero” de la base 2011
2. FORMULAMOS LA FUNCIÓN PIVOTAL
Z =
√
N (0, 1)
Zo=
√
= -1.47
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
α= 1% Z0.01= -2.58
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA
-2.58
5. TOMA DE DECISIONES
Tenemos que: Zo = -1.47> -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto, puede afirmarse que al nivel del 1%, la encuesta no es significativamente buena se ya que no se acerca a la realidad.
Ejercicio 2: Se realizó una encuesta a los estudiantes de la base 2010 sobre su estado, en una muestra de 44 se obtuvo que el 95% presenta un estado civil de “soltero”, también se realizó la misma encuesta a la base 2011 con una muestra de 47 y se obtuvo que el 100% presentan un estado civil de “soltero” realizada la encuesta en el 2012. De acuerdo con estas respuestas y con un nivel de significación del 1%, ¿podría rechazarse la hipótesis acerca de que la edad tiene relación respectoal estado civil que presentan los estudiantes de dicha facultad? Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: PX = Py H1: Px<Py Px: respuestas “soltero” de la base 2010 Py: respuestas “soltero” de la base 2011
2. FORMULAMOS LA FUNCIÓN PIVOTAL
Z =
√
N (0, 1)
Zo=
√
= -1.47
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
α= 1% Z0.01= -2.58
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA
-2.58
5. TOMA DE DECISIONES
Tenemos que: Zo = -1.47> -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto, puede afirmarse que al nivel del 1%, la edad no influye en el estado civil de los estudiantes de dicha facultad.
8.5. Estimación y Prueba de Hipótesis de la Varianza Ejercicio 1: En la facultad de Ciencias Económicas de la UNMSM, se plantea la hipótesis de que la desviación estándar de los ingresos familiares mensuales de los estudiantes es de S/.900. En una muestra de 159alumnos elegidos al azar, con una varianza de 910350.39. Con estos datos, ¿se justifica la suposición que la desviación estándar verdadera es S/.900? Use el nivel de significación del 1%, y suponga que la distribución de la actitud en un simulacro de sismo es normal. Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: = S/.810000
H1: ≠ S/.810000
2. FORMULAMOS LA FUNCIÓN PIVOTAL
V =
Vo=
=177.57
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA
67.3 140.2
5. TOMA DE DECISIONES
Tenemos que: [67.3- 140.2]; Vo=177.57;Zo Є RR. Por lo tanto rechazamos el Ho, la varianza poblacional es ≠ S/.810000.
Ejercicio 2:
En la facultad de Ciencias Económicas de la UNMSM de la base 2011, se plantea la hipótesis de que la desviación estándar es de S/.900. En una muestra de 47 alumnos elegidos al azar, con una varianza de S/.856736.08. Con estos datos, ¿Se justifica la suposición que la desviación estándar verdadera es de S/.900? Use el nivel de significación del 1%, y suponga que la distribución de los ingresos mensuales familiares es normal.
1. PLANTEAMOS LA HIPÓTESIS
Ho: = S/.810000
H1: ≠ S/.810000
2. FORMULAMOS LA FUNCIÓN PIVOTAL
V =
Vo=
=48.65
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA
74.2 129.6
5. TOMA DE DECISIONES
Tenemos que: [74.2- 129]; Vo=48.65;Zo Є RR. Por lo tanto rechazamos el Ho, la varianza poblacional es ≠ S/.810000.
Ejercicio 1:
Se seleccionan aleatoriamente 44 estudiantes de la base 2010de la facultad de Ciencias Económicas de la UNMSM, y se les aplica una encuesta, para verificar si existe razón, al creer que los estudiantes de altos ingresos por lo general tienen un rendimiento académico bueno, y que los estudiantes de bajos ingresos a menudo tienen un rendimiento académico regular. Los resultados obtenidos de la encuesta se muestra Utilice un nivel de significación del 1%
1. PLANTEAMOS LA HIPÓTESIS
Ho: el ingreso y el rendimiento son independientes. H1: Están relacionados o son dependientes.
2. FORMULAMOS LA FUNCIÓN PIVOTAL
∑
Dónde: F = Número de filas C = Número de columnas Oi =Frecuencias observadas ℮i = Frecuencias esperadas
En el siguiente cuadro:
Utilice un nivel de significación del 1%
3. PLANTEAMOS LA HIPÓTESIS
Ho: el ingreso y el rendimiento son independientes. H1: Están relacionados o son dependientes.
4. FORMULAMOS LA FUNCIÓN PIVOTAL
INGRESOS Rendimiento académico
BUENO REGULAR TOTAL
ALTOS 7 19 26
BAJOS 7 11 18
TOTAL 14 30 44
∑
Donde: F = Número de filas C = Número de columnas Oi =Frecuencias observadas ℮i = Frecuencias esperadas
5. NIVEL DE SIGNIFICACIÓN
α =1% ; P ( (
)
X= 6.63
Las frecuencias esperadas:
INGRESOS Rendimiento académico
BUENO REGULAR TOTAL
ALTOS 8 18 26
BAJOS 6 12 18
TOTAL 14 30 44
P=
{proporción de estudiantes con buenos rendimientos}
26(
= 8.32 {número de estudiantes con altos ingresos que presentan
buenos rendimientos}
CÁLCULO DE Q:
Q=∑
Q=
Q= 0.434
6. REGIÓN CRITICA O RECHAZO(RR) Y REGIÓN DE ACEPTACIÓN (RA)
RA
6.63
7. DESICIÓN:
Puesto que Q= 0.434< 6.63 → Q Є RA Aceptamos la hipótesis Ho. Por lo tanto, el ingreso familiar mensual de los estudiantes y el rendimiento académico son independientes.
8.8. PRUEBA DE HOMOGENEIDAD Ejercicio 1: Se efectuó un estudio a tres bases de la Facultad de Ciencias Económicas de la UNMSM: Base 2010, Base 2011 y Base 2012, para determinar el rendimiento académico de los alumnos, como “bueno” o “regular”. Una muestra aleatoria de 160 alumnos ha dado los resultados de la siguiente tabla. A partir de estos datos, determinar si las tres bases son homogéneas con respecto a su rendimiento académico. Utilice el nivel de significación del 1%.
RENDIMIENTO ACADEMICO
BASES TOTAL
BASE 10 BASE 11 BASE 12
BUENO 14 13 18 45
REGULAR 30 34 51 115
TOTAL 44 47 69 160
1. PLANTEAMOS LA HIPÓTESIS
Ho: Las tres bases son homogéneas con respecto su rendimiento académico. H1: Las tres bases no son homogéneas con respecto su rendimiento académico
2. FORMULAMOS LA FUNCIÓN PIVOTAL
∑
Donde: F = Número de filas C = Número de columnas Oi =Frecuencias observadas ℮i = Frecuencias esperadas
3. NIVEL DE SIGNIFICACIÓN
α =1% ; P ( (
)
X= 9.21
Las frecuencias esperadas:
RENDIMIENTO ACADEMICO
BASES TOTAL
BASE 10 BASE 11 BASE 12
BUENO 12 13 19 44
REGULAR 32 34 50 116
TOTAL 44 47 69 160
P=
{Proporción de alumnos que presentan rendimiento bueno}
44(
12.1 {Número de alumnos de la Base 10 que presentan
rendimiento bueno}
CÁLCULO DE Q:
Q=∑
Q=
Q= 0.525
4. REGIÓN CRITICA O RECHAZO(RR) Y REGIÓN DE ACEPTACIÓN (RA)
RA
9.21
5. DESICIÓN:
Puesto que Q= 0.525 < 9.21 → Q Є RA Aceptamos la hipótesis Ho. Por lo tanto, las tres bases son homogéneas con respecto a su rendimiento académico.
8.9. Análisis de Varianza Ejercicio 1: Se propone analizar tres bases diferentes, y se desea determinar si el ingreso promedio de los estudiantes es el mismo o si es diferente en por lo menos en 1 de las 3 bases encuestadas. Se observa aleatoriamente las respuestas de cada base. Para esto usaremos el análisis de varianza, y todo esto con un nivel de significación del 5%. Suponemos que estamos en un caso en que las poblaciones son normales homoscedásticas, en otras palabras, que las varianzas poblacionales para las 3 bases son iguales. Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: µ1=µ2=µ3 H1: No todos los µ1 son iguales
2. ESPECIFICAMOS EL NIVEL DE SIGNIFICACIÓN
α = 5%
Base 2010 Base 2011 Base 2012 Total
Total 77440 84200.03 96032.92 257672.95
in 44 47 58 159
iX 1760 925.6 1655.74 4341.34
2
i in X 136294400 40266561.9 159005547 335566508.9
8.1. ESTIMACIÓN Y PRUEBA DE HIPÓTESIS DE LA MEDIA Ejercicio 1: Se realizo una encuesta a 159 alumnos de la facultad de Ciencias Económicas de la UNMSM, la cual revela que en promedio del ingreso personal mensual es de s/. 313.648, con una desviación estándar de 132.237. Docimar la hipótesis de que el verdadero promedio de ingreso personal mensual fue de s/. 300, frente a la alternativa de que fue mayor que s/. 300. Utilizar un nivel de significación del 1%. Solución:
1) PLANTEAMOS LA HIPÓTESIS
2) FORMULAMOS LA FUNCIÓN PIVOTAL
No se conoce la varianza poblacional
Muestra grande
Z = -
√
⁄ N (0,1)
VALOR CALCULADO: Zo = -
√
⁄ =
√ ⁄
= 1.301
3) ESPECIFICAMOS EL NIVEL DE SIGNIFICACIÓN:
α= 1% Z (0.99) = 2.58
4) DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA
RR
2.58
Ho: µ=300
H1: µ>300
5) TOMA DE DECISIONES
Tenemos que: Zo = 1.301 < 2.58 Zo Є RA luego, aceptamos la hipótesis Ho, por lo tanto, la media poblacional es igual a s/. 300.
Ejercicio 2: Se realiza una encuesta a 44 alumnos de la facultad de Ciencias Económicas de la base 10 de la UNMSM, revela que en promedio del ingreso personal mensual de los alumnos es de s/. 329.773, con una desviación estándar de 115.386. Docimar la hipótesis de que el verdadero ingreso personal mensual de los estudiantes de la UNMSM es de s/. 300, frente a la alternativa de que fue mayor que s/. 300. Utilizar un nivel de significación del 1%. Solución:
1. PLANTEAMOS LA HIPÓTESIS
2. FORMULAMOS LA FUNCIÓN PIVOTAL
No se conoce la varianza poblacional
Muestra grande
Z = -
√
⁄ N (0,1)
VALOR CALCULADO: Zo = -
√
⁄ =
√ ⁄
= 1.712
3. ESPECIFICAMOS EL NIVEL DE SIGNIFICACIÓN:
α= 1% Z (0.99)= 2.58
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
Ho: µ=300
H1: µ>300
RA RR
2.58
5. TOMA DE DECISIONES
Tenemos que: Zo = 1.712 < 2.58; Zo Є RA luego, aceptamos la hipótesis Ho, por lo tanto, la media poblacional es igual a s/. 300.
8.2. ESTIMACIÓN Y PRUEBA DE HIPÓTESIS DE LA DIFERENCIA DE MEDIAS Ejercicio 1: Se propone estudiar una nueva base 12 para saber cuál es su ingreso personal mensual de ellos respecto a la base 10. Para estudiar la nueva base 12 realizamos una encuesta a
68 alumnos, y los resultados fueron X=329.773, Y=310.638, ¿Diría Ud. que la base 12 tiene un mejor ingreso personal mensualmente? Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: µx =µy
H1: µx <µy
2. FORMULAMOS LA FUNCIÓN PIVOTAL
No se conocen las varianzas poblacionales
Muestras grandes
Se supone Poblaciones Normales Homocedásticas
FP =
√
N (0, 1)
Valor calculado:
Zo=
√
= =
√
= 0.746
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
α= 1% Z(0.01)= -2.58
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA RR
-2.58
5. TOMA DE DECISIONES
Tenemos que: Zo = 0.746 >- 2.58; Zo Є RR. Por lo tanto rechazamos el Ho. Existe diferencia significativa entre ambas bases. La base 11 ha mejorado su ingreso personal mensual respecto a la base 10.
Ejercicio 2: Se propone estudiar una nueva base la 11 para saber cuál es la actitud de ellos ante un simulacro de sismo respecto a la base 10. Para estudiar la nueva base 12 realizamos una
encuesta a 68 alumnos, y los resultados fueron X=329.773, Y=305.294,
¿Diría Ud. que la base 11 tiene un mejor ingreso personal mensual? Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: µx =µy
H1: µx <µy
2. FORMULAMOS LA FUNCIÓN PIVOTAL
No se conocen las varianzas poblacionales
Muestras grandes
Se supone Poblaciones Normales Homocedásticas
FP =
√
N (0, 1)
Valor calculado:
Zo=
√
= =
√
= 0.99
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE
SIGNIFICACIÓN DEL 1%
α= 1% Z(0.01)= -2.58
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA
-2.58
5. TOMA DE DECISIONES
Tenemos que: Zo = 0.99 > -2.58 Zo Є RA. Por lo tanto aceptamos el Ho. No existe diferencia significativa entre ambas bases. La base 12 no ha mejorado su ingreso personal mensual respecto a la base 10.
8.3. ESTIMACIÓN Y PRUEBA DE HIPÓTESIS DE LA PROPORCIÓN Ejercicio 1: La fracción de respuestas negativas de cierta encuesta realizada en la facultad de Ciencias Económicas de la UNMSM de la base 11 respecto a que si estudia actualmente una carrera paralelamente fue de 0.38. Una nueva encuesta asegura que los resultados son menores. Con la muestra que se proporciona se hace la encuesta y se obtiene un resultado de 18 respuestas negativas de un total de 47 encuestas. Contrastar si la nueva encuesta es segura o no con razón a que si estudia una carrera paralelamente con un 1% de significación. Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: p =0.38
H1: p <0.38
2. FORMULAMOS LA FUNCIÓN PIVOTAL
Z =
√
N (0, 1)
Si se supone verdadera la hipótesis nula Ho: p=po
Zo=
√
= =
√
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
α= 1% Z(0.01)= -2.58
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA
-2.58
5. TOMA DE DECISIONES
Tenemos que: Zo = -0.14 > -2.58 Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto, la nueva encuesta a la base 11 no tiene respuestas confiables en cuanto a que si estudia una carrera paralelamente respecto a su carrera actual que es economía.
Ejercicio 2: La fracción de respuestas negativas de cierta encuesta realizada en la facultad de Ciencias Económicas de la UNMSM de la base 12 respecto a que si estudia actualmente una carrera paralelamente fue de 0.46. Una nueva encuesta asegura que los resultados son menores. Con la muestra que se proporciona se hace la encuesta y se obtiene un resultado de 31 respuestas negativas de un total de 68 encuestas. Contrastar si la nueva encuesta es segura o no con razón a que si estudia una carrera paralelamente con un 1% de significación. Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: p =0.46
H1: p <0.46
2. FORMULAMOS LA FUNCIÓN PIVOTAL
Z =
√
N (0, 1)
Si se supone verdadera la hipótesis nula Ho: p=po
Zo=
√
= =
√
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
α= 1% Z(0.01)= -2.58
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RR RA
-2.58
5. TOMA DE DECISIONES
Tenemos que: Zo = -0.46> -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto. La nueva encuesta a la base 12 no tiene respuestas confiables en cuanto a que si estudia una carrera paralelamente respecto a su carrera actual que es economía.
8.4. ESTIMACIÓN Y PRUEBA DE HIPÓTESIS DE LA DIFERENCIA DE PROPORCIONES
Ejercicio 1: Se realizo una encuesta a la base 10 sobre si estudian una carrera paralela a la de economía con una muestra de 44 se obtuvo que el 66% son respuestas positivas, también se realizó la misma encuesta a la base 11 con una muestra de 47 y se obtuvo que el 62% son respuestas positivas. De acuerdo con estas respuestas y con un nivel de significación del 1%, ¿podría rechazarse la hipótesis acerca de que si estudian otra carrera paralelamente a la de economía? Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: PX = Py
H1: Px < Py
Px: respuestas positivas de la base 10 Py: respuestas positivas de la base 11
2. FORMULAMOS LA FUNCIÓN PIVOTAL
Z =
√
N (0, 1)
Zo==
√
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
α= 1% Z(0.01)= -2.58
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA
-2.58
5. TOMA DE DECISIONES
Tenemos que: Zo = -1.094 > -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto, puede afirmarse que al nivel del 1%, la encuesta no fue muy buena ya que estaba un poco lejos de la realidad.
Ejercicio 2: Se realizo una encuesta a la base 10 sobre si estudian una carrera paralela a la de economía con una muestra de 44 se obtuvo que el 66% son respuestas positivas, también se realizó la misma encuesta a la base 12 con una muestra de 68 y se obtuvo que el 54% son respuestas positivas. De acuerdo con estas respuestas y con un nivel de significación del 1%, ¿podría rechazarse la hipótesis acerca de que si estudian otra carrera paralelamente a la de economía? Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: Px = Py
H1: Px < Py
Px: respuestas positivas de la base 2010 Py: respuestas positivas de la base 2012
2. FORMULAMOS LA FUNCIÓN PIVOTAL
Z =
√
N (0, 1)
Zo==
√
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
α= 1% Z(0.01)= -2.58
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA
-2.58
5. TOMA DE DECISIONES
Tenemos que: Zo = 0.491 > -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto, puede afirmarse que al nivel del 1%, la encuesta no fue muy buena ya que estaba un poco lejos de la realidad.
8.5. ESTIMACIÓN Y PRUEBA DE HIPÓTESIS DE LA VARIANZA Ejercicio 1: En la facultad de Ciencias Económicas de la UNMSM de la base 10, se plantea la hipótesis de que la desviación estándar 114.067. En una muestra de 44 alumnos elegidos al azar, con una varianza de 13011.312. Con estos datos, ¿se justifica la suposición que la desviación estándar verdadera es 114.067? Use el nivel de significación del 1%, y suponga que la distribución de que si estudia alguna carrera paralela a la de economía. Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: = 13000
H1: ≠ 13000
2. FORMULAMOS LA FUNCIÓN PIVOTAL
V =
Vo==
= 43.037
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN
DEL 1%
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA
REGIÓN DE ACEPTACIÓN (RA)
RA
22.9 70.6
5. TOMA DE DECISIONES
Tenemos que: [22.9- 70.6]; Vo=43.037; Zo Є RA. Por lo tanto aceptamos el Ho, la varianza poblacional es = 13000.
Ejercicio 2: En la facultad de Ciencias Económicas de la UNMSM de la base 11, se plantea la hipótesis de que la desviación estándar 127.836. En una muestra de 47 alumnos elegidos al azar, con una varianza de 16342.146. Con estos datos, ¿se justifica la suposición que la desviación estándar verdadera es 127.836? Use el nivel de significación del 1%, y suponga que la distribución de que si estudia alguna carrera paralela a la de economía. Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: = 16000
H1: ≠ 16000
2. FORMULAMOS LA FUNCIÓN PIVOTAL
V =
Vo==
= 46.984
3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN DEL 1%
4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA REGIÓN DE
ACEPTACIÓN (RA)
RA
25 74.4
5. TOMA DE DECISIONES
Tenemos que: [25 - 74.4]; Vo=46.984. ; Zo Є RA. Por lo tanto aceptamos el Ho, la varianza poblacional es = 16000.
8.6. PRUEBA JI-CUADRADO DE LA BONDAD DE AJUSTE Ejercicio 1: La siguiente información corresponde al ingreso personal mensual de los alumnos la Facultad de Ciencias Económicas de la UNMSM, donde: 1: [100 -200>; 2: [200 -350>; 3: [350 - 500>; 4: [500 - a mas> Probar la hipótesis de que la actitud de los alumnos sigue una distribución de Poisson al nivel de significación del 1%.
variable(actitud) 1 2 3 4 frecuencia(número de alumnos) 29 71 39 20
1. PLANTEAMOS LA HIPÓTESIS
Ho: El ingreso personal mensual sigue una distribución Poisson. H1: El ingreso personal mensual no sigue una distribución Poisson.
2. FORMULAMOS LA FUNCIÓN PIVOTAL
∑
Donde: Oi = Frecuencias observadas ℮i = Frecuencias esperadas K = Número de clases m = Número de parámetros a estimar
CÁLCULO DE Q: Para calcular Q, debemos obtener primero las frecuencias esperadas (℮i).
=
Pero = 2.32 P(x, ) =
Las frecuencias esperadas: ℮i=159[p(x, )
Número de clientes
Oi P(x,λ) ℮i= 159[ p(x,λ)]
(Oi-℮i)^2/℮i
1 29 0.3 47.7 7.33
2 71 0.3 47.7 11.38
3 39 0.2 31.8 1.63
4 20 0.2 31.8 4.38
Total 159 1 159 24.72
Q= ∑
3. NIVEL DE SIGNIFICACIÓN
α =5%
P ( (
)
X= 5.99
4. REGIÓN CRITICA O RECHAZO(RR) Y REGIÓN DE ACEPTACIÓN (RA)
RA
RR
5.99 24.72
5. DESICIÓN:
Puesto que Q= 24.72 > 5.99 → Q Є RR Rechazamos la hipótesis Ho. Por lo tanto, los datos no se ajustan a una distribución de Poisson.
Ejercicio 2: La siguiente información corresponde al ingreso personal mensual de la Facultad de Ciencias Económicas de la UNMSM de la base 11, donde: 1: [100 -200>; 2: [200 -350>; 3: [350 - 500>; 4: [500 - a mas> Probar la hipótesis de que la actitud de los alumnos sigue una distribución de Poisson al nivel de significación del 1%.
variable(actitud) 1 2 3 4 frecuencia(número de alumnos) 10 20 12 5
1. PLANTEAMOS LA HIPÓTESIS
Ho: El ingreso personal mensual sigue una distribución Poisson. H1: El ingreso personal mensual sigue no sigue una distribución Poisson.
2. FORMULAMOS LA FUNCIÓN PIVOTAL
∑
Donde: Oi = Frecuencias observadas ℮i = Frecuencias esperadas K = Número de clases m = Número de parámetros a estimar
CÁLCULO DE Q: Para calcular Q, debemos obtener primero las frecuencias esperadas (℮i).
=
Pero = 2.26 P(x, ) =
Las frecuencias esperadas: ℮i= 164[p(x, )]
Número de clientes
Oi P(x,λ) ℮i=47[p(x,λ)]
(Oi-℮i)^2/℮i
1 10 0.3 14.1 1.19
2 20 0.3 14.1 2.47
3 12 0.2 9.4 0.72
4 5 0.2 9.4 2.06
Total 47 1 47 6.44
Q= ∑
3. NIVEL DE SIGNIFICACIÓN
α =5%
P ( (
)
X= 5.99
4. REGIÓN CRITICA O RECHAZO(RR) Y REGIÓN DE ACEPTACIÓN (RA)
RA
RR
5.99 6.44
5. DESICIÓN:
Puesto que Q= 6.44 > 5.99 → Q Є RR Rechazamos la hipótesis Ho. Por lo tanto, los datos no se ajustan a una distribución de Poisson.
8.7. PRUEBA DE INDEPENDENCIA Ejercicio 1: Se seleccionan aleatoriamente 159 estudiantes de la facultad de ciencias económicas de la UNMSM, se les hizo una encuesta, para verificar si existe razón, al creer que existe una relación entre si estudia una carrera paralela y el género a los alumnos de la Facultad de Ciencias Económicas.de la UNMSM. Los resultados obtenidos de la encuesta se muestran en el siguiente cuadro:
GENERO OTRA CARRERA
TOTAL SI NO
MASCULINO 45 32 77
FEMENINO 50 32 82
TOTAL 95 64 159
Utilice un nivel de significación del 1%
1. PLANTEAMOS LA HIPÓTESIS
Ho: Si estudia una carrera paralela y el género a los alumnos de la Facultad de Ciencias Económicas. H1: Están relacionados o son independientes.
2. FORMULAMOS LA FUNCIÓN PIVOTAL
∑
Donde: F = Número de filas C = Número de columnas Oi =Frecuencias observadas ℮i = Frecuencias esperadas
3. NIVEL DE SIGNIFICACIÓN
α =1%
P ( (
)
X= 6.63
Las frecuencias esperadas:
GENERO OTRA CARRERA
TOTAL SI NO
MASCULINO 46 31 77
FEMENINO 49 33 82
TOTAL 95 64 159 CÁLCULO DE Q:
Q= ∑
Q=
Q= 0.105
4. REGIÓN CRITICA O RECHAZO(RR) Y REGIÓN DE ACEPTACIÓN (RA)
RA
RR
6.63
5. DESICIÓN:
Puesto que Q= 0.105 < 6.63 → Q Є RA Aceptamos la hipótesis Ho. Por lo tanto, el género de los alumnos y el equipamiento de la facultad son independientes.
8.8. PRUEBA DE HOMOGENEIDAD Ejercicio 1: Se realizo un estudio a tres bases de la facultad de ciencias económicas de la UNMSM base 10, base 11 y base 12, para determinar el ingreso personal mensual y se tuvo k separa en rangos 1: [0 -200> 2: [200 -350> 3.[350 -500> 4: [500 -a mas>. A partir de estos 4 datos, determinar si las tres bases son homogéneas con respecto a su ingreso personal mensual. Utilice el nivel de significación del 5%.
INGRESO DE LOS ALUMNO
BASES TOTAL
BASE 10 BASE 11 BASE 12
[0 - 200> 4 10 15 29
[200 - 350> 21 20 30 71
[350 - 500> 13 12 14 39
[500 - a mas> 6 5 9 20
TOTAL 44 47 68 159
1. PLANTEAMOS LA HIPÓTESIS
Ho: Las tres bases son homogéneas con respecto al ingreso personal mensual. H1: Las tres bases no son homogéneas con respecto al ingreso personal mensual.
2. FORMULAMOS LA FUNCIÓN PIVOTAL
∑
Donde: F = Número de filas C = Número de columnas Oi =Frecuencias observadas ℮i = Frecuencias esperadas
3. NIVEL DE SIGNIFICACIÓN
α =5%
P ( (
)
X= 12.6
Las frecuencias esperadas:
INGRESO DE LOS ALUMNO
BASES TOTAL
BASE 10 BASE 11 BASE 12
[0 - 200> 8.03 8.57 12.40 29
[200 - 350> 19.65 20.99 30.37 71
[350 - 500> 10.79 11.53 16.68 39
[500 - a mas> 5.54 5.91 8.55 20
TOTAL 44 47 68 159
P=
{proporción de alumnos que actúan como la opción 1}
CÁLCULO DE Q:
Q= ∑
Q=
Q= 4.16
4. REGIÓN CRITICA O RECHAZO(RR) Y REGIÓN DE ACEPTACIÓN (RA)
RA
12.6
5. DESICIÓN:
Puesto que Q= 4.16 < 12.6 → Q Є RA Aceptamos la hipótesis Ho. Por lo tanto, las tres bases son homogéneas con respecto a su ingreso personal mensual.
8.9. ANÁLISIS DE VARIANZA Ejercicio 1: Se propone analizar tres bases diferentes, y se desea determinar si el ingreso personal mensual igual o diferente. Se observa aleatoriamente las respuestas de cada base. ¿Qué conclusiones se pueden extraer al nivel de significación del 5%?
BASES
BASE 10 BASE 11 BASE 12
4 10 15
21 20 30
13 12 14
6 5 9 Solución:
1. PLANTEAMOS LA HIPÓTESIS
Ho: µ1=µ2=µ3 H1: No todos los µ1 son iguales µi= ingreso personal mensual i
2. ESPECIFICAMOS EL NIVEL DE SIGNIFICACIÓN
α = 5%
BASES
BASE 10 BASE 11 BASE 12
4 10 15
21 20 30
13 12 14
6 12 9
TOTAL 44 47 68 159
ni 4 4 4 12
i 11 11.75 17 13.25
ni( i ^2) 484 552.25 1156 2192.25
∑ ∑
=39205 ∑ n
SCT= ∑ ∑
- 39205 - 2107 = 11464
Suma de SCC=∑ Cuadrados SCE=SCT-SCC= 2192.25 - 85.25 =
TABLA DE ANALISIS DE VARIANZA (ANAVA)
FUENTE DE VARIACIÓN SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
CUADRADO MEDIO
RAZON Ho
ENTRE TRATAMIENTOS(COLUMNAS)
85.25 2 46.625 Fo=0.26 µi=µ
DENTRO DE LOS TRATAMIENTOS(ERROR)
10834.5 9 1203.83
TOTAL 11464 11
3. REGIÓN CRITICA O RECHAZO(RR) Y REGIÓN DE ACEPTACIÓN (RA)
RA
4.26
4. DESICIÓN:
Puesto que Fo=0.26 <F (2,9) =4.26 → Q Є RA Aceptamos la hipótesis Ho. Concluimos que las tres bases son significativamente iguales en cuanto a la actitud que toman frente a un simulacro de sismo.
VARIABLES
- MEDIO DE TRANSPORTE QUE UTILIZA PARA VENIR A LA UNIVERSIDAD.
- NUMERO DE INTEGRANTES QUE CONFORMAN SU FAMILIA.
ANÁLISIS DE LA VARIABLE MEDIO DE TRANSPORTE QUE UTILIZA PARA VENIR A LA UNIVERSIDAD
- Prueba de hipótesis para la proporción poblacional.
Analizando la población del estrato 2, es decir, la base 2011, contamos con el dato inicial que, la proporción muestral de alumnos que utilizan transporte público es de ˆ 0.915p . Con ello,
formularemos nuestra hipótesis que afirma que la proporción poblacional de alumnos que utilizan trasporte público, es igual a 5%con un nivel de confianza del 97%.
1) Planteamiento de la hipótesis:
0
1
: 0.14
: 0.14
H p
H p
2) Función Pivotal:
ˆ(0,1)
ˆ ˆ(1 )
p pZ N
p p
n
Utilizamos esa función pivotal dado que no conocemos la proporción poblacional.
0 0
0.914 0.9151.333
0.915(1 0.915)
273
Z Z
3) Nivel de significación:
5% 1.88Z
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z=1.34 Z = 1.88
5) Toma de decisiones:
Tenemos que 0 01.33 1.88Z Z Z RA . Por lo tanto, se acepta la hipótesis nula y como
resultado se obtiene que la proporción poblacional de alumnos utiliza un medio de trasporte público es bueno, es de 0.5 al 97% de significación.
- Prueba de hipótesis para la diferencia de proporciones poblacionales.
Analizando los estratos 1 y 2, es decir, los alumnos de las bases 2009 y 2010, tenemos que la proporción de alumnos que utilizan medio de trasporte público es 0.909 y 0.914 respectivamente. Con esto formulamos nuestra hipótesis que las proporciones poblaciones de ambas bases son iguales y como hipótesis alternativa, que la proporción poblacional de alumnos de la base 2009 es mayor que el de la base 2010. 1.) Planteamiento de la hipótesis:
0
1
:
:
x y
x y
H P P
H P P
2.) Función Pivotal:
ˆ ˆ( ) ( )(0,1)
(1 )(1 )
x y x y
y yx x
x y
p p P PZ N
P PP P
n n
0 0
(0.909 0.914)1.25
0.909(0.091) 0.914(0.086)
265 273
Z Z
3.) Nivel de significación:
3% 1.88Z
4.) Determinación de la región crítica (RR) y la región de aceptación (RA):
Z = -1.24 Z = 1.88
5.) Toma de decisiones:
Tenemos que 0 01.25 1.64Z Z Z RR . Por lo tanto, se rechaza la hipótesis nula,
entonces se acepta la hipótesis alternativa. Podemos afirmar que la proporción poblacional de alumnos de la base 10 que utilizan un medio de trasporte público mayor que la de la base 11.
- Prueba de Independencia (no paramétrica).
En esta sección vamos a analizar si el uso de medio de trasporte público tiene relación con el número de horas que tardan en llegar a la universidad. Esta relación se establece, ya que se puede creer que el hecho de demorarse muchas horas de su hogar a la universidad haga que muchos opten por otro tipo de trasporte a usar el servicio público. Por lo tanto, nuestra hipótesis nula será que el uso de trasporte público esté relacionado con el número de horas que tardan en llegar a la universidad. Todo esto con un nivel de significación del 1%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación:
MEDIO DE TRASPORTE QUE UTILIZA
NUMERO DE HORAS EN LLEGAR A LA UNIVERSIDAD
25 a 55 55 a 85 85 a mas Total
PUBLICO 48 57 29 134
PRIVADO 49 46 18 113
Total 97 103 47
1) Planteamiento de la hipótesis:
0
1
: alumnos que utlizan medio de trasporte publico esta relacionado
con el tiempor de horas que demoran en llegar a la facultad.
: Estan relacionados o son dependientes
H Los
H
2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
3) Nivel de significación:
2 2
( 1)( 1) 41% 0.01
13.3
F CP X x P X x
x
Frecuencias esperadas:
MEDIO DE TRASPORTE QUE UTILIZA
NUMERO DE HORAS EN LLEGAR A LA UNIVERSIDAD
25 a 55 55 a 85 85 a mas Total
publico 55 55 24 134
privado 46 47 20 113
Total 101 102 44
Calculo de Q:
2
1
( )ki i
i i
o eQ
e
2 2 2 2 2 2
0
2 2 2
(48 55) (49 46) (18 14) (57 55) (46 47) (14 15)
55 46 14 55 47 15
(29 24) (18 20) (4 7)
24 20 7
Q
0 4.92Q
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Q =4.928 13.3
5) Toma de decisiones:
Tenemos que 0 04.928 13.3Q Q RA . Por lo tanto, se acepta la hipótesis nula, por lo que
validamos la hipótesis planteada.
- Prueba de Homogeneidad (no paramétrica).
En esta sección vamos a analizar si los alumnos de las bases 2009, 2010 y 2011 son homogéneos con respecto a su variable sexo. Todo esto con un nivel de significación del 5%. La información tabulada de la encuesta, a continuación:
Sexo de los estudiantes
BASES
2009 2010 2011 Total
Femenino 20 23 39 379
Masculino 24 24 29 349
TOTAL 44 47 68 728
1) Planteamiento de la hipótesis:
0
1
: Las tres bases son homogéneas respecto a la variable sexo
: Las tres bases son heterogéneas respecto a la variable sexo
H
H
2) Función Pivotal:
22
( 1)( 1)
1
( )ki i
F C
i i
o eQ X
e
3) Nivel de significación:
2 2
( 1)( 1) 25% 0.05
5.99
F CP X x P X x
x
Frecuencias esperadas:
Sexo de los estudiantes
Bases
2009 2010 2011 Total
Femenino 147 145 87 379
Masculino 136 133 80 349
TOTAL 283 278 167 728
Calculo de Q:
2
1
( )ki i
i i
o eQ
e
2 2 2 2 2 2
0
(143 147) (140 136) (139 145) (139 133) (97 87) (70 80)
147 136 145 133 87 80Q
0 3.144Q
4) Determinación de la región crítica (RR) y la región de aceptación (RA):
Q =3.144 5.99
5) Toma de decisiones:
Tenemos que 0 03.144 5.99Q Q RA . Por lo tanto, acepta la hipótesis de que las tres
bases: 2009, 2010 y2011 son homogéneas con respecto a su variable sexo.
BIBLIOGRAFÍA
- RICHARD I AUTOR LEVIN, DAVID S AUTOR RUBIN – 2004 Estadística para Administración
- MARK L. BERENSON, DAVID M. LEVINE, TIMOTHY C. KREHBIEL – 2006 Estadística para Administración y Economía
- Métodos Técnicos del Muestreo – COCHRAN
- Inferencia estadística – RUFINO MOYA Y GREGORIO SARAVIA - Muestreo estadístico, Diseño y aplicaciones – MANUEL VIVANCO - La Investigación Sobre Eficacia Escolar en Iberoamérica – MUÑOZ Y VARGAS -
1990
- Consecuencias de la Desnutrición en el escolar peruano – ERNESTO POLLIT - Presencia universitaria – Internet