Unidad 5 - Estadistica Aplicada.docx
-
Upload
jose-alfredo-rey-mendez -
Category
Documents
-
view
229 -
download
0
Transcript of Unidad 5 - Estadistica Aplicada.docx
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
1/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
Instituto Tecnolgico de Veracruz
Ing. en Sistemas Computacionales
Probabilidad y Estadstica
Profesor:
Barrientos Arzamendi Victor Javier
Alumno:
Rey Mndez Jos Alfredo
Veracruz, Ver.
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
2/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
Unidad 5 Estadstica Aplicada
1.1 Inferencia Estadstica
Tambin se le llama estadstica inferencial, pero previamente recordemos que laestadstica (EI) comprende el conjunto de mtodos estadsticos que permiten deducir
(inferir) cmo se distribuye la poblacin bajo estudio, a partir de la informacin que
proporciona una muestra representativa obtenida de dicha poblacin. Ver seccin 1.6.2
del presente libro. Para que la estadstica inferencial proporcione buenos resultados debe:
1. Basarse en una tcnica estadstico-matemtica adecuada al problema y suficientemente
validada.
2. Utilizar una muestra que realmente sea representativa de la poblacin y de un tamao
suficiente.
Veamos el siguiente ejemplo:
Ejemplo 2.1.
Se realiza un estudio para comparar tres mtodos para ensear tcnicas de comprensin
lectora en ingls a escolares de segundo grado de Educacin Bsica Secundaria, como
son:
1. El mtodo de la enseanza recproca.
2. El mtodo de instruccin directa.
3. La combinacin de mtodos de instruccin directa y enseanza recproca.
Las preguntas por resolver son:
1. Cul de los mtodos mejora la comprensin lectora?
2. Para el prximo ao el mtodo, identificado como el mejor, dar buenos resultados
para el alumno Javier Hernndez Len, quin realizar el segundo grado de Educacin
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
3/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
Bsica Secundaria?
La primera pregunta es un caso de incertidumbre porque basndonos en el estudio de tres
muestras independientesyen igualdad de condiciones se aplicar uno de los tres mtodos
a cada muestra de manera independiente; con el apoyo de la estadstica inferencial
absolvemos esta pregunta, eligiendo a la que mejora significativamente la comprensin
lectora para este tipo de alumnos.
La segunda pregunta es un caso de toma de decisiones porque Javier Hernndez Len no
ha participado en el estudio, pero se le aplicar el mejor mtodo que resulte de la
investigacin realizada, ahora bien, con qu confianza diremos que ese mtodo lograrque Javier mejore su comprensin lectora en ingls.
Los casos de incertidumbre y toma de decisiones son resueltos por la estadstica
inferencial, por supuesto apoyada por la probabilidad.
Para iniciarse en el estudio y aplicacin de la estadstica inferencial es
necesario conocer los conceptos bsicos que a continuacin se van a tratar.
1.2. POBLACIN
Este concepto vamos a definirlo bajo diferentes enfoques.
En investigacin cientfica se le define como la totalidad de elementos sobre los
cuales recae la investigacin. A cada elemento se le llama unidad estadstica, a
sta se le observa o se le somete a una experimentacin, estas unidades son
medidas pertinentemente.
Si representamos mediante X una variable aleatoria bajo investigacin, al estudiara sta
variable en la poblacin, como resultado tendremos los
valores:
X1 ,X 2 ,X3,...,X N
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
4/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
Donde N es el total de elementos de la poblacin.
Ejemplo 2.2.
Sea X una variable aleatoria que representa la calificacin obtenida en la
prueba de conocimientos sobre educacin ambiental (escala vigesimal) de los
alumnos de la Facultad
de Educacin, si la poblacin consta de 300 alumnos, entonces:
X1 ,X2 ,X3 ,...,
X300
Es una poblacin en trminos de variable aleatoria, que selee as:
La calificacin que ha obtenido el alumno 1 en la prueba de conocimientos
sobre educacin ambiental, la calificacin que ha obtenido el alumno 2 en la
prueba de conocimientos sobre educacin ambiental, la calificacin que ha
obtenido el alumno 3 en la prueba de conocimientos sobre educacin ambiental, y
as sucesivamente hasta la calificacin que ha obtenido el alumno 300 en la
prueba de conocimientos sobre educacin ambiental.
El propsito de un estudio estadstico es extraer conclusiones acerca de la
naturaleza de la poblacin, pero resulta que las poblaciones son grandes, o por
razones de tica, recursos financieros, metodolgicos u otros no ser posible,
entonces se debe trabajar con una muestra extrada de la poblacin bajo estudio.
2.3. MUESTRA
Sierrra Bravo (1991), anota que una muestra en general es toda parte
representativa de la poblacin, cuyas caractersticas debe reproducir en pequeo lo
ms exactamente posible.
Para que sea representativa se debe seleccionar empleando el muestreo, tpico
importante de la estadstica, con la finalidad de que los resultados de esta muestra
sean vlidos para la poblacin de la que se ha obtenido la muestra. Esta
generalizacin se realiza empleando la estadstica inferencial.
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
5/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
2.4. MUESTRA ALEATORIA
Una muestra aleatoria de tamao n de la funcin de distribucin de la variable
aleatoria
X es una coleccin de n variables aleatorias
independientes con la misma funcin de
distribucin de la variable aleatoriaX.
X1 ,X2 ,X3 ,...,X n , cada una
2.5. MUESTRA ALEATORIA APLICADA
Una muestra aleatoria de tamao n es un conjunto de n
observaciones
x1 ,x2 ,x3 ,...,xn
sobre lasvariables
X1 ,X2 ,X3 ,...,X n , independientes e idnticamente distribuidas
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
6/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
x
2.6. PARMETRO
Sierra Bravo (1991), indica que parmetro deriva del vocablo griego parmetreo que
significa medir una cosa con otra: En estadstica se refiere a los valores o medidas que
caracterizan a una poblacin como, por ejemplo, la media y la desviacin tpica de una
poblacin () Son cantidades indeterminadas, constantes o fijas respecto a una condicin
o situacin, que caracterizan a un fenmeno en un momento dado que ocurre en una
poblacin.
Se suele representar a un parmetro mediante letras griegas. Por ejemplo, la media
poblacional se representa mediantex
y se lee como media poblacional de la variable
aleatoriaX, la varianza poblacional se representa mediante 2 y se lee como varianza
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
7/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
poblacional de la variable aleatoriaX.
En trminos prcticos, un parmetro es un valor que resulta al emplear los valores que se
obtienen de una poblacin.
Ejemplo 2.5.
Si al obtener las calificaciones de los 300 alumnos que conforman la poblacin, stas se
promedian, entoncesx =14.78 es el parmetro correspondiente. Para su clculo se ha
empleado la siguiente expresin, llamada media poblacional:
N
X ii 1 (2.1)xN
Obviamente queN toma el valor de 300 para este ejemplo.
Si de estos 300 alumnos, 198 son mujeres, entonces la proporcin poblacional de mujeres
representada por x =0.66(66%). Para su clculo se ha empleado la siguiente expresin,
llamada proporcin poblacional:
N
X ii 1 (2.2)
xN
Pero, ahora la variable aleatoria se define como:
1X
i si alumna
0 si alumno
En este caso el numerador de la expresin (2.2) es 198 yN toma el valor de 300.
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
8/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
2.7. ESTADSTICO
Se contrapone al parmetro porque es un valor que se obtiene a partir de los valores
muestrales. Se pueden obtener media y varianzas mustrales, por ejemplo.
Los estadsticos son variables aleatorias por que estn sujetos a la fluctuacin de la
muestra en relacin al valor poblacional, que se asume es constante.
Ejemplo 2.6.
Continuando con el ejemplo 2.4, al seleccionar una muestra aleatoria de tamao seis, unavez identificados los seis alumnos, se obtienen las siguientes calificaciones x1 = 13,x2 =
10, x3 = 13, x4 = 14 x5 = 11, x6 = 10. La media obtenida de los seis alumnos es de
11,83, llamada media muestral y se representa mediante x , cuya expresin es:
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
9/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
Unidad xi x x2
xi
13 1,3689
10 -1,83 3,3489
13 1,3689
14 4,7089
11 -0,83 0,6889
10 -1,83 3,3489
Total 71 0,02* 14,8334
n
xii 1
n(2.3)
El numerador de la expresin (2.3) es la suma de los seis valores, que da 71, que dividido
por 6, resulta x = 11,83, es decir en promedio los alumnos han obtenido 11,83 de
calificacin en la prueba de educacin ambiental.
La varianza de esta muestra aleatoria es 2,4722, y se representa mediante
expresin es:
S2 , cuya
n2
xi xS
2 i 1
n(2.4)
Para su clculo, disponemos de la tabla 2.1, en la que mostramos paso a paso el uso de la
expresin (2.4), sabiendo que x = 11,83:
Tabla 2.1
Clculos para obtener el valor de la varianza (Ejemplo 2.6)
i
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
10/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
Tericamenten
xi x 0i 1
El numerador de la expresin (2.4) es la suma del cuadrado de las seis desviaciones de
cada valor que toma la variable, respecto a su media aritmtica, que es igual a 14,8334, que
dividido por 6 es justamente 2,4722.
La raz cuadrada, positiva, de la varianza se llama desviacin estndar o desviacin tpica,
esto es:
S S 2 (2.5)
Entonces, usando la expresin anterior (2.5), la desviacin estndar es S = 1,5723.
2.8. DISTRIBUCIN MUESTRAL
Sierrra Bravo (1991), anota que la distribucin muestral est formada por estadsticos o
valores determinados obtenidos de muestras: medias, varianzas, etc. acompaados de sus
respectivas frecuencias relativas o probabilidades, o de la proporcin de veces que se
repiten en el conjunto de todas las muestras posibles del mismo tamao obtenidas de la
poblacin.
De manera ms formal, Tsokos y Milton (1998), anotan que la distribucin de
probabilidad del estadstico se llama distribucin muestral.
Ejemplo 2.7.
Vamos a obtener la distribucin muestral, de las calificaciones obtenidas en la prueba que
mide la educacin ambiental, de una poblacin hipottica compuesta por 3 estudiantes y
que toma calificaciones iguales a: X1 = 13,X 2 = 11,X 3 = 07. Fijamos para una muestra
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
11/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
de tamao 2. En la tabla 2.2 se muestran los posibles resultados de la muestra de tamao
2, as como su respectiva media muestral:
Tabla 2.2Resultados de posibles muestras de tamao 2
Muestras
posibles
Medias muestrales
(media para cada muestra)
13,11 12
13,7 10
11,13 12
11,7 9
7,13 10
7,11 9
Ahora se muestra la distribucin de frecuencias para los valores de la media muestral:
Tabla 2.3
Distribucin muestral de la media muestral
Valores de las
medias muestrales
Frecuencia Frecuencia relativa
9 2 2/6 = 0.33
10 2 2/6 = 0.33
12 2 2/6 = 0.33
La distribucin muestral de la media muestral es la distribucin de frecuencias o de
probabilidad. En este caso, de las frecuencias relativas de todas las medias muestrales
posibles, obtenidas de muestras de tamao 2, de la poblacin de tamao 3.
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
12/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
x
Por cultura estadstica estudiaremos algunos estadsticos y su distribucin de probabilidad
(distribucin muestral).
2.8.1. Media muestral
La expresin (2.3), nos indica cmo se obtiene una media muestral. Veamos sus
propiedades:
Propiedades de la media muestral
Si X es una variable aleatoria con esperanza o media poblacional y varianza
poblacional 2 , entonces la media muestral x tiene las siguientes propiedades:
1. E x
2. V x 2 / n
3. La desviacin estndar de x , que se representa mediante , conocida tambin como
error estndar de la media muestral es igual a / n
4. Sea X1 ,X 2 ,X 3 ,...,X n una muestra aleatoria de tamao n, de una distribucin con
media poblacional y varianza poblacional 2 . Entonces, para n grande, la variable
aleatoria:
x
/ n(2.6)
Se distribuye aproximadamente como una normal estandarizada N 0,1 . Se considera
una buena aproximacin cuando n 30 (teorema del lmite central). De este modo,
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
13/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
(n-1)s^2
a^2
incluso, an cuando la variable aleatoriaX no est normalmente distribuida, podemos
aplicarla en la inferencia estadstica.
2.8.2. Varianza muestral
A partir de cada muestra aleatoria de tamao n de X :
calcular la varianza muestral definida como:
x1 ,x2 ,...,xn , tambin se puede
s21
n 1
n2
xi x (2.7)i 1
Cabe precisar, que algunos autores la llaman cuasivarianza.
Propiedades de la varianza muestral
Si X es una variable aleatoria con esperanza y varianza y ^2 respectivamente,
entonces para la varianza muestral de tamao n se cumple que:
1. E(s^2) = ^2
2. Si X tiene distribucin de probabilidad normal , esuna variable aleatoria con
distribucin chi-cuadrado con n 1 grados de libertad.
CUL ES LA DIFERENCIA ENTRE DESVIACIN ESTNDAR
Y ERRORESTNDAR?
La diferencia es que la DESVIACIN ESTNDAR describe la variabilidad
de los valores de unavariable, en cambio el ERROR ESTNDAR describe
la precisin del estadstico.
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
14/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
Ejemplo 2.8.
En una muestra aleatoria de 15 docentes de educacin secundaria, de la Institucin
Educativa Martn Adn, se aplic un cuestionario para recoger su opinin sobre elinvestigador educativo. Se presenta la respuesta de 3 preguntas, de un total de 27:
Tabla 2.4
Muestra aleatoria de 15 docentes de la Institucin Educativa Martn Adn (Lima)
Docente Edad(1) Investigador(2) Remuneracin(3)
1 34 1 1
2 38 1 1
3 49 2 1
4 42 1 1
5 35 1 2
6 44 2 1
7 30 1 2
8 36 1 1
9 43 2 1
10 47 2 1
11 39 1 2
12 46 2 1
13 48 2 1
14 36 1 215 44 1 1
(1) Edad en aos cumplidos del docente.
(2) La profesin de investigador es profesin atractiva para:
1. Docentes jvenes. 2. Docentes maduros.
(3) El investigador educativo debe ser bien remunerado:
1. S. 2. No.
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
15/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
5,48 5,48
n 15 3,87
Con esta informacin vamos a mostrar la diferencia entre desviacin estndar y error
estndar.
Media muestral
La edad en aos cumplidos tiene distribucin con media poblacional, = 38,5 aos y
varianza poblacional, 2 = 30 aos2.
Usando la expresin 2.3 se obtiene x = 40,73 aos, y al usar la expresin 2.7 se obtiene
s2 = 33,21 aos2.
Por tanto la desviacin estndar muestral de la edad es: s s2 33,21 = 5,76.
En cambio el error estndar del estadstico media muestral, empleando la propiedad 3, es:
x = 1,42 aos.
Proporcin muestral
Para la segunda variable, interesa que el docente encuestado indique que la profesin de
investigador es una profesin atractiva para docentes jvenes (A). La muestra aleatoria
es igual a 15 docentes n 15 .
En esta poblacin se asume que la proporcin poblacional de docentes que consideran
que la profesin de investigador es una profesin atractiva para docentes jvenes es igual
a 0,71 0,71 .
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
16/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
De la tabla contamos que, nA =9, es decir 9 docentes afirman que la profesin de
investigador es una profesin atractiva para docentes jvenes, entonces empleando la
expresin 2.8, se obtiene:
p9
= 0,6 (60%)15
Esto es, el 60% de docentes encuestados afirman que la profesin de investigador es una
profesin atractiva para docentes jvenes.
El error estndar del estadstico p es:
(1 )p
n
0,71(1
15
0,71) 0,71(0,29)
15
0,2059
150,0137 = 0,1170
2.9. ESTIMACIN
La inferencia estadstica se clasifica como: estimacin y prueba de hiptesis de parmetros
estadsticos. En ambos casos hay una poblacin bajo investigacin y generalmente al
menos un parmetro de esta poblacin, al que vamos a representar mediante la letra
griega .
Cuando no se tiene una nocin preconcebida sobre el valor de , se desea responder a la
pregunta: Cul es el valor de ?
En este caso el intentar conocer el valor de es en trminos estadsticos, estimar el valor
de es decir tratar de conocer el valor del parmetro en trminos prcticos.
Sierra Bravo (1991), anota que estimacin proviene del latn estimatio y significa
estimacin, precio y valor que se da a una cosa. En estadstica es la operacin que
mediante la inferencia un parmetro, utilizando datos incompletos procedentes de una
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
17/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
muestra, se trata de determinar el valor del parmetro. Pero los valores de la muestra estn
sujetos al error muestral esto es a las fluctuaciones de la muestra.
La estimacin de un parmetro puede ser mediante una:
1. Estimacin puntual.
2. Estimacin mediante intervalos de confianza.
Para cualquiera de estas dos situaciones empleamos el estadstico que, como ya se ha
mencionado, es una variable aleatoria.
La aproximacin se hace utilizando estadsticos apropiados. A un estadstico empleado
para aproximar o estimar un parmetro de la poblacin se le llama estimador puntual
de y se denota mediante . De este modo por ejemplo, al estimador de la media , se
le denotara por . Una vez que la muestra ha sido tomada y se han hecho algunas
observaciones, se puede obtener el valor numrico del estadstico . A tal nmero se le
denomina una estimacin puntual de . Ntese que hay una diferencia entre los trminos
estimador y estimacin.
ESTIMADOR: Es el estadstico utilizado para generar una estimacin y es una
variable aleatoria.
ESTIMACIN: Es el valor que toma el estimador.
Ejemplo 2.9.
Consideremos las variables edad en aos cumplidos X y el docente considera que el
investigador educativo debe ser bien remunerado Y , para distinguir entre estimador y
estimacin:
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
18/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
Variable Parmetro Estimador Estimacin
X
n
xix i 1
n
x = 40,73 aos
2
2 1n
2
sn 1
xi xi 1
2s
2 =33,21 aos2
Yp
nA
n p 0,7333(73,33%)
2.10. PRUEBA DE HIPTESIS
Proceso mediante el cual, a partir de los valores de una muestra aleatoria, se decide si se
rechaza o no el supuesto que plantea el investigador para el parmetro o parmetros de la
poblacin o poblaciones bajo estudio, pero con cierta probabilidad de error (riesgo) por
tomar una decisin.
Ejemplo 2.10.
En cierta investigacin, se requiere estudiar el nivel de comprensin lectora en nios de 8
aos de edad, que asisten a Instituciones Educativas estatales y privadas, para tal fin se
elige al azar una muestra de alumnos de cada tipo de Institucin Educativa (IE). Se
pretenden lograr los siguientes objetivos:
1. Determinar el nivel promedio poblacional del puntaje de la prueba de comprensin
lectora para tipo de IE.
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
19/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
2. Verificar si el nivel promedio poblacional del puntaje de la prueba de comprensin
lectora en nios de IE estatal es diferente de los nios de IE privados.
Explicar cul rama de la inferencia estadstica emplear para lograr cada objetivo.
Solucin
Previamente se requiere identificar:
Poblacin. Se trata de dos poblaciones bajo estudio:
1. Nios de 8 aos de edad, que asisten a Instituciones Educativas estatales.
2. Nios de 8 aos de edad, que asisten a Instituciones Educativas privadas.
Muestra. Nios de 8 aos de edad seleccionados aleatoriamente e independiente de cada
poblacin.
Variable aleatoria. Est representada mediante X y se define como: Puntaje de
comprensin lectora obtenida mediante una prueba especial.
Parmetros: En relacin a la variable aleatoria bajo estudio y considerando que se
investiga para dos tipos deIE, los parmetros son:
1 = Nivel promedio poblacional del puntaje de la prueba de comprensin lectora para
nios de 8 aos de edad que asisten a IE estatales.
2 = Nivel promedio poblacional del puntaje de la prueba de comprensin lectora
para nios de 8 aos de edadque asisten a IE privados.
-
8/12/2019 Unidad 5 - Estadistica Aplicada.docx
20/20
Rey Mndez Jos Alfredo Probabilidad y Estadstica
1 = Desviacin estndar poblacional del puntaje de la prueba de comprensin lectora
para nios que asisten a IE estatales.
2 = Desviacin estndar poblacional del puntaje de la prueba de comprensin lectora
para nios que asisten a IE privadas.
Para lograr el objetivo 1. Se debe emplear la estimacin debido a que se requiere tener
un valor aproximado de 1 y 2 empleando muestras aleatorias que se han obtenido de
manera independiente de cada tipo de institucin educativa.
Para el logro del objetivo 2. Se debe verificar que los promedios poblacionales 1 y 2
son diferentes a partir de muestras aleatorias, aritmticamente significa: 1 diferente de
2 ( 1 2) o equivalentemente 1 - 2 = 0.
En este caso se parte del supuesto que no existe diferencias entre el nivel promediopoblacional del puntaje de la prueba de comprensin lectora para nios que asisten a IE
estatales y privados. Por tanto se empleara la prueba de hiptesis estadstica, mediante el
cual se somete a prueba 1 - 2 = 0.