Unidad 5 - Estadistica Aplicada.docx

download Unidad 5 - Estadistica Aplicada.docx

of 20

Transcript of Unidad 5 - Estadistica Aplicada.docx

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    1/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    Instituto Tecnolgico de Veracruz

    Ing. en Sistemas Computacionales

    Probabilidad y Estadstica

    Profesor:

    Barrientos Arzamendi Victor Javier

    Alumno:

    Rey Mndez Jos Alfredo

    Veracruz, Ver.

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    2/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    Unidad 5 Estadstica Aplicada

    1.1 Inferencia Estadstica

    Tambin se le llama estadstica inferencial, pero previamente recordemos que laestadstica (EI) comprende el conjunto de mtodos estadsticos que permiten deducir

    (inferir) cmo se distribuye la poblacin bajo estudio, a partir de la informacin que

    proporciona una muestra representativa obtenida de dicha poblacin. Ver seccin 1.6.2

    del presente libro. Para que la estadstica inferencial proporcione buenos resultados debe:

    1. Basarse en una tcnica estadstico-matemtica adecuada al problema y suficientemente

    validada.

    2. Utilizar una muestra que realmente sea representativa de la poblacin y de un tamao

    suficiente.

    Veamos el siguiente ejemplo:

    Ejemplo 2.1.

    Se realiza un estudio para comparar tres mtodos para ensear tcnicas de comprensin

    lectora en ingls a escolares de segundo grado de Educacin Bsica Secundaria, como

    son:

    1. El mtodo de la enseanza recproca.

    2. El mtodo de instruccin directa.

    3. La combinacin de mtodos de instruccin directa y enseanza recproca.

    Las preguntas por resolver son:

    1. Cul de los mtodos mejora la comprensin lectora?

    2. Para el prximo ao el mtodo, identificado como el mejor, dar buenos resultados

    para el alumno Javier Hernndez Len, quin realizar el segundo grado de Educacin

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    3/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    Bsica Secundaria?

    La primera pregunta es un caso de incertidumbre porque basndonos en el estudio de tres

    muestras independientesyen igualdad de condiciones se aplicar uno de los tres mtodos

    a cada muestra de manera independiente; con el apoyo de la estadstica inferencial

    absolvemos esta pregunta, eligiendo a la que mejora significativamente la comprensin

    lectora para este tipo de alumnos.

    La segunda pregunta es un caso de toma de decisiones porque Javier Hernndez Len no

    ha participado en el estudio, pero se le aplicar el mejor mtodo que resulte de la

    investigacin realizada, ahora bien, con qu confianza diremos que ese mtodo lograrque Javier mejore su comprensin lectora en ingls.

    Los casos de incertidumbre y toma de decisiones son resueltos por la estadstica

    inferencial, por supuesto apoyada por la probabilidad.

    Para iniciarse en el estudio y aplicacin de la estadstica inferencial es

    necesario conocer los conceptos bsicos que a continuacin se van a tratar.

    1.2. POBLACIN

    Este concepto vamos a definirlo bajo diferentes enfoques.

    En investigacin cientfica se le define como la totalidad de elementos sobre los

    cuales recae la investigacin. A cada elemento se le llama unidad estadstica, a

    sta se le observa o se le somete a una experimentacin, estas unidades son

    medidas pertinentemente.

    Si representamos mediante X una variable aleatoria bajo investigacin, al estudiara sta

    variable en la poblacin, como resultado tendremos los

    valores:

    X1 ,X 2 ,X3,...,X N

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    4/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    Donde N es el total de elementos de la poblacin.

    Ejemplo 2.2.

    Sea X una variable aleatoria que representa la calificacin obtenida en la

    prueba de conocimientos sobre educacin ambiental (escala vigesimal) de los

    alumnos de la Facultad

    de Educacin, si la poblacin consta de 300 alumnos, entonces:

    X1 ,X2 ,X3 ,...,

    X300

    Es una poblacin en trminos de variable aleatoria, que selee as:

    La calificacin que ha obtenido el alumno 1 en la prueba de conocimientos

    sobre educacin ambiental, la calificacin que ha obtenido el alumno 2 en la

    prueba de conocimientos sobre educacin ambiental, la calificacin que ha

    obtenido el alumno 3 en la prueba de conocimientos sobre educacin ambiental, y

    as sucesivamente hasta la calificacin que ha obtenido el alumno 300 en la

    prueba de conocimientos sobre educacin ambiental.

    El propsito de un estudio estadstico es extraer conclusiones acerca de la

    naturaleza de la poblacin, pero resulta que las poblaciones son grandes, o por

    razones de tica, recursos financieros, metodolgicos u otros no ser posible,

    entonces se debe trabajar con una muestra extrada de la poblacin bajo estudio.

    2.3. MUESTRA

    Sierrra Bravo (1991), anota que una muestra en general es toda parte

    representativa de la poblacin, cuyas caractersticas debe reproducir en pequeo lo

    ms exactamente posible.

    Para que sea representativa se debe seleccionar empleando el muestreo, tpico

    importante de la estadstica, con la finalidad de que los resultados de esta muestra

    sean vlidos para la poblacin de la que se ha obtenido la muestra. Esta

    generalizacin se realiza empleando la estadstica inferencial.

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    5/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    2.4. MUESTRA ALEATORIA

    Una muestra aleatoria de tamao n de la funcin de distribucin de la variable

    aleatoria

    X es una coleccin de n variables aleatorias

    independientes con la misma funcin de

    distribucin de la variable aleatoriaX.

    X1 ,X2 ,X3 ,...,X n , cada una

    2.5. MUESTRA ALEATORIA APLICADA

    Una muestra aleatoria de tamao n es un conjunto de n

    observaciones

    x1 ,x2 ,x3 ,...,xn

    sobre lasvariables

    X1 ,X2 ,X3 ,...,X n , independientes e idnticamente distribuidas

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    6/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    x

    2.6. PARMETRO

    Sierra Bravo (1991), indica que parmetro deriva del vocablo griego parmetreo que

    significa medir una cosa con otra: En estadstica se refiere a los valores o medidas que

    caracterizan a una poblacin como, por ejemplo, la media y la desviacin tpica de una

    poblacin () Son cantidades indeterminadas, constantes o fijas respecto a una condicin

    o situacin, que caracterizan a un fenmeno en un momento dado que ocurre en una

    poblacin.

    Se suele representar a un parmetro mediante letras griegas. Por ejemplo, la media

    poblacional se representa mediantex

    y se lee como media poblacional de la variable

    aleatoriaX, la varianza poblacional se representa mediante 2 y se lee como varianza

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    7/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    poblacional de la variable aleatoriaX.

    En trminos prcticos, un parmetro es un valor que resulta al emplear los valores que se

    obtienen de una poblacin.

    Ejemplo 2.5.

    Si al obtener las calificaciones de los 300 alumnos que conforman la poblacin, stas se

    promedian, entoncesx =14.78 es el parmetro correspondiente. Para su clculo se ha

    empleado la siguiente expresin, llamada media poblacional:

    N

    X ii 1 (2.1)xN

    Obviamente queN toma el valor de 300 para este ejemplo.

    Si de estos 300 alumnos, 198 son mujeres, entonces la proporcin poblacional de mujeres

    representada por x =0.66(66%). Para su clculo se ha empleado la siguiente expresin,

    llamada proporcin poblacional:

    N

    X ii 1 (2.2)

    xN

    Pero, ahora la variable aleatoria se define como:

    1X

    i si alumna

    0 si alumno

    En este caso el numerador de la expresin (2.2) es 198 yN toma el valor de 300.

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    8/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    2.7. ESTADSTICO

    Se contrapone al parmetro porque es un valor que se obtiene a partir de los valores

    muestrales. Se pueden obtener media y varianzas mustrales, por ejemplo.

    Los estadsticos son variables aleatorias por que estn sujetos a la fluctuacin de la

    muestra en relacin al valor poblacional, que se asume es constante.

    Ejemplo 2.6.

    Continuando con el ejemplo 2.4, al seleccionar una muestra aleatoria de tamao seis, unavez identificados los seis alumnos, se obtienen las siguientes calificaciones x1 = 13,x2 =

    10, x3 = 13, x4 = 14 x5 = 11, x6 = 10. La media obtenida de los seis alumnos es de

    11,83, llamada media muestral y se representa mediante x , cuya expresin es:

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    9/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    Unidad xi x x2

    xi

    13 1,3689

    10 -1,83 3,3489

    13 1,3689

    14 4,7089

    11 -0,83 0,6889

    10 -1,83 3,3489

    Total 71 0,02* 14,8334

    n

    xii 1

    n(2.3)

    El numerador de la expresin (2.3) es la suma de los seis valores, que da 71, que dividido

    por 6, resulta x = 11,83, es decir en promedio los alumnos han obtenido 11,83 de

    calificacin en la prueba de educacin ambiental.

    La varianza de esta muestra aleatoria es 2,4722, y se representa mediante

    expresin es:

    S2 , cuya

    n2

    xi xS

    2 i 1

    n(2.4)

    Para su clculo, disponemos de la tabla 2.1, en la que mostramos paso a paso el uso de la

    expresin (2.4), sabiendo que x = 11,83:

    Tabla 2.1

    Clculos para obtener el valor de la varianza (Ejemplo 2.6)

    i

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    10/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    Tericamenten

    xi x 0i 1

    El numerador de la expresin (2.4) es la suma del cuadrado de las seis desviaciones de

    cada valor que toma la variable, respecto a su media aritmtica, que es igual a 14,8334, que

    dividido por 6 es justamente 2,4722.

    La raz cuadrada, positiva, de la varianza se llama desviacin estndar o desviacin tpica,

    esto es:

    S S 2 (2.5)

    Entonces, usando la expresin anterior (2.5), la desviacin estndar es S = 1,5723.

    2.8. DISTRIBUCIN MUESTRAL

    Sierrra Bravo (1991), anota que la distribucin muestral est formada por estadsticos o

    valores determinados obtenidos de muestras: medias, varianzas, etc. acompaados de sus

    respectivas frecuencias relativas o probabilidades, o de la proporcin de veces que se

    repiten en el conjunto de todas las muestras posibles del mismo tamao obtenidas de la

    poblacin.

    De manera ms formal, Tsokos y Milton (1998), anotan que la distribucin de

    probabilidad del estadstico se llama distribucin muestral.

    Ejemplo 2.7.

    Vamos a obtener la distribucin muestral, de las calificaciones obtenidas en la prueba que

    mide la educacin ambiental, de una poblacin hipottica compuesta por 3 estudiantes y

    que toma calificaciones iguales a: X1 = 13,X 2 = 11,X 3 = 07. Fijamos para una muestra

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    11/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    de tamao 2. En la tabla 2.2 se muestran los posibles resultados de la muestra de tamao

    2, as como su respectiva media muestral:

    Tabla 2.2Resultados de posibles muestras de tamao 2

    Muestras

    posibles

    Medias muestrales

    (media para cada muestra)

    13,11 12

    13,7 10

    11,13 12

    11,7 9

    7,13 10

    7,11 9

    Ahora se muestra la distribucin de frecuencias para los valores de la media muestral:

    Tabla 2.3

    Distribucin muestral de la media muestral

    Valores de las

    medias muestrales

    Frecuencia Frecuencia relativa

    9 2 2/6 = 0.33

    10 2 2/6 = 0.33

    12 2 2/6 = 0.33

    La distribucin muestral de la media muestral es la distribucin de frecuencias o de

    probabilidad. En este caso, de las frecuencias relativas de todas las medias muestrales

    posibles, obtenidas de muestras de tamao 2, de la poblacin de tamao 3.

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    12/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    x

    Por cultura estadstica estudiaremos algunos estadsticos y su distribucin de probabilidad

    (distribucin muestral).

    2.8.1. Media muestral

    La expresin (2.3), nos indica cmo se obtiene una media muestral. Veamos sus

    propiedades:

    Propiedades de la media muestral

    Si X es una variable aleatoria con esperanza o media poblacional y varianza

    poblacional 2 , entonces la media muestral x tiene las siguientes propiedades:

    1. E x

    2. V x 2 / n

    3. La desviacin estndar de x , que se representa mediante , conocida tambin como

    error estndar de la media muestral es igual a / n

    4. Sea X1 ,X 2 ,X 3 ,...,X n una muestra aleatoria de tamao n, de una distribucin con

    media poblacional y varianza poblacional 2 . Entonces, para n grande, la variable

    aleatoria:

    x

    / n(2.6)

    Se distribuye aproximadamente como una normal estandarizada N 0,1 . Se considera

    una buena aproximacin cuando n 30 (teorema del lmite central). De este modo,

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    13/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    (n-1)s^2

    a^2

    incluso, an cuando la variable aleatoriaX no est normalmente distribuida, podemos

    aplicarla en la inferencia estadstica.

    2.8.2. Varianza muestral

    A partir de cada muestra aleatoria de tamao n de X :

    calcular la varianza muestral definida como:

    x1 ,x2 ,...,xn , tambin se puede

    s21

    n 1

    n2

    xi x (2.7)i 1

    Cabe precisar, que algunos autores la llaman cuasivarianza.

    Propiedades de la varianza muestral

    Si X es una variable aleatoria con esperanza y varianza y ^2 respectivamente,

    entonces para la varianza muestral de tamao n se cumple que:

    1. E(s^2) = ^2

    2. Si X tiene distribucin de probabilidad normal , esuna variable aleatoria con

    distribucin chi-cuadrado con n 1 grados de libertad.

    CUL ES LA DIFERENCIA ENTRE DESVIACIN ESTNDAR

    Y ERRORESTNDAR?

    La diferencia es que la DESVIACIN ESTNDAR describe la variabilidad

    de los valores de unavariable, en cambio el ERROR ESTNDAR describe

    la precisin del estadstico.

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    14/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    Ejemplo 2.8.

    En una muestra aleatoria de 15 docentes de educacin secundaria, de la Institucin

    Educativa Martn Adn, se aplic un cuestionario para recoger su opinin sobre elinvestigador educativo. Se presenta la respuesta de 3 preguntas, de un total de 27:

    Tabla 2.4

    Muestra aleatoria de 15 docentes de la Institucin Educativa Martn Adn (Lima)

    Docente Edad(1) Investigador(2) Remuneracin(3)

    1 34 1 1

    2 38 1 1

    3 49 2 1

    4 42 1 1

    5 35 1 2

    6 44 2 1

    7 30 1 2

    8 36 1 1

    9 43 2 1

    10 47 2 1

    11 39 1 2

    12 46 2 1

    13 48 2 1

    14 36 1 215 44 1 1

    (1) Edad en aos cumplidos del docente.

    (2) La profesin de investigador es profesin atractiva para:

    1. Docentes jvenes. 2. Docentes maduros.

    (3) El investigador educativo debe ser bien remunerado:

    1. S. 2. No.

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    15/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    5,48 5,48

    n 15 3,87

    Con esta informacin vamos a mostrar la diferencia entre desviacin estndar y error

    estndar.

    Media muestral

    La edad en aos cumplidos tiene distribucin con media poblacional, = 38,5 aos y

    varianza poblacional, 2 = 30 aos2.

    Usando la expresin 2.3 se obtiene x = 40,73 aos, y al usar la expresin 2.7 se obtiene

    s2 = 33,21 aos2.

    Por tanto la desviacin estndar muestral de la edad es: s s2 33,21 = 5,76.

    En cambio el error estndar del estadstico media muestral, empleando la propiedad 3, es:

    x = 1,42 aos.

    Proporcin muestral

    Para la segunda variable, interesa que el docente encuestado indique que la profesin de

    investigador es una profesin atractiva para docentes jvenes (A). La muestra aleatoria

    es igual a 15 docentes n 15 .

    En esta poblacin se asume que la proporcin poblacional de docentes que consideran

    que la profesin de investigador es una profesin atractiva para docentes jvenes es igual

    a 0,71 0,71 .

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    16/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    De la tabla contamos que, nA =9, es decir 9 docentes afirman que la profesin de

    investigador es una profesin atractiva para docentes jvenes, entonces empleando la

    expresin 2.8, se obtiene:

    p9

    = 0,6 (60%)15

    Esto es, el 60% de docentes encuestados afirman que la profesin de investigador es una

    profesin atractiva para docentes jvenes.

    El error estndar del estadstico p es:

    (1 )p

    n

    0,71(1

    15

    0,71) 0,71(0,29)

    15

    0,2059

    150,0137 = 0,1170

    2.9. ESTIMACIN

    La inferencia estadstica se clasifica como: estimacin y prueba de hiptesis de parmetros

    estadsticos. En ambos casos hay una poblacin bajo investigacin y generalmente al

    menos un parmetro de esta poblacin, al que vamos a representar mediante la letra

    griega .

    Cuando no se tiene una nocin preconcebida sobre el valor de , se desea responder a la

    pregunta: Cul es el valor de ?

    En este caso el intentar conocer el valor de es en trminos estadsticos, estimar el valor

    de es decir tratar de conocer el valor del parmetro en trminos prcticos.

    Sierra Bravo (1991), anota que estimacin proviene del latn estimatio y significa

    estimacin, precio y valor que se da a una cosa. En estadstica es la operacin que

    mediante la inferencia un parmetro, utilizando datos incompletos procedentes de una

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    17/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    muestra, se trata de determinar el valor del parmetro. Pero los valores de la muestra estn

    sujetos al error muestral esto es a las fluctuaciones de la muestra.

    La estimacin de un parmetro puede ser mediante una:

    1. Estimacin puntual.

    2. Estimacin mediante intervalos de confianza.

    Para cualquiera de estas dos situaciones empleamos el estadstico que, como ya se ha

    mencionado, es una variable aleatoria.

    La aproximacin se hace utilizando estadsticos apropiados. A un estadstico empleado

    para aproximar o estimar un parmetro de la poblacin se le llama estimador puntual

    de y se denota mediante . De este modo por ejemplo, al estimador de la media , se

    le denotara por . Una vez que la muestra ha sido tomada y se han hecho algunas

    observaciones, se puede obtener el valor numrico del estadstico . A tal nmero se le

    denomina una estimacin puntual de . Ntese que hay una diferencia entre los trminos

    estimador y estimacin.

    ESTIMADOR: Es el estadstico utilizado para generar una estimacin y es una

    variable aleatoria.

    ESTIMACIN: Es el valor que toma el estimador.

    Ejemplo 2.9.

    Consideremos las variables edad en aos cumplidos X y el docente considera que el

    investigador educativo debe ser bien remunerado Y , para distinguir entre estimador y

    estimacin:

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    18/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    Variable Parmetro Estimador Estimacin

    X

    n

    xix i 1

    n

    x = 40,73 aos

    2

    2 1n

    2

    sn 1

    xi xi 1

    2s

    2 =33,21 aos2

    Yp

    nA

    n p 0,7333(73,33%)

    2.10. PRUEBA DE HIPTESIS

    Proceso mediante el cual, a partir de los valores de una muestra aleatoria, se decide si se

    rechaza o no el supuesto que plantea el investigador para el parmetro o parmetros de la

    poblacin o poblaciones bajo estudio, pero con cierta probabilidad de error (riesgo) por

    tomar una decisin.

    Ejemplo 2.10.

    En cierta investigacin, se requiere estudiar el nivel de comprensin lectora en nios de 8

    aos de edad, que asisten a Instituciones Educativas estatales y privadas, para tal fin se

    elige al azar una muestra de alumnos de cada tipo de Institucin Educativa (IE). Se

    pretenden lograr los siguientes objetivos:

    1. Determinar el nivel promedio poblacional del puntaje de la prueba de comprensin

    lectora para tipo de IE.

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    19/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    2. Verificar si el nivel promedio poblacional del puntaje de la prueba de comprensin

    lectora en nios de IE estatal es diferente de los nios de IE privados.

    Explicar cul rama de la inferencia estadstica emplear para lograr cada objetivo.

    Solucin

    Previamente se requiere identificar:

    Poblacin. Se trata de dos poblaciones bajo estudio:

    1. Nios de 8 aos de edad, que asisten a Instituciones Educativas estatales.

    2. Nios de 8 aos de edad, que asisten a Instituciones Educativas privadas.

    Muestra. Nios de 8 aos de edad seleccionados aleatoriamente e independiente de cada

    poblacin.

    Variable aleatoria. Est representada mediante X y se define como: Puntaje de

    comprensin lectora obtenida mediante una prueba especial.

    Parmetros: En relacin a la variable aleatoria bajo estudio y considerando que se

    investiga para dos tipos deIE, los parmetros son:

    1 = Nivel promedio poblacional del puntaje de la prueba de comprensin lectora para

    nios de 8 aos de edad que asisten a IE estatales.

    2 = Nivel promedio poblacional del puntaje de la prueba de comprensin lectora

    para nios de 8 aos de edadque asisten a IE privados.

  • 8/12/2019 Unidad 5 - Estadistica Aplicada.docx

    20/20

    Rey Mndez Jos Alfredo Probabilidad y Estadstica

    1 = Desviacin estndar poblacional del puntaje de la prueba de comprensin lectora

    para nios que asisten a IE estatales.

    2 = Desviacin estndar poblacional del puntaje de la prueba de comprensin lectora

    para nios que asisten a IE privadas.

    Para lograr el objetivo 1. Se debe emplear la estimacin debido a que se requiere tener

    un valor aproximado de 1 y 2 empleando muestras aleatorias que se han obtenido de

    manera independiente de cada tipo de institucin educativa.

    Para el logro del objetivo 2. Se debe verificar que los promedios poblacionales 1 y 2

    son diferentes a partir de muestras aleatorias, aritmticamente significa: 1 diferente de

    2 ( 1 2) o equivalentemente 1 - 2 = 0.

    En este caso se parte del supuesto que no existe diferencias entre el nivel promediopoblacional del puntaje de la prueba de comprensin lectora para nios que asisten a IE

    estatales y privados. Por tanto se empleara la prueba de hiptesis estadstica, mediante el

    cual se somete a prueba 1 - 2 = 0.