COMPENDIO MODELOS INFERENCIALES

download COMPENDIO MODELOS INFERENCIALES

of 68

description

COMPENDIO MODELOS INFERENCIALES

Transcript of COMPENDIO MODELOS INFERENCIALES

  • Modelos Inferenciales - 2014

    1

    U N I V E R S I D A D DE C A R T A G E N A

    PROGRAMA DE ADMINISTRACIN FINANCIERA

    COMPENDIO DE MODELOS INFERENCIALES

    INTRODUCCIN A LOS MODELOS INFERENCIALES

    La Estadstica es la parte de las Matemticas que se encarga del estudio de una determinada caracterstica en una poblacin, recogiendo los datos, organizndolos en tablas, representndolos grficamente y analizndolos para sacar conclusiones de dicha poblacin. Segn se haga el estudio sobre todos los elementos de la poblacin o sobre un grupo de ella, vamos a diferenciar dos tipos de Estadstica: Estadstica descriptiva. Realiza el estudio sobre la poblacin completa, observando una

    caracterstica de la misma y calculando unos parmetros que den informacin global de toda la poblacin. Estadstica inferencial. Realiza el estudio descriptivo sobre un subconjunto de la poblacin llamado

    muestra y, posteriormente, extiende los resultados obtenidos a toda la poblacin.

    Vocabulario estadstico:

    Las primeras definiciones necesarias para el inicio de cualquier estudio estadstico son:

    Poblacin: Conjunto de todos los elementos que verifican una caracterstica que ser objeto de estudio.

    Individuo: Cada uno de los elementos de la poblacin. Muestra: Cualquier subconjunto de la poblacin. Este subconjunto es muy importante que

    sea representativo de la poblacin. Carcter: Cada una de las propiedades que poseen los individuos de la poblacin y que pueden

    ser objeto de estudio.

  • Modelos Inferenciales - 2014

    2

    Caracteres

    Cualitativos Cuantitativos

    Continuos Discretos

    http://recursostic.educacion.es/descartes/web/indice_ud.php

    Una diferencia importante entre la estadstica y probabilidad es que: En la Probabilidad se razona a partir de la poblacin hasta llegar a la muestra. En la Estadstica el razonamiento parte de la muestra para llegar al conocimiento de toda la

    poblacin. El estudio de una poblacin tomando como base las muestras, se llama ESTADSTICA INFERENCIAL o INDUCTIVA, algunos autores la citan como teora de muestras. La inferencia estadstica trata de conocer o explicar el comportamiento de la poblacin, mediante los datos obtenidos de una muestra. Como no podemos estar absolutamente seguros de la veracidad de las inferencias obtenidas, las llamaremos probabilidades. Ahora, para predecir a partir de una muestra, es necesario haberla seleccionado y recopilado cuidadosamente; si la muestra no se selecciona adecuadamente, o si la recoleccin es incorrecta o hay desviaciones en los datos, con ningn anlisis estadstico que se aplique, se llegar a buenas conclusiones. Por lo tanto es necesario estudiar elTema: teora de muestreo Definicin de Estadstica Inferencial: De acuerdo con el diccionario de la Real Academia Espaola,

    inferir significa "sacar una consecuencia o deducir algo de otra cosa".

    El principal objetivo de la Estadstica consiste en poder decir algo con respecto a un gran conjunto de

    personas, mediciones u otros entes (poblacin) con base en las observaciones hechas sobre slo

    una parte (muestra) de dicho gran conjunto.

    La capacidad para "decir algo" sobre poblaciones con base en muestras est basada en supuestos

    con respecto a algn modelo de probabilidad que permite explicar las caractersticas del fenmeno

    bajo observacin.

    Al conjunto de procedimientos estadsticos en los que interviene la aplicacin de modelos de

    probabilidad y mediante los cuales se realiza alguna afirmacin sobre poblaciones con base en la

    informacin producida por muestras se le llama Inferencia Estadstica o Estadstica Inferencial.

    La estadstica inferencial es una parte de la estadstica que comprende los mtodos y procedimientos para deducir propiedades de una poblacin estadstica, a partir de una pequea parte de la misma. La estadstica inferencial comprende como aspectos importantes:

    La toma de muestras o muestreo. La estimacin de parmetros o variables estadsticas. El contraste de hiptesis. El diseo experimental. La inferencia bayesiana. Los mtodos no paramtricos

  • Modelos Inferenciales - 2014

    3

    Planteamiento del problema: Un problema de inferencia estadstica suele iniciarse con una fijacin

    de objetivos o algunas preguntas del tipo: Cul ser la media de esta poblacin respecto a tal caracterstica? Se parecen estas dos poblaciones? Hay alguna relacin entre? En el planteamiento se definen con precisin la poblacin, la caracterstica a estudiar, las variables, etc. Elaboracin de un modelo: Se establece un modelo terico de comportamiento de la variable de estudio. En ocasiones no es posible disear el modelo hasta realizar un estudio previo. Los posibles modelos son distribuciones de probabilidad. Extraccin de la muestra: Se usa alguna tcnica de muestreo o un diseo experimental para obtener informacin de una pequea parte de la poblacin. Tratamiento de los datos: En esta fase se eliminan posibles errores, se depura la muestra, se

    tabulan los datos y se calculan los valores que sern necesarios en pasos posteriores, como la media muestral, la varianza. Los mtodos de esta etapa estn definidos por la estadstica descriptiva. Estimacin de los parmetros: Con determinadas tcnicas se realiza una prediccin sobre cules podran ser los parmetros de la poblacin Contraste de hiptesis: Artculo principal: Contraste de hiptesis.

    Los contrastes de hiptesis son tcnicas que permiten simplificar el modelo matemtico bajo anlisis. Frecuentemente el contraste de hiptesis recurre al uso de estadsticos mustrales. Ministerio de educacin y ciencia de Espaa: http://recursostic.educacion.es/descartes/web/

    http://descartes.cnice.mec.es/ http://recursostic.educacion.es/descartes/web/Descartes1/Bach_HCS_2/Distri... http://ntic.educacion.es/w3//eos/MaterialesEducativos/mem2001/estadistica/index2.htm

  • Modelos Inferenciales - 2014

    4

    UNIDAD 1: DISTRIBUCIONES DE PROBABILIDAD

    Contenido temtico Las nociones elementales de la probabilidad

    Propsito del contenido temtico

    Las nociones elementales de la probabilidad, son de gran importancia para las unidades siguientes, especialmente en la eleccin de un modelo que permita la descripcin del comportamiento de los datos para que el alumno lo utilice al realizar trabajos de investigacin cientfica.

    Conceptos fundamentales El concepto de probabilidad

    Nmeros de sesiones 1 (semana) con alto porcentaje de estudio independiente

    ACTIVIDADES DE APERTURA OBSERVACIN

    Te damos una cordial bienvenida como estudiante del curso de Modelos Inferenciales y te deseamos xito en ste semestre. Te recomendamos que contestes todas tus actividades de aprendizaje y participes activamente en las siguientes secuencias didcticas para que construyas un aprendizaje significativo. Recuerda lo importante es que aprendas a aprender, a resolver problemas de la vida cotidiana.

    Contextualizar el tema integrador en base a:

    Las expectativas educativas en el presente semestre y al momento de

    egresar del programa.

    ACTIVIDADES DE DESARROLLO

    Revisin de contenido: 1. Lee de manera individual y cuidadosamente, los contenido relacionados

    al problema en tu gua didctica: Distribucin Binomial. Distribucin Poisson. Distribucin Hper geomtrica Distribucin Normal.

    2. Junto con los integrantes de tu equipo, comenten las estrategias para la solucin de las preguntas antes sealadas.

    3. Realicen otras consultas, en libros, internet, o apuntes diversos.

    Consultar la presente gua didctica para argumentar

    su solucin y otras bibliografas.

    ACTIVIDADES DE CIERRE

    En reunin plenaria, expondrn las vas de solucin que hayan

    encontrado a dichos preguntas ya sea con lminas, o presentaciones PowerPoint.

    Tambin podrn confrontar las respuestas de otros equipos. En la plenaria, encontraras la solucin ms idnea entre todo el grupo. De manera respetuosa podrs solicitar a todo el grupo, te disipen

    algunas dudas que tengas respecto al tema y a la solucin del problema en general.

    El tutor propiciar la exposicin libre de las inquietudes e impresiones generadas durante el desarrollo del tema.

    Se considera conveniente realizar un ejercicio similar

    en tu programa, como tarea.

    BIBLIOGRAFA, CIBERGRAFIA Y OTRAS FUENTES DE INFORMACIN

    Estadstica y Muestreo. Ciro Martnez Bencardino, Ecoe Ediciones, Novena Edicin. Eco Ediciones, Novena Edicin.

    Chao Lincoln. (1992). Introduccin a la estadstica. Editorial McGraw Hill Interamericana. Mxico.

    Texto Estadstica Aplicada a los Negocios y la Economa. Decimo tercera Edicion. McGrawHill. Autores Lind, Douglas A., Marchal, William G., Wathen, Samuel A.

    http://descartes.cnice.mec.es/ del ministerio de educacin y ciencia de Espaa

    http://ntic.educacion.es/w3//eos/MaterialesEducativos/mem2001/estadistica/index2.htm

    http://recursostic.educacion.es/descartes/web/materiales_didacticos/Distribucion_normal/Distribucion_normal.htm

    http://recursostic.educacion.es/descartes/web/materiales_didacticos/Distribucion_binomial/binomial.htm

  • Modelos Inferenciales - 2014

    5

    1.1. DISTRIBUCCION BINOMIAL

    Algunos la denominan como mtodo exacto y, corresponde a una distribucin de variable aleatoria discreta.

    Una forma corriente de descripcin de los experimentos aleatorios equiprobables con variable discreta es la

    distribucin binomial. En este tipo de distribucin se estudia la probabilidad de que se produzca un cierto

    resultado, que se describe por medio de dos parmetros: el nmero de repeticiones realizadas del experimento

    y la probabilidad individual del suceso aleatorio que se persigue como resultado.

    Qu es una distribucin binomial? Una distribucin de probabilidad ampliamente utilizada de una variable aleatoria discreta en la distribucin binomial. Esta describe varios procesos de inters para los administradores. Describe datos discretos, resultantes de un experimento denominado proceso de Bernoulli en honor del matemtico suizo Jacob Bernoulli, quien vivi en el siglo XVII. Empleo del proceso de Bernoulli.

    Podemos servirnos de los resultados de un nmero fijo de lanzamientos de una moneda como ejemplo de un proceso de Bernoulli. Este proceso lo describimos as:

    1. Cada ensayo (cada lanzamiento, en nuestro caso) tiene slo dos resultados posibles: lado A o lado B, s o no, xito o fracaso.

    2. La probabilidad del resultado de cualquier ensayo (lanzamiento) permanece fija con el tiempo. Tratndose de una moneda la probabilidad de que salga del lado A sigue siendo de 0.5 en cada lanzamiento, cualquiera que sea el nmero de veces que la moneda sea arrojada.

    3. Los ensayos son estadsticamente independientes, es decir, el resultado de un lanzamiento no afecta al de cualquier otro lanzamiento.

    Cada proceso de Bernoulli tiene su propia probabilidad caracterstica. Pongamos el caso en que siete dcimas partes de las personas que solicitaron cierto tipo de empleo pasaron la prueba. Diremos entonces que la probabilidad caracterstica fue de 0.7 pero podemos describir los resultados de la prueba como un proceso de Bernoulli slo si tenemos la seguridad de que la proporcin de los que fueron aprobados permaneci constante con el tiempo. Desde luego, la otra caracterstica del proceso de Bernoulli tambin deber ser satisfecha. Cada prueba deber arrojar tan slo dos resultados (xito o fracaso = y los resultados de las pruebas habrn de ser estadsticamente independientes.

    En un lenguaje ms formal, el smbolo p representa la probabilidad de un xito y el smbolo q (1- p ) representa la probabilidad de un fracaso. Para representar cierto nmero de xitos, utilizaremos el smbolo k y para simbolizar el nmero total de ensayos emplearemos el smbolo n.

    Frmulas de la d is t r ibucin b inomia l n = es el nmero de pruebas.

    k = es el nmero de xitos.

    p = es la probabilidad de xito.

    q = es la probabilidad de fracaso.

    E l n m e r o c o m b i n a t o r io

    Parmetros de la Distribucin Binomial

    Media = np

    Varianza 2= npq Desviacin Tpica = npq

  • Modelos Inferenciales - 2014

    6

    Ejemplo 1:

    Un examen consta de 10 preguntas a las que hay que contestar SI o NO. Suponiendo que a las personas que

    se le aplica no saben contestar a ninguna de las preguntas y, en consecuencia, contestan al azar, hallar.

    a. Probabilidad de obtener cinco aciertos.

    b. Probabilidad de obtener algn acierto.

    c. Probabilidad de obtener al menos cinco aciertos.

    En una distribucin binomial, la persona solo puede acertar o fallar la pregunta.

    Suceso A (xito) = acertar la pregunta p = p(A) = 0.5

    Suceso A = no acertar la pregunta = p( A) = 0.5

    Distribucin binomial de parmetros n= 10, p= 0.5 B (10; 0.5)

    a- Probabilidad de obtener cinco aciertos:

    Obtener exactamente cinco aciertos k= 5, aplicamos la frmula:

    Factorial = ( ! )

    b- Probabilidad de obtener algn acierto

    P(x ) = p (x = 1) + p (x = 2) + p (x =3) + P(x =4) + p(x =5) + p(x =6) + p( x=7) + p(x =8) + p(x 9) + p( x= 10)

    Hacerlo de esta forma resulta muy pesado. Lo hacemos por sucesos contrarios.

    El suceso obtener algn acierto es el suceso contrario a no obtener ningn acierto

    P(x 1) = 1 p (x =0)

    Calculemos la probabilidad de no obtener ningn acierto p (x =o)

    c) Probabilidad de obtener a los menos cinco aciertos Acertar cinco o ms

    p(x 5) = p (x= 5) + P(x =6) + p(x =7) + p(x= 8) + p(x =9) + p(x =10)

    p(x 5) = 0.2461 + 0.2051+ 0.1172 + 0.0439 + 0.0098 + 0.0010 = 0.6231

  • Modelos Inferenciales - 2014

    7

    Ejemplo 2

    La probabilidad de que un estudiante obtenga el ttulo de licenciado en farmacia es 0.3.

    Hallar la probabilidad de que un grupo de siete estudiantes matriculados en primer curso finalice la carrera:

    a- Ninguno de los siete finalice la carrera.

    b- Finalicen todos.

    c- Al menos dos acaben la carrera.

    d- Hallar la media y la desviacin tpica del nmero de alumnos que acaban la carrera.

    A = Obtener el ttulo p = p (A) = 0.3 B (7; 0.3)

    A = No obtener el ttulo = p ( A) = 1 0.3 = 0.7

    a- Ninguno de los siete finalice la carrera. X=0

    b- Finalicen todos. X = 7

    c- Al menos dos terminen la carrera. X= 2

    Calculamos la probabilidad del suceso contrario. Probabilidad que no termine ninguno ms la

    probabilidad de que termine uno.

    P(x 2) = 1 [ p(X= 0) + p(X =1)]

    - La probabilidad de que no termine ninguno la hemos calculado en el apartado a. p(x = 0) = 0.0824

    - Probabilidad de que termine uno:

    d- Media y desviacin tpica.

    Media: = n x p = 7 x 0.3 = 2.1

    Desviacin tpica

  • Modelos Inferenciales - 2014

    8

    Ejemplo3.

    La probabilidad de que un alumno de 1 de bachillerato repita curso es de 0.3.

    Elegimos 20 alumnos al azar. Cul es la probabilidad de que haya exactamente 4 alumnos repetidores.

    Es una distribucin binomial, el alumno repite o pasa de curso.

    - Consideremos suceso xito el ue nos preguntan El alumno repite curso P (A) = p = 0.3.

    - El alumno no repite curso P( A ) =1-p = q q = 1 0.3 = 0.7

    - Elegimos 20 alumno n = 20

    - Es una distribucin binomial de parmetros n= 20 , p = 0.3 B (n, p) B( 20, 0.3)

    Probabilidad de ue haya exactamente 4 alumnos repetidores X = 4

    Ejemplo 4.

    Calcular la probabilidad de que una familia que tiene cuatro hijos, tres e ellos sean nios. Es una distribucin binomial, los hijos solo pueden ser nios o ms.

    - Suceso A (xito) tener un nio p (a) = 0.5 p = 0.5 - Suceso A tener una nia p( A) = 0.5 q = 0.5 - n = 4 (hijos) B (n, p) B ( 4; 0.5 )

    Probabilidad de tener tres nios X = 3

  • Modelos Inferenciales - 2014

    9

    La distribucin binomial se puede expresar de forma grfica,

    http://gmein.uib.es/bioinformatica/estadistica/index.html

  • Modelos Inferenciales - 2014

    10

    1.2. DISTRIBUCION DE POISSON

    En una distribucin binomial cuando n es grande, por lo general mayor de cincuenta, y p, la probabilidad de

    xito de un suceso, se acerca a cero, mientras que q la probabilidad de fracaso, se aproxima a 1 de tal manera

    que el producto de np, llamado lambda , es menor o igual a 5, debe utilizarse la distribucin de Poisson. Algunos autores consideran no solo el hecho de que p sea muy pequeo, sino tambin cuando p es tan grande

    que se aproxima a 1, tambin para > 5, en ambos casos, se puede aplicar esta distribucin.

    Condicin: Los eventos deben ser independientes.

    Su distribucin de probabilidad est dada por

    Dnde:

    e = es la base del logaritmo natural= (e = 2.71828...), X! =es el factorial de x, X = nmero de casos favorables

    = nxp, es un nmero real positivo, equivalente al nmero esperado de ocurrencias durante un intervalo dado. = lambda

    La distribucin de Poisson es una distribucin de probabilidad discreta.

    Trabaja con la probabilidad de ocurrencia en un tiempo determinado o regin especfica, teniendo como

    parmetro de la distribucin el promedio de ocurrencias en el mismo intervalo de tiempo o regin especfica. Por

    ejemplo, el nmero de llamadas telefnicas que entran a un conmutador por hora; nmero de personas que se

    inscriben a la universidad por semestre, nmero de artculos defectuosos que salen por hora, etc.

    Caractersticas de la distribucin de Poisson

    La distribucin de Poisson sirve para estudiar las ocurrencias de un evento por intervalo de tiempo. Para que un proceso de esta naturaleza sea estudiado bajo esta distribucin de probabilidades, deben cumplirse todas las siguientes

    caractersticas. El promedio de individuos que esperan ser atendidos en una hora

    pico, puede ser estimada con base en los datos disponibles observando con anterioridad

    La probabilidad que un individuo llegue exactamente en un segundo es muy pequea y permanece constante para los dems intervalos de la hora pico

    Debemos ser capaces de calcular la ocurrencia promedio de este evento utilizando datos anteriores

    La probabilidad que dos o ms individuos lleguen en un intervalo igual a un segundo es tan pequeo que se puede considerar igual a cero

    El nmero de individuos que llegan en un intervalo de un segundo, es independiente del momento que este se presente en la hora pico

    El nmero de individuos que llegan en un segundo es independiente del nmero de individuos que llegan en cualquier otro segundo

  • Modelos Inferenciales - 2014

    11

    1- Ejemplo: Si el 1% de las bombillas fabricadas por una compaa son defectuosas, hallas la probabilidad de

    que, en una muestra de 100 bombillas, 3 sean defectuosas.

    Solucin:

    = n x p

    = 100 x (0,01)= 1

    = 1

    X = 3

    e = 2,71828

    P(X=3)= 13 x e -1 = 1 x (0.36788) = 0.06131

    3! 6

    P (X =3) = 6,13%

    2- Ejemplo: Su pongamos que hay 300 errores de impresin distribuidos aleatoriamente a lo largo de un libro

    de 500 pg.

    Encuentre la probabilidad de que en una pg., dada contenga exactamente 2 errores de impresin.

    Solucin:

    n = 300 errores

    P = _1_ es muy pequeo

    500

    X = 2 Dist. Poisson

    = n x p

    = 300 x _1_ = 0.6

    500

    = 0.6

    P (x=2)= (0,6)2 x e

    - 0,6 P (x=2)= (0,36) (0,549) P (x=2)= 0,0988 P (x=2)= 9.88 %

    2! 2!

    3- Ejemplo: Un cajero automtico es utilizado cada 20 minutos por 6 personas. Se debe saber cul es la

    probabilidad:

    a. Que el cajero sea utilizado por 5 personas en 20 minutos.

    b. Que el cajero sea utilizado por 10 personas en 20 minutos.

    c. Que el cajero sea utilizado por 5 personas o menos en 20 minutos.

    Solucin:

    e = 2,71828

    a) X=5

    b) X=10

    c) X= 5

  • Modelos Inferenciales - 2014

    12

    a)- P(X=5) = 65 x e

    -6 P(X=5)= 7776 x 0,0025 = 0,162 P(X=5)= 16,2 %

    5 ! 120

    b)- P(X=10) = 610

    x e -6

    P(X=10)= 60466176 x 0,0025 = 0.04165 P(X=5)= 4,16 %

    10 ! 3628800

    c)- P(X 5) = P(X=0) + P(X=1) + P(X=3) + P(X=4) + P(X=5)

    P(X 5) = 60

    x e -6

    + 61

    x e -6

    + 62

    x e -6

    + 63

    x e -6

    + 64

    x e -6

    + 65

    x e -6

    =

    0! 1! 2! 3! 4! 5!

    P(X 5) = 0.0024787 + 0.01487 + 0.044617 + 0.08923 + 0.13385 + 0.16062 = 0.44567 44.56%

    Ejemplo: En un interseccin de la ciudad de Villahermosa, las autoridades de trnsito han reportado que

    suceden en promedio 4 accidentes al mes, y la distribucin de este fenmeno est bajo un modelo de Poisson. Las autoridades han declarado que mejorarn los sealamientos en la interseccin si se conociera que la probabilidad de que ms de tres accidentes por mes, fuera mayor de 0.50 de acuerdo con esta informacin, debern las autoridades mejorar los sealamientos en dicha interseccin? Primero se requiere conocer la probabilidad de que sucedan 0, 1, 2, y 3 accidentes por mes.

    P(x)= x e -

    x!

    P(0)= (4)0(2.71828)

    -4 =(1) (0.01832) =0.01832

    0! 1

    P(1)= (4)1(2.71828)

    -4 =(4) (0.01832) =0.07328

    1! 1

    P(2)= (4)2(2.71828)

    -4 =(16) (0.01832) =0.14656

    2! 2

    P(3)= (4)3(2.71828)

    -4 =(64) (0.01832) =0.195413

    3! 6

    Para contestar la pregunta se requiere conocer la suma de todas las probabilidades de ocurrencia de P(x=0), P(x=1), P(x=2), P(x=3), la cual es de 0.43357, ste valor lo restamos de uno, y dar como resultado la probabilidad que se est tratando contestar, que es de 0.56643, por lo que respondiendo a la interrogante de las autoridades, se debe de mejorar los sealamientos ya que la probabilidad de que sucedan ms de tres accidentes por mes es de 0.56.

    La distribucin probabilstica de Poisson para este ejemplo es como se muestra.

    Nmero de accidentes (x) Probabilidad exacta de x

    0 0.01832

    1 0.07328

    2 0.14656

    3 0.19541

    4 0.19541

    5 0.15630

    6 0.10420

    7 0.05955

    8 0.02970

    9 0.01323

    Total de 0 a 9 0.99196

    Probabilidad de ms de 10 0.00804

    La distribucin Poisson se puede expresar de forma grfica: http://gmein.uib.es/bioinformatica/estadistica/index.html

  • Modelos Inferenciales - 2014

    13

    1.3. DISTRIBUCION HPERGEOMTRICA

    Al igual que la distribucin Binomial y la de Poisson corresponde a variables aleatorias discretas.

    La distribucin Hpergeomtrica est asociada generalmente con un proceso de muestras sin reposicin en una

    poblacin finita.

    Las caractersticas o condiciones que debe reunir una distribucin hipergeomtrica son:

    a. La informacin de la muestra se toma sin reposicin de una poblacin finita.

    b. La probabilidad de xito no es contante, cambia para cada observacin.

    c. El resultado de una prueba es dependiente de la prueba anterior, siempre se ver afectado por el resultado

    de observaciones previas.

    d. El tamao de la muestra (n) debe ser superior en un 5% con respecto al tamao poblacional N.

    e. Se relaciona con situaciones de dos o ms resultados.

    f. Esta distribucin es adecuada cuando el tamao de la poblacin es pequea. Esta condicin limita su

    aplicacin.

    La frmula que se debe emplear para la distribucin Hpergeomtrica es:

    Siendo: N= Tamao de la poblacin A= Numero de xitos en la poblacin n= Tamao de la muestra X= Numero de xitos en la muestra

    Es necesario tener en cuenta que X no puede exceder a A ni n.

    1-Ejemplo: De 50 edificios en un parque industrial 12 no cumplen el cdigo elctrico. Si se selecciona 10

    edificios aleatoriamente determina la probabilidad de que:

    a- 3 no cumplan el cdigo.

    b- 4 no cumplan el cdigo.

    c- Menos de 5 no cumplan el cdigo.

    Datos:

    N = Total poblacin = 50

    A = xito poblacin = 12

    n = Muestras = 10

  • Modelos Inferenciales - 2014

    14

    R/T.

    1.4. DISTRIBUCION NORMAL

    Entre la gran cantidad de distribuciones continuas que se usan en la estadstica, la ms importante, es la distribucin normal o curva normal. La frmula de esta distribucin fue publicada por primera vez por Abraham Demoivre (1667-1754) en 1733. Otros matemticos que figuran, en la historia inicial de la distribucin normal, son Pierre Simn, el Marqus de Laplace (1749-1827) y Carl Friedrich Gauss (1777-1855), en cuyo honor se denomina a veces, como distribucin de Gauss. La frmula de la distribucin normal es:

    La frmula de la distribucin normal es:

    Dnde: = la media de la distribucin

    = la desviacin tpica de la distribucin = la constante 3.1459 y,

    Indica que el termino entre corchetes es el exponente de e, donde e = la constante 2.71828

  • Modelos Inferenciales - 2014

    15

    La curva normal, es una curva en forma de campana que se extiende indefinidamente en ambos extremos, cada vez, pegndose ms al eje horizontal sin llegarlo a tocarlo. Algunas caractersticas importantes de la distribucin normal, son las que se mencionan a continuacin:

    a. El rea total comprendida bajo la curva y por encima del eje horizontal, es igual a 1 (unidades cuadradas).

    b. La distribucin es simtrica al respecto de su media. Es decir, el 50% del rea est a la derecha de la media y el 50% a la izquierda.

    c. La media, la mediana y la moda son todas iguales. 4. La distancia horizontal, que hay desde el punto de inflexin de la curva (el punto donde la curva deja de ser cncava hacia abajo y empieza a ser cncava hacia arriba), hasta una perpendicular levantada sobre la media, es igual a la desviacin estndar , como se muestra en la siguiente figura:

    5. La distribucin normal, es realmente una familia de distribuciones, puesto ue existe una distribucin diferente para cada valor de y . En la siguiente figura se pueden ver tres distribuciones normales con la misma desviacin estndar, pero diferente media. Las distribuciones que tienen diferentes medias, se sitan en diferentes posiciones sobre el eje horizontal.

  • Modelos Inferenciales - 2014

    16

    Ahora se muestran, tres distribuciones normales con la misma media, pero con diferentes desviaciones estndar. Aqu nos muestra, cmo mientras ms grande sea la distribucin estndar, ms plana y ms extendida es la grfica de la distribucin.

    6. La curva de una distribucin normal se extiende de (infinito) hasta + Afortunadamente en la prctica, no es necesario alargar estas colas muy lejos, pues se encuentran tan cerca del eje horizontal, que el rea bajo ellas es despreciable cuando nos alejamos ms de cuatro o cinco desviaciones estndar de la media.

    En la prctica, se pueden calcular las probabilidades de una variable X que est distribuida normalmente, y que tenga valores entre ciertos nmeros Xa y Xb, utilizando la tabla reas bajo la curva normal estndar (que se encuentra ms adelante), donde aparecen las reas entre los valores 0 y Z, con Z > 0, para la curva normal estndar. ( = 0 y = 1 ).

    Si utilizamos la simetra de la curva alrededor de la media, podemos calcular reas entre cualquiera de los dos valores Xa y Xb. Para obtener reas bajo cualquier curva normal, efectuamos el cambio de escala (ver la figura siguiente), que convierte las unidades de medida de la escala original o la escala X, en unidades estndar por medio de la frmula:

    Esta nueva escala o valor de Z simplemente, nos indica en cuntas desviaciones estndar por encima o por debajo de la media de su distribucin, se desva el valor correspondiente de X. (La

    anterior expresin tambin es conocida como desviacin normal).

    Antes de utilizar la frmula para valores de Z, te invitamos a que reflexiones detenidamente unos

    ejemplos y calculemos, las reas correspondientes a probabilidades de una variable aleatoria normal.

  • Modelos Inferenciales - 2014

    17

    a) Encuentra el rea bajo la curva normal estndar a la izquierda de 0.83 o P(Z < 0.83)

    Como el rea bajo toda la curva es 1, el rea que est a la izquierda del 0 es 0.5; el rea que est a la izquierda de 0.83 es igual a la suma del rea a la izquierda del 0 ms el rea entre 0 y 0.83. En la tabla reas bajo la curva normal estndar encontramos que este ltimo valor es 0.2967. El rea que buscamos es entonces 0.5 + 0.2967 =

    0.7967 observa su curva. El rea que se ha calculado corresponde a la probabilidad de que esta variable, tome valores menores a 0.83 que es de 0.7967 o 79.67%

    b) Encuentra el rea bajo la curva normal estndar a la derecha de 1.07 o P(Z > 1.07)

    El rea a la derecha del 0 es 0.5 y la podemos descomponer como la suma del rea entre 0 y 1.07 y el rea a la derecha del 1.07. En la tabla reas bajo la curva normal estndar, obtenemos ue el rea entre 0 y 1.07 es 0.3577. El rea a la derecha de 1.07 es lo que le falta a 0.3577 para llegar a 0.5, es decir, 0.5 0.3577 = 0.1423. Por tanto, la probabilidad de que esta variable tome valores mayores a 1.07 es de 0.1423 o 14.23%

    c) Encuentra el rea bajo la curva normal estndar entre 0.24 y 1.18 o P(0.24 Z < 1.18) Si el rea entre 0 y 1.18 le restamos el rea entre 0 y 0.24 obtenemos el rea que buscamos. El rea entre 1.18 y 0.24 es 0.3810 0.0948 = 0.29 Por tanto, la probabilidad de que esta variable tome valores entre 0.24 y 1.18 es de 0.29 o 29%

    d) Encuentra el rea bajo la curva normal estndar entre 1.70 y 0.93 o P(-1.70Z

  • Modelos Inferenciales - 2014

    18

    Ejemplo: La media de un grupo de ingresos semanales con distribucin aproximadamente normal para un

    conjunto de gerentes de nivel medio es de 1000 dlares y presenta una desviacin estndar de 100 dlares. Cul es la probabilidad.

    a. Que los gerentes tengan un ingreso semanal entre 840 y 1200 dlares.

    b. Con ingresos semanales de 1245 dlares o ms.

  • Modelos Inferenciales - 2014

    19

    Ejemplo: La panadera sureste elabora piezas de pan, la longitud de una pieza se distribuye de forma normal con una media de 15 cm y una varianza de 2,25 cm. Determine:

    a. Probabilidad de que una pieza exceda los 18 cm. b. Probabilidad de que las piezas de pan estn entre 13 y 17 cm.

    Datos:

    X = 15 cm

    = 2.25 cm = =1,5 cm

  • Modelos Inferenciales - 2014

    20

    La distribucin Normal se puede expresar de forma grfica: http://gmein.uib.es/bioinformatica/estadistica/index.html

  • Modelos Inferenciales - 2014

    21

    ACTIVIDADES DE APRENDIZAJE:

    Les recomiendo ue utilices una curva normal por cada ejercicio, y apoyndote en la tabla reas bajo la curva normal estndar, encuentres las respuestas correctas.

  • Modelos Inferenciales - 2014

    22

    UNIDAD 2: TEORIA DE MUESTREO

    Contenido temtico Teorema elemental de muestreo

    Propsito del contenido temtico Conocer los conceptos bsicos de la teora elemental de muestreo para que el alumno lo utilice al realizar trabajos de investigacin cientfica.

    Conceptos fundamentales Teora elemental de muestreo

    Nmeros de sesiones 1 (semana) con alto porcentaje de estudio independiente

    ACTIVIDADES DE APERTURA OBSERVACIN

    Te damos una cordial bienvenida como estudiante del curso de Modelos Inferenciales y te deseamos xito en ste semestre. Al igual que otros semestres, te recomendamos que contestes todas tus actividades de aprendizaje y participes activamente en las siguientes secuencias didcticas para que construyas un aprendizaje significativo. Recuerda lo importante es que aprendas a aprender, a resolver problemas de la vida cotidiana.

    Contextualizar el tema integrador en base a:

    Las expectativas educativas en el presente semestre y al momento de egresar del

    programa. ACTIVIDADES DE DESARROLLO

    Revisin de contenido: 1. Lee de manera individual y cuidadosamente, los contenido

    relacionados al problema en tu gua didctica: La teora de muestreo. El muestreo aleatorio simple. Los nmeros aleatorios. El muestreo con o sin remplazamiento. Los diseos de muestras.

    2. Junto con los integrantes de tu equipo, comenten las estrategias para la solucin n de las preguntas antes sealadas.

    3. Realicen otras consultas, en libros, internet, o apuntes diversos.

    Consultar la presente gua didctica para argumentar

    su solucin y otras bibliografas.

    ACTIVIDADES DE CIERRE

    En reunin plenaria, expondrn las vas de solucin que hayan

    encontrado a dichos preguntas ya sea con lminas, o presentaciones PowerPoint. Tambin podrn confrontar las respuestas de otros equipos. En la plenaria, encontraras la solucin ms idnea entre todo el

    grupo. De manera respetuosa podrs solicitar a todo el grupo, te disipen

    algunas dudas que tengas respecto al tema y a la solucin del problema en general.

    El tutor propiciar la exposicin libre de las inquietudes e impresiones generadas durante el desarrollo del tema.

    Se considera conveniente realizar un ejercicio similar

    en tu programa, como tarea.

    BIBLIOGRAFA, CIBERGRAFIA Y OTRAS FUENTES DE INFORMACIN

    Estadstica y Muestreo. Ciro Martnez Bencardino, Ecoe Ediciones, Novena Edicin. Eco Ediciones, Novena Edicion.

    Chao Lincoln. (1992). Introduccin a la estadstica. Editorial McGraw Hill Interamericana. Mxico.

    Texto Estadstica Aplicada a los Negocios y la Economa. Decimotercera Edicion. McGrawHill. Autores Lind, Douglas A., Marchal, William G., Wathen, Samuel A.

    http://recursostic.educacion.es/descartes/web/aplicaciones.php?bloque=4#28

    http://recursostic.educacion.es/descartes/web/materiales_didacticos/muestreo_poblaciones_ccg/tipos_muestreo.htm

    http://recursostic.educacion.es/descartes/web/materiales_didacticos/muestreo_poblaciones_ccg/tamano_muestra.htm

  • Modelos Inferenciales - 2014

    23

    2. LA TEORA DE MUESTREO

    Recordemos que el objeto de un estudio estadstico es doble. Deseamos describir la muestra que tenemos a mano y queremos sacar conclusiones o inferencias sobre la poblacin de donde hemos extrado dicha muestra. Las decisiones tomadas respecto de la poblacin, a partir de la informacin de la muestra, se basan en la probabilidad.

    Figura 1. Esquema de cmo se lleva a cabo un estudio estadstico

    Aunque el objetivo al llevar a cabo una investigacin es, por lo general, conocer las caractersticas de los individuos de una poblacin, en la prctica suele ser difcil, cuando no imposible. Para obviar estos inconvenientes, se recurre al estudio de una muestra, a partir de la cual podemos inferir, inducir o estimar las caractersticas de la poblacin entera de la cual aquella ha sido extrada. Por

    consiguiente, en contraposicin a la estadstica descriptiva, a esta parte que vamos a estudiar la denominaremos estadstica inferencial, inductiva o analtica.

    Es el estudio de las relaciones existentes entre una poblacin y las muestras extradas de ellas. Es de gran

    utilidad en muchos campos; por ejemplo, para ESTIMAR caractersticas desconocidas de poblaciones (como la

    media y la varianza poblacionales), denominadas parmetros de la poblacin o simplemente parmetros, a

    partir del conocimiento de las caractersticas muestrales correspondientes, nombradas estadsticos de la

    muestra o, en forma sencilla, estadsticos.

    A los valores (mu) y (ro) que son, respectivamente la media y la desviacin estndar poblacionales, se les llama PARMETROS DE LA POBLACIN. Como la media de la muestra ( ) nos da una idea del valor de , se dice que ESTIMA a o que es un

    estimador del parmetro ; anlogamente, S (desviacin estndar) estima a (Desviacin estndar de la poblacin), o de otra forma, que S es un estimador de .

  • Modelos Inferenciales - 2014

    24

    Recordemos sus frmulas:

    La teora del muestreo tambin sirve para determinar si las diferencias observadas entre dos muestras se deben a variaciones por el azar o si en realidad son significativas. Dichas cuestiones surgen, por ejemplo, al probar un nuevo suero para el tratamiento de una enfermedad o al decidir si un proceso de produccin es mejor que otro. Sus respuestas involucran el uso de las denominadas pruebas significativas y de hiptesis, que son importantes en la teora de decisiones, la cual estudiaremos ms adelante. 2.1 TIPOS DE MUESTREO. Como ya se seal al principio de este apartado; para que las conclusiones de la teora de muestreo y la estadstica inferencial sean vlidas, se deben elegir muestras REPRESENTATIVAS de la poblacin.

    2.1.1. MUESTREO ALEATORIO SIMPLE O AL AZAR Y NUMERO ALEATORIOS :

    Una forma de obtener una muestra representativa, es por medio del proceso denominado muestreo aleatorio simple, en el cual cada miembro de una poblacin tienen las mismas probabilidades de ser incluido en la muestra. Una tcnica de obtencin de una muestra aleatoria es la asignacin de nmeros a cada miembro de la poblacin, anotar estos nmeros en pedazos de papel, colocarlos en una urna y despus sacar nmeros de dicha urna, teniendo cuidado de mezclarlos muy bien antes de cada extraccin.

    Otro concepto importante es si la poblacin es finita o infinita. Una poblacin es FINITA, si consta de un nmero finito o fijo de elementos, medidas u observaciones. En cambio, una poblacin es INFINITA, al menos hipotticamente, porque contienen una infinidad de elementos, medidas u observaciones.

    Resumiendo Una muestra de tamao n de una poblacin finita de tamao N, es una variable aleatoria

    si se selecciona de manera tal que cada una de las (N Cn) muestras posibles, tiene la misma probabilidad, 1/N Cn de ser seleccionada

    Recordemos con un ejemplo Cuntas muestras distintas de n, podemos tomar de una poblacin finita de tamao N ?.

    Cuando n = 2 Tamao de la muestra N = 12 Tamao de la Poblacin

  • Modelos Inferenciales - 2014

    25

    Solucin; hay 12C2= 12 x 11/ 2! = 66 muestras distintas.

    12. C2= 12 x 11/2 12. C2= 12 x 5.5 12.C2 = 66

    Podemos utilizar la frmula de Combinacin: nCr = n! = 12 ! = 12 x 11x 10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 = 12 x 11 = 66 (n r)! r! (12 2 )! 2! (10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 ) 2! 2 !

    En la calculadora 12C2: 12 tecla SHIFT y nCr queda 12C colocas el 2 queda 12C2 ubicas el signo = y te da la repuesta 66

    Y cuando n = 3 y N = 100 Solucin; Hay 100C3 = 161,700 muestras distintas.

    Ahora con poblacin infinita

    Una muestra de tamao n de una poblacin infinita, es aleatoria si consta de valores de variables aleatorias independientes, que tienen la misma distribucin.

    Por independiente ueremos decir, ue las probabilidades relacionadas con cual uiera de las variables aleatorias son las mismas, sin que tengan importancia los valores que se hayan observado, para las otras variables aleatorias.

    NMEROS ALEATORIOS: Otro mtodo alternativo al muestreo aleatorio o al azar, es el uso de una tabla de nmeros aleatorios,

    especialmente elaborados para dicho propsito (como la tabla siguiente), que contienen nmeros entre cero y uno, distribuidos uniformemente.

    Para obtener una muestra aleatoria, escogemos un nmero cualquiera de stos, digamos que elegimos en la (Tabla N1 Nmeros Aleatorios) el sptimo nmero de la quinta columna (.266194) y a partir de l,

    tomamos tantos nmeros como tenga la muestra. Para elegir una muestra de 6 de 20 individuos nos fijamos en los siguientes cinco nmeros, los multiplicamos por 20, (el tamao de la poblacin), y redondeamos a nmeros enteros.

    En la siguiente tabla tenemos estos clculos:

    ri .246194 .361474 .721938 .874239 .588587 .987107

    20 x ri 4.92388 7.22948 14.43876 17.48478 11.77174 19.74214

    Redondeado 5 7 14 17 12 20

    Esto significa que la muestra que obtuvimos, consiste de los individuos 5, 7, 14, 17, 12 y 20. En caso de que despus de redondear, obtengamos un nmero repetido simplemente lo ignoramos y tomamos un nmero aleatorio ms de la tabla. Existen tablas extensas de nmeros aleatorios que pueden consultarse en caso necesario, o bien, es posible generar secuencias de nmeros aleatorios en hojas de clculo para computadoras personales.

    MUESTREO CON Y SIN REEMPLAZAMIENTO:

    Si se saca un nmero de una urna, existe la opcin de reponer o no, el nmero en la urna antes de la segunda extraccin. En el primer caso, el nmero puede salir una y otra vez, mientras que en el segundo caso, esto pasara una vez. El muestreo en que cada miembro de la poblacin sera elegido ms de una vez, se denomina MUESTREO CON REEMPLAZAMIENTO, mientras que si cada miembro no puede ser elegido ms de una vez, se denomina MUESTREO SIN REEMPLAZAMIENTO.

    Las poblaciones son finitas o infinitas. Si, por ejemplo, se extraen 10 bolas sucesivamente sin reemplazamiento de una urna con 100 bolas, se hace un muestreo de una poblacin finita; mientras que si

  • Modelos Inferenciales - 2014

    26

    se lanza una moneda 50 veces y se cuenta el nmero de caras, el muestreo es de una poblacin infinita. Una poblacin finita en la que se realiza un muestreo con reemplazamiento, puede considerarse tericamente infinita, ya que es posible extraer cualquier nmero de muestras sin agotar la poblacin. Para muchos propsitos prcticos, efectuar el muestreo de una poblacin finita muy grande, llega a tomarse como muestreo de una poblacin infinita.

    Guillermo Pastor. Estadstica Bsica. Editorial Trillas, Conalep. 1 Edicin 12 reimpresin enero 2003.

    DISEOS DE MUESTRAS: Las clases de muestras que hasta ahora hemos estudiado, son las muestras aleatorias simples y nmeros aleatorios y no hemos considerado la posibilidad, de que en ciertas condiciones, puede haber muestras que son ms fciles de obtener, ms econmicas o ms informativas que las muestras aleatorias y no hemos entrado en detalles sobre la pregunta de lo qu, podra hacerse, cuando el muestreo aleatorio es imposible.

    Hay muchas otras maneras de seleccionar una muestra de la poblacin y hay gran cantidad de bibliografa sobre el tema de los procedimientos del diseo del muestreo.

    A continuacin estudiaremos brevemente, algunos diseos de muestras que no son ms que un plan determinado, antes de recopilar cualquier dato, para tomar una muestra de una poblacin.

  • Modelos Inferenciales - 2014

    27

    2.1.2. MUESTREO SISTEMTICO:

    En algunos casos, la manera ms prctica de efectuar un muestreo, consiste en seleccionar, digamos, cada vigsimo nombre de una lista, cada decimosegunda casa de un lado de una calle y as sucesivamente. Esto se conoce como muestreo sistemtico. En este caso, se divide la poblacin en subconjuntos de tamao igual, segn la frmula que a continuacin analizaremos, despus se toma al azar, la unidad en la que se debe comenzar, que ocupa el lugar K y el resto de los elementos de la muestra, ocupan los siguientes lugares.

    Hagamos un ejemplo para comprender mejor este muestreo

    Ejemplo: En una colonia de la ciudad de Jalisco, de 8060 habitantes segn el censo, se va a hacer una encuesta, y se selecciona una muestra sistemtica de 20 personas, entre 1200 padres de familia, para conocer el grado de aceptacin de la gestin administrativa de la ciudad, por parte del alcalde municipal.

    Primero calculamos el factor de elevacin = N/n =1200/20 = 60 a continuacin seleccionamos un elemento, AL AZAR, entre el 1 y el 60, supongamos que el seleccionado es el 27(este ser K), entonces, el primer nmero ser 27; el segundo nmero ser 27+60= 87; el tercer nmero seleccionado ser 27+ 2(60) = 147; el cuarto nmero 27+ 3(60)= 207 y as sucesivamente sern el 267, 327, 387, 447, 507, 567, 627, 687, 747, 807, 867, 927, 987, 1047, 1107, 1167. Se han seleccionado a 20 personas, a las que les corresponden los nmeros citados.

    Cuando el resultado de N/n no es entero, se redondea al entero menor, esto puede producir una pequea dificultad que no afecta y debe despreciarse cuando n > 50.

    El muestreo sistemtico es semejante al aleatorio simple, si se selecciona el elemento inicial en forma aleatoria. Sus ventajas son: de fcil aplicacin y se extiende la muestra a toda la poblacin. Sus desventajas son que se presentan dificultades al tratar de calcular la varianza, y aumento de la varianza si existe periodicidad en la numeracin de los elementos; adems, de posible presencia de periodicidades ocultas.

    2.1.3. MUESTREO ESTRATIFICADO:

    En este muestreo, la poblacin se divide en estratos homogneos internamente y lo ms heterogneos externamente entre s.

    Si tenemos informacin acerca de la constitucin de una poblacin (es decir, su composicin) y sta es importante para nuestra investigacin, podemos mejorar el muestreo aleatorio por medio de la ESTRATIFICACIN. Este es un procedimiento, que consiste en estratificar (o dividir) en un nmero de subpoblaciones o estratos que no se traslapen y luego tomar una muestra de cada estrato. Si los artculos, personas o cosas seleccionados de cada estrato constituyen muestras aleatorias simples, el procedimiento completo (primero la estratificacin y luego el muestreo aleatorio) se conoce como muestreo aleatorio simple estratificado.

    Ejemplo, para analizar mejor este tipo de muestreo.

    En una colonia con una poblacin aproximada de 17000 habitantes se sabe, segn el censo reciente, que 7800 son jvenes, 2950 de la tercera edad y 6250 son nios.

    Calcular el tamao de la muestra de cada estrato, si se desea saber las preferencias de 300 personas, en sus programas de televisin.

  • Modelos Inferenciales - 2014

    28

    Para las personas jvenes su clculo ser: 300 (7800/17000) = 300 (0.4588) = 138

    Para la tercera edad: 300 (2950/17000) = 300 (0.1735) = 52

    Para los nios: 300 (6250/17000) = 300 (0.3674) = 110

    Suma total = 300

    Se contina con el muestreo aleatorio, para seleccionar las personas de cada estrato que van a hacer motivo de la investigacin.

    La ventaja del muestreo estratificado, es que permite obtener informacin, sobre las caractersticas motivo de estudio y aumenta la precisin de las estimaciones sobre toda de la poblacin; y en general, da mejores resultados que el muestreo aleatorio, mientras ms diferentes sean los estratos entre s y sean ms homogneos internamente. Sus desventajas son: dificultad para decidir a qu estrato se asigna cada uno de los elementos de la poblacin y cmo elegir el tamao de la muestra de cada estrato, para que el total sea n.

    2.1.4. MUESTREO POR CONGLOMERADOS:

    Esta tcnica tiene utilidad, cuando el universo que se requiere estudiar admite ser subdividido en universos menores, de caractersticas similares a las del universo total. La poblacin se divide en reas, que se llaman conglomerados; cada uno de stos, ser lo ms heterogneo posible internamente, y lo ms homogneo entre

    s; a continuacin se selecciona, al azar, uno o algunos conglomerados, que forman la muestra.

    Ejemplo: Para ilustrar esta clase de muestreo, supongamos que una gran empresa quiere estudiar los

    diferentes gastos familiares, en el rea de Cartagena, Bolvar. Al intentar elaborar los programas de gastos de 1200 familias, la empresa encuentra que el muestreo aleatorio simple es prcticamente imposible.

    Dado que no se cuenta con las listas adecuadas, y el costo de ponerse en contacto con las familias dispersas en esta gran ciudad, es muy alto. Una manera en que se puede tomar una muestra de esta situacin, es dividiendo el rea total de Cartagena, en varias reas ms pequeas que no se traslapen, digamos, manzanas, regiones, sectores etc., de la ciudad; entonces se seleccionan algunas casas al azar, y todas las familias que residen en estas manzanas, constituyen la muestra definitiva.

    Este mtodo, se utiliza cuando resulta muy costoso elaborar una lista completa, de todos los elementos de la poblacin. El inconveniente se presenta, cuando los conglomerados no son homogneos entre s, ya que la muestra final, puede no ser representativa de la poblacin. Sin embargo, tiene la ventaja de simplificar, el levantamiento de la poblacin

    Tanto en el muestreo estratificado como en el de conglomerados, la poblacin se divide en grupos bien

    definidos. Usamos el muestreo estratificado, cuando cada grupo tiene una pequea variacin dentro de s mismo, pero hay una amplia variacin dentro de los grupos. Usamos el muestreo por conglomerados en el caso opuesto: cuando hay una variacin considerable dentro de cada grupo, pero los grupos son esencialmente similares entre s. 2.2 ERRORES AL MUESTREAR.

    Recordemos que la muestra descansa, en el principio de que las partes representan al todo y, por tal, refleja las caractersticas que definen a la poblacin de la cual fue extrada, lo cual nos indica, que es representativa. Es decir, que para hacer una generalizacin exacta de una poblacin, es necesario tomar una muestra representativa. Por lo tanto, la validez de la generalizacin, depende de la validez y tamao de la muestra. Cuando trabajamos con muestras, generalmente se presentan dos tipos de errores:

    Error sistemtico. Llamado de distorsin o sesgo de la muestra, se presentan por causas ajenas a la

    muestra:

    Situaciones inadecuadas: se presentan, por ejemplo, cuando el encuestador tiene dificultades para obtener la informacin y la sustituye por la que ms fcilmente est a su alcance, que no siempre es la ms confiable.

  • Modelos Inferenciales - 2014

    29

    Insuficiencia en la recoleccin de datos: hay distorsin por falta de respuestas, o respuestas inadecuadas, ya sea por ignorancia o falta de datos relativos a los elementos incluidos. Distorsiones del encuestador causadas por prejuicios, inters personal o por fallas en la aplicacin de instrumentos.

    Errores de cobertura a causa de que no se han incluido elementos importantes y significativos para la

    investigacin que se realiza.

    Error de muestreo o muestral. Cualquiera que sea el procedimiento utilizado y la perfeccin del

    mtodo empleado, la muestra diferir de la poblacin. A esta diferencia se la denomina error de muestreo. Cuando una muestra es aleatoria o probabilstica, es posible calcular sobre ella, el error muestral. Este

    error, indica el porcentaje de incertidumbre, es decir, el riesgo que se corre que la muestra elegida no sea representativa. Si trabajamos con un error calculado en 5%, ello significa que existe un 95% de probabilidades de que el conjunto muestral, represente adecuadamente, al universo del cual ha sido extrado.

    A medida que incrementamos el tamao de la muestra, el error muestral tiende a reducirse, pues la muestra va acercndose ms al tamao del universo. Del mismo modo, para una muestra determinada, su error ser menor cuanto ms pequeo sea el universo a partir del cual se la ha seleccionado.

    Ejemplo: As, para un universo de 10,000 casos, una muestra de 200 unidades tendr un error mayor que una de 300; esto es; N =10,000 y n =200 por lo tanto su fraccin de muestreo n/N = 200 /10,000 = 0.02 y N=10,000 y n =300 por lo que su fraccin de muestreo n/N = 300/10,000 = 0.03, por lo tanto la

    fraccin de muestreo ms chica (0.02), ser la que tenga mayor error muestral. De manera similar, si vara el tamao del universo con igual tamao de muestra, se confirma tambin la anterior afirmacin; por ejemplo para una muestra de n=200 casos, se tendr un error mayor, si el universo tiene 10,000 unidades, que si el universo posee solamente 2,000 unidades.

    Hagamos los clculos, n =200 y N =10,000; la fraccin de muestreo es n/N = 0.02; en la otra poblacin N = 2,000 y n = 200, n/N = 0.1 se confirma que la primera fraccin de muestreo que es la ms chica, tendr un error de muestreo mayor, ya que disminuy el universo de la poblacin, con una misma muestra. Para fijar el tamao de la muestra adecuado a cada investigacin, es preciso primero determinar el porcentaje de error que estamos dispuestos a admitir.

    Una vez hecho esto, debern realizarse las operaciones estadsticas correspondientes, para poder calcular el tamao de la muestra, que nos permite situarnos dentro del margen de error aceptado. Dichos clculos se estudiarn en otro apartado; sin embargo, si el tamao de la muestra queda determinado previamente por consideraciones prcticas; no hay otra alternativa que aceptar el nivel de error, que su magnitud acarree.

  • Modelos Inferenciales - 2014

    30

    A continuacin resuelve las siguientes actividades de aprendizaje para que reafirmes lo aprendido hasta el momento ACTIVIDADES DE APRENDIZAJE:

    Contesta las siguientes preguntas?

    1. Escribe el nombre y smbolo de los dos principales parmetros de la poblacin, as como sus dos estadsticos de la muestra.

    2. Cuntas muestras distintas de tamao n = 4, podemos escoger de una poblacin finita de tamao N = 30?

    Respuesta: _________

    3. Cuntas muestras distintas de tamao n =3, podemos tomar de una poblacin finita de tamao N = 110?, Respuesta: _________

    4. Cules son los tipos de errores que se pueden cometer cuando se trabaja con muestras? ___________________________ y ______________________ explcalos brevemente con tus palabras.

    5. Asigna a cada uno de los integrantes de tu grupo un nmero y utiliza la Tabla N1 de nmeros aleatorios, a partir del elemento 21 de la sexta columna hacia la derecha determina una muestra aleatoria de seis estudiantes. Realiza tus

    clculos.

    6. De los nmeros asignados en el ejercicio anterior, ahora a partir del 14 elemento de la primera columna hacia abajo

    determina una muestra aleatoria de cuatro estudiantes.

    7. Escribe que entiendes por MUESTREO ALEATORIO SIMPLE: __________________________________

    8. Elabora un mapa conceptual o esquema, con los principales conceptos hasta aqu estudiados.

    9. De la lista de tus compaeros del grupo, anota en un pedazo de papel el nmero que corresponde a cada uno de ellos. Mezcla bien todos los papelitos en una caja o urna y extrae sin reemplazamiento 6 estudiantes para un muestra aleatoria simple. Anota aqu tu resultado.

    __________________ _________________ _________________ __________________ _________________ _________________

    10. De la misma manera que el ejercicio anterior, Extrae una muestra aleatoria simple de 5 estudiantes con reemplazamiento. Anota aqu tus resultados. __________________ _________________ _________________ __________________ _________________ 11. En la colonia 2 de agosto de Turbaco, de 1980 habitantes, se pretende realizar una encuesta y seleccionar a 16 personas entre 180 seoras, para conocer el grado de aceptacin de un nuevo producto de limpieza. De acuerdo al tipo de muestreo sistemtico, calcula, cules sern las 16 personas seleccionadas para ser entrevistadas? Realiza tus clculos.

    12. A medida que se incrementa el tamao de la muestra, Se incrementa el error muestral? SI___ NO____ Porque? _______________________________________________________

    13. Observa detenidamente los siguientes datos y contesta Cul tendr mayor error muestral? Poblacin 1 Universo (N = 350) y Muestra (n = 150) Poblacin 2 Universo (N = 350) y Muestra (n = 250)

    Qu poblacin tiene mayor error muestral? __________

    14. Poblacin 1 N = 70 y n = 15 Poblacin 2 N = 800 y n = 150 Qu poblacin tiene mayor error muestral? ____________

  • Modelos Inferenciales - 2014

    31

    2.3. DISTRIBUCIONES MUESTRALES. El concepto de distribucin muestral, es el concepto ms bsico de la inferencia estadstica y se puede definir como una distribucin de probabilidad, que consta de todos los valores posibles de un estadstico de la muestra de tamao n (con o sin remplazo). En cada muestra, se suele calcular un estadstico, como la media o la desviacin estndar, que vara de una muestra a otra. De esta forma se obtiene una distribucin del estadstico denominada distribucin muestral.

    Si por ejemplo, el estadstico utilizado es la MEDIA MUESTRAL, entonces la distribucin se llama distribucin del muestreo de medias o distribucin muestral de la media. De forma similar, se puede obtener distribuciones mustrales de las desviaciones estndar, las varianzas, las medianas, etctera. 2.3.1. DISTRIBUCIN MUESTRAL DE MEDIAS:

    Con el propsito de familiarizarnos con la forma de estudiar estos problemas, analizaremos un caso muy simple. Ejemplo: Supongamos que tenemos una poblacin de N = 5 nios y que la nuestras son de tamao n = 2. (Es claro que para un problema de este tamao simplemente tomamos las alturas de los cinco nios, las sumamos, dividimos entre 5 y se acab)

    El objetivo de ste anlisis, es entender algunos aspectos importantes de la distribucin muestral de medias a travs de este ejemplo.

    Nio 1 2 3 4 5

    Altura 1.20 1.18 1.32 1.23 1.28

    La media poblacional de las alturas es:

    y su desviacin estndar poblacional es:

    Ahora Cuntas muestras posibles hay en una poblacin ( N ) de 5 nios y queremos muestras ( n ) de tamao 2, sin reemplazo? O dicho de otra manera, Cules son todas las muestras de tamao igual a 2, que

    pueden obtenerse sin reemplazo de la poblacin de 5 nios?

    Como es sin reemplazo, hay un total de 5C2 = (5) x (4)/ 2! = 10 muestras posibles.

    Que son los NIOS: {1,2}, {1,3}, {1,4}, {1,5}, {2,3}, {2,4}, {2,5}, {3,4}, {3,5}, {4,5}.

    Estas 10 muestras posibles, se pueden observar en la siguiente tabla

  • Modelos Inferenciales - 2014

    32

    Para cada una de estas muestras, tenemos una media . Por ejemplo, para la muestra {1,2}, su media es = (1.20 + 1.18) / 2 = 1.19 y para la muestra {3,5} su media es = (1.32 + 1.28)/2 =1.30, etc. Segn se muestra en la siguiente tabla de medias.

    Ahora calculemos dos aspectos importantes de esta variable aleatoria, como son la MEDIA Y LA DESVIACION ESTANDAR de la distribucin muestral de medias.

    La media que denotamos por la llamamos MEDIA DE LA DISTRIBUCION MUESTRAL que es la media de las medias de cada muestra.

    Su frmula es: Resultado es igual a la media poblacional obtenida.

    Esto es, LA MEDIA DE LA POBLACION, ES IGUAL A LA MEDIA DE LA DISTRIBUCION MUESTRAL DE

    MEDIAS (1.24)

  • Modelos Inferenciales - 2014

    33

    Ahora, la desviacin estndar, que denotamos y llamaremos ERROR ESTANDAR DE LA MEDIA, que es la desviacin estndar de la distribucin muestral de medias; Calculemos, siguiendo los datos de la tabla y posteriormente analizaremos otra manera ms fcil.

    ERROR ESTNDAR DE LA MEDIA

    Muestra Media

    Medias al Cuadrado

    2

    (1,2) 1.19 1.4161

    (1,3) 1.26 1.58761

    (1,4) 1.215 1.476225

    (1,5) 1.24 1.5376

    (2,3) 1.25 1.5625

    (2,4) 1.205 1.452025

    (2,5) 1.23 1.5129

    (3,4) 1.275 1.625625

    (3,5) 1.30 1.69

    (4,5) 1.255 1.575025

    Total 12.45 15.4356

    Con los datos anteriores, podemos utilizar una formula y obtener el error estndar de la media que es:

    Hasta aqu, hagamos un espacio de reflexin: Hay dos resultados muy importantes, que describen la distribucin de la variable aleatoria de la distribucin muestral de medias. El primero de ellos nos dice, que la media de la distribucin muestral de medias, siempre coincide con la media de la poblacin y que el error estndar de la media, es siempre menor que la desviacin estndar de la poblacin, o igual a ella, si la dividimos entre la raz cuadrada del tamao de la muestra. Ms precisamente:

    Si tomamos muestras de tamao n de una poblacin de tamao N con media y desviacin estndar , y se simbolizan la media y la desviacin estndar de la distribucin muestral de medias por y respectivamente, entonces:

    Para el ejemplo que venimos desarrollando, utilizaremos la ltima frmula para estimar la desviacin estndar de las medias muestrales o el error estndar de la media.

    Coincide con el valor que obtuvimos antes para la desviacin estndar de la distribucin muestral de medias.

  • Modelos Inferenciales - 2014

    34

    Pero es preciso indicar que el factor

    de la segunda formula, se conoce como factor de correccin de

    la poblacin finita (cpf), ya que sin este, las dos frmulas (para poblaciones infinitas y finitas) son las mismas.

    Una regla de uso muy frecuente, establece que el factor de correccin de poblacin finita (cpf), se puede pasar por alto cuando n/N es menor o igual a 0.05, esto es, cuando la muestra contiene el 5% o menos de la poblacin. Por lo tanto, si la poblacin es infinita; o el muestreo se hace de una poblacin infinita con reemplazamiento; o cuando N > 20n la frmula para encontrar el error estndar se reduce a

    Para encontrar el error estndar de la media cuando la poblacin es finita y el muestreo se hace sin reemplazo; o cuando N< 20n es:

    ACTIVIDADES DE APRENDIZAJE: Contesta adecuadamente las siguientes preguntas y completa los espacios correctamente: El tamao de la muestra se denota cmo?________________________________ El tamao de la poblacin se denota cmo?_______________________________ La media poblacional se denota cmo?___________________________________ La desviacin estndar poblacional se escribe cmo?________________________ La media de la distribucin muestral de medias se denota?____________________ El error estndar de la media se denota cmo? _____________________________ En una distribucin muestral de medias: La frmula de la media de la distribucin muestral de medias es: ___________________________________ y su resultado es: _______________________ a la media poblacional. (Igual o diferente)

  • Modelos Inferenciales - 2014

    35

    En cambio el error estndar de la media es:____________________, que la desviacin estndar poblacional (Igual o diferente) Son dos frmulas para calcular el error estndar de la media (1) Para poblaciones ______________o muestreo ________________ su frmula es _________________ (Finitas o infinitas) (Con o sin reemplazo)

    (2) Para poblaciones _______________o muestreo _______________ su frmula es __________________ (Finitas o infinitas) (Con o sin reemplazo)

    Cuando N > 20n se utiliza la frmula _________________ para poblaciones______________

    Cuando N < 20n se utiliza la frmula _________________ para poblaciones______________ Realiza un esquema, mapa conceptual, o formulario con los anteriores conceptos y frmulas, para que las tengas a la mano y las utilices posteriormente. 2.4. ERROR ESTNDAR O TPICO:

    Como se seal en el ejemplo anterior, en lugar de decir "la desviacin estndar de la distribucin de las medias de la muestra" nos referimos al error estndar de la media. De manera similar, la "desviacin estndar de la distribucin de las proporciones de la muestra" se abrevia como error estndar de la proporcin. El trmino error estndar se utiliza porque da a entender que la variabilidad en los estadsticos de la muestras, provienen de un error de muestreo debido al azar; es decir, hay diferencias entre cada muestra y la poblacin, y adems entre las diversas muestras debido nicamente a los elementos que decidimos escoger para las muestras. Por lo tanto, mide el grado en el que se puede esperar que flucten o varen los estadsticos de una muestra como consecuencia del azar, pero no solo mide el error de azar que se ha cometido, sino tambin la probable precisin que obtendremos si utilizamos una estadstica de muestra para estimar un parmetro de poblacin.

    Si el error estndar es bajo, hay buenas posibilidades de que el estadstico de una muestra se aproxime al de la poblacin; en cambio.

    Si el error estndar es alto es ms probable que obtengamos una muestra que difiera

    considerablemente de la poblacin.. Ejemplo: Supngase que la estatura de 3000 estudiantes universitarios hombres, se distribuye normalmente, con una media de 68 pulg. y una desviacin estndar de 3 pulg. Si se obtienen 80 muestras de 25 estudiantes cada una.

    Cules seran las medias y las desviaciones estndar (error estndar) esperadas de la distribucin muestral de medias, si los muestreos se hubieran hecho:

    a) Con reemplazamiento y

    b) sin reemplazamiento? El nmero de muestras de tamao 25 ue podran obtenerse tericamente de un grupo de 3,000 estudiantes con reemplazamiento es de (3000)

    25 = 8.47x10

    86 y, sin reemplazamiento es de 3000C25=4.91x1061 que son

    mucho mayores que 80.

  • Modelos Inferenciales - 2014

    36

    Por tanto, no se obtiene una verdadera distribucin muestral de medias, sino slo una distribucin muestral terica. Por tanto

    a)- Con reemplazamiento x = = 68 pulg y

    b)- Sin reemplazamiento x = = 68 pulg y

    Este ltimo resulto, es solo ligeramente menor que 0.6 pulg. y puede, para propsitos prcticos, considerarse igual que el muestreo con reemplazamiento.

    Por lo tanto, se esperara que la distribucin muestral de media este distribuida aproximadamente de manera

    normal, con media de la distribucin muestral = 68.0 pulg, y el error estndar de la media = 0.6 pulg.

    2.5 TEOREMA DEL LMITE CENTRAL

    La relacin entre la forma de la distribucin de la poblacin y la forma de la distribucin de muestreo se denomina teorema del lmite central, que es tal vez, el teorema ms importante de toda la inferencia estadstica; su importancia radica en que nos permite usar los estadsticos de la muestra, para hacer inferencias con respecto a los parmetros de poblacin, sin saber nada sobre la forma de la distribucin de frecuencias de esa poblacin, ms que lo que podamos obtener de la muestra.

    El teorema del lmite central, nos permite el empleo de la distribucin normal en una amplia variedad de problemas; an, cuando la variable en estudio no tenga distribucin normal, o su distribucin sea desconocida.

    Si el nmero de elementos de la muestra es suficientemente grande, por aplicacin del Teorema del Lmite Central, la media aritmtica igualmente va a tener aproximadamente distribucin normal.

    TEOREMA DEL LMITE CENTRAL: Si n es grande, la distribucin muestral de las medias puede aproximarse a una distribucin normal, sin

    importar la forma de la distribucin de la poblacin.

    Aun cuando no especifica que tan grande debe ser el tamao de la muestra n, para poder aproximar la distribucin muestral por una distribucin normal, una buena regla es que basta que n sea mayor o igual a 30, o sea, n 30.

    Otro aspecto importante, es que para convertir cualquier variable aleatoria normal, en una variable aleatoria normal estndar, debemos sustraer la media de la variable que se est estandarizando y dividir el resultado

    entre el error estndar (la desviacin estndar de dicha variable), segn la siguiente frmula, donde z = son las unidades estndar.

    Anlogamente, tambin podemos utilizar la frmula

  • Modelos Inferenciales - 2014

    37

    Siguiendo el mismo ejercicio de los 3000 estudiantes universitarios que se distribuyen normalmente con una

    media =68.0 pulg y desviacin estndar pul y donde calculamos un error estndar de la media = 0.6 pulg. Ahora las preguntas sern

    En cuntas muestras de las 80 del anterior problema, esperaramos encontrar la media

    - a) entre 66.8 y 68.3 pulg y tambin - b) Menor que 66.4 pulg.?

    La media de una muestra en UNIDADES ESTANDAR est dada aqu por:

    a) Cuantas muestras hay entre 66.8 y 68.3 pulgadas? O P (66.8 Z < 68.3 )

    66.8 en unidades estndar = 68.8 68.0 = -2.0 0.6 68.3 en unidades estndar = 68.3 68.0 = - 0.5 0.6 La proporcin de muestras con media entre 66.8 y 68.3 pulg es igual al rea bajo la curva normal entre Z = -2.0 y Z = 0.5, esto es igual al (rea entre Z = - 2.0 y Z = 0) + mas (rea entre Z = 0 y Z = 0.5 ). Buscamos los valores en la tabla rea bajo la curva normal estndar y encontramos ue para 2 = 0.4772 y para 0.5 = 0.1915 Sumamos los dos valores = 0.6687 = 66.87 % y entonces

    finalmente, el nmero esperado de muestras es: ( 80 ) (0.6687) = 53.496 o 53 muestras.

    b) Cuantas muestras son menor que 66.4 pulg. o P (Z < 66.4 ) 66.4 en unidades estndar = 66.4 68.0 = - 2.67 0.6

    La proporcin de muestras con medias menores que 66.4 pulg. = (rea bajo la curva normal a la izquierda de Z = - 2.67 ) = ( rea a la derecha de Z = 0 ) menos ( rea entre Z = 2.67 y Z = 0 ) = 0.5 0.4962 = 0.0038 = 0.38% Por lo tanto, el numero esperado de muestras es (80)(0.0038)= 0.304 o cero muestras

    Con base en el teorema del lmite central. Cul es la probabilidad de que el error de una variable aleatoria sea menor que 5, cuando se usa la media de una muestra aleatoria de tamao n = 64 para estimar la media de una poblacin infinita con = 20?

    Aunque el valor de es desconocida, sabemos que la distribucin muestral de las medias es normal con la media poblacional . Por lo tanto, la probabilidad se obtiene por medio del rea de la zona bajo la curva de normal estndar, entre

  • Modelos Inferenciales - 2014

    38

    Dado que la entrada de la tabla corresponde a Z = - 2.00 es 0.4772 y Z = 2.00 es 0.4772 la probabilidad que se pide es 0.4772 + 0.4772 = 0.9544

    Entonces afirmamos, la probabilidad de que una media de una muestra aleatoria de tamao n=64 de la

    poblacin infinita con , difiera de la poblacin por menos de 5 es de 0.9544 o el 95.44 %

    SIGUE PRACTICANDO OTROS PROBLEMAS, Y TE RECOMENDAMOS QUE INGRESES A LA PAGINA

    INTERACTIVA DE INTERNET. http://descartes.cnice.mec.es/ del ministerio de educacin y ciencia de Espaa,

    modalidad de humanidades y ciencias sociales, en el tema, Distribucin Normal e inferencia estadstica.

    ACTIVIDADES DE APRENDIZAJE: Con el propsito que reafirmes lo aprendido, contesta utilizando tus palabras y criterio las siguientes

    preguntas

    1. Explica brevemente qu entiendes por distribucin muestral?

    Respuesta: ______________________________________________________________________________

    _______________________________________________________________________________________

    2. Qu estudiamos cuando analizamos una distribucin muestral de medias?

    Respuesta: ______________________________________________________________________________

    _______________________________________________________________________________________

  • Modelos Inferenciales - 2014

    39

    3. Cul es el nmero de muestras de tamao 5, que podran obtenerse de un grupo de 200 estudiantes, con

    reemplazo y sin reemplazo? Realiza tus clculos aqu. Por favor.

    Con reemplazo: _________

    Sin reemplazo: __________

    4. Cul es el nmero de muestras de tamao 4, que podran obtenerse de un grupo de 30 personas, con

    reemplazo y sin reemplazo?

    Con reemplazo: __________

    Sin reemplazo: __________

    5. Qu es lo que mide el error estndar en una distribucin muestral de medias?

    Respuesta: _____________________________________________________________________________

    _______________________________________________________________________________________

    6. Si el error estndar es bajo o alto que nos sugiere?

    Si es bajo indica: ______________ Si es alto indica: ___________________

    7. Que nos indica el teorema del lmite central?

    Respuesta:______________________________________________________________________________

    Resuelve adecuadamente los siguientes problemas.

    8. Una poblacin consiste de cinco nmeros 2, 3, 6, 8 y 11. Considere todas las muestras de tamao igual a 2

    que pueden obtenerse, con reemplazamiento y sin reemplazamiento, a partir de estas poblaciones. Calcule a)

    la media de la poblacin, b) la desviacin estndar de la poblacin, c) la media de la distribucin muestral de

    medias, y d) la desviacin estndar de la distribucin de medias, es decir, el error estndar de medias.

    9. Quinientos baleros de rodamiento tienen un peso medio de = 5.02 g y una desviacin estndar de = 0.30

    g., de una muestra aleatoria de n = 100 baleros de rodamiento elegida de este grupo. Calcula la probabilidad

    de que, el peso combinado est entre 496 y 500 g, si el peso medio de los 100 baleros, est entre 4.96 y 5.00 g

    y la probabilidad de que el peso combinado exceder 510 g, si el peso medio de los 100 baleros excede 5.10 g.

  • Modelos Inferenciales - 2014

    40

    UNIDAD 3: ESTIMACION ESTADISTICA

    Contenido temtico Teora de Estimacin Estadstica

    Propsito del contenido temtico Analizar los conceptos de la teora de la estimacin estadstica, para que el estudiante los utilice durante el desarrollo de trabajos estadsticos inferenciales.

    Conceptos fundamentales Intervalos de confianza

    Conceptos subsidiarios Intervalos de confianza de parmetros poblacionales: Intervalos de confianza para medias e Intervalos de confianza para proporciones.

    Nmeros de sesiones 1 (semana) con alto porcentaje de estudio independiente

    ACTIVIDADES DE APERTURA OBSERVACIN

    Te invitamos a que reflexiones un momento sobre el tema de las RELACIONES HUMANAS y la difcil tarea de tomar decisiones. Contesta honestamente Cules son las personas que ms respetas y por qu? Cules son las personas que menos toleras y por qu? Por qu son importantes las relaciones humanas en la toma decisiones?

    Es conveniente un tiempo aceptable para desarrollar

    esta importante introduccin.

    Integrarse en equipos de 3 estudiantes.

    ACTIVIDADES DE DESARROLLO

    1. Consultar la presente gua didctica, en los temas correspondientes a: Estimacin de parmetros.

    Estimacin sin sesgo.

    Estimacin puntual y estimacin por intervalos.

    Estimacin por intervalos de confianza de los parmetros poblacionales:

    para medias y de proporciones.

    Error probable o error mximo y Tamao de la muestra.

    2. Investigar de manera personal, otras fuentes de informacin a tu alcance para enriquecer tus conocimientos de los temas antes mencionados.

    3. Integrado en equipos de tres compaeros, comenten las estrategias para la solucin de las preguntas antes sealadas.

    4. Realicen esquemas, lminas, o presentaciones para su exposicin grupal en el aula.

    Consultar la presente gua didctica para

    argumentar su solucin y otras bibliografas.

    ACTIVIDADES DE CIERRE

    En reunin plenaria, expondrn ya sea con, lminas, o presentaciones PowerPoint; las vas de solucin que se hayan encontrado a dichos preguntas.

    En la plenaria, encontraras la solucin ms idnea entre todo el grupo. De manera respetuosa podrs solicitar a todo el grupo, te disipen algunas

    dudas que tengas respecto al tema y a la solucin del problema en general. El tutor propiciar la exposicin libre de las emociones y sentimientos generados durante el desarrollo del tema.

    El cierre se har en dos fases

    1ra. Sobre las relaciones

    humanas

    2da. Sobre el problema estadstico

    BIBLIOGRAFA, CIBERGRAFIA Y OTRAS FUENTES DE INFORMACIN

    Estadstica y Muestreo. Ciro Martnez Bencardino, Ecoe Ediciones, Novena Edicin. Eco Ediciones, Novena Edicin.

    Chao Lincoln. (1992). Introduccin a la estadstica. Editorial McGraw Hill Interamericana. Mxico.

    Texto Estadstica Aplicada a los Negocios y la Economa. Decimotercera Edicion. McGrawHill. Autores Lind, Douglas A., Marchal, William G., Wathen, Samuel A.

    http://recursostic.educacion.es/descartes/web/aplicaciones.php?bloque=4

    http://recursostic.educacion.es/descartes/web/materiales_didacticos/Muestreo_Inferencia_Estadistica/estimacion_puntual.html

    http://recursostic.educacion.es/descartes/web/materiales_didacticos/inferencia_estadistica/estimac.htm

  • Modelos Inferenciales - 2014

    41

    3. TEORIA DE ESTIMACIN ESTADSTICA

    Hay dos tipos de inferencia estadstica; la estimacin y la verificacin de hiptesis; en este tema (teora de la estimacin estadstica) vamos a estudiar los conceptos y tcnicas fundamentales de la estimacin de intervalos y en el apartado siguiente (teora de la decisin estadstica), analizaremos los principios indispensables para la verificacin o prueba de hiptesis. 3.1. ESTIMACIN DE PARMETROS En el tema anterior, se revis la manera en que la teora de muestreo puede emplearse para obtener informacin acerca de las muestras obtenidas aleatoriamente de una poblacin conocida. Tambin observamos, cmo la desviacin estndar de la poblacin y el tamao de la muestra, determinan la variabilidad de la distribucin muestral de la medias, ya que entre menor sea el error estndar de la media, mejor ser nuestra estimacin. Un problema que consideraremos en este tema, es el de la estimacin de parmetros

    poblacionales o simplemente parmetros, como la media y la desviacin estndar, a partir de los estadsticos muestrales correspondientes o tambin llamados estadsticos, como la media y la desviacin estndar muestrales. 3.2. ESTIMADOS SIN SESGO Y EFICIENTE Si la media de la distribucin muestral de un estadstico, es igual al parmetro poblacional correspondiente, el estadstico se denomina estimador sin sesgo (insesgado) del parmetro; de otra manera, es denominado

    estimador sesgado. La media de la distribucin muestral de las medias es = , la media poblacional.

    Por lo tanto la media muestral es un estimado sin sesgo de la media poblacional . Si las distribuciones muestrales de dos estadsticos tienen la misma media, entonces el estadstico con la MENOR varianza o desviacin estndar, se denomina estimador eficiente de la media, mientras que el otro estadstico, se llama estimador ineficiente. Si se consideran todos los estadsticos posibles, cuyas distribuciones muestrales tienen la misma media; aqul con la menor varianza o desviacin estndar, suele denominarse el mejor o ms eficiente estimador de dicha media. 3.3. ESTIMACIN PUNTUAL Y ESTIMACIN POR INTERVALO El estimado de un parmetro poblacional dado por un solo nmero, se denomina estimado puntual del parmetro. El estimado de un parmetro poblacional dado por dos nmeros, entre los cuales, se considera que, est el parmetro, se denomina estimado por intervalo del parmetro. Los estimados por intervalo, indican la precisin de un estimado y son, por lo tanto, preferibles al estimado puntual. Si se dice que una distancia es de 5.28 metros, se est dando un estimado puntual. Si por otro lado, la distancia es de 5.28 0.03 metros, es decir, la distancia est entre 5.25m y 5.31m, se est dando un estimado por intervalo. La informacin sobre el error (o precisin) de un estimado, se conoce como su confiabilidad. 3.4. ESTIMACIN POR INTERVALOS DE CONFIANZA DE LOS PARMETROS POBLACIONALES

    En este apartado nicamente vamos a analizar dos parmetros poblaciones, los intervalos de confianza para medias y los intervalos de confianza de proporciones

    Sean s y s la media y la desviacin estndar (error estndar), en ese orden, de la distribucin muestral de un estadstico. Entonces, si la distribucin muestral es en forma aproximada a la normal ( lo cual es verdadero para muchos estadsticos, si el tamao de la muestra es N =30), se puede esperar encontrar un estadstico muestral, real que caiga en los intervalos.

  • Modelos Inferenciales - 2014

    42

    Debido a lo anterior, se llaman intervalos de confianza a 68.26%, 95.44% y 99.74% de estimacin para s.

    Los nmeros extremos de estos intervalos, se denominan lmites de confianza. De forma similar, S 1.96 s y S 2.58 s son los lmites de confianza a 95% y 99%, o (0.95 y 0.99) de S. El porcentaje de confianza suele denominarse nivel de confianza. Las cifras 1.96, 2.58, etctera, en los lmites de confianza; se llaman coeficientes de confianza o valores crticos y se denotan por Zc. A partir de los niveles de confianza se pueden calcular los coeficientes de confianza y viceversa. En la tabla siguiente se muestran algunos de los valores crticos de Zc, correspondientes a diversos niveles de confianza. Los valores de Zc, para los niveles de confianza, no incluidos en la tabla, pueden obtenerse en la tabla reas bajo la curva normal estndar.

    Completar la tabla, ejemplo: 95%/2 = 47.5 / 100 = 0.475 en la tabla Zc = 1.96 Nivel de

    confianza 99.73% 99% 98% 96% 95.45% 95% 90% 80% 68.27% 50%

    Zc 2.575 1.96 1.645

    Nivel de

    confianza 99.73% 99% 98% 96% 95.45% 95% 90% 80% 68.27% 50%

    Zc 3.00 2.575 2.33 2.06 2.00 1.96 1.645 1.28 1.00 0.68

    Si queremos un intervalo de 90% de confianza, tenemos 1 = 0.90, y el valor correspondiente a un rea central de 0.90 en la distribucin normal estndar es de Z= 1.645 segn se indica en la tabla y la figura siguiente.

    Denotamos con la letra griega (alfa) a la probabilidad con la que estamos dispuestos a cometer error (=0.10); entonces, no cometer el error o confiabilidad ser: 1- (0.90), recordando que la probabilidad de un evento ms la probabilidad de su complemento, es igual a 1; dicho de otra manera, como se ha definido como la probabilidad de cometer el error y la probabilidad del evento complementario a este, es la probabi lidad de NO cometer error, esto es, la confiabilidad, entonces se tiene que la suma de estos eventos complementarios es 1.

  • Modelos Inferenciales - 2014

    43

    Resolvamos un problema para analizar y resumir lo dicho hasta el momento Intervalos de confianza para medias:

    En la zona metropolitana de la ciudad de Mxico, se tom una muestra de 30 lecturas del nivel de ozono durante cierto periodo invernal. En la tabla siguiente tenemos estas lecturas:

    178 190 228 211 187 165 172 244 229 208

    193 203 215 226 231 209 220 258 278 235

    246 227 211 195 202 212 219 216 204 193

    La media de esta muestra es =213.5 inmecas. Si sta es la nica informacin que tenemos, podemos emplear este valor como una estimacin de la media del nivel de ozono en la zona durante la poca invernal. Una estimacin as es llamada una estimacin puntual pues consiste de un nico nmero o punto de la recta

    real. Este tipo de estimacin puntual no brinda informacin sobre el tamao del error. Una alternativa que brinda ms informacin, consiste en estimar la media por medio de un intervalo o aquellos nmeros reales que se encuentran entre dos valores o lmites del intervalo. El teorema del lmite central nos permite entonces asociar a un intervalo alrededor de nuestro valor de = 213.5, una probabilidad o grado de certidumbre de que la media que estimamos se encuentre efectivamente entre estos lmites.

    Cuando no se tiene mayor informacin acerca de la desviacin estndar de la poblacin , y n es grande (n

    30) podemos sustituir por la desviacin estndar de la muestra S. En nuestro problema tenemos que la desviacin estndar, como se trata de una muestra, est dada por

    Si la poblacin es grande en relacin al tamao de la muestra (N>20n), el tamao de la muestra es mayor o igual que 30 y si el muestreo se lleva a cabo a partir de una poblacin infinita o de una poblacin finita con

    remplazamiento, el intervalo de confianza para de grado de confianza es:

    Si el muestreo se realiza sin remplazamiento de una poblacin finita.

    Donde el rea de la curva normal estndar entre 0 y Zc es /2, esto es, con un grado de confianza el error al estimar la media () por es menor a.

    Una estimacin por intervalo o un intervalo de confianza consta de 3 partes (primera ecuacin); que es el

    estimador, Zc es el factor de confiabilidad y

    que es el error tpico del estimador y en la segunda ecuacin

    incluye, el factor de correccin finita

  • Modelos Inferenciales - 2014

    44

    Los grados de confianza que ms emplearemos son 0.95 y 0.99 y sus correspondientes coeficientes de

    confianza o valores crticos Zc que son 1.96 y 2.575, respectivamente. A estos intervalos, tambin se les conoce, como los intervalos de confianza del 95% y 99%. Para encontrar los intervalos de confianza al 95% de confianza, en el caso del nivel de contaminacin de ozono tenemos:

    213.5 1.96. (4.54) = 213.5 8.90 = 204.60 y 213.5 + 1.96. (4.54) = 213.5 + 8.90 = 222.40 por lo que el intervalo de confianza del 95% es 204.60 < < 222.40 por lo tanto.

    Con una probabilidad de 0.95 la media poblacional se encuentra entre 204.60 y 222.4 o bien, que con un grado de confianza del 95% el error al estimar la media como 213.5 es menor a 8.9 Analicemos ms detenidamente esto ltimo. 3.5. ERROR PROBABLE O ERROR MAXIMO Y TAMAO DE LA MUESTRA

    ERROR PROBABLE O MXIMO: La expresin.

    Representa el error probable o mximo al estimar

    la media poblacional () con grado de confianza , y puede ser usada para determinar el tamao de la muestra, cuando se desea cierto grado de precisin; esto lo analizaremos un poco ms adelante.

    Por lo tanto, el Error mximo del nivel de contaminacin de ozono al 95% de confianza es:

    Si se aumenta el grado de confianza, aumentar el error mximo al estimar la media.

    Seguimos practicando con los intervalos de confianza

    Si deseamos aumentar el grado de certeza al 99% Cul ser el intervalo de confianza y su error probable?

    213.5 2.575.(4.54)= 213.5 11.69 = 201.81 y 213.5 + 2.575.(4.54)=213.5 + 11.69 = 225.19. El error probable o mximo al estimar la media con 99% de confianza, es de 11.69 Los intervalos de confianza a un 99% es de 201.81< < 225.19.

    Observamos, que entre mayor sea la certidumbre (grado de confianza), mayor es tambin el intervalo. Por lo tanto, podemos afirmar que con una probabilidad de