Trabajo Infer en CIA a Grupo 100403-9

download Trabajo Infer en CIA a Grupo 100403-9

of 16

Transcript of Trabajo Infer en CIA a Grupo 100403-9

  • 8/2/2019 Trabajo Infer en CIA a Grupo 100403-9

    1/16

    ACTIVIDAD 4 TRABAJO COLABORATIVO 1INFERENCIA ESTADISTICA

    WILSON O. RUIZNANCY AVECEDOEDUARDO LUNA

    GRUPO: 100403_9

    TUTOR:

    DANYS BRITO

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

    ESCUELA DE CIENCIAS BASICAS, TECNOLOGIA E INGENIERIA

  • 8/2/2019 Trabajo Infer en CIA a Grupo 100403-9

    2/16

    INTRODUCCION

    En este trabajo se inicia un proceso de interaccin entre los miembros del grupocolaborativo, para lo cual se hace necesario que cada uno de los miembros del grupo,haga una revisin general de la temtica a tratar la cual se encuentra en el modulo,revisando, unidades, temas, subtemas del mismo, as como objetivos y los demsaspectos generales.El objeto de este trabajo es interiorizar los aspectos de la temtica relacionados laprimera unidad del Modulo INFERENCIA ESTADISTCIA principios de muestreointervalos de confianza los cuales son:

    Elementos bsicos del muestreoClases de muestreo 12Muestreo Aleatorio SimpleMuestreo Aleatorio estratificadoMuestreo sistemticoMuestreo por ConglomeradoDistribucin MuestralTeorema Central del Lmite

  • 8/2/2019 Trabajo Infer en CIA a Grupo 100403-9

    3/16

    OBJETIVOS

    1. Efectuar un acercamiento hacia el contenido temtico de la unidad 1, y susobjetivos educativos.

    2. Realizar una introduccin sobre qu es el la inferencia estadstica y bajo cualesparmetros se deben llevar los desarrollos de muestreo e intervalos de confianzapara obtener mejores resultados.

    3. Despertar el inters en los estudiantes respecto a ciertas temticas y promover lainvestigacin referente a las mismas.

    4. Incentivar la revisin bibliogrfica en Internet y el intercambio de informacin entrelos integrantes del grupo.

    5. Identificar el objetivo general de la Unidad 1 principios de muestreo e intervalos deconfianza del modulo de inferencia estadstica y los objetivos de cada uno de lossubtemas abordados en la misma.

    6. Fomentar en el estudiante el espritu investigativo, despertar la creatividad en eldesarrollo de soluciones a problemas dentro de las alternativas que ofrece Internet.

    7. Aplicar las tcnicas de muestreo y de intervalos de confianza, realizando inferenciassobre los parmetros de la media y el total poblacional y determinar su validezestadstica comparndolos con los datos reales.

    8. Medir el nivel de progreso en las metas de aprendizajes de conceptos y susrelaciones en el mbito de la estimacin y el muestreo.

  • 8/2/2019 Trabajo Infer en CIA a Grupo 100403-9

    4/16

    DESARROLLO DE ACTIVIDADES

    1. Explique la diferencia entre cada par de trminos:

    Trminos Diferencias

    Muestreo por conglomerado y

    muestreo estratificadoAmbos se diferencian en que en losconglomerados los subconjuntos se danen la vida real o ya estn agrupados deesa manera; por ejemplo: Escuelas, tiposde Industrias, bloques de casas y otros. Enel estratificado el investigador decide lasagrupaciones que utilizar segn la posiblevariabilidad de los fenmenos a estudiar;otra diferencia es que en este el

    investigador conoce la distribucin de lavariable, todo lo contrario que en elmuestreo por conglomerado.

    Error muestral y error No

    muestral

    El error muestral tiene que ver con la variacin

    natural existente entre muestras tomadas de la

    misma poblacin, y el error no muestral tiene que

    ver con los errores que se cometen al tomar las

    muestras

    Muestreo simple y muestreo

    sistemtico

    El muestreo simple se toman al azar de la

    muestra si orden alguno, en cambio el sistematico

    se toman con una secuencia numrica por

    ejemplo de 10 en 10 (el 10, el 20, el 30.)Muestra aleatoria y muestra Noaleatoria

    En la muestra aleatoria todos los elementos de la

    poblacin tienen alguna oportunidad de ser

    escogidos en la muestra, en cambio en la muestra

    no aleatoria se basa exclusivamente en lo que es

    conveniente para el investigador

  • 8/2/2019 Trabajo Infer en CIA a Grupo 100403-9

    5/16

    2. La estimacin se puede hacer a su vez por dos procedimientos cules son? QuVentajas tienen cada uno?

    Estimacin puntual: Con base en los datos mustrales, se busca un nico valor estimadopara el parmetro. Es slo un nmero que se utiliza para estimar un parmetro de poblacin

    desconocido. Una estimacin puntual a menudo resulta insuficiente, debido a que slo tienedos opciones: es correcta o est equivocada. Por ejemplo, si se pretende estimar la tallamedia de un determinado grupo de individuos, puede extraerse una muestra y ofrecer comoestimacin puntual la talla media de los individuos. Lo ms importante de un estimador, esque sea un estimador eficiente. Es decir, que sea insesgado (ausencia de sesgos) y estableen el muestreo (varianza mnima). Si a partir de las observaciones de una muestra secalcula un solo valor como estimacin de un parmetro de la poblacin desconocido, elprocedimiento se denomina estimacin puntual.

    Estimacin por intervalo de confianza: Se determina un intervalo dentro del cual seencuentra el valor del parmetro, con una probabilidad determinada. Es un intervalo de

    valores que se utiliza para estimar un parmetro de poblacin. Esta estimacin indica el errorde dos maneras: por la extensin del intervalo y por la probabilidad de obtener el verdaderoparmetro de la poblacin que se encuentra dentro del intervalo.

    3. A qu se refiere el margen de error en un intervalo de confianza.

    El margen de error es derivado de la idea de intervalo de confianza (IC), conceptofundamental en ciencia estadstica. Por lo tanto, un IC es un intervalo de valores que, en unainvestigacin estadstica, se estima que tiene una determinada probabilidad (95% por logeneral) de contener el verdadero valor de una cualidad de un universo.El margen de error sirve para medir la precisin de nuestro reporte estadstico de resultados.

    El margen de error es una medida de la precisin del reporte y proyeccin estadsticosasociados a una investigacin. En ciertos casos se predefinir un margen de error (porejemplo, 4%), mientras que en otros se predefinir un tamao de muestra, tras lo cual seproceder a calcular el margen de error asociado (cuando, por ejemplo, tras elegir un totalde 400 individuos hallamos que el margen de error de esta investigacin es 4.90%). Enmuchos casos se opta por lo primero.As, resulta que no calculamos el margen de error, sino que debemos ms bien calcular eltamao de la muestra para nuestra investigacin

    4. Explique cules son los criterios que debe cumplir un muestra seleccionada depoblacin para considerarla representativa de dicha poblacin.

    Segn la definicin una muestra se cataloga como representativa cuando se est indicandoque la muestra debe imitar perfectamente o ser imagen de la poblacin. Sabemos que no es el parecido con la poblacin lo que valida una muestra, sino su mtodode seleccin. Se tiene los criterios a seguir:

    Muestreo por cuotas: Tambin denominado en ocasiones "accidental". Se asientageneralmente sobre la base de un buen conocimiento de los estratos de la poblacin y/o delos individuos ms "representativos" o "adecuados" para los fines de la investigacin.

  • 8/2/2019 Trabajo Infer en CIA a Grupo 100403-9

    6/16

    Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene elcarcter de aleatoriedad de aqul.

    En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de individuosque renen unas determinadas condiciones. Este mtodo se utiliza mucho en las encuestas

    de opinin.

    Muestreo opintico o intencional: Este tipo de muestreo se caracteriza por un esfuerzodeliberado de obtener muestras "representativas" mediante la inclusin en la muestra degrupos supuestamente tpicos. Es muy frecuente su utilizacin en sondeos preelectorales dezonas que en anteriores votaciones han marcado tendencias de voto.

    Muestreo casual o incidental: Se trata de un proceso en el que el investigador seleccionadirecta e intencionadamente los individuos de la poblacin. El caso ms frecuente de esteprocedimiento el utilizar como muestra los individuos a los que se tiene fcil acceso (losprofesores de universidad emplean con mucha frecuencia a sus propios alumnos). Un caso

    particular es el de los voluntarios.

    Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos aotros, y as hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentementecuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinadostipos de enfermos, etc.

    5. Explique el tipo de relacin directa o inversamente proporcional de cada uno de losfactores involucrados en el clculo del tamao de la muestra de una poblacin finita,para estimar la media de la poblacin.

    El tamao adecuado de la muestra para una encuesta relativa a la poblacin estdeterminado en gran medida por tres factores:

    Prevalencia estimada de la variable considerada Nivel deseado de fiabilidad Margen de error aceptable.

    Si el nmero de sujetos es insuficiente habra que modificar los criterios de seleccin,solicitar la colaboracin de otros centros o ampliar el periodo de reclutamiento.Los estudios con tamaos mustrales insuficientes, no son capaces de detectar diferenciasentre grupos, llegando a la conclusin errnea de que no existe tal diferencia.

    Si el nmero de sujetos es excesivo, el estudio se encarece desde el punto de vistaeconmico y humano. Adems es poco tico al someter a ms individuos a una intervencinque puede ser menos eficaz o incluso perjudicial.

    Clculo

    Existen dos estrategias para calcular la mediana: Considerando los datos tal cual, sinagruparlos, o bien cuando los tenemos agrupados en intervalos de clase. Veamos cada unade ellas.

  • 8/2/2019 Trabajo Infer en CIA a Grupo 100403-9

    7/16

    Datos sin agrupar

    Considerando x_1,x_2,x_3,\ldots,x_n los datos de una muestra ordenada en orden crecientey designando la mediana como Me, distinguimos dos casos:

    a) Si n es impar, la mediana es el valor que ocupa la posicin {\frac {n+1} {2}} una vez quelos datos han sido ordenados (en orden creciente o decreciente), porque ste es el valorcentral. Es decir: M_e=x_{\frac {n+1} {2}}.

    Por ejemplo, si tenemos 5 datos, que ordenados son: x1 = 3, x2 = 6, x3 = 7, x4 = 8, x5 = 9=> El valor central es el tercero: x_ {\frac {5+1} {2}} = x_3 = 7. Este valor deja dos datos pordebajo (x1, x2) y otros dos por encima de l (x4, x5).

    b) Si n es par, la mediana es la media aritmtica de las dos observaciones centrales.Cuando n es par, los dos datos que estn en el centro de la muestra ocupan las posiciones{\frac {n} {2}} y {\frac {n} {2}}+1. Es decir: M_e = \frac {x_ {\frac {n} {2}} + x_{\frac {n}

    {2}+1}}{2}.

    Por ejemplo, si tenemos 6 datos, que ordenados son: x1 = 3, x2 = 6, x3 = 7, x4 = 8, x5 = 9,x6 = 10 => Hay dos valores que estn por debajo del x_{\frac {6} {2}} = x_3 = 7 y otros dosque quedan por encima del siguiente dato x_{{\frac {6} {2}}+1} = x_4 = 8. Por tanto, cabeconsiderar la mediana como la media aritmtica de estos dos datos: Me = \frac {x_3 +x_4}{2} = \frac {7 + 8} {2}=7,5.

    Datos agrupados

    Al tratar con datos agrupados, si n/2 coincide con el valor de una frecuencia acumulada, el

    valor de la mediana coincidir con la abscisa correspondiente. Si no coincide con el valor deninguna abscisa, se calcula a travs de semejanza de tringulos en el histograma o polgonode frecuencias acumuladas, utilizando la siguiente equivalencia:

    Dnde Ni y Ni-1 son las frecuencias absolutas tales que Ni-1< n/2

  • 8/2/2019 Trabajo Infer en CIA a Grupo 100403-9

    8/16

    Desventajas:

    Se debe de usar tcnicas que permitan garantizar que se cumplan las propiedades dehomogeneidad, independencia y representatividad. La tcnica de muestreo utilizada depende de los objetivos del estudio, de las

    caractersticas de la poblacin y de las disponibilidades de materiales. Cada dato cuesta dinero

    7. El margen de error de una estimacin es controlado por tres factores: Nivel deconfianza, tamao de la muestra y desviacin estndar. Explique los criterios quetiene un investigador para su determinacin en una investigacin estadstica.

    Con respecto al estudio de una investigacin estadstica se debe contemplar los esquemasque pueden tener sus variaciones de acuerdo a la opcin de cada investigador. No obstante,la comunidad cientfica ha convenido que toda propuesta, debe contener como mnimo: El

    planteamiento del problema, justificacin de la investigacin, los objetivos generales yespecficos, el captulo de metodologa, el plan de anlisis, el cronograma y presupuesto.Lo ms importante de tener en cuenta de un investigador es el tener en cuenta losconceptos bsicos que se van a tratar como el error de estimacin: que es una medida de suprecisin que se corresponde con la amplitud del intervalo de confianza. Cuanta msprecisin se desee en la estimacin de un parmetro, ms estrecho deber ser el intervalode confianza y, si se quiere mantener o disminuir el error, ms ocurrencias debern incluirseen la muestra estudiada. En caso de no incluir nuevas observaciones para la muestra, mserror se comete al aumentar la precisin. Se suele llamar E, segn la frmula E = ?2 - ?1.Con respecto al nivel de confianza que es la probabilidad de que el verdadero valor delparmetro estimado en la poblacin se site en el intervalo de confianza obtenido. El nivel

    de confianza se denota por (1-?), aunque habitualmente suele expresarse con un porcentaje((1-?)100%). Es habitual tomar como nivel de confianza un 95% o un 99%, que secorresponden con valores ? de 0,05 y 0,01, respectivamente. Se debe seleccionar unaprueba estadstica que se pueda dar veracidad con lo que se requiere en una investigacinestadstica por lo cual las pruebas estadsticas se dividen en dos grandes grupos:paramtricas y no paramtricas. Las primeras son aquellas cuyo modelo especifica ciertascondiciones o premisas que debe tener la poblacin, de la cual se ha derivado la muestrabajo anlisis; adems se requiere expresar las observaciones en escala de intervalo o tasa.Por otra parte, las pruebas no paramtricas, como su nombre lo indica, no requierensatisfacer esas condiciones o premisas.Las pruebas paramtricas son las ms eficaces y de uso comn en la investigacin, como

    las de comparacin de promedios o prueba t de Student y la de anlisis de varianza deFischer. Ambos procedimientos deben cumplir las premisas siguientes:

    a. Las observaciones deben ser independientes. Al seleccionar un caso, para incluirlo en

    la muestra, no se deben prejuiciar las probabilidades de seleccin de ningn otro caso

    de la poblacin, asimismo, la puntuacin que se d a una observacin no debe

    prejuiciar a ninguna otra.

    b. Las poblaciones deben provenir de universos cuya distribucin siga una curva normal.

  • 8/2/2019 Trabajo Infer en CIA a Grupo 100403-9

    9/16

    c. Las poblaciones deben tener la misma varianza, aunque en casos especiales es

    suficiente con saber la tasa de sus varianzas.

    d. Las variables consideradas en el estudio deben ser medidas por lo menos en escala

    de intervalo, para que sea posible hacer operaciones aritmticas.

    Cuando por cualquier razn no se puedan cumplir los requisitos de las pruebasparamtricas, el investigador podr recurrir a las llamadas pruebas alternas, como la pruebat de Student-Welch, la F asimilada de Cochran y la F de Tukey. En ellas no hay exigencia dehomogeneidad de varianzas y, auxiliadas por un modelo matemtico de ajuste, se puedeobtener una eficacia que es muy cercana a la de las pruebas t de Student y de anlisis devarianza.Cabe sealar que, conforme menos condiciones o presunciones exigen una pruebaestadstica, en que se basa su modelo matemtico, ms generales son sus conclusionesderivadas de su aplicacin; sin embargo, tambin es menos eficaz para rechazar la

    influencia del azar, cuando ste no desempea un papel importante.Cuando las observaciones en escala de intervalo no se ajustan a las premisas de laspruebas paramtricas, el investigador debe estimar la prdida de eficacia para decidir utilizarlos procedimientos no paramtricos, y transformar aquellas en escalas nominales uordinales.

    Tamao de la muestra.

    Anteriormente se habl de que la eficacia de una prueba estadstica disminuye cuando sereducen las condiciones o premisas del modelo; sin embargo, a medida que aumenta eltamao de la muestra, se incrementa tambin la eficacia.

    Dicha aseveracin generalmente es verdadera para muestras de tamao definido, peropueden carecer de veracidad al compararse dos pruebas estadsticas con muestras detamaos diferentes, es decir, si con un tamao de 30 por cada grupo, una prueba A puedeser ms eficaz que la prueba B; en cambio, la prueba B es ms eficaz que A cuando staslo cuenta con un tamao de muestra igual a 20. En otras palabras, se puede evitarescoger entre potencias y generalizacin, para lo cual se selecciona una prueba estadsticaque tenga amplia generalizacin, y luego aumentar su eficacia, comparable a la prueba mstil, incrementando el tamao de la muestra.Seleccin de la muestra.

    Las muestras por analizar pueden ser independientes y dependientes o relacionadas.

    Muestras independientes. Son aquellas cuyo universo de poblacin resulta diferente,lo cual no quiere decir que provengan de reas desconocidas, sino que, en trminosde estadstica, la fenomenologa estudiada puede ser consecuencia de variablesdistintas y que, por cada variable existente, hay un universo finito o infinito; porejemplo, en la Tierra hay un nmero finito de seres humanos, pero la variable sexodivide en dos universos diferentes: hombres y mujeres. En el mismo sentido, elestado civil define otros universos distintos, solteros, casados, divorciados, viudos,

  • 8/2/2019 Trabajo Infer en CIA a Grupo 100403-9

    10/16

    etc. De esta manera, se pueden enumerar mltiples variables, que dan lugar a unainfinidad de universos mustrales, de donde es factible elegir muestrasindependientes.

    Muestras dependientes o relacionadas. Se refieren a las provenientes de un universo

    muestral, a las que se aplicar un plan experimental, mediante el cual se espera uncambio, que obligadamente exige un punto de referencia de no cambio. Para estacondicin, el mismo grupo experimental sirve como control o testigo, en el momentoprevio al tratamiento. De esta manera, en el anlisis de las observaciones existen dosperodos: antes y despus del tratamiento.

    Criterios para la determinacin del tamao adecuado de una muestra1. Estimar un parmetro determinado con el nivel de confianza deseado.2. Detectar una determinada diferencia, si realmente existe, entre los grupos de estudio

    con un mnimo de garanta.3. Reducir costes o aumentar la rapidez del estudio: al estudiar una pequea parte de la

    poblacin, los gastos de recogida y tratamiento de los datos sern menores que si losobtenemos del total de la poblacin.

    4. Rapidez: al reducir el tiempo de recogida y tratamiento de los datos, se consiguemayor rapidez.

    5. Viabilidad: la eleccin de una muestra permite la realizacin de estudios que seranimposible hacerlo sobre el total de la poblacin.

    Por ejemplo, en un estudio de investigacin epidemiolgico la determinacin de un tamaoadecuado de la muestra tendra como objetivo su factibilidad. As:

    Si el nmero de sujetos es insuficiente habra que modificar los criterios de seleccin,

    solicitar la colaboracin de otros centros o ampliar el periodo de reclutamiento. Losestudios con tamaos mustrales insuficientes, no son capaces de detectardiferencias entre grupos, llegando a la conclusin errnea de que no existe taldiferencia.Si el nmero de sujetos es excesivo, el estudio se encarece desde el punto de vistaeconmico y humano. Adems es poco tico al someter a ms individuos a unaintervencin que puede ser menos eficaz o incluso perjudicial.

    8. Cul es el criterio a seguir si queremos determinar un tamao de muestra y noconocemos la varianza poblacional. Explique como se resuelve el problema.

    Cuando no se conoce la varianza poblacional, entonces como se dispone de una muestra

    aleatoria simple de tamao n, podemos calcular la varianza muestral Sy utilizar en lugar dela varianza poblacional desconocida, pues Ses un buen estimador de , sustituyamos eltamao de la muestra, si n es grande, es decir, n >= 30:

  • 8/2/2019 Trabajo Infer en CIA a Grupo 100403-9

    11/16

    Si el tamao de la muestra es n < 30, los valores de la varianza muestral S varanconsiderablemente de muestra en muestra, pues S disminuye a medida que n aumenta yno seria una distribucin normal.

    9. Explique como se define la confiabilidad y cual es su interpretacin en la construccinde un intervalo de confianza. Presente un ejemplo.

    Dado que los estimativos puntuales pocas veces sern iguales a los parmetros que tratande estimar, podemos darnos una mayor libertad en su estimacin mediante el uso de la"estimacin por intervalos" o "intervalos de confianza". Un intervalo de confianza es unintervalo estimado dentro del cual se espera encontrar el valor de un parmetro. Este

    concepto se fundamenta en la nocin de varianza, la cul es una medida de variabilidad quesintetiza el grado de homogeneidad o heterogeneidad de las diferencias individuales.La teora de la confiabilidad se basa en una suposicin presentada por Spearman (1910): elpuntaje obtenido por un individuo puede considerarse que est formado por doscomponentes: un puntaje verdadero (porcin constante) y un puntaje error (error tpico demedida, que representa el grado o magnitud de la sensibilidad a las influencias). Estadescomposicin nos lleva a plantear a la confiabilidad como la proporcin entre la varianzaverdadera y la varianza total.

    Ejemplo: Cul es la confiabilidad de un test cuando la proporcin de la varianza totalcompuesta de varianza verdadera es 0.80?

    Sabemos que hablar de una correlacin perfecta y positiva significa tener un valor = 1.Entonces:Varianza Total = 1Varianza Verdadera =-0.80Varianza de Error = 0.20

    Si el coeficiente de varianza verdadera es 0.80, vamos a decir que existe un 80% deestabilidad, equivalencia o consistencia interna (segn el mtodo utilizado) en laspuntuaciones de los sujetos. Con lo cul el 20% restante representa el puntaje error ovarianza de error.

    10. Consulte los registros sobre las tarifas de un servicio pblico (agua, telfono, luz, gas,etc.), de por los menos 300 usuarios de estrato 3, de un barrio de en su ciudad de origen,en una empresa de servicios pblicos: Determine la varianza de muestreo, con unamuestra de 15 tarifas seleccionadas al azar, utilcela para calcular el tamao de muestranecesario para estimar la media y el total de la poblacin, con un error de $500 y unaconfianza de 99%. Obtenga con base en esta muestra (Seleccionada con el muestreoaleatorio simple y sistemtico), los intervalos de confianza para estos dos parmetros.Vuelva a calcular los valores de los dos parmetros (media y el total) con todos los datosde la poblacin de tarifas consultadas. Compare los valores estimados con los valores

  • 8/2/2019 Trabajo Infer en CIA a Grupo 100403-9

    12/16

    reales y concluya: qu tan buenas son las estimaciones realizadas por usted?, estnlas estimaciones calculadas de acuerdo con los valores reales?

  • 8/2/2019 Trabajo Infer en CIA a Grupo 100403-9

    13/16

  • 8/2/2019 Trabajo Infer en CIA a Grupo 100403-9

    14/16

  • 8/2/2019 Trabajo Infer en CIA a Grupo 100403-9

    15/16

    CONCLUSIONES

    Gracias a este trabajo se pudo entender mejor el papel que juega la inferenciaestadstica en el mundo, adems la funcin que realiza dentro de la estadstica pormedio de los muestreos conglomerados a travs de grupos, estratificado en subgruposllamados estratos, simples con una muestra de una poblacin infinita, sistemticosidentificando las unidades con el coeficiente de elevacin, adems de la muestrasaleatorias con el azar y no aleatorias.Con la inferencia estadstica tambin se puede estudiar las muestras a travs de laestimacin ya sea puntual buscando un nico valor estimado para el parmetro con dosopciones que pueden ser correctas como no, otra forma de estimacin es por intervalode confianza en donde se encuentra el valor del parmetro con una probabilidaddeterminada. Al realizar estos estudios tambin se pueden encontrar errores mustralescon respecto a la variacin natural existente en las muestras de una poblacin, nomustrales con el sesgo negativo o positivo.

  • 8/2/2019 Trabajo Infer en CIA a Grupo 100403-9

    16/16