Clase3

download Clase3

of 52

description

s

Transcript of Clase3

Diapositiva 1

ANLISIS DE DATOS EN ECOLOGA (Anlisis multivariados) Pepe ESPINOZA

Clase 3.Muestra, muestreo, tipos, caractersticas, tamao de muestra.Hiptesis, planteamiento, comprobacin. Conceptos asociados.

Muestra nociones bsicasMuestrasPoblacion: es un conjunto de entidades de inters (e.g. peces, cefalpodos, crustceos, ......)Muestras: es un subconjunto de entidades azarosamente obtenidas de la poblacin.ExtensinespacialPoblacinLa Estadstica responde preguntas de INVESTIGACIN utilizando muestrasUnidad de anlisis: es un individuo de la entidad de inters (e.g. pez, cefalpodo, crustceo, ......).Unidad de anlisisMuestra nociones bsicasComo representar las muestras?Ejemplo: Poblacin de pecesPregunta: hay mas hembras que machos?Extensinespacial?PoblacinLa Estadstica responde preguntas de INVESTIGACIN utilizando muestras Unidad de anlisisEs la unidad bsica en la que se genera la informacin primaria que es objeto del estudio (p.ej: un pez, un alga, un calamar).

Muestra nociones bsicas4Unidad de muestreoColecciones o agrupaciones de unidades de anlisis claramente delimitadas e identificables no solapadas o disjuntas que cubren completamente a la poblacin marco de muestreo (p.ej. Un cardumen de peces).

Muestra nociones bsicasMarco de muestreoConjunto conformado por el listado de unidades de muestreo (p.ej. El conjunto de estaciones de muestreo en una baha)

Muestra nociones bsicasSIMPLICIDAD. Significa que los elementos que participan en la investigacin y que pertenecen a la poblacin, deben estar definidos en forma clara, simple y precisa.

REPRESENTATIVIDAD. Las caractersticas relevantes de la poblacin deben encontrarse en la muestra, slo deben diferir en el nmero de elementos.

COMPARABILIDAD. Cuando en un estudio es necesario contar con dos muestras, entre las cuales se desea establecer alguna diferencia especfica, es necesario que ambas muestras sean similares en todas las caractersticas, a excepcin de aquella caracterstica que es motivo de la investigacin.Muestra principios fundamentales

Muestra estapas de la investigacinResumido en 5 pasos:

1. Construir una hiptesis nula (H0) (Pregunta de investigacin)E.g. pregunta: hay mas hembras que machos? 2. Elegir un anlisis estadsticoE.g. la prueba t para detectar diferencias entre hembras y machos

3. Colectar los datos (muestreo)E.g. Muestrear hembras y machos

4. Calcular p-valores y la prueba estadsticaCorrer prueba t.

5. Rechazar/aceptar (H0) si p es pequeo/grande(RESPONDER LA PREGUNTA)Error ComnAntes del muestreo: (1) construir la hiptesis y (2) elegir los anlisis estadsticosMuestra nociones bsicasTENER PRESENTE!1. Lo mas claro es la pregunta, mas fcil es el muestreo,lo mas simple es el estadstico a ser aplicado.2. Preguntas sin sentido y nada claras, y un mal diseo,llevan a realizar anlisis mas complejosSin estadstica no se pueden escribir artculos cientficos(Casi)Donde ubicarse?Muestreo: conceptoMUESTREOEs un procedimiento por el cual se estudia una parte de la poblacin llamada muestra, con el objetivo de inferir con respecto a toda la poblacin.INFERENCIA

La inferencia estadstica es la estimacin puntual de un parmetro (por ejemplo la media poblacional) a partir de la informacin que proporciona una muestra.Muestreo: terminologa1. Poblacin.Es todo conjunto de objetos, situaciones o sujetos con un rasgo comn. Es un conjunto de casos que satisface una serie predeterminada de criterios.2. Muestra. Es un subconjunto de individuos extrados de una poblacin.3. Unidad de anlisis. Es un sujeto u objeto el cual es motivo de investigacin, al cual se toma mediciones.4. Unidad de muestreo. Es un elemento que permite llegar y seleccionar a la unidad de anlisis. En algunos estudios puede coincidir con la unidad de anlisis.5. Unidad reportante. Es el sujeto que brinda informacin sobre la unidad de anlisis (p.e. madres de pacientes peditricos).6. Marco muestral. Es una lista completa y detallada de las unidades de muestreo.

Muestreo: ConsideracionesTCNICAS DE MUESTREOCuando elegimos individuo de una poblacin de estudio para formar muestras podemos encontrarnos en las siguientes situaciones:Muestreos probabilistasConocemos la probabilidad de que un individuo sea elegido para la muestra.. Interesantes para usar estadstica matemtica con ellos.Muestreos no probabilistasNo se conoce la probabilidad.Son muestreos que seguramente esconden sesgos.En principio no se pueden extrapolar los resultados a la poblacin.A pesar de ello una buena parte de los estudios que se publican usan esta tcnica.Muestreo: Consideracin (1)-tipo de muestreoPROBABILISTICOSeleccin aleatoriaNO PROBABILISTICOCriterio del investigadorALEATORIO SIMPLESISTEMATICOESTRATIFICADOCONGLOMERADOPOR CONVENIENCIAIntencionalPOR CUOTAS AccidentalSeleccin de elementos sobre bases aleatorias partiendo de una estructura muestral que enumera todos los elementosSeleccin de una unidad por cada cierto nmero de casos de alguna lista o grupoDivide la poblacin en subgrupos homogneos de los cuales se escogen los elementos en forma aleatoriaSeleccin sucesiva de muestras aleatorias de unidades mayores o menores por mtodos aleatorios simples o estratificadosSujetos con que puede contarse ms fcilmente, considerando unidades supuestamente tpicasDivide poblacin por subgrupos segn variables de inters y escoge sujetos de cada estrato por extraccin accidentalTIPOS DE MUESTREO

Muestreo: Consideracin (1)-tipo de muestreoMuestreo Aleatorio Simple.Es el mtodo de muestreo que asegura que cada una de las unidades de anlisis (individuo) tiene igual probabilidad de ser incluida en la muestra, igualmente, cada una de las muestras posibles tendr la misma probabilidad de ser elegida; esta caracterstica asegura la representatividad e imparcialidad de la muestra.Muestreo: Consideracin (1)-tipo de muestreoMuestreo Estratificado.

Con el fin de asegurar una mayor representatividad de la muestra a elegir de la poblacin completa, se clasifica a la poblacin en n" estratos independientes; por tanto, cada estrato constituye una sub-poblacin con todas las caractersticas y parmetros de un universo independiente.

Para estimar los parmetros de esta poblacin estratificada se extrae una muestra simple aleatoria en forma independiente de cada estrato construido tratando a cada estrato como un universo separado; esta forma de muestrear permitir asegurar que la muestra total elegida contenga la informacin de todas las partes importantes (estratos) de la poblacin en general.Muestreo: Consideracin (1)-tipo de muestreoDistancia mProfundidad m024681012141618202224262830323436-25-20-15-10-50

DETERMINACN DE LA ESTRATIFICACION DE LOS RECURSOSISLA SAN LORENZOMuestreo: Consideracin (1)-tipo de muestreoProfundidad m024681012141618202224262830323436-25-20-15-10-50

DETERMINACN DE LA ESTRATIFICACION DE LOS RECURSOSISLA SAN LORENZOMuestreo: Consideracin (1)-tipo de muestreo

BAHA INDEPENDENCIA: MUESTREO DE CONCHA DE ABANICO (Argopecten purpuratus) Muestreo: Consideracin (1)-tipo de muestreoMuestreo SistemticoEn estos muestreos las muestras se ordenan de acuerdo a algn criterio, tanto en orden espacial como en temporal. Comprende la seleccin aleatoria de una unidad de muestreo inicial, a partir de la cual las restantes unidades quedan sistemticamente seleccionadas de acuerdo al lugar que ocupan en la poblacin.

Muestreo sistemtico temporal Anomala de temperatura (C)Muestreo: Consideracin (1)-tipo de muestreoMuestreo sistemtico espacial

ANCHOVETA PERUANA (Engraulis ringens) Muestreo: Consideracin (1)-tipo de muestreoMuestreo de Conglomerados (Racimos).La unidad muestral es un grupo de elementos de la poblacin que forman una unidad, a la que llamamos conglomerado. A diferencia de un estrato, un conglomerado es una unidad de elementos que contienen representantes de toda la poblacin (segn la caracterstica de la misma que se mida durante el experimento)

Colonias de bacteriasMuestreo: Consideracin (2)-tamao de muestraPor qu calcular el tamao de la muestra?Las muestras se pueden estudiar mas fcilmente que una poblacin.Es menos costosa.Toma menos tiempo.Con frecuencia son mas precisos que los basados en la poblacin.

Tipos de muestreo:Probabilstico: aleatorio simple, sistemtico, estratificado, por conglomerados.No probabilstico: accidental, por conveniencia, por cuotas, por bola de nieve.Muestreo: Consideracin (2)-tamao de muestraPara determinar el tamao de la muestra, se debe considerar diferentes situaciones:Para determinar parmetros (proporciones, medias).Para contraste de hiptesis, es decir, pretende comparar si las proporciones o medias de las muestras son diferentes.

Entonces si queremos determinar hacer inferencias de valores poblacionales (proporciones o medias), debemos conocer:El nivel de confianza o seguridad (1-). Para un nivel de seguridad del 95%: =1.96; para un 99% de seguridad: =2.58.Que da lugar a un coeficiente (z).La proporcion esperada (p).q=1-p, La precisin (d) que se desea para el estudio.El total de la poblacin (N).La vraianza (s2).Muestreo: Consideracin (2)-tamao de muestra

Tamao de Mnimo de Muestra para Estudios de ComunidadesCURVA ESPECIE-MUESTRAn = Nivel de confianza x VarianzaError (Precisin)n: tamao de la poblacinMuestreo: Consideracin (2)-tamao de muestraDonde:t = Valor de Student con (n-1) grados de libertad y probabilidad (1-). Puede ser aproximado a 2.d = Margen de error permisible para el estimador del promedios = Desviacin estndar de los datos observados en la muestraTamao de Muestra para el Muestreo Simple Aleatorio. a) Para estimar promedios

Muestreo: factores que afectanFACTORES QUE AFECTAN AL MUESTREOEfecto de la disposicin espacial y/o temporal de una poblacin

Al azar Uniforme Por contagio o agregacin

Efectos metodolgicos, instrumentales y personales.

Efecto de la variabilidad del observadorEfecto de la tcnica de capturaEfecto de la variabilidad de respuesta de los animales.Muestreo: factores que afectanDISTRIBUCIN DE LAS POBLACIONESAL AZARPOR CONTAGIO O AGREGADOUNIFORMEMuestreo poblacional e IncertidumbrePoblacinNormalmente estimamos medias usando muestras. Esto no es posible de medir para todos los individuos en una poblacin.Como trabajamos con muestras, siempre hay un grado de INCERTIDUMBRE en la estimacin. Como podemos reducer este grado de incertidumbre?

Media=40Media=42Media=39.5Muestreo poblacional e IncertidumbreStandard error (SE)SE es simplemente la SD de la probabilidad de distribucin de un estadstico especfico.E.g. SE de la mediaCI es un intervalo estimado de un parmetro poblacional. Como probablemente el intervalo contiene el parmetro, es determinado por el intervalo de confianza(95%)Confidence intervals (CI)

t distribution (n30)Muestreo poblacional Ley de los grandes nmerosConforme se incrementa el tamao de muestras (n), la media de la muestra refleja la media poblacional

Poblacin con media = 0SD = 1Cuando es una muestra lo suficientemente grande?Espacio muestralEs un conjunto cuyos elementos representan los resultados posibles de un experimento. Es el conjunto universal y se representa por E. Encierra todos los casos posibles.

Por ejemplo; el espacio muestral de lanzar un dado, hay seis posibilidades: E={1,2,3,4,5 o 6}

Sucesos: A={3,2} y B={2,5}

Espacio muestral

Espacio muestral distribucin estadsticaPRINCIPALES DISTRIBUCIONESDistribucin = Comportamiento de los datos (observaciones) de una variable en estudioVariable aleatoria discreta: Funcin de probabilidad. E.g. Bernoulli, binomial, Poisson.Variable aleatoria contnua: Funcin de densidad. E.g. distribucin normal, t, F, x2.

La inferencia estadstica es la estimacin de un parmetro (por ejemplo la media poblacional, varianza poblacional) a partir de la informacin que proporciona una muestra.Muestreo e inferencia estadsticaInferencia estadstica y planteamiento de hiptesisDe investigacin (generales o especficas), las cuales pueden responder en forma amplia a las interrogantes planteadas en el Marco Terico respecto al problema en estudio.

Estadsticas, las que expresan la relacin en trminos matemticos.Clasificacin de hiptesis:Hiptesis estadstica - PruebasFORMULACIN DE HIPTESISCLCULO DE LA PRUEBA ESTADSTICADECISIN ESTADSTICA. SE ACEPTA O RECHAZA Ho

Si Zc pertenece a la regin de aceptacin, se Acepta H0 Si Zc pertenece a la regin de rechazo, se Rechaza H0 Partes de una prueba de hiptesis:Hiptesis estadstica - Planteamiento

Como plantear correctamente una hiptesis?En realidad, por lo general, no sabemos como plantear una hiptesis de forma correcta.

Una hiptesis se relaciona con un problema.No la podremos generar si no tenemos clarolo que buscamos.Por lo tanto, esta surge de los problemas y los objetivos de la investigacin.

Una hiptesis nos indica una bsqueda o intento de probar algo, por lo tanto no necesariamente tiene que ser verdadera; la idea es que a partir de ella probemos algo.

Aunque se piense lo contrario, el error mas grande es creer que una hiptesis es el primer paso de una investigacin.

Hiptesis estadstica - Planteamiento

Cual es el problema de una investigacin? Como resolverlo?

Hiptesis estadstica - Planteamiento

Una hiptesis es una proposicin tentativa sujeta a comprobacin emprica durante una investigacin.Se puede tener una, dos o varias y a veces ninguna hiptesis.

Pueden ser:Mas o menos generales o precisasInvolucrar dos o mas variables.

Surgen de los anlisis tericos, de generalizaciones empricas o de estudios (antecedentes) cuidadosamente revisados.

La falta de rigurosidad y cuidado antes de formularlas nos lleva a cometer errores como hipotetizar algo que ya ha sido comprobado o contundentemente rechazado.

Hiptesis estadstica - Planteamiento

En trminos de la estadstica, las hiptesis de investigacin son simbolizadas.Se parte de una hiptesis nula (H0): proposiciones que se plantean para refutar o negar lo que afirma la hiptesis de investigacin. Generalmente se plantea para ser rechazada, aunque resulta que a veces es verdadera y es aceptada.

y una

Hiptesis alternativa (Ha): se formula cuando hay otras posibilidades adems de la H0. Es una posibilidad ante la hiptesis de investigacin y la nula.

Hiptesis estadstica - ContrasteH0 : = 0Ha : < 0H0 : = 0Ha : > 0H0 : = 0Ha : 0

Plantear las hiptesis H0 y H1 : Elegir el nivel de significacin

Hallar la estadstica de prueba y establecer las regiones de aceptacin y rechazo con el punto crtico (Valor de tablas) Hallar el valor calculado de la estadstica de prueba con los datos de la muestra.

Regla de decisin:

Si Zc pertenece a la regin de aceptacin, se Acepta H0 Si Zc pertenece a la regin de rechazo, se Rechaza H0

Procedimiento de una prueba de hiptesis:Hiptesis estadstica region de rechazoRegin crticaValores improbables si...Es conocida antes de realizar el experimento: resultados experimentales que refutaran H0

Nivel de significacin: Nmero pequeo: 1% , 5% (0.01, 0.05)Fijado de antemano por el investigadorEs la probabilidad de rechazar H0 cuando es cierta

Acepto HoReg. Crit.Reg. Crit. =0.05H0: =70/2/2Rechazo HoRechazo HoRegin crtica y nivel de significacinHiptesis estadstica - Constraste

La posicin de la regin crtica depende de la hiptesis alternativaUnilateralizquierdaUnilateralderechaBilateralHa: 70Ha: 70H0: m=70H0: m>70H0: m=70H0: m70H0: m=70a=0.05Se aceptaH0: m=70

p_valor < 0.001Se rechazaH0: m=70H0: m=70H0: m>70Contrastes: prueba de significacin pHiptesis estadstica Error asociadoRealidadH0 verdaderaH0 FalsaAceptar H0Decisin correctaError de tipo IIProbabilidad de aceptar Ho cuando en realidad es falsaProbabilidad

Rechazo Ho

Acepto HaError de tipo IProbabilidad de rechazar la Ho cuando en realidad es verdadera Probabilidad Decisin correctaTIPOS DE ERRORHiptesis estadstica - Significanciaa, p-valor; CRITERIOS DE RECHAZOSobre aEs nmero pequeo, preelegido al disear el experimento

Conocido a sabemos todo sobre la regin crticaSobre p-valorEs conocido tras realizar el experimento

Conocido p sabemos todo sobre el resultado del experimentoSobre el criterio de rechazoContraste significativo = p-valor menor que aHiptesis estadstica Prueba de normalidad

H0: la variable x presenta distribucin normal H0: la variable x no presenta distribucin normalp-valor> a =0.05Se acepta Hop-valor