Tema1 Repaso-diseño y analisis Experimental

40
Diseño y análisis experimental Dr. Esteban Pineda diez de Bonilla [email protected]

description

este documento trata sobre los temas que se ven en diseño de analisis experimental, asi como un breve repaso de estadistica

Transcript of Tema1 Repaso-diseño y analisis Experimental

  • Diseo y anlisis experimental

    Dr. Esteban Pineda diez de Bonilla [email protected]

  • Temario

    Tema I Introduccin al diseo experimental Conceptos generales Aplicaciones del diseo experimental Modelos estadstico Repaso de estadstica

  • Reglas del juego

    3 exmenes parciales 75%

    Ejercicios 20%

    Asistencia 5%

  • Temario

    Tema II Agrupamiento simple y doble Diseo completamente aleatorio Ventajas y desventajas, Modelo aditivo lineal Estimadores del modelo, Anlisis de varianza Pruebas de comparacin de medias de tratamientos Diseo de boques completamente aleatorio Modelo aditivo lineal, Ventajas y desventajas, Modelo aditivo lineal Estimadores del modelo, Anlisis de varianza Pruebas de comparacin de medias

  • Temario Tema III Diseos factoriales Diseo completamente aleatorio Ventajas y desventajas, Modelo aditivo lineal Estimadores del modelo, Anlisis de varianza Pruebas de comparacin de medias de tratamientos Diseo de boques completamente aleatorio Modelo aditivo lineal, Ventajas y desventajas, Modelo aditivo lineal Estimadores del modelo, Anlisis de varianza Pruebas de comparacin de medias

  • Temario Tema IV Regresin Regresin lineal simple Pruebas de hiptesis, estimacin de intervalos, comprobacin, anlisis de residuales, prueba de falta de ajuste, coeficiente de determinacin Regresin lineal mltiple Pruebas de hiptesis, estimacin de intervalos, comprobacin, prueba de falta de ajuste.

  • Temario

    Tema IV Covarianza Diseo unifactorial con una covarianza Prueba de significacin de regresin general

  • Repaso de estadstica

    estad stica descriptiva

    estad stica inferencial

    Estad stica

    Objetivos de la estad stica

  • La Estadstica se divide en dos ramas: La estad stica descriptiva, que se dedica a los mtodos

    de recoleccin, descripcin, visualizacin y resumen de datos originados a partir de los fenmenos en estudio. Estimacin de parmetros descriptivos (media, mediana, moda, varianza y la desviacin estndar).

    La estad stica inferencial, que se dedica a la generacin

    de los modelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta lo aleatorio e incertidumbre en las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la poblacin de estudio (prueba de hiptesis, estimacin, correlacin o anlisis de regresin).

  • Mtodo cientfico tradicional

    1. Observacin, recoleccin y ordenamiento de datos 2. Induccin de las generalizaciones, leyes 3. Desarrollo de teoras explicativas 4. Deduccin de hiptesis para probar teoras 5. Prueba de hiptesis experimentales y

    observacionales (uso de estad stica) 6. Sustento o adaptacin de la teora

  • Objeto, proceso o caracterstica que est presente, en el fenmeno que se quiere estudiar, reciben este nombre en la medida en que su modificacin provoca una modificacin en otro objeto, proceso o caracterstica. Las variables principales en psicologa pueden ser: independientes, dependientes, intermedias, conductuales, observables, o inobservables.

    VARIABLE INDEPENDIENTE La variable que manipula el experimentador VARIABLE DEPENDIENTE

    La variable que modifica su estado, es decir que depende de la variable independiente y que provoca efecto

    Ejemplo: Si queremos averiguar cmo se produce un cambio en nuestras

    sensaciones visuales con la modificacin de la luz, la luz sera la variable que tiene que manipular el investigador es decir, la variable independiente y la sensacin luminosa del sujeto, es la variable dependiente.

    VARIABLE

  • Diseo Es el esbozo, el esquema, el prototipo o modelo que indica el

    conjunto de decisiones, pasos y actividades a realizar para guiar el curso de una investigacin

    El diseo de la investigacin incluye, una serie de pasos del

    marco terico:

    Constitucin del equipo de investigacin Coordinacin de tareas Eleccin de los instrumentos metodolgicos Organizacin del material de consulta y de investigacin Eleccin de la muestra Esquema presupuestario-administrativo

  • Anlisis e interpretacin de los datos

    Es la fase donde se realiza el tratamiento estadstico-matemtico de toda el conjunto de datos clasificados y tabulados.

    El anlisis no puede quedar reducido a una operacin contable,

    de obtencin de promedio, medias, ndices, medida de asociacin etc.

    El propsito del anlisis es resumir y comparar las observaciones llevadas a cabo en forma tal que sea posible materializar los resultados de la investigacin con el fin de proporcionar respuesta a las interrogantes iniciales de la investigacin.

    El objetivo de la interpretacin en cambio es buscar un significado

    ms amplio a las respuestas a travs de otros conocimientos disponibles; generalizaciones, leyes, teoras etc. Se trata de poner los datos en una perspectiva de contextos, de relaciones mutuas, que permitan profundizar la compresin de lo que est pasando.

  • Diseo y anlisis experimental

    Tema II Nociones y conceptos bsicos

  • Anlisis descriptivo e inferencial

    Anlisis descriptivo: El objetivo es caracterizar, describir y extraer conclusiones sobre una muestra de datos.

    Anlisis inferencial: Implica realizar inferencias de la poblacin a partir de los datos muestrales.

    El nexo de unin entre ambos anlisis es la teora de probabilidad.

  • Conjunto de todos los elementos que cumplen una o varias caractersticas.

    Puede ser una poblacin finita (los estudiantes de biologa en Chiapas) o infinita (el conjunto de los nmeros pares).

    Normalmente, trabajaremos con muestras

    Poblacin

  • Subconjunto de los elementos de una poblacin. La muestra en sentido genrico, es una parte del universo, que

    rene todas las condiciones o caractersticas de la poblacin, de manera que sea lo ms pequea posible, pero sin perder exactitud.

    Muestreo: procedimiento de extraccin de la muestra.

    Muestra (n)

    Es importante aprovechar la informacin de la muestra en un anlisis descriptivo antes de efectuar inferencias sobre la poblacin.

  • Parmetro: Propiedad descriptiva de la poblacin. Se simbolizan con letras griegas (m para la media, s para la desviacin tpica).

    Estadstico (estimador): Propiedad descriptiva de la muestra. Se simbolizan con letras latinas (x para la media, s para la desviacin tpica).

    Poblacin & Muestra

  • Caractersticas de una poblacin y de una muestra (parmetros y estadsticos)

    Medida

    PARAMETRO (poblacin)

    ESTADISTICO (muestra)

    Media o promedio Desviacin estndar Proporcin o porcentaje P p Cantidad de elemento N n

  • Representacin de variables dependientes e independientes

    Al aumentar la VI la VD aumenta Al aumentar la VI la VD no vara

    Al aumentar la VI la VD aumenta de manera lineal pero no vale O

    Al aumentar la VI la VD aumenta de forma exponencial

    Al aumentar la VI la VD disminuye Al aumentar la VI la VD aumenta de forma exponencial

  • Tipos de variables Pueden ser cualitativas o cuantitativas. Generalmente se

    utiliza el trmino modalidad cuando hablamos de caracteres cualitativos y el trmino valor cuando estudiamos caracteres cuantitativos. Una variable no es sino el conjunto de las distintas modalidades o valores que toma un carcter.

    Variables cualitativas (o categricas): aquellas que no aparecen en forma numrica, sino como categoras o atributos (sexo, profesin, color de ojos). Las variables cualitativas slo pueden ser nominales u ordinales.

    Variables cuantitativas: las que pueden expresarse

    numricamente (temperatura, salario, nmero de goles en un partido). Se pueden cuantificar los resultados experimentales por medio de instrumentos adoptando unidades de medida para valorar los diferentes resultados.

  • Tipos de Variables Son cada uno de los rasgos o caractersticas de los elementos de una

    poblacin y que varan de un individuo a otro (peso, color de ojos, sexo, nmero de hijos).

    Las variables pueden corresponder a cuatro tipos o niveles de medicin:

    1) Nominal: hace referencia a datos que slo pueden clasificarse en categoras; existen slo conteos; no existe orden particular para los grupos. Ejemplo: color de ojos, especies.

    2) Ordinal: corresponde a aquellos datos que se pueden agrupar en categoras y ordenarlas segn algn tipo de gradacin. Ejemplo; nivel de dolor, nivel de preferencia.

    3) De Intervalo: incluye todas las caractersticas de la escala ordinal, pero adems la distancia entre valores es constante pues los valores que toma este tipo de variables corresponde al orden de los nmeros naturales. Ejemplo: nmero de hijos, nmero de especies.

    4) De Razn: tiene las caractersticas de la escala de intervalo, pero se agrega un punto cero absoluto tal que significa ausencia del atributo y la razn o cociente de dos nmeros es significativo pudindose aplicarles todo tipo de instrumental matemtico. Ejemplo: peso, edad.

  • Variables cuantitativas Las variables cuantitativas segn el tipo de

    valores que pueda tomar pueden ser discretas o continuas.

    Variables discretas: son el resultado de contar y

    slo toman valores enteros (nmero de hijos) Variables continuas: son el resultado de medir, y

    pueden contener decimales (temperatura, peso, altura). Se pueden subdividir a voluntad. Pueden tomar, entonces, cualquier valor de un determinado intervalo.

  • Diseo y anlisis experimental

    Tema Medicin de variables

  • Tipos de Medidas en Biologa Se llama medicin al proceso de atribuir nmeros a las

    caractersticas. Una caracter stica es una propiedad o cualidad de un

    individuo. Una modalidad es cada una de las maneras como se

    presenta una caracterstica. La asignacin de nmeros a las caractersticas se hace

    siguiendo unas reglas.

  • En general la estructura del proceso de medicin, tiene 4 niveles: 1) La variable, o propiedad que se quiere medir (ej: sexo, inteligencia, memoria, temperatura, etc.), 2) El atributo o grado (modalidad) en que se manifiesta la propiedad medida, 3) El valor o forma de expresar de forma numrica el atributo, y 4) La relacin aceptable entre los distintos valores de la variable. Por ejemplo, en la variable "clase social", el proceso de medicin quedara representado como:

  • TIPOS DE MEDIDA Escala nominal: Los nmeros asignados slo sirven para distinguir

    categoras. Sexo (0=macho, 1=hembra) Caracter sticas:

    Asigna los objetos por identidad. Datos categricos (exclusivos). Relacin de igualdad.

    Ejemplos: sexo, conductas (alimentacin, reproduccin, etc.), especies.

    Escala ordinal: Los nmeros indican no slo igualdad/desigualdad

    (escala nominal) sino tambin una relacin de orden. Nivel de perturbacin (0=bajo, 1=medio, 2=alto)

    Caracter sticas: Diferencia los objetos en posicin. Ausencia del concepto de cantidad. Magnitudes relativas. Relacin de orden. Relacin de igualdad.

    Ejemplos: grado de perturbacin, categora de edad, etc.

  • Escala de intervalo: En este caso disponemos ya de unidad de medida (esto es, sabemos cunta diferencia hay entre elementos). El origen de la escala es arbitrario. Temperatura en grados centgrados o en grados Fahrenheit.

    Escala de razn. En este caso, disponemos tanto

    de unidad de medida como de un 0 absoluto. En este caso, tenemos relaciones de igualdad/desigualdad de razones. Peso, estatura.

    TIPOS DE MEDIDA

  • Escalas

    Operaciones emp ricas bsicas

    Ejemplo

    Nominal Relacin de igualdades El sexo, color de ojos

    Ordinal Relacin de mayor o menor

    Escalas de disturbio, dureza de los minerales

    De Intervalo Determinacin de la igualdad de la diferencia de intervalos

    El rendimiento acadmico medido en un rango de 0 a 10, temperatura (C)

    De razn Existencia de un cero real o absoluto

    El tiempo de reaccin, talla, abundancia

  • Tipos de frecuencia Uno de los primeros pasos que se realizan en cualquier

    estudio estadstico es la tabulacin de resultados, es decir, recoger la informacin de la muestra resumida en una tabla en la que a cada valor de la variable se le asocian determinados nmeros que representan el nmero de veces que ha aparecido, su proporcin con respecto a otros valores de la variable, etc. Estos nmeros se denominan frecuencias:

    1. Frecuencia absoluta (ni) 2. Frecuencia relativa (fi) 3. Porcentaje (pi) 4. Frecuencia absoluta acumulada (Ni) 5. Frecuencia relativa acumulada (Fi) 6. Porcentaje acumulado (Pi)

  • Frecuencia absoluta (ni): Es el nmero de veces que aparece en la muestra dicho valor de la variable.

    Frecuencia relativa (fi): es el cociente entre la frecuencia absoluta y el tamao

    de la muestra (N). Porcentaje (pi): esta medida resulta de multiplicar la frecuencia relativa por

    100. Frecuencia Absoluta Acumulada (Ni): Suma de las frecuencias absolutas hasta

    dicho valor. Frecuencia Relativa Acumulada (Fi): es la frecuencia absoluta acumulada

    dividido por el tamao de la muestra Porcentaje Acumulado (Pi): Es la frecuencia relativa acumulada por 100.

  • Se realiza un muestreo de 50 nidos de aves, para estimar las tasas de reclutamiento poblacional

    Nmero de cr as por nido

    Nmero de

    nidos xi ni fi pi Ni Fi Pi 1 16 16/50 32% 16 16/50 32% 2 20 20/50 40% 36 36/50 72% 3 9 9/50 18% 45 45/50 90% 4 5 5/50 10% 50 50/50 100%

    Total (N) 50

    Tabla de

    frecuencias

  • Representaciones grficas Grficos de barras: En el eje X representamos los valores de las variables y

    levantamos un trazo o barra de longitud igual a la frecuencia relativa (o absoluta).

    Pictogramas: Figuras cuya rea es la frecuencia (o un valor proporcional) del

    valor que representan. Generalmente se emplean para variables cualitativas Grficos circulares (pastel) : Se divide un crculo en sectores cada uno de ellos

    proporcional a la frecuencia relativa de un valor.

  • Representaciones grficas Grficos de l neas: representa la informacin comparando las clases y frecuencias Diagrama de caja (Box-Plot): representa la distribucin en cuartiles de los datos Pol gono de frecuencias (poligonal de frecuencias): Se obtiene uniendo los puntos

    medios de los extremos superiores de los rectngulos que forman el histograma. Diagrama de tallos y hojas: Procedimiento semigrfico para el que se preparan los

    datos resumindolos en dos o tres cifras (expresndolos en las unidades adecuadas). A continuacin se disponen en una tabla de dos columnas del siguiente modo:

    1. Si los datos son de dos dgitos, a la izquierda (en el tallo) aparece la cifra de las decenas, a la derecha separadas por una lnea aparecen las hojas y se escriben todas seguidas.

    2. Si hay tres dgitos el tallo est formado por los dos primeros.

  • Ejemplo: Dada la muestra {114, 125, 114, 124, 152, 134}, dibuja su diagrama de tallos y hojas.

    10

    11 4 4

    12 4 5

    13 4

    14

    15 2

  • Reglas para formar las distribuciones de frecuencia

    1. Determinar el valor mayor y el menor entre los datos registrados y as encontrar el rango (diferencia entre el mayor y el menor de los datos).

    2. Dividir el rango en un nmero conveniente de intervalos de clase del mismo tamao. El nmero de intervalos de clase se toma generalmente entre 5 y 20 dependiendo de la cantidad de datos. Los intervalos de clase se eligen tambin de forma que las marcas de clase o puntos medios* coincidan con los datos realmente observados.

    3. Determinar el nmero de observaciones que caen dentro de cada intervalo de clase, es decir, encontrar las frecuencias de clase.

    * Marcas de clase: Punto medio del intervalo de clase, se obtiene sumando los lmites superior e inferior de la clase y dividiendo por 2.

  • Intervalos de clases y amplitud

    Regla de Sturges (k) k = 1+3.322 (log 10 n) Rango (R) R = Valor mayor valor menor Amplitud del intervalo (w) w= R/k

  • Histograma de frecuencias Es una representacin grfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical (Y) se representan las frecuencias y en el eje horizontal (X) los valores de las variables (nmero de observaciones), normalmente sealando las marcas de clase, es decir, la mitad del intervalo en el que estn agrupados los datos. Se utiliza cuando se estudia una variable continua (edades o altura de la muestra) y sus valores se agrupan en clases, es decir, valores continuos.

    F

    Clases/categoras

  • Formas t picas de histogramas relacionadas con curvas de frecuencias

    No representa una variabilidad natural quiz porque se han eliminado algunos valores

    Los datos no siguen el patrn de comportamiento general (anomal as, errores)

    Responde a la variabilidad que presenta ciertas variables que no siguen una ley normal (tiempos

    de vida).

    Se presenta cuando estn mezclados datos de distinto origen centrados en valores distintos

    Representa la variabilidad debida a causas aleatorias

  • Sesgo y curtsis

    platicrtica

    Sesgo -

    Sesgo +

    Sesgo: es el grado de asimetra en la distribucin de los datos

    Curtsis: mide el grado agregacin o dispersin de valores de un conjunto de datos