Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec...

48
Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM

Transcript of Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec...

Page 1: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Análisis estadístico I

Medidas de tendencia central, variabilidad y gráficas

Colegio LamatepecBiología BI NM

Page 2: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Método científico

• video motivacional TED sobre método científico en la historia:http://www.ted.com/talks/how_simple_ideas_lead_to_scientific_discoveries.html

Page 3: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Análisis estadístico

• Hacer observaciones es el primer paso del método científico.

• Las observaciones deben medirse de alguna manera, y esto genera una colección de datos. Por razones prácticas, los datos que obtenemos son de muestras, que son porciones pequeñas de la realidad biológica.

• La Estadística nos permite sacar conclusiones sobre las poblaciones, a partir de muestras pequeñas. La Estadística mide diferencias y relaciones entre los datos obtenidos en un experimento.

Page 4: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Medidas de tendencia central

• La media: es el promedio de los datos.En Excel: función AVERAGE o PROMEDIOEj: AVERAGE (A2:A21) calcula la media de los valores de la celda A2 a la A2

• La Mediana: el valor que se encuentra en el centro de los datos, es decir, nos permite conocer el valor que se encuentra exactamente en la mitad del conjunto de datos. En Excel: MEDIANA

• Moda: indica el valor que más veces se repite dentro de los datos. Excel: MODA

Page 5: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.
Page 6: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Cuando una distribución de frecuencia es simétrica, la media, mediana y moda coinciden en su valor ( X = Me = Mo).

Page 7: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

En las distribuciones simétricas los parámetros media, mediana y moda coinciden, mientras que si una distribución presenta cierta asimetría, de un tipo o de otro, los parámetros se sitúan como muestra el gráfico.

http://es.wikipedia.org/wiki/Par%C3%A1metro_estad%C3%ADstico

Page 8: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.
Page 9: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Rango

• El rango de una variable estadística es la diferencia entre el mayor y el menor valor que toma la misma.

• Es la medida de dispersión más sencilla de calcular, aunque es algo burda porque sólo toma en consideración un par de observaciones. Basta con que uno de estos dos datos varíe para que el parámetro también lo haga, aunque el resto de la distribución siga siendo, esencialmente, la misma.

Page 10: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Mediana

• La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que estos están ordenados de menor a mayor.

• Por ejemplo, la mediana del número de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:

http://es.wikipedia.org/wiki/Par%C3%A1metro_estad%C3%ADstico

Page 11: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los anteriores:

Mediana

Page 12: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Variabilidad de los datos

• Varianza: es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.

• En Excel: VARP (para la población total) o VAR (para una muestra)

Page 13: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Variabilidad de los datos

• Desviación estándar o típica: es la raíz cuadrada de la varianza.

• Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.

• La desviación estándar se representa por σ para una muestra o por S para la población.

Page 14: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Áreas bajo la curva normal

Page 15: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Áreas bajo la curva normal

Page 16: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Graficando datos e interpretándolos

Page 17: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Los datos brutos de un experimento deben presentarse en tablas y gráficas

• Ver el siguiente tutorial:• http://www.youtube.com/watch?v=ykPi_OSO

HXA

Page 18: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Pictográficas

• http://www.khanacademy.org/math/statistics/v/reading-pictographs

Page 19: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Gráficas de barras

• http://www.khanacademy.org/math/statistics/v/reading-bar-graphs

Page 20: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

HistogramaUn histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos.

Page 22: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.
Page 23: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

interpretando la gráfica anterior:El eje-x, o eje horizontal, muestra la variable tiempo en unidades anuales, y el eje-y, o eje vertical, muestra la variable de la concentración de bióxido de carbono (CO2) en unidades de partes por millón (ppm). Por consiguiente, el gráfico nos muestra el cambio temporal en concentraciones de CO2 atmosférico. La línea azul oscura muestra el promedio anual de las concentraciones de CO2, tal como aparecen en la columna a la derecha de la tabla. La línea azul clara representa todos los datos numéricos mensuales de la tabla superior. Si un observador perspicaz pudiera deducir de la tabla el incremento promedio anual de las concentraciones de CO2 que aparecen en la línea azul oscura, sería muy difícil, hasta para el más preparado científico, notar el ciclo anual del CO2 atmosférico que la línea azul clara muestra fácilmente.

http://www.visionlearning.com/library/module_viewer.php?mid=109&l=s

Page 24: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Gráficas de pastel

• http://www.khanacademy.org/math/statistics/v/reading-pie-graphs--circle-graphs

Page 25: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Box and whisker plots[diagramas de caja]

• http://www.khanacademy.org/math/statistics/v/box-and-whisker-plots

• http://www.khanacademy.org/math/statistics/v/reading-box-and-whisker-plots

Page 26: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

rango intercuartílico, que se define como la diferencia entre el cuartil tercero y el cuartil primero. En ese rango están, por la propia definición de los cuartiles, el 50% de las observaciones. Este tipo de medidas también se usa para determinar valores atípicos. En el diagrama de caja que aparece a la derecha se marcan como valores atípicos todos aquellos que caen fuera del intervalo [Li, Ls]http://es.wikipedia.org/wiki/Par%C3%A1metro_estad%C3%ADstico

Page 27: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Merging geospatial and field data to predict the distribution and abundance of an exotic macrophyte in a large Wisconsin reservoirAquatic BotanyVolume 96, Issue 1, January 2012, Pages 31–41http://www.sciencedirect.com/science/article/pii/S0304377011001434

Page 28: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Barras de error

• Son la representación gráfica de la variabilidad de los datos.

• Son usadas para mostrar el rango de los datos o la desviación estándar en una gráfica.

• Como cada barra o histograma representa la media de los datos obtenidos, cada colección de datos tendrá una desviación estándar distinta. Y se representa con una línea que se extiende igualmente por encima y por debajo de la media.

• ¿Será deseable que la línea sea corta o larga?

Page 29: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Barras de error

http://biologyze.com/2011/11/

Page 30: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Relative Abundance of cell types in Gastrocnemius. Frequency relates to how often the cell type was observed and Force % was a calculated parameter measuring the contribution of each fiber type to the overall force of the entire muscle. SO = slow oxidative. FOG = fast oxidative glycolytic. FG = fast glycolytic. Error bars designate standard error of data.

Page 31: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.
Page 32: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Tracing the role of R-bodies in the killer trait: Absence of toxicity of R-body producing recombinant E. coli on parameciaEuropean Journal of ProtistologyAvailable online 20 February 2012

Page 33: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Placebo Medicina8.7 9.68.4 9.67.9 10.48.7 8.79.1 9.99.5 9.1

  11.1Media

Desv. Stand.

t-test

Se cambiaron las columnas, pues el ejemploparece estar equivocado. Biology, Book Companion p. 237 (Second Edition, 2010)

A los pacientes que se recuperan de cirugías del corazón se les administran medicinas anticoagulantes para evitar obstrucciones en las arterias. Se condujo un experimento para ver si una medicina anticoagulante tenía un efecto en el tiempo de coagulación de la sangre en dos grupos de pacientes. A un grupo se le administró la medicina y al otro un “placebo”. Los resultados obtenidos en el experimento se presentan en la tabla. Calcular la media, la desviación estándar y la probabilidad del t-test

Page 34: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Placebo Medicina

8.7 9.6

8.4 9.6

7.9 10.4

8.7 8.7

9.1 9.9

9.5 9.1

  11.1

Media 8.7 9.8Desv. Stand. 0.6 0.8

t-test 0.01794224

Este valor es la probabilidad; como es menor que 0.05, el efecto de la medicina

es estadísticamente significativo sobre el tiempo de coagulación

Page 35: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Agregando barras de error a un histograma con Excel

1. Marcar la barra de histograma: click mouse izquierdo sobre la barra

2. Ir a "presentación" en el menú

3. Ir a "barras de error" en el menú

4. ir a "más opciones de barras de error"

5. aparece "barras de error verticales"

mostrar: Dirección: ambos; Estilo final: con remate

6. Cuantía de error: valor "fijo" y escribir el valor de la desviación estándar

7. Dar Enter: aparece la barra de error con remate a ambos lados.

Page 36: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

11.0

3.0

5.0

7.0

9.0

11.0

8.7

9.8

Tiempos de coagulación: placebo y medicina

Series1 Series2

Tipo de tratamiento: placebo y medicina

Tiem

po c

oagu

laci

ón e

n s

Page 37: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Gráfico de doble escala

• Este tipo de gráfico se usa en la presentación de datos que tienen diferente tipo de escala. Se usan para ello diagramas lineales o de barras, y también es posible combinar en un gráfico dos o más variables.

• En el ejemplo siguiente se presentan dos series de informaciones como precipitaciones pluvial y temperatura, para lo cual se usan datos de lluvia total o mensual y la temperatura media mensual.

Page 39: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Gráficos polares o en telaraña

• Este tipo de gráfico se emplea generalmente para representar fenómenos de los que se poseen datos que varían en el tiempo o de otra forma.

• Para interpretar este tipo de gráfico, se fija una escala vertical y luego se analiza cuáles datos están más cerca y cuáles más alejados de la escala.

• Por ejemplo, en el gráfico que se muestra a continuación, se puede visualizar que países están más cerca o más lejos de tener una tasa de mortalidad infantil cercana a cero, y se puede observar que los más cercanos son Costa Rica y Panamá, luego le seguiría Belice, México, El Salvador y el más alejado sería Guatemala.

http://www.estadistica.ucr.ac.cr/cdmmora/pages/lecturas/lectura7.pdf

Page 40: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Gráficos polares o en telaraña

Page 41: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Gráficos triangulares

• Los gráficos triangulares, se basan en un sistema de coordenadas con tres ejes que forman un triángulo equilátero, y se utilizan para mostrar características dependientes de tres variables.

• Se puede usar para cualquier estructura o grupo de tres variables siempre que entre las tres sumen el 100%. El área del triángulo queda dividida en otras más pequeñas representando cada una de éstas el grupo dominante, así muestra cómo afecta el aumento o disminución de un grupo a los demás.

• Para localizar el punto sobre el gráfico se trazan líneas paralelas. En el lugar donde se junten los tres parámetros estará el punto que se busca.

Page 42: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.
Page 43: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Gráficos triangulares

• En el ejemplo se presenta el Producto Bruto Interno por departamentos. Gráficamente se observan tres puntos distantes que corresponden al departamento de Lima, Moquegua y Pasco.

• Lima destaca por la mayor concentración de los servicios, que supera el 70% , mostrando apenas un 5% para actividades de extracción.

• El departamento de Moquegua destaca tanto por las actividades de extracción como de transformación.

• En el departamento de Pasco, casi las tres cuartas partes de su actividad económica, está referida a la actividad primaria o extractiva.

http://www.diresajunin.gob.pe/diresajunin/oite/infoJunin/JUNIN_2012_ODEI_INEI_GUIA_PRESENTACION_DE_GRAFICOS_ESTADISTICOS.pdf

Page 44: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Gráfico de áreasLos gráficos de áreas enfatizan la magnitud del cambio a lo largo del tiempo y se pueden utilizar para dirigir la atención al valor total de una tendencia. Por ejemplo, los datos que representan los beneficios a lo largo del tiempo se pueden representar en un gráfico de áreas a fin de destacar los beneficios totales.Un gráfico de áreas apilado también muestra la relación de las partes con respecto al total.

http://office.microsoft.com/es-es/excel-help/presentar-datos-en-un-grafico-de-areas-HA010218671.aspx#BMusingareacharts

Page 45: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Gráficos de tres dimensiones

Un diagrama en tres dimensiones puede conectar tres variables. En este caso, el eje-x y eje-y están relacionados a la latitud y longitud, mientras que el eje-z muestra la concentración de la polución de mercurio en pequeñas zonas dentro del área.

Page 46: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Gráficos de tres dimensiones

En estos gráficos, cada uno de sus puntos puede ser localizado especificando tres números dentro de un cierto rango. Por ejemplo, anchura, longitud y profundidad.

http://es.wikipedia.org/wiki/Tridimensional

Page 47: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

Gráficos de tres dimensiones

http://www.msmacrosystem.nl/3Dsurf/About3Dview.html

Page 48: Análisis estadístico I Medidas de tendencia central, variabilidad y gráficas Colegio Lamatepec Biología BI NM.

FIN