UNIDAD II

61
UNIDAD II ESTADISTICA DRA. CAROLINA ALEMAN ORTEGA

description

UNIDAD II. ESTADISTICA DRA. CAROLINA ALEMAN ORTEGA. ESTADISITICA. DEFINICION: CIENCIA QUE SE ENCARGA DE RECOPILAR, ORGANIZAR Y ANALIZAR LOS DATOS. Estadística en Medicina. E l resultado de un análisis estadístico no es un objetivo en sí mismo, sino una herramienta para : - PowerPoint PPT Presentation

Transcript of UNIDAD II

UNIDAD II

ESTADISTICA

DRA. CAROLINA ALEMAN ORTEGA

ESTADISITICA

DEFINICION: CIENCIA QUE SE ENCARGA DE RECOPILAR,

ORGANIZAR Y ANALIZAR LOS DATOS .

Estadística en Medicina

El resultado de un análisis estadístico no es un objetivo en sí mismo, sino una herramienta para:

comprobar o rechazar una hipótesis de trabajo,

representar de una forma eficiente y resumida un colectivo de observaciones

para validar un modelo de un proceso fisiológico

Definición de estadística

Estadística es la ciencia y técnica que tiene que ver con la recolección, procesamiento, análisis e interpretación de datos.

Se clasifica en:• Descriptiva • Inferencial

ESTADISTICA

La estadística descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura

de los estudiantes de una escuela, temperatura en los meses de verano, etc.) y trata de extraer conclusiones sobre el comportamiento de estas

variables.

Estadística inferencial

Proporciona métodos para estimar las características de un grupo (población) basándose en los datos de un conjunto pequeño (muestra).

Población

Muestra

ESTADISTICA

Las variables pueden ser de dos tipos:

Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).

Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales).

ESTADISTICA Las variables también se pueden clasificar

en: Variables unidimensionales: sólo recogen

información sobre una característica (por ejemplo: edad de los alunmos de una clase).

Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase).

Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase).

ESTADISTICA variables cuantitativas se pueden

clasificar en discretas y continuas: Discretas: sólo pueden tomar valores

enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45).

Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.

Moda

es el valor que se repite más dentro de un conjunto de

datos.

Mediana

es un valor del conjunto de datos que mide el elemento central: La mitad de los elementos se encuentran por arriba y la otra mitad por debajo de él.

Presentación de datos cuantitativos Indicar un valor central y uno de

variabilidad o dispersión. Cuando es razonable suponer que

los datos pueden seguir una distribución normal, se estimará la media y la desviación estándar.

Ejemplo: La media de la PAS fue de 139.2 ± 14.9 mmHg

0

10

20

30

40

50

60

70

80

90

1 2 3 4 5 6 7 8 9 10 11 12 13

ModaMedian

aMedia

Distribución Simétrica

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10 11 12 13

Moda

MedianaMedi

a

Distribución Sesgada a la Izquierda

Distribución Sesgada a la Derecha

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10 11 12 13

ModaMedian

aMedia

Distribución normal: distribución aproximada de valores

CUARTILES

Los cuartiles dividen en cuatro partes las observaciones. El primer cuartil Q1 es un valor que deje por debajo de él 25% de las y por encima 75% de las observaciones. El Q2 es la mediana (50%) y Q3 deja por debajo 75% y por encima 25% de las observaciones

ESTADISTICA Individuo: cualquier elemento que porte información sobre el

fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo.

Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeo que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.

Muestra: subconjunto que seleccionamos de la población. Así, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo.

ESTADISTICA

La distribución de frecuencia es la representación estructurada, en forma de tabla, de toda la información que se ha recogido sobre la variable que se estudia.

Gráficos

Son imágenes que, combinando la utilización de sombreado, colores, puntos, líneas, símbolos, números, texto y un sistema de referencia (coordenadas), permiten presentar información cuantitativa.

ESTADISTICA

representación gráfica de tronco y hoja. Esta representación se basa en la ordenación de los datos a manera de gráfico, pero sin llegar a ello, utilizando las decenas y las unidades.

Diagrama de tallo y hojas

1* 34456

2* 001235

3* 04999

4* 344457777789

5* 23434

6* 244667777

Gráficas

Sirven para: Organizar los datos Observar patrones Observar agrupamientos Observar relaciones Comparar distribuciones Visualizar rápidamente la distribución de los

datos Visualizar, obtener y comparar medidas

estadísticas

Gráficas

La calidad de un gráfico estadístico consiste en comunicar ideas complejas con precisión, claridad y eficiencia, de tal manera que:

• Induzca a pensar en el contenido más que en la apariencia

• No distorsione la información proporcionada por los datos

• Presente mucha información (números) en poco espacio

• Favorezca la comparación de diferentes grupos de datos o de relaciones entre los mismos (por ejemplo una secuencia temporal)

Diagrama de barras

Grafica de barras

05

10152025303540

Mes

Fre

cuen

cia

(variable discreta o categoría)

Histograma

Histograma

05

10152025303540

Clases

Fre

cuen

cia

de la

cla

se

(variable continua agrupada en clases o intervalos)

Diagrama de Pastel

Partes del todo

17%

22%

19%

13%

29%Opcion 1Opcion 2Opcion 3Opcion 4Opcion 5

Diagrama de puntos

Hombres = rojo Mujeres = amarillo

Media de los resultados del cuestionario de calidad de vida

Recomendaciones para un gráfico Si es estético, fomenta la lectura y

comprensión. Sencillez y claridad, el uso del color debe ser

moderado y bien elegido. Usar líneas finas, eliminar las superfluas Usar grid si es necesario Balance entre el espacio en blanco y datos Idealmente no hay que acudir al texto . Balance entre texto, tablas e imágenes, Combinar texto y tablas insertas

ESTADISTICA

EJERCICIOS .

Medidas de tendencia central

Otra forma de describir datos numéricos, las medidas de tendencia central, comúnmente conocidas como promedios. Estos promedios son la media aritmética, la mediana, y la moda.

La media aritmética La medida de tendencia central mas ampliamente usada es la media

aritmética, usualmente abreviada como media Propiedades de la media aritmética Puede ser calculada en distribuciones con escala relativa e intervalar. Todos los valores son incluidos en el cómputo de la media. Una serie de datos solo tiene una media. Es una medida muy útil para comparar dos o más poblaciones. Es la única medida de tendencia central donde la suma de las

desviaciones de cada valor respecto a la media es igual a cero. Por lo tanto podemos considerar a la media como el punto de balance de una serie de datos.

Desventajas de la media aritmética Si alguno de los valores es extremadamente grande o

extremadamente pequeño, la media no es el promedio apropiado para representar la serie de datos.

No se puede determinar si en una distribución de frecuencias hay intervalos de clase abiertos.

La media aritmética de una muestra de datos organizados en una distribución de frecuencias se calcula de la siguiente manera :X= ΣfX /n

_X simboliza la media de la muestraX es la marca de claseF es la frecuencia de clase f X es la suma de los productos de f por

X n es la suma de las frecuencias de clase

La mediana

Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeños, la media aritmética no es representativa. El valor central en tales problemas puede ser mejor descrito usando una medida de tendencia central llamada mediana.

Mediana. Es el punto medio de los valores de una serie de datos después de haber sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como posteriores en el arreglo de datos

Ejemplo:

El peso neto del contenido de cinco botellas de perfume Giorgio seleccionadas de forma aleatoria de la línea de producción son (en gramos): 85.4, 85.3, 84.9, 85.4, y 84.0. ¿Cuál es la mediana de las observaciones muestreadas?

85.4 85.4 85.3← mediana =X 84.9 84.0

Ejemplo:

Una muestra de los honorarios de paramédicos cargados por la clínica de salud reveló estas cantidades: $35, $29, $30, $25, $32, $35. ¿Cuál es la mediana?

25 29 30← mediana 32 35 35

Ejemplo:

En este caso la mediana se calcula obteniendo la media de las dos observaciones centrales

_ X =30 + 32/ 2 = 31

Propiedades de la mediana Hay solo una mediana en una serie de

datos. No es afectada por los valores extremos

( altos o bajos ) Puede ser calculada en distribuciones

de frecuencia con intervalos abiertos, si no se encuentra en el intervalo abierto.

Puede ser calculada en distribuciones con escala relativa, intervalar, y ordinal.

La Moda La moda es la medida de tendencia central

especialmente útil para describir mediciones de tipo ordinal y nominal.

La moda. Es el valor de la observación que aparece más frecuentemente.

Propiedades de la moda La moda se puede determinar en todos los

tipos de mediciones (nominal, ordinal, intervalar, y relativa).

La moda tiene la ventaja de no ser afectada por valores extremos.

Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.

Desventajas de la moda

En muchas series de datos no hay moda porque ningún valor aparece más de una vez.

En algunas series de datos hay más de una moda, en este caso uno podría preguntarse ¿cual es el valor representativo de la serie de datos?

Ejemplo El peso neto del contenido de cinco botellas de perfume

Giorgio seleccionadas de forma aleatoria de la línea de producción son (en gramos): 85.4, 85.3, 84.9, 85.4, y 84.0. ¿Cuál es la moda de las observaciones muestreadas?

Moda = 85.4

Muestra Se denomina muestra al subconjunto de ese universo y

del cual se recopilarán los datos. Es necesario que esa muestra sea debidamente representativa.

Por ejemplo, se quiere saber el número de hijos por matrimonio de una villa. Para este propósito, se elige una muestra representativa de 50  matrimonios de ella. Se obtienen los siguientes datos:

2 , 2 , 4 , 1 , 3 , 5 , 3 , 2 , 1 , 6 , 3 , 4 , 1 , 2 , 0 , 2 , 3 , 1 , 7 , 4 , 2 , 3 , 0 , 5 , 1 , 4 , 3 , 2 , 4 , 1 , 5 , 2 , 1 , 2 , 4 , 0 , 3 , 3 , 2 , 6 , 1 , 5 , 4 , 2 , 0 , 3 , 2 , 4 , 3 , 1 .

El número total de datos se representa con la letra n. En este ejemplo n   =   50 .

Frecuencia absoluta ( f i ) La frecuencia absoluta es el número

de veces que aparece un valor  ( x i )  en los datos obtenidos.

En nuestro ejemplo, la frecuencia absoluta indica el número de familias que tienen esa cantidad de hijos:

Tabla:

X i f i

0 4

1 9

2 12

3 10

4 8

5 4

6 2

7 1

GRAFICO :

GRAFICO

Frecuencia absoluta acumulada ( F i ) La frecuencia absoluta acumulada

indica cuantos elementos de la lista de datos son menores o iguales a un valor dado. Es la suma de las frecuencias absolutas desde la primera fila hasta la fila elegida.

Por ejemplo, sabemos que hay 25  matrimonios de la muestra que tienen a lo más 2  hijos.

Tabla:

X i f i F i

0 4 4

1 9 13

2 12 25

3 10 35

4 8 43

5 4 47

6 2 49

7 1 50

Grafico :

Frecuencia relativa ( h i ) La frecuencia relativa es el

cociente entre la frecuencia absoluta ( f i )  y el número total de datos ( n ). En nuestro ejemplo:

Tabla :

X i f i F i h i

0 4 4 0.08

1 9 13 0.18

2 12 25 0.24

3 10 35 0.20

4 8 43 0.16

5 4 47 0.08

6 2 49 0.04

7 1 50 0.02

Frecuencia relativa acumulada ( H i )

La frecuencia relativa acumulada es el cociente entre la frecuencia absoluta acumulada ( F i )  y el número total de datos ( n ).

Tabla :

X i f i F i h i H i

0 4 4 0.08 0.08

1 9 13 0.18 0.26

2 12 25 0.24 0.50

3 10 35 0.20 0.70

4 8 43 0.16 0.86

5 4 47 0.08 0.94

6 2 49 0.04 0.98

7 1 50 0.02 1.00

Frecuencia porcentual ( f i % ) La frecuencia porcentual es la

frecuencia relativa ( h i ) expresada en forma porcentual. En otras palabras, es la frecuencia relativa ( h i )multiplicada por 100.

X i f i F i h i H i h i %

0 4 4 0.08 0.08 8 %1 9 13 0.18 0.26 18 %2 12 25 0.24 0.50 24 %3 10 35 0.20 0.70 20 %4 8 43 0.16 0.86 16 %5 4 47 0.08 0.94 8 %6 2 49 0.04 0.98 4 %7 1 50 0.02 100 2 %

Frecuencia porcentual acumulada ( F i % )

La frecuencia porcentual acumulada es la frecuencia relativa acumulada ( H i )  multiplicada por 100.

2.- Se aplicó una encuesta donde se les pide indicar el número de amigos o parientes que visitan cuando menos una vez al mes. Los resultados son los siguientes:

3 5 2 3 3 4 1 8 4

2 4 2 5 3 3 3 0 3

5 6 4 3 2 2 6 3 5

4 14 3 5 6 3 4 2 4

9 4 1 4 2 4 3 5 0

4 3 5 7 3 5 6 2 2

a)   Haga una distribución de frecuencias, de frecuencia acumulada, de frecuencia relativa y de frecuencia relativa acumulada.

DISTRIBUCION DE FRECUENCIAS

Para agrupar un conjunto de observaciones se debe seleccionar un conjunto de intervalos contiguos ,para que cada valor en el conjunto de observaciones pueda ser puesto en uno y solo uno de los intervalos.

Estos intervalos se conocen como intervalos de clase.

Intervalo de clase

Deben ser de 6 a 15 intervalos . K=1+3.322(log10 n ) K=el num. De intervalos de clase N=el num. De valores de observación Ejemplo:de 275 observaciones

(frecuencias )el Log10 de 275 es 2.4393 K=1+3.322(2.4393)=9.

Rango

Es la diferencia entre la observación mas pequeña y la mas grande dentro del conjunto de datos.

W= R / k

Los siguientes datos representan la duración de la vida, en segundos, de 50 moscas

sometidas a un nuevo atomizador en un experimento de laboratorio controlado 17

20 10 9 23 13 12 19 18 24

12 14 6 9 13 6 7 10 13 7

16 18 8 13 3 32 9 7 10 11

13 7 18 7 10 4 27 19 16 8

7 10 5 14 15 10 9 6 7 15

a)   Haga una distribución de frecuencia, de frecuencia acumulada, de frecuencia relativa y de frecuencia relativa acumulada, represente gráficamente cada una de ellas. b)   Calcule la media aritmética. la mediana, y la moda.

El gerente local de OXXO esta interesado en el número de veces que un cliente compra en su tienda durante un periodo de dos semanas. Las respuestas de los 51 clientes fueron:

5 3 3 1 4 4 5 6 4 2 6 6 6 7 1 1 14

1 2 4 4 4 5 6 3 5 3 4 5 6 8 4 7 6

5 9 11 3 12 4 7 6 5 15 1 1 10 8 9 2 12

a)   Haga una distribución de frecuencia, de frecuencia acumulada, de frecuencia relativa y de frecuencia relativa acumulada, represente gráficamente cada una de ellas. b)   Calcule la media aritmética. la mediana, y la moda.