Estadistica Univariada
-
Upload
unicauca -
Category
Technology
-
view
6.195 -
download
2
Transcript of Estadistica Univariada
ESTADÍSTICA
SANDRA JIMENA JÁCOME VELASCOFisioterapeuta
Esp. Docencia universitariaEsp. Epidemiología general
Candidato Mg. Educación [email protected]
QUE ES ESTADÍSTICA
La estadística es un método científico de operar con los datos e interpretarlos.
Arte de decisión frente a una incertidumbre
AREAS DE APLICACIÓN
Es aplicable a cualquier campo en el cual se hacen observaciones
Gobierno: economía, inventarios, censos
Salud
Seguros
Juegos del azar
Comercio
Industria
Educación
TIPOS DE ESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA O DEDUCTIVA: Método para obtener conclusiones de un conjunto de datos tomados de un colectivo o de una muestra, sin generalizarlos al colectivo
ESTADÍSTICA INFERENCIAL O INDUCTIVA O INFERENCIA ESTADÍSTICA: Método y conjunto de técnicas que buscan obtener información sobre un colectivo mediante un procedimiento metódico de los datos tomados de una muestra perteneciente al colectivo
CONCEPTOS CLAVES
Población o universo o colectivo: conjunto de elementos, medidas, individuos u objetos que tienen una característica común
Parámetro: medida que describe una población
Estadística: medida que describe una muestra
Datos: medidas, valores o características susceptibles de ser observados y contados
Variables
VARIABLES
Característica que puede tener diferentes valores en los distintos elementos o individuos de un conjunto. Se clasifican según
TIPO: Cuantitativa o cualitativa
CLASE: Discreta o continua
ESCALA: Nominal, Ordinal, De intervalo, de razón
UNIDAD 1: DISTRIBUCIONES DE
FRECUENCIA
DISTRIBUCIONES DE FRECUENCIA
Definición
Elementos para la construcción de tablas de frecuencia
Elaboración de tablas de frecuencia
Graficas de la distribución de frecuencia
Histogramas
Definición: distribución de frecuencia
Representación estructurada en forma de tabla, de toda la información que se ha recogido sobre la variable que se estudia
Elementos Para La Construcción De Tablas De Frecuencia
X= valores que puede tomar una variable
n= número de veces que se repite cada valor
F= % porcentaje que la repetición da cada valor supone sobre el total
Elaboración de tablas de Frecuencia
Variable(valor)
Frecuencia absoluta
Frecuencia relativa
simple acumulada simple acumulada
X1 n1 n1 f1=n1/n f1
X2 n2 n1+n2 f2=n2/n f1+f2
total n Sumatoria n (Σn)
100 Sumatoria f (Σf)
Ejemplo: medida de altura de grupo de niños
Estudiante estatura Estudiante estatura Estudiante Estatura
Pedro 1,25 Erica 1,23 Esteban 1,21
Juan 1,28 Lorena 1,26 Jaime 1,29
Martha 1,27 Patricia 1,30 Amparo 1,26
Lucy 1,21 Jimena 1,21 Camilo 1,22
Eduardo 1,22 Olga 1,28 Manuel 1,28
Pablo 1,29 Rosa 1,30 Esther 1,27
Santiago 1,30 Rodrigo 1,22 Mariela 1,26
David 1,24 Alejando 1,25 Mauricio 1,23
Jose 1,27 Miguel 1,20 Jairo 1,22
Stella 1,29 Edith 1,28 Orlando 1,21
Al construir una tabla de frec. De la anterior variable quedaría
Variable(valor)2
Frecuencia absoluta
Frecuencia relativa
Simple Acumulada Simple Acumulada
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40%
1,25 2 14 6,6% 46,6%
1,26 3 17 10% 56,6%
1,27 3 20 10% 66,6%
1,28 4 24 13,3% 80%
1,29 3 27 10% 90%
1,30 3 30 10% 100%
Total 30 30 100% 100%
Graficas de la distribución de frecuencia
El objetivo de los gráficos es facilitar la lectura e interpretación de los resultados de una variable.
Se elaboran según el tipo de variable y la población a la cual va dirigida
Loa tipos de gráficos mas frecuencia utilizados son: gráficos de línea, gráficos de barra, pictogramas, tortas o diagramas de pastel o circulares e histogramas.
Ejemplos de gráficos
0102030405060708090
1er trim. 2dotrim.
3er trim.4to trim.
Este
Oeste
Norte
0
50
100
1ertrim.
2dotrim.
3ertrim.
4totrim.
casos dediarrea
1er trim.
2do trim.3er trim.
4to trim.
0
5
10
15
20
25
30
35
40
45
1,22
1,23
1,24
G. De barras
Histograma
G. De Circular, pastel, tortaG. De línea
Pictograma
Vivienda por ciudades en 2007 =1000000
Bogotá
PopayánCali
Uso – elección tipo de gráfico
*Los pictogramas son gráficos de dibujos utilizados para comparaciones que impacten visualmente, llamando la atención del público en general
G. circulares: para distribuciones porcentuales, con variables cuyos valores asignados (posibles respuestas) no superan cuatro opciones (Ej: M-F, Alto-medio-bajo)
G. de barra: para presentar valores de variables cualitativas o cuantitativas discretas con valores asignados de tres o mas posibilidades (Ej: estrato 1, 2, 3, ,4, 5, 6)
Histogramas: para presentar valores de variables cuantitativas continuas con valores asignados de dos o mas posibilidades (Ej: talla, peso)
G. de línea: para presentar series de datos acumulativos (Ej ventas, producción) o datos instantáneos (Ej: tº, inventarios)
UNIDAD 2: MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE TENDENCIA CENTRAL
También llamadas medidas de posición central. Permiten conocer algunas características de una serie de datos.La tendencia central se refiere al punto medio de una distribución Son: La media aritmética, la mediana, la moda, media geométrica y media armónica
La Media Aritmética
También conocida como promedio XEquivale a la suma de sus valores dividido por su númeroN=número de observacionesX=valor de cada observaciónX=media aritmética, media o X barra
X=ΣX
N
Ventajas y desventajas de la media
Es la medida de tendencia central mas estable, fluctúa menos que la moda o la mediana
Es útil para establecer comparaciones entre los grupos, aunque en algunas ocasiones no es la mas indicada
Media geométrica
Es la raíz índice N del producto de N términosMd geométrica = N X1X2…XNEs útil en el cálculo de tasas de crecimiento.Ej: 2,4,6,12,18 Mdgeométrica= 5 (2)(4)(6)(12)(18) =
Media armónica HEs el recíproco de la media aritmética, de los recíprocos de los números de la serie 1 + 1 ……1 1 = X1 X2 Xn H NEj. Un Fisioterapeuta recupera un paciente en 6 días y otro en 8 días. El rendimiento representativo del rendimiento de los dos Ft. Es 1 + 11 = 6 8 = 1= 7 = H 2 H 48
La mediana (Md o Mdn)Valor que divide una distribución de datos ordenados en dos mitades, deja por arriba un número de términos igual al que deja por debajo Es el término del medio del conjunto de datos. Punto de un escala numérica por arriba y por abajo del cual se encuentran el 50% de los datos. No toma en cuenta los valores cuantitativos de los puntajes individuales, ni se ve afectada por los valores extremosMd=N+1 2
Cálculo de mediana a partir de datos no agrupados: en primer lugar es necesario organizarlos ya sea de manera ascendente o descendente. Si el conjunto de datos contiene un número par de elementos, el de en medio es la mediana. Si hay un número par de observaciones la mediana es el promedio de los dos elementos de en medio
Ej: 7,8,8,10,12,19,23 Med=10
3,4,4,5,16,19,25,30 Med= (5+16)/2 =
Ventajas y desventajas de la mediana
Los valores extremos no afectan a la mediana tan intensamente como a la media
La mediana es fácil de entender y se pude calcular partir de cualquier tipo de datos, incluso para valores cualitativos.
Es necesario organizar los datos previamente, lo que implica consumo de tiempo
Moda
Valor numérico mas frecuente en una distribución. Es la mas sencilla de las medidas de tendencia central, no se calcula, se determina mediante una inspección de una distribución de frecuencias
Ventajas y desventajas de la moda
Es rápido y sencillo de obtener
Es inestable, tiende a fluctuar ampliamente de una muestra a otra aunque provenga de la misma población
Se utiliza poco, excepto para la descripción de valores típicos en mediciones de escala nominal
Curva de un distribución de frecuencias y las medidas de tendencia central
Media
MedianaMediana
Moda
Punto de equilibrio. Semejante a un centro de gravedadDivide el área bajo la curva en dos partes igualesEs el pico de la curva o mayor ordenada
Simetría
En una distribución simétrica las tres medidas de tendencia central son idénticas. Si la distribución se torna asimétrica, la moda sigue igual, pero la mediana y la media se corren en dirección de la asimetría.La asimetría es positiva hacia la derecha y negativa hacia la izquierda
En la asimetría positiva, la mediana aumenta por el mayor número de frecuencias hacia la derecha, y la media aumenta mas
En las asimetrías negativas ocurre lo contrario
S
UNIDAD 3: MEDIDAS DE DISPERSIÓN
DEFINICIÓN
Información que permite apreciar la dispersión de los valores alrededor de las medidas de tendencia central
Grado en que los resultados se desvían uno de otro
CUALES SON
RANGO
CUARTIL
DECIL
DESVIACIÓN MEDIA
VARIANZA
DESVIACIÓN TÍPICA O ESTÁNDAR
RANGO
Diferencia entre los límites superior e inferior
Es la medida de dispersión mas fácil de obtener, pero es poco utilizada, debido a que es muy influenciable por la presencia de valores extremos de poca frecuencia, lo que lleva a operaciones erróneas
Sólo toma dos valores por lo que es una medida bastante inestable
CUARTILES
Sirven para conocer los intervalos dentro de los cuales quedan proporcionalmente distribuidos los términos de una distribución
Al dividir la distribución de frecuencias en 4 partes iguales, cada una contendrá el mismo número de observaciones (25% del total)
Un cuartil es el punto de separación de los valores
El primer cuartil corresponde al 25% (Q1)
El segundo cuartil (Q2) coincide con la mediana y corresponde al 50% de los valores
El tercer cuartil (Q3) separa el 75% de las observaciones que quedan debajo de el
DECILES
En vez de dividir la distribución en 4 partes iguales, se divide en 10 partes iguales, se tienen 9 puntos de división
El primer decil corresponde al valor por debajo del cual está el 10% de las observaciones y así sucesivamente
Desviación media
Es la media aritmética de los valores absolutos de las desviaciones de las variables respecto a la media aritméticaDM=Sumatoria X-X NEs una medida bastante objetiva, cuanto mayor sea
su valor mayor es la dispersión de los datos, pero no proporciona una relación matemática precisa entre su magnitud y la posición de un dato dentro de la distribución
Permite comparar varios resultados
Ej: desviación promedio de disparos en el tiro al blanco de un jugador respecto a otro
No toma los signos negativos
Varianza
S² es la media aritmética de los cuadrados de las desviaciones respecto a la media aritmética
S²= Sumatoria (X-X) ²
N
Al elevarla al cuadrado se omiten los valores negativos de los datos, pero mide la dispersión en el valor al cuadrado
Ej si es centímetros, mide en centímetros cuadrados
Desviación típica o estándar
Es la más importante de todas las medidas de dispersión
Conociendo la desviación estándar es posible ubicar la posición de una observación respecto a una serie de observaciones
Resume la magnitud promedio en que los valores individuales se desvían de la media
La desviación estándar o típica es la raíz cuadrada de la varianza
S= √ S²
ESTADISTICA DESCRIPTIVA EN
SPSS
Generalidades
Recuerda que el SPSS (Stadistical pack for social sciences) para windows es un programa de computador que se utiliza para realizar una gran variedad de análisis estadísticos, así como gráficos y tablas
Creando la base de datos
En la pantalla que ves a continuación, encontrarás en la esquina inferior izquierda dos pestañas, una que dice vista de variables y otra vista de datos.
Elige la vista de variables, para comenzar a crear la estructura de la base de datos
Como observaste en la dispositiva anterior, ya se creo una base de datos. Revisemos los pasos: Columna
1. Nombre: escribe un nombre como lo recuerdes. Máximo 8 caracteres
2. Tipo: Elije la pestaña de clasificación de variable según su naturaleza o tipo. Las variables numéricas equivalen a las cuantitativas y las de cadena equivalen a las cualitativas
Si elegiste una variable numérica escribe el número de anchura (Números enteros) que requieras y el número de decimales que posean tus datos a registrar. Recuerda que el número de anchura siempre debe ser mayor que el número de decimalesSi elegiste una variable de cadena escribe el número de caracteres (Números de letras que posee) que posean tus datos a registrar.
Automáticamente te aparecerán llenas las dos columnas siguientes
3. Etiqueta: Escribe aquí el nombre con el cual quieres que te salgan los título de las variables en los resultados. Puedes escribir como desees, es decir mayúscula sostenida, inicial, minúscula, caracteres especiales, etc…
4 Valores: En ésta columna se abre una ventana donde escribes los valores de la variable, si los tiene. Ej: la variable sexo o género se puede codificar con el número 1 (Masculino) y el 2 (Femenino). Entonces en la ventana de valor escribes el número 1 y en etiqueta de valor escribes masculino, añadir. Así realizas con los demás valores y cuando finalices le das la orden aceptar
5 Perdidos: Aquí determinas aquellos valores que vas a llamar perdidos según los valores asignados. Ej: en la variable “vida” las etiquetas de valor indican que los números o códigos o, 8 y 9 equivalen a 0 No procede8 No sabe9 No respondeLos cuales se tomarán como valores perdidos del sistema y se señalan en perdidos
6 y 7 Columnas y alineación: éstas dos columnas se utilizan para definir el número de columnas y hacia donde quieres que se alineen los datos
8 Medida: esta columna permite seleccionar la escala en que se clasifica la variable, la cual en el programa SPSS puede ser
Escala: de intervalo y de razón
Ordinal: ordinal
Nominal: nominal
!LISTA LA ESTRUCTURA DE LA BASE DE DATOS¡
Ahora pasa a la pestaña vista de datos ubicada en la esquina inferior izquierda y empieza a digitar los datos
ESTADÍSTICA DESCRIPTIVA
Recuerda lo revisado en clase sobre medidas de tendencia central, medidas de dispersión y gráficosDecide la variable a analizar, recuerda guiarte por tu cuadro de clasificación de variables y según la naturaleza o tipo y medida, elije los procedimientos estadísticos a realizar
Pasos
Elije la opción “Analizar” ubicada en la barra superior de la pantalla
Elije la opción “Estadísticos descriptivos”
Elije la opción Frecuencias
Aparecerá una nueva ventana llamada “Frecuencias” y en la parte izquierda aparece el listado de variables a los cuales les puedes aplicar los procedimientos estadísticos predeterminados.
Elije la variable a trabajar, selecciónala con el ratón y pásala con la fecha a la ventana derecha
Selecciona la opción “mostrar tablas de frecuencia”
Selecciona la pestaña “Estadísticos”
Aparecerá una nueva ventana donde te ofrece las opciones de estadísticos que según el tipo y medida de variable el programa te permite realizar
Selecciona la o las opciones deseadas y finalizas con la opción “Continuar”
Selecciona la pestaña “Gráficos” si deseas que éstos aparezcan en los resultados
Aparecerá una nueva ventana donde te ofrecen tres opciones de gráficos mas utilizados
Selecciona el tipo de gráfico mas adecuado según el tipo de variable
Si elijes gráficos de barras o de sectores (Tortas) se activará la opción valores del gráfico, elije preferiblemente porcentajes, recuerda que es lo que puedes comparar
Si elijes la opción histogramas se activará la opción “Con curva normal”. Esta opción se revisará en clases posteriores
Finaliza con la opción “Continuar”
Aparecerá una nueva pantalla con los resultados de los procesos solicitados anteriormente
Esta nueva pantalla aparece con el nombre visor de SPSS y la extensión SPO
Puedes utilizar igualmente la opción “Analizar”, “Estadísticos descriptivos”, “Descriptivos” para aquellas variables numéricas
Igualmente aparecerá una nueva ventana donde encuentras las variables numéricas, selecciona la variable a analizar y la pestaña “opciones”
En la nueva ventana elije las medidas estadísticas que necesites y oprimes “Continuar”
Aparecerá una nueva pantalla con los resultados: visor de SPSS con extensión SPO
Otra forma de trabajar estadística descriptiva con SPSS, es cruzando dos variables para identificar como se distribuyen en un mismo análisis, sin establecer relación entre éstas
Un ejemplo es identificar como es la distribución de la edad de una población según el género
Elije la opción “Analizar”, “Estadísticos descriptivos”, “tablas de contingencia”
Aparecerá una nueva ventana donde te aparecen las variables en el lado izquierdo y en el lado derecho aparece las opciones “filas” y abajo “columnas”
Selecciona en “Filas” aquella variable que sea independiente
Selecciona en “Columnas” aquellas variables que sean dependientes
Selecciona la opción “Mostrar los gráficos de barra agrupadas”Selecciona la pestaña “casillas”Elije la opción “Frecuencias”: observadas“Porcentaje”: filas o columnas y total (si quieres determinar los porcentajes en filas y/o columnas y totales)Selecciona la pestaña “continuar”Selecciona la pestaña “Aceptar”Nuevamente aparecerá la pantalla de resultados en el visor de SPSS con extensión SPO
Guardalo…
Puedes guardarlo con el nombre que desees
Elije la pestaña superior izquierda: “Archivo”, “Guardar como” y le asignas el nombre y ubicación deseado
También puedes seleccionar con el botón izquierdo del ratón una tabla o gráfico y con el botón derecho le dices “copiar” y luego lo pegas en word o donde quieras
Recuerda que previo a guardarlo en Word, debes realizar los cambios de forma, color, trama, entre otros, de los gráficos, dándole doble clic sobre el gráfico, aparecerán varias opciones de cambio, elije y modifica como mas te guste y se adapte a las necesidades
FINALIZASTE LOS CONCEPTOS BÁSICOS DE ESTADÍOSTICA
UNIVARIADA
BIBLIOGRAFÍA
PORTUS Govinden, Lincoyán. Curso práctico de estadística. Ed. McGraw Hill. Colombia, 1991
MILTON, J. Susan. Estadística para bilogía y ciencias de la salud. Ed. McGraw Hill 3.ed. España, 2001
MENDEZ, Ignacio y cols. El protocolo de investigación. México, 1991
MANUAL DE SPSS PARA WINDOWS