Codificación y Análisis

24
Estadística Descriptiva Con Software Esp. Guillermo Augusto Narváez Burbano Codificación y Análisis de Datos Cuantitativos con Software Estadístico

Transcript of Codificación y Análisis

Page 1: Codificación y Análisis

Estadística Descriptiva Con Software

Esp. Guillermo Augusto Narváez Burbano

Codificación y Análisis

de Datos Cuantitativos

con Software Estadístico

Page 2: Codificación y Análisis

Reforzar Conocimientos Estadísticos Fundamentales.

Explorar los datos obtenidos en una recolección de

información.

Obtener las medidas estadísticas para el análisis

descriptivo de las variables con el uso del software

estadístico.

Visualizar y analizar descriptivamente los datos por

variable.

Page 3: Codificación y Análisis

Análisis de

Datos

Cuantitativos

Software Estadísticos

SPSS

MiniTab

SAS

STATS

MS Excel

Calc

Page 4: Codificación y Análisis

Análisis de

Datos

Cuantitativos

InferencialDescriptiva

Análisis Paramétrico

Análisis no Paramétrico

Análisis Multivariados

Distribución de Frecuencias

Medidas de Tendencia Central

• Media

• Mediana

• Moda

Medidas de Variabilidad

• Rango

• Desviación Estándar

• Varianza

Gráficas

Page 5: Codificación y Análisis

Variable: Es lo que se va a medir y representa una

característica de la unidad de análisis.

Unidad de Análisis: Quienes van a ser medidos, los sujetos u

objetos de análisis de una población o una muestra.

Codificar datos: Es asignar números a las modalidades

observadas o registradas de las variables que constituyen la

base de datos, así como asignar código (valor numérico) a

los valores faltantes (aquellos que no han sido registrados u

observados).

Población: Es el total de unidades de análisis que son tema

de estudio.

Muestra: Es un conjunto de unidades de análisis

provenientes de una población.

Page 6: Codificación y Análisis

Variables Cuantitativas: Aquellas que indican

características medibles o contables.

Discretas: Toman valores enteros y en la mayoría

de los casos pueden ser situadas dentro de un

rango. Ej: Número de elementos vendidos, número

de hijos, número de animales en una granja.

Continuas: Toman valores en números reales,

pudiendo así tener infinitos y diferentes valores

dependiendo de la precisión de una medida. Ej:

Peso, Estatura, Temperatura, Velocidad.

Page 7: Codificación y Análisis

Variables Cualitativas: aquellas que indican una

cualidad o sea una característica no medible o

contable. Existen 2 tipos de variables cualitativas:

Nominal: Característica o cualidad cuyas

categorías no tienen un orden preestablecido.

Ejemplo: Sexo, deporte favorito, nacionalidad,

religión, etc.

Ordinal: Característica o cualidad cuyas

categorías tienen un orden preestablecido.

Ejemplo: Calificaciones, grado de interés en un

tema, estrato social, nivel académico, etc.

Page 8: Codificación y Análisis

Microsoft Excel es una aplicación para hojas de cálculo.

Este programa de Microsoft es utilizado normalmente en

tareas financieras, contables y estadísticas.

Excel cuenta con un paquete funciones estadísticas que

permiten un ágil y efectivo análisis estadístico. Dichas

funciones se encuentran en la pestaña Fórmulas,

generalmente en el botón Más Funciones:

Búsqueda de Ayuda Para Microsoft Office:

https://support.office.com/

Page 9: Codificación y Análisis

Estadística Descriptiva Para Cada Variable

Medidas de Tendencia Central:

Son las que tratan de dar un valor central en torno al cual se

distribuyen los datos.

Es el valor de la variable que deja por encima y por debajo el

mismo número de datos, es decir, es el valor central de la

variable. Esto es, la mitad los casos caen por debajo de la

mediana y la otra mitad se ubican por encima. Si numero de

datos es impar, mediana es el dato que esta en la mitad, si es

par es la media de los dos datos de la mitad.

Función MEDIANA de MS Excel:

https://support.office.com/es-es/article/MEDIANA-

funci%C3%B3n-ea66592d-8df3-4e66-945c-

75740408ddf0?ui=es-ES&rs=es-ES&ad=ES

Page 10: Codificación y Análisis

Estadística Descriptiva Para Cada Variable

Medidas de Tendencia Central:

Es el valor de la variable con que se repite con mayor

frecuencia. Para calcularla se puede utilizar la formula y para

confirmar el resultado basta con observar la columna de

frecuencias absolutas en la tabla de frecuencias.

Si se cuenta con muchos datos suele ser difícil encontrar la

categoría con mayor frecuencia, para agilizar el trabajo en

esos casos utilizando MS Excel puede ordenar la columna en

forma ascendente o descendente para localizar el dato mayor,

utilizar la función estadística MAX, o utilizar la función MODA.

Función MODA de MS Excel:https://support.office.com/es-es/article/MODA-funci%C3%B3n-MODA-

e45192ce-9122-4980-82ed-4bdc34973120?CorrelationId=0be7fe08-

ca2f-47ef-9e6e-99deb68f1fac&ui=es-ES&rs=es-ES&ad=ES

Page 11: Codificación y Análisis

Estadística Descriptiva Para Cada Variable

Medidas de Tendencia Central:

Es la medida de centralización más conocida, es muy

sensible para valores extremos, por lo que no siempre es la

mejor medida de centralización. Se calcula así:

X = Σ Xi / N

Media = Sumatoria de Valores / Cantidad de

Valores

_

Obtener Promedio con MS Excel:

http://office.microsoft.com/es-es/excel-help/funcion-promedio-

HP010062482.aspx?CTT=5&origin=HP010079190

Page 12: Codificación y Análisis

Estadística Descriptiva Para Cada Variable

Medidas de Variabilidad:

Indican la dispersión de los datos y así nos dan una idea de

en que medida los datos están más o menos juntos

(concentrados) o más o menos dispersos, y cual es la

fiabilidad de las medidas de centralización.

R = Xmax – Xmin

Rango = Valor mayor – Valor menor

También llamado recorrido, es la diferencia entre el mayor y

el menor de los datos de una variable. Cuanto mas grande

sea el rango, mayor será la dispersión de datos.

Page 13: Codificación y Análisis

Estadística Descriptiva Para Cada Variable

Medidas de Variabilidad:

Medida del grado de dispersión de datos respecto al promedio.

Más claramente, es una medida de dispersión que nos dice

cuánto tienden a alejarse los valores del promedio en una

distribución. Específicamente, el cuadrado de la desviación

estándar es "el promedio del cuadrado de la distancia de cada

punto respecto del promedio". Se suele representar por una

“S” o con la letra sigma “σ”.

Desviación Estándar

Desviación Estándar con

Frecuencias para Datos

Agrupados

Page 14: Codificación y Análisis

Estadística Descriptiva Para Cada Variable

Medidas de Variabilidad:

Medida de dispersión definida como la media aritmética de los

cuadrados de las desviaciones respecto de la media. En un

sentido práctico la Varianza es la Desviación Estándar al

cuadrado, o la Desviación Estándar es la raíz cuadrada de la

Varianza. Se representa con “S²” o “σ²”

S² =

Varianza = (Desviación Estandar)²

Desviación Estandar = √(Varianza)

Page 15: Codificación y Análisis

Estadística Descriptiva Para Cada Variable

Medidas de Variabilidad:

Proceso de Obtención de la Varianza y la Desviación Estándar

con MS Excel:

https://www.youtube.com/watch?v=CdrhTnzGk9o

https://www.youtube.com/watch?v=Z0sMwLCyzM0

Formulas de la Varianza y la Desviación Estándar en MS Excel:https://support.office.com/es-ES/article/DESVESTA-funci%C3%B3n-DESVESTA-

5ff38888-7ea5-48de-9a6d-11ed73b29e9d?CorrelationId=ede77c53-b8c5-4a38-

a31e-0100a3dddce3&ui=es-ES&rs=es-ES&ad=ES

https://support.office.com/es-es/article/VARS-funci%C3%B3n-VARS-913633DE-

136B-449D-813E-65A00B2B990B?ui=es-ES&rs=es-ES&ad=ES

Page 16: Codificación y Análisis

Es el conjunto de puntuaciones ordenadas por categorías o

intervalos que representan cuantas veces se repite un

resultado o valor en los datos.

Generalmente se presenta en una tabla de frecuencias y

contiene los siguientes elementos:

Frecuencia Absoluta (f): Número de veces que se repite un valor.

Frecuencia Absoluta Acumulada (F): Suma de todas las frecuencias

absolutas de todos los valores anteriores al presente, más la

frecuencia absoluta presente.

Frecuencia Relativa (fr): Cociente entre la frecuencia absoluta y el

número total de valores, N.

Porcentaje de Frecuencia (f%): Porcentaje que representa una

frecuencia, se obtiene multiplicando la frecuencia relativa por 100.

Porcentaje Acumulado (F%): Suma de todos los porcentajes de

frecuencias anteriores al presente, más el porcentaje de frecuencia

presente.

Estadística Descriptiva Para Cada Variable

Page 17: Codificación y Análisis

Estadística Descriptiva Para Cada Variable

xi fi Fi fr = if

n fri% Fr= F

n Fr %

1 2 2 0,1538 15,38 0,1538 15,38

2 4 6 0,3077 30,77 0,4615 46,15

3 1 7 0,0769 7,69 0,5385 53,85

4 3 10 0,2308 23,08 0,7692 76,92

5 2 12 0,1538 15,38 0,9231 92,30

6 1 13 0,0769 7,69 1,0000 100,00

Totales 13 1,000 100,00

Cómo Construir Una Tabla de Datos Y Una De Frecuencias

Con Excel:

https://www.youtube.com/watch?v=bH6S0Z_0Z9o

https://www.youtube.com/watch?v=Q7TKChYclfk

Obtener la Frecuencia en Excel:https://support.office.com/es-es/article/FRECUENCIA-funci%C3%B3n-FRECUENCIA-

44e3be2b-eca0-42cd-a3f7-fd9ea898fdb9?CorrelationId=830d713f-91c6-4ace-b4c5-

2bf5e49a9636&ui=es-ES&rs=es-ES&ad=ES

Page 18: Codificación y Análisis

Estadística Descriptiva Para Cada Variable

Las herramientas de análisis, también conocidas como Analysis

Toolpak, son un complemento de Excel que agrega funciones

adicionales al programa y que ayudan en el análisis financiero,

estadístico y de ingeniería.

Dado que por defecto se

encuentran desactivadas, para

activar estas herramientas de

MS Excel haga clic en la pestaña

Archivo y posteriormente en

Opciones.

Page 19: Codificación y Análisis

Estadística Descriptiva Para Cada Variable

Se mostrará el cuadro de diálogo de Opciones donde deberá

hacer clic en Complementos. Dentro de la lista desplegable se

deberá seleccionar la opción Complementos de Excel y hacer

clic en el botón Ir.

Page 20: Codificación y Análisis

Estadística Descriptiva Para Cada Variable

Se mostrará el cuadro de diálogo

Complementos y deberás marcar la caja

de selección identificada

como Herramientas para análisis y hacer

clic en el botón Aceptar.

Page 21: Codificación y Análisis

Estadística Descriptiva Para Cada Variable

Para comprobar que el complemento se ha activado

correctamente debes ir a la ficha Datos y verificar que se haya

agregado un nuevo grupo llamado Análisis el cual tendrá el

comando Análisis de datos.

El primer paso para utilizar estas herramientas es pulsar el

botón Análisis de datos de la ficha Datos

Page 22: Codificación y Análisis

Estadística Descriptiva Para Cada Variable

Una vez pulsado el botón Análisis de datos de la ficha Datos

seleccione la opción Estadística Descriptiva. Al pulsar el botón

Aceptar se mostrará un nuevo cuadro de diálogo que nos

permitirá hacer las configuraciones necesarias para obtener los

datos estadísticos de nuestra información.

Page 23: Codificación y Análisis

Estadística Descriptiva Para Cada Variable

Rango de entrada: La columna que contiene los

datos.

Rótulos en la primera columna: Se debe marcar

si dentro del rango de entrada está incluida la

celda que contiene el título de la columna.

Opciones de salida. Puede elegir un rango

dentro de la misma hoja donde se colocarán

los resultados, que los resultados se coloquen

en una hoja nueva o en un libro nuevo.

Resumen de estadísticas. Es necesario que esta

opción esté seleccionada para obtener los

datos estadísticos que necesitamos.

Una vez configurado el cuadro de diálogo

Estadística descriptiva pulsa el botón Aceptar

para ver los resultados.

Page 24: Codificación y Análisis

HERNANDEZ, Roberto, FERNANDEZ, Carlos, BAPTISTA, Pilar.

Metodología de la Investigación. Perú: McGraw Hill, 2010. 613p.

ISBN 978-607-15-0291-9.

Soporte Técnico De Office. Microsoft Excel [En Línea].

<https://support.office.com/es-es> [Citado Marzo 19 de 2015].