Resumen estadistica descriptiva resumen

10

Click here to load reader

Transcript of Resumen estadistica descriptiva resumen

Page 1: Resumen estadistica descriptiva resumen

Estadística descriptiva

La estadística descriptiva es una gran parte de la estadística que se dedica a

recolectar, ordenar, analizar y representar un conjunto de datos, con el fin de

describir apropiadamente las características de ese conjunto. Este análisis es muy

básico. Aunque hay tendencia a generalizar a toda la población, las primeras

conclusiones obtenidas tras un análisis descriptivo, es un estudio calculando una

serie de medidas de tendencia central, para ver en qué medida los datos se

agrupan o dispersan en torno a un valor central. Esto es lo que podria ser un

concepto aproximado.

Estadística y Los Conceptos.

La Estadística es la ciencia que se encarga de recolectar datos de una población

o muestra. Los conceptos estadísticos se han trabajado intuitivamente desde la

antigüedad, las primeras culturas recopilaban datos poblacionales por medio de

censos como los realizados Egipto y por Moisés (según consta la Biblia) y el

empadronamiento que fue efectuado por los romanos en Judea, solo a partir del

siglo pasado Adolfo Qutelec (1796-1874) creo diferentes métodos para realizar

observaciones con el fin de determinar el tipo de datos que regulan algunos

fenómenos.

Lista de conceptos básicos en orden cronológico de estudio

La siguiente lista en orden cronológico para su estudio, recopila conceptos

básicos con los que, todo aquel que se pretenda iniciar en las

técnicas Estadísticas, debería estar familiarizado.

Probabilidad

Definición de

Estadística

Definición de

Descriptiva

Población

Estadístico

Frecuencia

Estadística

Media

Mediana

Desviación

estándar

Varianza

Varianza con

probabilidad

Moda

Tabla de

frecuencias

Análisis de

frecuencia

acumulada

Histograma

Estadística

Inferencia

Encuesta

Error estadístico

Variable

aleatoria

Variable

estadística

Análisis de series

temporales

Page 2: Resumen estadistica descriptiva resumen

Censo

Combinatoria

Diseño

experimental

Distribución

bionomíal

Distribución

normal

Distribución t

Grados de

libertad

Muestreo

Muestra

Parámetro

estadístico

Prueba de χ²

Regresión

estadística

Rango

Notación sumatoria

—o—

Los números cuya suma se indica en una notación sigma pueden ser naturales,

complejos u objetos matemáticos más complicados. Si la suma tiene

un número infinito de términos, se conoce como serie infinita.

Dada una sucesión:

Ésta se puede representar como la suma de los primeros términos con la notación

de sumatoria o notación sigma.

El nombre de esta notación se denomina de la letra griega

(sigma mayúscula, que corresponde a nuesta S de "suma" ).

La notación sigma es de la siguiente manera:

La suma de los primeros pares

Page 3: Resumen estadistica descriptiva resumen

Impares

*Ejemplo:

Medidas de tendencia central

Las medidas de tendencia central (media, mediana y moda) sirven como puntos de

referencia para interpretar las calificaciones que se obtienen en una prueba.

En resumen, el propósito de las medidas de tendencia central es:

Mostrar en qué lugar se ubica la persona promedio o típica del grupo.

Sirve como un método para comparar o interpretar cualquier puntaje en relación con el

puntaje central o típico.

Sirve como un método para comparar el puntaje obtenido por una misma persona en dos

diferentes ocasiones.

Sirve como un método para comparar los resultados medios obtenidos por dos o más

grupos.

Las medidas de tendencia central más comunes son:

La media aritmética: comúnmente conocida como media o promedio. Se representa por

medio de una letra M o por una X con una línea en la parte superior.

La mediana: la cual es el puntaje que se ubica en el centro de una distribución. Se

representa como Md.

La moda: que es el puntaje que se presenta con mayor frecuencia en una distribución. Se

representa Mo.

Page 4: Resumen estadistica descriptiva resumen

Medidas de forma

Las medidas de forma permiten comprobar si una distribución de frecuencia tiene

características especiales como simetría, asimetría, nivel de concentración de datos y

nivel de apuntamiento que la clasifiquen en un tipo particular de distribución.

Las medidas de forma son necesarias para determinar el comportamiento de los datos y

así, poder adaptar herramientas para el análisis probabilístico.

Medidas de forma: Son indicadores estadísticos que permiten identificar si una distribución

de frecuencia presenta uniformidad.

Medidas de dispersión

Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la

distribución.

Las medidas de dispersión son:

Rango o recorrido

El rango es la diferencia entre el mayor y el menor de los datos de una distribución

estadística.

Desviación media

La desviación respecto a la media es la diferencia entre cada valor de la variable

estadística y la media aritmética.

Di = x - x

La desviación media es la media aritmética de los valores absolutos de las desviaciones

respecto a la media.

La desviación media se representa por

Page 5: Resumen estadistica descriptiva resumen

Varianza

La varianza es una medida estadística que mide la dispersión de los valores respecto a un

valor central (media), es decir, es el cuadrado de las

desviaciones:

DATOS NO AGRUPADOS.

Los datos no agrupados son los datos sin procesar, y las estadísticas correctas pueden ser

determinadas. Los datos no agrupados son usualmente el punto de inicio de los análisis.

Es el conjunto de datos obtenidos en la recopilación, una vez que se han recopilado los

datos, el siguiente paso consiste en organizarlos.

1.- los datos son brutos(es decir, no se presentan clasificados)

2.- no es necesario clasificar ni generar una tabla de frecuentas, ya que no tiene “mucho

sentido”.

3.- elementos que menor tamaño (generalmente menor a 20 elementos).Esto no sucede

así siempre.

Aunque contemos con menos de 20 elementos, debe de verificarse que los datos no sean

significativos, Esto es: que la información no sea “repetitiva”, de esta forma, sabremos que

no se podrá clasificar y por lo tanto ser resumida en una “tabla de frecuencias”.

En caso de que una vez que hayamos ordenado los elementos, se cuente con datos

significativos. Procedemos a clasificarlos (si es posible, ya que también debemos de

buscar la lógica al clasificar los elementos) para convertirlos en “datos agrupados”.

4.- los datos no agrupados, también pueden ser ordenados y de la misma forma, también

se pueden obtener graficas, determinar media, desviación estándar, etc.

El hecho de que los datos “no agrupados” pueden ordenarse, no significa que se

conviertan en “datos agrupados”.

Ejemplos:

Vas a investigar la edad a un grupo de 20 Niños en datos no agrupados (es decir, vienen

los 20 niños y asi como te dan la edad asi la anotas

Page 6: Resumen estadistica descriptiva resumen

2,2,1,3,3,3,4,4,5,6,1,2,2,3,3,3,4,4,3,6 (Total 20 niños)

Estos son datos no agrupados por qué no los has clasificado y contado

1,1,2,2,2,2,3,3,3,3,3,3,3,4,4,4,4,5,5,6 (Total 20 niños)

Los datos no agrupados también los puedes ordenar, por ejemplo de la edad menor a la

edad mayor, no están contabilizados ni clasificados solamente están ordenados

Para que sean datos agrupados tienes que contarlos y clasificarlos, por ejemplo cuántos

niños había de cada año. (y siguen siendo 20 niños)

Edad..........Frecuencia

1..................2

2..................4

3..................7

4..................4

5..................2

6..................1

Total............20

Medidas de posición

Las medidas de posición nos facilitan información sobre la serie de datos que estamos

analizando. La descripción de un conjunto de datos, incluye como un elemento de

importancia la ubicación de éstos dentro de un contexto de valores posible.

Son indicadores usados para señalar que porcentajes de datos dentro de una distribución

de frecuencias superan estas expresiones, cuyo valor representa el valor del dato que se

encuentra en el centro de la distribución de frecuencia, por lo que también se llaman

medida de tendencia central.

Medidas de posición más comunes:

- Cuartiles: hay tres cuartiles que dividen a una distribución en 4 partes iguales:

primero, segundo y tercer cuartil.

- Deciles: hay nueve deciles que la dividen en 10 partes iguales: (del primero al

noveno decil).

- Percentiles: hay noventa y nueve percentiles que dividen a una serie en 100 partes

iguales.

Medidas de Forma

Comparan la forma que tiene la representación gráfica, bien sea el histograma o el

diagrama de barras de la distribución, con la distribución normal.

Page 7: Resumen estadistica descriptiva resumen

MEDIDA DE ASIMETRÍA

Diremos que una distribución es simétrica cuando su mediana, su moda y su media

aritmética coinciden.

Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o

relativas) descienden más lentamente por la derecha que por la izquierda.

Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos

que la distribución es asimétrica a la izquierda.

Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es

el Coeficiente de Asimetría de Pearson:

Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la

derecha y negativo cuando existe asimetría a la izquierda.

MEDIDA DE APUNTAMIENTO O CURTOSIS

Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se

definen 3 tipos de distribuciones según su grado de curtosis:

Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los

valores centrales de la variable (el mismo que presenta una distribución

normal). Distribución leptocúrtica: presenta un elevado grado de concentración

alrededor de los valores centrales de la variable. Distribución platicúrtica: presenta un

reducido grado de concentración alrededor de los valores centrales de la variable.

Page 8: Resumen estadistica descriptiva resumen

EJEMPLO 1

El número de diás necesarios por 10 equipos de trabajadores para terminar 10 instalaciones

de iguales características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 días. Calcular la

media, mediana, moda, varianza y desviación típica.

SOLUCIÓN:

La media: suma de todos los valores de una variable dividida entre el número total de

datos de los que se dispone:

La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la

otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la

secuencia:

15, 21, 32, 59, 60, 60,61, 64, 71, 80.

Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los

dos valores que se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media

de estos dos valores nos dará a su vez 60, que es el valor de la mediana.

La moda: el valor de la variable que presenta una mayor frecuencia es 60

La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la

variable y la media aritmética de la distribución.

Page 9: Resumen estadistica descriptiva resumen

Sx2=

La desviación típica S: es la raíz cuadrada de la varianza.

S = √ 427,61 = 20.67

El rango: diferencia entre el valor de las observaciones mayor y el menor

80 - 15 = 65 días

El coeficiente de variación: cociente entre la desviación típica y el valor absoluto de la

media aritmética CV = 20,67/52,3 = 0,39

Cuadro sinóptico de Estadística Descriptiva

Medidas descriptivas

Las medidas descriptivas son valores numéricos calculados a partir de la muestra y que nos

resumen la información contenida en ella.

Page 10: Resumen estadistica descriptiva resumen