Histogramas y Normalidad de Los Datos

2
Histogramas y normalidad de los datos La mayoría de los datos que representan nuestros procesos se ajustan a una distribución normal. Cuando hacemos el histograma de nuestros datos, nos esperamos ver que esta distribución tiene una curva suave conocida como la campana de Gauss. Pero a veces los histogramas (o diagramas de frecuencia) presentan unas formas peculiares. En el gráfico siguiente podéis apreciar 4 histogramas generados con 20 datos procedentes de una distribución normal estándar (media = 0, desviación estándar = 1) Histograma de una distribución normal estándar con 20 datos A pesar de ser normales, estos histogramas podrían llevarnos a falsas conclusiones sobre la normalidad de los datos. De hecho, con solo 20 datos, un diagrama de puntos podría ser más adecuado para ver la dispersión de los datos (con toda su granularidad). Diagrama de puntos - 20 datos

Transcript of Histogramas y Normalidad de Los Datos

Page 1: Histogramas y Normalidad de Los Datos

Histogramas y normalidad de los datos

La mayoría de los datos que representan nuestros procesos se ajustan a una distribución

normal. Cuando hacemos el histograma de nuestros datos, nos esperamos ver que esta

distribución tiene una curva suave conocida como la campana de Gauss. Pero a veces los

histogramas (o diagramas de frecuencia) presentan unas formas peculiares.

En el gráfico siguiente podéis apreciar 4 histogramas generados con 20 datos procedentes de

una distribución normal estándar (media = 0, desviación estándar = 1)

Histograma de una distribución normal estándar con 20 datos

A pesar de ser normales, estos histogramas podrían llevarnos a falsas conclusiones sobre la

normalidad de los datos.

De hecho, con solo 20 datos, un diagrama de puntos podría ser más adecuado para ver la

dispersión de los datos (con toda su granularidad).

Diagrama de puntos - 20 datos

En cambio si aumentamos el nº de datos, la forma del histograma se aproxima a la campana

de Gauss. A continuación, se muestran 4 histogramas realizados con unos datos

procedentes de un distribución normal estándar pero variando la cantidad de datos.

Page 2: Histogramas y Normalidad de Los Datos

Histogramas de una distribución normal

Los histogramas son una buena representación gráfica para ver la dispersión de los datos

pero es preferible un diagrama de puntoscuando la cantidad de datos no sobrepasa los 20.

Aprovecho este post para recordar que la única manera de saber si unos datos se ajustan a

una distribución normal es hacer un test de normalidad. El diagrama de probabilidad de

Minitab nos proporciona la representación de los datos con una recta de Henry y nos da el p-

valor. De esta forma, con un p-valor > 0.05, podemos afirmar con un95% de

confianza que nuestros datos se ajustan a una distribución normal.