Estadistica para la investigación (sesión4)

35
Lenin H. Cari Mogrovejo [email protected]

description

ESTADISTICA, SPSS, LENIN, INVESTIGACION

Transcript of Estadistica para la investigación (sesión4)

Page 2: Estadistica para la investigación (sesión4)

La dispersión es la variación en un conjunto de datos

que proporciona información adicional y permite juzgar

la confiabilidad de la medida de tendencia central.

¿QUÉ ES LA DISPERSIÓN?

Page 3: Estadistica para la investigación (sesión4)

CLASIFICACIÓN

Las medidas de resumen más importantes se

clasifican en tres grupos:

MEDIDAS DE TENDENCIA CENTRAL :

Media, mediana, moda

MEDIDAS DE FORMA

Asimetria y curtosis

MEDIDAS DE POSICIÓN :

Deciles, cuartiles, percentiles

MEDIDAS DE DISPERSIÓN :

Desviación estándar, varianza, coeficiente de variación

Page 4: Estadistica para la investigación (sesión4)

MEDIDAS DE FORMA

ASIMETRIA CURTOSIS

4

0,0000

0,0500

0,1000

0,1500

0,2000

0,2500

0,3000

0,3500

0,4000

0,4500

0,5000

4 5 6 70 1 2 3

Q1 Q2 Q3 Q4

Rango

EAI02

Page 5: Estadistica para la investigación (sesión4)

la curva que forman los valores de la serie presenta la misma

forma a izquierda y derecha de un valor central (media

aritmética).

(g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe

aproximadamente la misma cantidad de valores a los dos lados de la media.

(g1 > 0): La curva es asimétricamente positiva por lo que los valores se

tienden a reunir más en la parte izquierda que en la derecha de la media.

(g1 < 0): La curva es asimétricamente negativa por lo que los valores se

tienden a reunir más en la parte derecha de la media.

ASIMETRIA:

Page 6: Estadistica para la investigación (sesión4)

analiza el grado de concentración que presentan los

valores alrededor de la zona central de la distribución.

Para detectar tanto asimetría como curtosis, es útil dibujarel histograma. Además, para asimetría se comparan lasmedidas de posición, Media, Mediana y moda.

CURTOSIS :

Page 7: Estadistica para la investigación (sesión4)

7

Si una distribución es simétrica, la media,

mediana y modo coinciden

• Si una distribución no es simétrica, las tres

medidas difieren.

Asimetría hacia la derecha

(asimetría positiva)

Media

MedianaModo

Media

Mediana

Modo

Asimetría hacia la izquierda

(asimetría negativa)

Media, Mediana y Moda

Page 8: Estadistica para la investigación (sesión4)

RENDIMIENTO RENDIMIENTO

NO ADECUADO ADECUADO

8

Asimetría hacia la derecha

(asimetría positiva)

Media

MedianaModo

Media

Mediana

Modo

Asimetría hacia la izquierda

(asimetría negativa)

Page 9: Estadistica para la investigación (sesión4)

CURTOSIS

(g2 = 0) la distribución es Mesocúrtica: (± 0.5 aprox.)

(g2 > 0) la distribución es Leptocúrtica

(g2 < 0) la distribución es Platicúrtica

Page 10: Estadistica para la investigación (sesión4)

Leptocúrtica: Cuando la distribución de

frecuencias es más apuntada que la normal.

Medidas de Apuntamiento

(Curtosis o Kurtosis)

Page 11: Estadistica para la investigación (sesión4)

Mesocúrtica: Cuando la distribución de frecuencias es tan

apuntada como la normal.

Medidas de Apuntamiento

(Curtosis o Kurtosis)

Page 12: Estadistica para la investigación (sesión4)

Platicúrtica: Cuando la distribución de frecuencias

es menos apuntada que la normal.

Medidas de Apuntamiento

(Curtosis o Kurtosis)

Page 13: Estadistica para la investigación (sesión4)

Asimetría Positiva

Mo < Me < X

Page 14: Estadistica para la investigación (sesión4)

Simetría

Mo = Me = X

Page 15: Estadistica para la investigación (sesión4)

Asimetría Negativa

Mo > Me > X

Page 16: Estadistica para la investigación (sesión4)

MEDIDAS DE POSICIÓN

Page 17: Estadistica para la investigación (sesión4)

CUARTILES: permiten dividir un conjunto de datos en 4

partes iguales.

DECILES: son muy parecidos a los cuartiles; pero dividen al

conjunto de datos en 10 partes iguales

PERCENTILES: también se lo conoce como centil, y

permite dividir un conjunto de datos en 100 partes iguales.

Page 18: Estadistica para la investigación (sesión4)

MEDIDAS DE DISPERSIÓN

Las medidas de dispersión nos permiten conocer si los

valores en general están cerca o alejados de los valores

centrales, muestran la variabilidad de una distribución

de datos, indicando por medio de un número si las

diferentes puntuaciones de una variable están muy

alejadas de la medida de tendencia central.

Page 19: Estadistica para la investigación (sesión4)

RANGO (AMPLITUD DE VARIACIÓN): Es la diferencia

entre el valor máximo y el mínimo en nuestros datos, esta

medida de dispersión aunque es la más fácil de obtener, en lo

general es muy poco usada.

MEDIDAS DE DISPERSIÓN

Page 20: Estadistica para la investigación (sesión4)

Dispersión: Amplitud Total

Amplitud Total = Valor Mayor – Valor Menor

Page 21: Estadistica para la investigación (sesión4)

VARIANZA

La varianza esta basada en las desviaciones con respecto a la

media.

VARIANZA: Es el promedio de los cuadrados de las

desviaciones de cada observación con respecto de la media.

Esta varianza es cero si todas las observaciones son iguales.

Existen dos tipos de varianza.

•Varianza poblacional.

•Varianza muestral.

Page 22: Estadistica para la investigación (sesión4)

VARIANZA POBLACIONAL: Varianza de toda la población.

Es el valor medio de las desviaciones con respecto a la media,

elevadas al cuadrado.

Su fórmula es:

El proceso para calcular la varianza poblacional es el siguiente:

1. Calcular la media aritmética.

2. Comprobar ٤(X-u) = 0, por cada número se resta la media

poblacional y se realiza la sumatoria.

3. Calcular (X-u) 2

4. Obtener varianza.

Page 23: Estadistica para la investigación (sesión4)

VARIANZA MUESTRAL: varianza de una muestra de la

población.

Su fórmula es:

La varianza muestral es el valor medio de las desviaciones

con respecto a la media, elevadas al cuadrado.

El proceso para calcularla es el siguiente:

1. Calcular X 2

2. Calcular ٤X y ٤ X 2

3. Reemplazar en la fórmula.

Page 24: Estadistica para la investigación (sesión4)

EJEMPLO DE DISPERSIÓN

8 cms.

Aquí tenemos 9 rectángulos cuya altura es de 8 centímetros (y todos

tienen la misma base).

¿Existe alguna variación respecto de su altura entre estos rectángulos?

¿Cuál es el promedio de la altura de estos rectángulos?

8 + 8 + 8 + 8 + 8 + 8 + 8 + 8 + 8

9=

72

9= 8

Page 25: Estadistica para la investigación (sesión4)

EJEMPLO DE DISPERSIÓN

El quinto rectángulo y el octavo rectángulo en un acto de rebeldía cambiaron su

altura. El quinto rectángulo, ahora de color rojo, mide 10 centímetros, y el

octavo rectángulo, de color azul, mide 6 centímetros?

¿Cuál es el nuevo promedio de estos 9 rectángulos?

8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8

9=

72

9= 8

... ¡el mismo promedio! Pero... ¿ha habido variación?

8 cms.

10 cms

6 cms

Page 26: Estadistica para la investigación (sesión4)

EJEMPLO DE DISPERSIÓN

El rectángulo rojo tiene +2 centímetros sobre el promedio, y el rectángulo azul

tiene –2 centímetros bajo el promedio. Los otros rectángulos tienen cero

diferencia respecto del promedio.

8 cms.

10 cms

6 cms

Si sumamos estas diferencias de la altura respecto del promedio, tenemos

0 + 0 + 0 + 0 + 2 + 0 + 0 – 2 + 0 = 0

Este valor nos parece indicar que ¡no ha habido variabilidad! Y sin embargo,

ante nuestros ojos, sabemos que hay variación.

Page 27: Estadistica para la investigación (sesión4)

EJEMPLO DE DISPERSIÓN

8 cms.

10 cms

6 cms

Una forma de eliminar los signos menos de aquellas diferencias que sean

negativas, esto es de aquellos mediciones que estén bajo el promedio, es

elevar al cuadrado todas las diferencias, y luego sumar...

02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 = 8

Y este resultado repartirlo entre todos los rectángulos, es decir lo dividimos por

el número de rectángulos que es 9

02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 =

9 9

8= 0,89

Page 28: Estadistica para la investigación (sesión4)

EJEMPLO DE DISPERSIÓN

8 cms.

10 cms

6 cms

Se dice entonces que la varianza fue de 0,89

Observemos que las unidades involucradas en el cálculo de la varianza están al

cuadrado. En rigor la varianza es de 0,89 centímetros cuadrados. De manera

que se define

0,89 0,943

La raíz cuadrada de la varianza se llama desviación estándar

Page 29: Estadistica para la investigación (sesión4)

EJEMPLO DE DISPERSIÓN

8 cms.

10 cms

6 cms

Que la desviación estándar haya sido de 0,943 significa que en promedio la

altura de los rectángulos variaron (ya sea aumentando, ya sea disminuyendo) en

0,943 centímetros.

Es claro que esta situación es “en promedio”, puesto que sabemos que los

causantes de la variación fueron los rectángulos quinto y octavo. Esta

variación hace repartir la “culpa” a todos los demás rectángulos que se

“portaron bien”.

La desviación estándar mide la dispersión de los datos respecto del

promedio

Page 30: Estadistica para la investigación (sesión4)

EJEMPLO DE DISPERSIÓN

8 cms.

10 cms

6 cms4 cms

8 cms.8 cms. 8 cms.7 cms.

8 cms.

¿Cuál es la varianza y la desviación estándar de las alturas de los rectángulos?

En primer lugar debemos calcular el promedio

8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8

9= 7,44

Luego debemos calcular la varianza

Page 31: Estadistica para la investigación (sesión4)

EJEMPLO DE DISPERSIÓN

8 cms.

10 cms

6 cms4 cms

8 cms. 8 cms. 8 cms.7 cms.

8 cms.

Promedio

7,44

0,56-

3,44

0,56 0,56 2,56 0,56 -

0,44-

1,440,56

0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562

9

22,2224

9=

= 2,469Este es el valor de la varianza

Page 32: Estadistica para la investigación (sesión4)

EJEMPLO DE DISPERSIÓN10 cms

8 cms.

6 cms4 cms

8 cms. 8 cms. 8 cms.7 cms.

8 cms.

Promedio

7,44

Si la varianza fue de 2,469, entonces la desviación estándar es de...

2,469 1,57

Lo que significa que, en promedio, los rectángulos se desviaron más o menos

(más arriba o más abajo) en 1,57 centímetros.

Page 33: Estadistica para la investigación (sesión4)

DESVIACIÓN

Es la medida de dispersión mas utilizada, también se la

conoce como desviación típica, y es la raíz cuadrada de la

varianza.

Esta medida pretende conseguir que la medida de dispersión

se exprese en las mismas unidades que los datos u

observaciones, al igual que la varianza existen dos tipos:

•Desviación estándar poblacional

•Desviación estándar muestral.

Page 34: Estadistica para la investigación (sesión4)

DESVIACIÓN ESTÁNDAR POBLACIONAL: Para

toda la población o datos, es la raíz cuadrada de la

varianza poblacional.

DESVIACIÓN ESTÁNDAR MUESTRAL: Es un

estimado de la desviación estándar poblacional. Es la raíz

cuadrada de varianza muestral, su fórmula es:

Page 35: Estadistica para la investigación (sesión4)

Muchas gracias

Lenin H. Cari MogrovejoCel. [email protected][email protected]