Pcespoch

25
pcespoch MEDIDAS DESCRIPTIVAS WILMER FABIAN N [AlienWfabi]

Transcript of Pcespoch

Page 1: Pcespoch

pcespochMEDIDAS DESCRIPTIVAS

WILMER FABIAN N

[AlienWfabi]

Page 2: Pcespoch

MEDIDAS DESCRIPTIVAS

MEDIDAS

DESCRIPTIVAS

POSICION

CENTRALIZACION

DISPERCION

FORMA

Divide un conjunto ordenados de datos en

Grupos con la misma cantidad de individuos

Indican valores con respecto a los que los

datos parecen agruparse

Indican la mayor o menor concentración de

los datos con respecto a las medidas

de centralización

CUARTILES

DECILES

PERCENTILES

MEDIA

MEDIANA

MODA

VARIANZA

DESVIACION

TIPICA

COEFICIENTE

DE VARIACION

RANGO

ASIMETRIA

CURTOSIS

Page 3: Pcespoch

POSICION

Page 4: Pcespoch

Ejemplo:

xi ni Ni

0 14 14

1 10 24

2 15 39

3 26 65

4 20 85

5 15 100

n=100

Page 5: Pcespoch

CENTRALIZACION

DATOS NO AGRUPADOS

Page 6: Pcespoch

CENTRALIZACION

Nos dan un centro de la distribución de frecuencias, es un valor que se puede tomar como representativo de todos los datos.

Hay diferentes modos para definir el "centro" de las observaciones en un conjunto de datos. Por orden de importancia, son:

MEDIA(Media aritmética o simplemente media). es el promedio aritmético de las observaciones, es decir, el cociente entre la suma

de todos los datos y el numero de ellos. Si xi es el valor de la variable y ni su frecuencia,

Ejemplo:

Calcule el valor medio (o promedio) del ingreso anual de una muestra de empleados de la empresa “CLARO”:

10.500, 8.720, 11.350, 9.520 y 12.350 USD.

n

XX

5

12350952011350872010500X

5

52440X

USD10488X

Page 7: Pcespoch

CENTRALIZACION

MEDIANA

1) Cuando hay valores extremos (muy grandes o pequeños) la media puede no ser

representativa.

2) Mediana corresponde al punto medio de los datos después de ordenarlos.

3) 50% de las observaciones son mayores que la mediana y 50% son menores.

4) Si el número de datos es par, la mediana es la media aritmética de los datos situados en la

mitad.

5) Si el número de datos es impar, la mediana es el valor que se sitúe justo en la mitad.

2

n med Pos

2

1n med Pos

Page 8: Pcespoch

EJEMPLOEdades de una muestra de 8 Edades de una muestra de 9

estudiantes de Estadística. estudiantes de Estadística.

(PAR) (IMPAR)

42

8 med Pos

23

23

24

28

30

32

34

41

Mediana

292

3028

23

23

24

25

28

30

32

34

41

52

19 med Pos

Mediana

Page 9: Pcespoch

CENTRALIZACION

MODA

Valor que aparece con mayor frecuencia.

EJEMPLO:

Edades de personas que asisten a una tienda de videos de un centro

comercial a las 10 am.

12 8 17 21 11 17 14 8 17 21 28

Moda

Page 10: Pcespoch

CENTRALIZACION

DATOS AGRUPADOS

Page 11: Pcespoch

CENTRALIZACION

MEDIA

FORMULA

MEDIANACLASE MEDIANA: clase cuya frecuencia acumulada es igual o próxima mayor a la mitad de los datos.

FORMULA

DONDE:

Li: límite inferior de la clase mediana.

n: Es el numero de datos de la muestra.

: Es la semisuma de las frecuencias absolutas.

Fi-1: frecuencia acumulada anterior a la clase mediana.

fi: frecuencia absoluta de la clase mediana.

c: Es la amplitud o intervalo de la clase.

n

fxX

ii

cfi

Fn

LiMei

*21

2

n

Page 12: Pcespoch

CENTRALIZACION

MODA

CLASE MODAL: clase que contiene la mayor frecuencia

FORMULA

DONDE:

Li: límite inferior de la clase modal.

fi: Frecuencia absoluta de la clase modal.

fi-1: frecuencia absoluta anterior a la clase modal.

fi+1: frecuencia absoluta posterior a la clase modal.

ai: Es la amplitud de la clase.

i

iiii

ii

affff

ffLiMo *

)()( 11

1

Page 13: Pcespoch

CENTRALIZACION

EJEMPLO:

En una muestra de 50 ciudades de EEUU con poblaciones que se encuentran entre 100.000 y

1´000.000 habitantes, se encontró la siguiente distribución de frecuencias para el costo diario

de una habitación doble en un hospital.

Costo de una

habitación de hospital

(USD)

FRECUENCIA

{100, 200) 1

{200, 300) 9

{300, 400) 20

{400, 500) 15

{500, 600) 5

50

Page 14: Pcespoch

CENTRALIZACION

Costo de una

habitación de hospital

(USD)

FRECUENCIA Xm f*Xm

{100, 200) 1 150 150

{200, 300) 9 250 2250

{300, 400) 20 350 7000

{400, 500) 15 450 6750

{500, 600) 5 550 2750

50 18900

37850

18900

n

fxX

iiEl costo medio de una habitación

doble en las 50 ciudades de la

muestra es de 378 USD

MEDIA

Page 15: Pcespoch

CENTRALIZACION

Costo de una

habitación de

hospital (USD)

FRECUENCIAFRECUENCIA

ACUMULADA

{100, 200) 1 1

{200, 300) 9 10

{300, 400) 20 30

{400, 500) 15 45

{500, 600) 5 50

50

CLASE MEDIANA:

Frecuencia acumulada es

igual o próxima mayor a la

mitad de los datos

10020

102

50

300 *21

cf

Fn

LiMei

i

USD375MeEl costo mediano de una habitación

doble en las 50 ciudades de la

muestra es de 375 USD

MEDIANA

Page 16: Pcespoch

CENTRALIZACION

Costo de una

habitación de

hospital (USD)

FRECUENCIA

{100, 200) 1

{200, 300) 9

{300, 400) 20

{400, 500) 15

{500, 600) 5

50

CLASE MODAL

Mayor frecuencia

1001520920

920300*

)()( 11

1i

iiii

iia

ffff

ffLiMo

USD369MeEl costo modal de una habitación

doble en las 50 ciudades de la

muestra es de 369 USD

MODA

Page 17: Pcespoch

DISPERCION

VARIANZA

Podemos definirla como el promedio del cuadrado de las diferencias de todas las puntuaciones respecto a la media

aritmética. La varianza es la distancia media entre puntuaciones.

Propiedades de la varianza:

Una varianza puede valer cualquier cosa, es decir, no tiene límites numéricos. Su valor dependerá de las categorías

de las variables.

Una varianza jamás puede ser negativa, y siempre tendrá un valor positivo o igual a O.

Se ve afectada por la modificación de cualquiera de las puntuaciones.

Si multiplicamos un conjunto de puntuaciones por una constante, la desviación típica y la varianza quedarán

multiplicadas por la constante y por el cuadrado de esa constante.

Si sumamos un conjunto de puntuaciones a una constante, la desviación típica y la varianza no se verán afectadas.

Para datos agrupados en intervalos, el valor depende de la amplitud de los intervalos, el número de ellos y los límites

fijados.

No debe calcularse en situaciones en que tampoco debe calcularse la media.

FORMULA Para datos no agrupados

Si los datos están agrupados utilizamos la siguiente formula.

1

)(1

2

2

n

xX

S i

i

1

)(1

2

2

n

xXf

S i

ii

Page 18: Pcespoch

DISPERCION

DESVIACION TIPICA

Se define como la raíz cuadrada de la varianza, tomada con signo positivo. Dado que antes hemos elevado las

puntuaciones al cuadrado para que nos saliesen distancias negativas, ahora le haremos la raíz a la varianza para

devolver los datos a su estado original

La desviación típica es el índice de dispersión más importante.

Las propiedades de la desviación típica son similares a las de la varianza.

FORMULA Para datos no agrupados.

FORMULA Para datos agrupados.

COEFICIENTE DE VARIACION

Es un coeficiente que se usa para comparar variabilidad entre dos grupos o más grupos.

Cuanto más alto es este coeficiente, más dispersión, más variabilidad, y más distintos serán los sujetos entre sí.

El Coeficiente de variación (CV) es una medida de la dispersión relativa de un conjunto de datos, que se obtiene dividiendo

la desviación estándar del conjunto entre su media aritmética:

se expresa para una muestra.

se expresa para la población.

2SS

1

)( 2

2

n

xXfS

ii

)100(x

SCV

)100(x

CV

Page 19: Pcespoch

DISPERCION

Los coeficientes de variación tienen las siguientes características:

Puesto que tanto la desviación estándar como la media se miden en las unidades originales, el CV es una medida

independiente de las unidades de medición.

Debido a la propiedad anterior el CV es la cantidad más adecuada para comparar la variabilidad de dos conjuntos de datos.

En áreas de investigación donde se tienen datos de experimentos previos, el CV es muy usado para evaluar la precisión de

un experimento, comparando en CV del experimento en cuestión con los valores del mismo en experiencias anteriores.

RANGO

Podemos definirlo como la distancia que existe entre la máxima y la mínima puntuación de una distribución.

FORMULA

Re = xmax – xmin

Donde:

R = Recorrido, rango o amplitud

Xmax = Valor máximo de los datos de un conjunto

Xmin = Valor mínimo de los datos de un conjunto

Page 20: Pcespoch

DISPERCION

EJEMPLO:

En seis sábados consecutivos un operador de taxis recibió 9, 7, 11, 10, 13 y 7 llamadas a su sitio para su

servicio. Calcule:

a) Amplitud.

b) Media.

c) Desviación estándar.

d) Varianza.

e) Coeficiente de variación.

a) Para calcular la amplitud.

Valor máximo 13

Valor mínimo 7

A = 13 - 7 = 6

Page 21: Pcespoch

b) Para calcular la media.

c) Para calcular la desviación estándar.

Se puede utilizar la siguiente tabla:

5.96

57

6

1713101179

n

fxX

ii

n

fxX

ii

1

)( 2

n

xXfS

ii

Al sustituir los valores se obtiene:

3452.2516

5.55.275.27S

Page 22: Pcespoch

d) Para calcular la varianza:

e) Para calcular el coeficiente de variación:

1

)(1

2

2

n

xX

S i

i

5.5

)3452.2(

2

22

S

S

)100(x

SCV

2468.0

5.9

3452.2

CV

CV

Page 23: Pcespoch

FORMAComparan la forma que tiene la representación gráfica, bien sea el histograma o el diagrama de barras de la distribución, con

la distribución normal.

MEDIDA DE ASIMETRÍA Diremos que una distribución es simétrica cuando su mediana, su moda y su media aritmética coinciden.

Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas) descienden más

lentamente por la derecha que por la izquierda.

Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la distribución es asimétrica

a la izquierda.

Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el Coeficiente de Asimetría de

Pearson:

Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y negativo cuando existe

asimetría a la izquierda.

Page 24: Pcespoch

FORMA

MEDIDA DE APUNTAMIENTO O CURTOSIS

Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda.Se definen 3 tipos de

distribuciones según su grado de curtosis:

Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales

de la variable (el mismo que presenta una distribución normal).

Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores

centrales de la variable.

Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores

centrales de la variable.

Page 25: Pcespoch

GRACIAS POR SU ATENCION