Estadística descriptiva: medidas numéricas

201
Estad´ ıstica descriptiva: medidas n´ um´ ericas. Roc´ ıo Meza Moreno Universidad Aut´ onoma Metropolitana, Iztapalapa Roc´ ıo Meza Moreno Estad´ ıstica descriptiva

description

Se presentan las principales medidas numéricas, tanto de tendencia central como de variación, asociadas a un conjunto de datos.

Transcript of Estadística descriptiva: medidas numéricas

Page 1: Estadística descriptiva: medidas numéricas

Estadıstica descriptiva: medidas numericas.

Rocıo Meza MorenoUniversidad Autonoma Metropolitana, Iztapalapa

Rocıo Meza Moreno Estadıstica descriptiva

Page 2: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Cuando se estudia un conjunto de datos es importantedeterminar las siguientes caracterısticas:

1 Valor central: es un valor representativo que indica lalocalizacion de la mitad del conjunto de los datos.

2 Variacion: medida de que tanto varıan los datos enrtre sı.

3 Distribucion: forma en que se distribuyen los datos(simetricamente o con sesgo).

Rocıo Meza Moreno Estadıstica descriptiva

Page 3: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Cuando se estudia un conjunto de datos es importantedeterminar las siguientes caracterısticas:

1 Valor central: es un valor representativo que indica lalocalizacion de la mitad del conjunto de los datos.

2 Variacion: medida de que tanto varıan los datos enrtre sı.

3 Distribucion: forma en que se distribuyen los datos(simetricamente o con sesgo).

Rocıo Meza Moreno Estadıstica descriptiva

Page 4: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Cuando se estudia un conjunto de datos es importantedeterminar las siguientes caracterısticas:

1 Valor central: es un valor representativo que indica lalocalizacion de la mitad del conjunto de los datos.

2 Variacion: medida de que tanto varıan los datos enrtre sı.

3 Distribucion: forma en que se distribuyen los datos(simetricamente o con sesgo).

Rocıo Meza Moreno Estadıstica descriptiva

Page 5: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Cuando se estudia un conjunto de datos es importantedeterminar las siguientes caracterısticas:

1 Valor central: es un valor representativo que indica lalocalizacion de la mitad del conjunto de los datos.

2 Variacion: medida de que tanto varıan los datos enrtre sı.

3 Distribucion: forma en que se distribuyen los datos(simetricamente o con sesgo).

Rocıo Meza Moreno Estadıstica descriptiva

Page 6: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Definiciones

Un parametro es una medicion numerica que describealguna caracterıstica de una poblacion.

Un estadıstico es una medicion numerica que describealguna caracterıstica de una muestra.

En estadıstica inferencial, al estadıstico muestral se le conocecomo el estimador del correspondiente parametro poblacional.

Rocıo Meza Moreno Estadıstica descriptiva

Page 7: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Definiciones

Un parametro es una medicion numerica que describealguna caracterıstica de una poblacion.

Un estadıstico es una medicion numerica que describealguna caracterıstica de una muestra.

En estadıstica inferencial, al estadıstico muestral se le conocecomo el estimador del correspondiente parametro poblacional.

Rocıo Meza Moreno Estadıstica descriptiva

Page 8: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Definiciones

Un parametro es una medicion numerica que describealguna caracterıstica de una poblacion.

Un estadıstico es una medicion numerica que describealguna caracterıstica de una muestra.

En estadıstica inferencial, al estadıstico muestral se le conocecomo el estimador del correspondiente parametro poblacional.

Rocıo Meza Moreno Estadıstica descriptiva

Page 9: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplos

1 Segun datos del INEGI, en 2010 la poblacion de Mexicoascendıa a 112,336,538 de habitantes, 54,855,231 hombres y57,481,307 mujeres. Esto significa que en 2010, el 51 % dela poblacion eran mujeres. La cifra del 51 % es unparametro pues se obtuvo a partir de informacion detodos los habitantes del paıs.

2 Con base en una muestra de 877 ejecutivos encuestados, seencontro que el 45 % de ellos no contratarıa a alguien conun error ortografico en su solicitud de empleo. Esta cifra del45 % es un estadıstico, ya que esta basada en una muestray no en la poblacion completa de todos los ejecutivos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 10: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplos

1 Segun datos del INEGI, en 2010 la poblacion de Mexicoascendıa a 112,336,538 de habitantes, 54,855,231 hombres y57,481,307 mujeres. Esto significa que en 2010, el 51 % dela poblacion eran mujeres. La cifra del 51 % es unparametro pues se obtuvo a partir de informacion detodos los habitantes del paıs.

2 Con base en una muestra de 877 ejecutivos encuestados, seencontro que el 45 % de ellos no contratarıa a alguien conun error ortografico en su solicitud de empleo. Esta cifra del45 % es un estadıstico, ya que esta basada en una muestray no en la poblacion completa de todos los ejecutivos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 11: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Medidas de tendencia central

Una medida de tendencia central es un valor que seencuentra al centro o a la mitad de un conjunto de datos.

Son medidas de tendencia central la media, la mediana, lamoda y la mitad del rango.

Rocıo Meza Moreno Estadıstica descriptiva

Page 12: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Medidas de tendencia central

Una medida de tendencia central es un valor que seencuentra al centro o a la mitad de un conjunto de datos.

Son medidas de tendencia central la media, la mediana, lamoda y la mitad del rango.

Rocıo Meza Moreno Estadıstica descriptiva

Page 13: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Media (aritmetica)

Es la medida de tendencia central que se calcula al sumar losvalores de la totalidad de los datos y dividir el resultado entrela cantidad de estos.

La media, tambien conocida como promedio, es la medidanumerica mas importante para describir datos.

Cuando la media se calcula a partir de los datos de unamuestra se denota por x (estadıstico) y cuando se calcula apartir de los datos de una poblacion se denota por µ(parametro).

Rocıo Meza Moreno Estadıstica descriptiva

Page 14: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Media (aritmetica)

Es la medida de tendencia central que se calcula al sumar losvalores de la totalidad de los datos y dividir el resultado entrela cantidad de estos.

La media, tambien conocida como promedio, es la medidanumerica mas importante para describir datos.

Cuando la media se calcula a partir de los datos de unamuestra se denota por x (estadıstico) y cuando se calcula apartir de los datos de una poblacion se denota por µ(parametro).

Rocıo Meza Moreno Estadıstica descriptiva

Page 15: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Media (aritmetica)

Es la medida de tendencia central que se calcula al sumar losvalores de la totalidad de los datos y dividir el resultado entrela cantidad de estos.

La media, tambien conocida como promedio, es la medidanumerica mas importante para describir datos.

Cuando la media se calcula a partir de los datos de unamuestra se denota por x (estadıstico) y cuando se calcula apartir de los datos de una poblacion se denota por µ(parametro).

Rocıo Meza Moreno Estadıstica descriptiva

Page 16: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

En sımbolos, si x1, x2, x3, . . . , xn son los valores de lasobservaciones de una muestra, entonces

x =

n∑i=1

xi

n=x1 + x2 + · · ·+ xn

n

Y si x1, x2, x3, . . . , xN son los valores de las observaciones deuna poblacion, entonces

µ =

N∑i=1

xi

N=x1 + x2 + · · ·+ xN

N

Rocıo Meza Moreno Estadıstica descriptiva

Page 17: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

En sımbolos, si x1, x2, x3, . . . , xn son los valores de lasobservaciones de una muestra, entonces

x =

n∑i=1

xi

n=x1 + x2 + · · ·+ xn

n

Y si x1, x2, x3, . . . , xN son los valores de las observaciones deuna poblacion, entonces

µ =

N∑i=1

xi

N=x1 + x2 + · · ·+ xN

N

Rocıo Meza Moreno Estadıstica descriptiva

Page 18: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Una asociacion recaba informacion sobre los sueldos anualesiniciales de los recien egresados de universidades de acuerdo consu especialidad. A continuacion se presentan muestras de lossueldos anuales iniciales de especialistas en marketing y encontadurıa (los datos estan en miles de dolares):

Egresados de marketing:

34.2 45.0 39.5 28.4 37.7 35.8 30.6 35.2 34.2 42.4

Egresados de contadurıa:

33.5 57.1 49.7 40.2 44.2 45.2 47.8 38.0 53.9 41.141.7 40.8 55.5 43.5 49.1 49.9

Rocıo Meza Moreno Estadıstica descriptiva

Page 19: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Una asociacion recaba informacion sobre los sueldos anualesiniciales de los recien egresados de universidades de acuerdo consu especialidad. A continuacion se presentan muestras de lossueldos anuales iniciales de especialistas en marketing y encontadurıa (los datos estan en miles de dolares):

Egresados de marketing:

34.2 45.0 39.5 28.4 37.7 35.8 30.6 35.2 34.2 42.4

Egresados de contadurıa:

33.5 57.1 49.7 40.2 44.2 45.2 47.8 38.0 53.9 41.141.7 40.8 55.5 43.5 49.1 49.9

Rocıo Meza Moreno Estadıstica descriptiva

Page 20: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

El sueldo promedio de los egresados en marketing es:

xm =34.2 + 45.0 + 39.5 + · · ·+ 42.4

10

= 36.3

Y el sueldo promedio de los egresados en contadurıa es:

xc =33.5 + 57.1 + 49.7 + · · ·+ 49.9

16= 45.7

Se observa que el sueldo inicial promedio de un egresado encontadurıa supera al sueldo inicial promedio de un egresado enmarketing por

45, 700− 36300 = 9400

es decir, por aproximadamente 9000 dolares.

Rocıo Meza Moreno Estadıstica descriptiva

Page 21: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

El sueldo promedio de los egresados en marketing es:

xm =34.2 + 45.0 + 39.5 + · · ·+ 42.4

10= 36.3

Y el sueldo promedio de los egresados en contadurıa es:

xc =33.5 + 57.1 + 49.7 + · · ·+ 49.9

16= 45.7

Se observa que el sueldo inicial promedio de un egresado encontadurıa supera al sueldo inicial promedio de un egresado enmarketing por

45, 700− 36300 = 9400

es decir, por aproximadamente 9000 dolares.

Rocıo Meza Moreno Estadıstica descriptiva

Page 22: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

El sueldo promedio de los egresados en marketing es:

xm =34.2 + 45.0 + 39.5 + · · ·+ 42.4

10= 36.3

Y el sueldo promedio de los egresados en contadurıa es:

xc =33.5 + 57.1 + 49.7 + · · ·+ 49.9

16

= 45.7

Se observa que el sueldo inicial promedio de un egresado encontadurıa supera al sueldo inicial promedio de un egresado enmarketing por

45, 700− 36300 = 9400

es decir, por aproximadamente 9000 dolares.

Rocıo Meza Moreno Estadıstica descriptiva

Page 23: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

El sueldo promedio de los egresados en marketing es:

xm =34.2 + 45.0 + 39.5 + · · ·+ 42.4

10= 36.3

Y el sueldo promedio de los egresados en contadurıa es:

xc =33.5 + 57.1 + 49.7 + · · ·+ 49.9

16= 45.7

Se observa que el sueldo inicial promedio de un egresado encontadurıa supera al sueldo inicial promedio de un egresado enmarketing por

45, 700− 36300 = 9400

es decir, por aproximadamente 9000 dolares.

Rocıo Meza Moreno Estadıstica descriptiva

Page 24: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

El sueldo promedio de los egresados en marketing es:

xm =34.2 + 45.0 + 39.5 + · · ·+ 42.4

10= 36.3

Y el sueldo promedio de los egresados en contadurıa es:

xc =33.5 + 57.1 + 49.7 + · · ·+ 49.9

16= 45.7

Se observa que el sueldo inicial promedio de un egresado encontadurıa supera al sueldo inicial promedio de un egresado enmarketing por

45, 700− 36300 = 9400

es decir, por aproximadamente 9000 dolares.

Rocıo Meza Moreno Estadıstica descriptiva

Page 25: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la media

1 La media puede calcularse para conjuntos de datos connivel de medicion de intervalo o de razon.

2 Todos los datos se toman en cuenta en el calculo de lamedia.

3 La suma de las desviaciones de cada valor de la media escero, en sımbolos,

n∑i=1

(xi − x) = 0

Rocıo Meza Moreno Estadıstica descriptiva

Page 26: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la media

1 La media puede calcularse para conjuntos de datos connivel de medicion de intervalo o de razon.

2 Todos los datos se toman en cuenta en el calculo de lamedia.

3 La suma de las desviaciones de cada valor de la media escero, en sımbolos,

n∑i=1

(xi − x) = 0

Rocıo Meza Moreno Estadıstica descriptiva

Page 27: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la media

1 La media puede calcularse para conjuntos de datos connivel de medicion de intervalo o de razon.

2 Todos los datos se toman en cuenta en el calculo de lamedia.

3 La suma de las desviaciones de cada valor de la media escero,

en sımbolos,

n∑i=1

(xi − x) = 0

Rocıo Meza Moreno Estadıstica descriptiva

Page 28: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la media

1 La media puede calcularse para conjuntos de datos connivel de medicion de intervalo o de razon.

2 Todos los datos se toman en cuenta en el calculo de lamedia.

3 La suma de las desviaciones de cada valor de la media escero, en sımbolos,

n∑i=1

(xi − x) = 0

Rocıo Meza Moreno Estadıstica descriptiva

Page 29: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Por ejemplo, la media de 6, 4, 3, 9 y 7 es

x = (6 + 4 + 3 + 9 + 7)/5 = 5.8

Ası que la suma de las desviaciones es:

(6− 5.8) + (4− 5.8) + (3− 5.8) + (9− 5.8) + (7− 5.8) =

= 0.2− 1.8− 2.8 + 3.2 + 1.2 = 0

Rocıo Meza Moreno Estadıstica descriptiva

Page 30: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Por ejemplo, la media de 6, 4, 3, 9 y 7 es

x = (6 + 4 + 3 + 9 + 7)/5 = 5.8

Ası que la suma de las desviaciones es:

(6− 5.8) + (4− 5.8) + (3− 5.8) + (9− 5.8) + (7− 5.8) =

= 0.2− 1.8− 2.8 + 3.2 + 1.2 = 0

Rocıo Meza Moreno Estadıstica descriptiva

Page 31: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Por ejemplo, la media de 6, 4, 3, 9 y 7 es

x = (6 + 4 + 3 + 9 + 7)/5 = 5.8

Ası que la suma de las desviaciones es:

(6− 5.8) + (4− 5.8) + (3− 5.8) + (9− 5.8) + (7− 5.8) =

= 0.2− 1.8− 2.8 + 3.2 + 1.2

= 0

Rocıo Meza Moreno Estadıstica descriptiva

Page 32: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Por ejemplo, la media de 6, 4, 3, 9 y 7 es

x = (6 + 4 + 3 + 9 + 7)/5 = 5.8

Ası que la suma de las desviaciones es:

(6− 5.8) + (4− 5.8) + (3− 5.8) + (9− 5.8) + (7− 5.8) =

= 0.2− 1.8− 2.8 + 3.2 + 1.2 = 0

Rocıo Meza Moreno Estadıstica descriptiva

Page 33: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Una desventaja importante de la media es que es muysensible a valores extremos, esto es, valores muy pequenos oconsiderablemente grandes.

Por ejemplo, suponga que un estudiante entrego todas lastareas del trimestre menos una y que sus calificaciones son:

10 9.2 10 9 9.5 0

El promedio de sus calificaciones es entonces:

10 + 9.2 + 10 + 9 + 9.5 + 0

6= 7.95

La mediana resuelve en gran medida este problema.

Rocıo Meza Moreno Estadıstica descriptiva

Page 34: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Una desventaja importante de la media es que es muysensible a valores extremos, esto es, valores muy pequenos oconsiderablemente grandes.

Por ejemplo, suponga que un estudiante entrego todas lastareas del trimestre menos una y que sus calificaciones son:

10 9.2 10 9 9.5 0

El promedio de sus calificaciones es entonces:

10 + 9.2 + 10 + 9 + 9.5 + 0

6= 7.95

La mediana resuelve en gran medida este problema.

Rocıo Meza Moreno Estadıstica descriptiva

Page 35: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Una desventaja importante de la media es que es muysensible a valores extremos, esto es, valores muy pequenos oconsiderablemente grandes.

Por ejemplo, suponga que un estudiante entrego todas lastareas del trimestre menos una y que sus calificaciones son:

10 9.2 10 9 9.5 0

El promedio de sus calificaciones es entonces:

10 + 9.2 + 10 + 9 + 9.5 + 0

6= 7.95

La mediana resuelve en gran medida este problema.

Rocıo Meza Moreno Estadıstica descriptiva

Page 36: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Una desventaja importante de la media es que es muysensible a valores extremos, esto es, valores muy pequenos oconsiderablemente grandes.

Por ejemplo, suponga que un estudiante entrego todas lastareas del trimestre menos una y que sus calificaciones son:

10 9.2 10 9 9.5 0

El promedio de sus calificaciones es entonces:

10 + 9.2 + 10 + 9 + 9.5 + 0

6= 7.95

La mediana resuelve en gran medida este problema.

Rocıo Meza Moreno Estadıstica descriptiva

Page 37: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Mediana

Es el valor intermedio de un conjunto de datos que estanordenados en forma ascendente.

Se acostumbra denotar la mediana por el sımbolo x. Paracalcularla se ordenan los datos de menor a mayor y seconsideran los siguientes casos:

1 Si el numero de datos es impar, la mediana es el valor quese encuentra justo a la mitad de la lista.

2 Si el numero de valores es par, la mediana es el promediode los dos valores que estan a la mitad.

Rocıo Meza Moreno Estadıstica descriptiva

Page 38: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Mediana

Es el valor intermedio de un conjunto de datos que estanordenados en forma ascendente.

Se acostumbra denotar la mediana por el sımbolo x. Paracalcularla se ordenan los datos de menor a mayor y seconsideran los siguientes casos:

1 Si el numero de datos es impar, la mediana es el valor quese encuentra justo a la mitad de la lista.

2 Si el numero de valores es par, la mediana es el promediode los dos valores que estan a la mitad.

Rocıo Meza Moreno Estadıstica descriptiva

Page 39: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Mediana

Es el valor intermedio de un conjunto de datos que estanordenados en forma ascendente.

Se acostumbra denotar la mediana por el sımbolo x. Paracalcularla se ordenan los datos de menor a mayor y seconsideran los siguientes casos:

1 Si el numero de datos es impar, la mediana es el valor quese encuentra justo a la mitad de la lista.

2 Si el numero de valores es par, la mediana es el promediode los dos valores que estan a la mitad.

Rocıo Meza Moreno Estadıstica descriptiva

Page 40: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Mediana

Es el valor intermedio de un conjunto de datos que estanordenados en forma ascendente.

Se acostumbra denotar la mediana por el sımbolo x. Paracalcularla se ordenan los datos de menor a mayor y seconsideran los siguientes casos:

1 Si el numero de datos es impar, la mediana es el valor quese encuentra justo a la mitad de la lista.

2 Si el numero de valores es par, la mediana es el promediode los dos valores que estan a la mitad.

Rocıo Meza Moreno Estadıstica descriptiva

Page 41: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Considere los datos del ejemplo anterior:

10 9.2 10 9 9.5 0

que ordenados quedan:

0 9 9.2 9.5 10 10

Como el numero de datos es par, la mediana es

x =9.2 + 9.5

2= 9.35

Rocıo Meza Moreno Estadıstica descriptiva

Page 42: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Considere los datos del ejemplo anterior:

10 9.2 10 9 9.5 0

que ordenados quedan:

0 9 9.2 9.5 10 10

Como el numero de datos es par, la mediana es

x =9.2 + 9.5

2= 9.35

Rocıo Meza Moreno Estadıstica descriptiva

Page 43: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Considere los datos del ejemplo anterior:

10 9.2 10 9 9.5 0

que ordenados quedan:

0 9 9.2 9.5 10 10

Como el numero de datos es par, la mediana es

x =9.2 + 9.5

2= 9.35

Rocıo Meza Moreno Estadıstica descriptiva

Page 44: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Suponga, por ejemplo, que el estudiante tuvo la oportunidadde entregar la tarea faltante pero no obtuvo una buena nota,digamos que saco 6,

entonces su promedio serıa

x =6 + 9 + 9.2 + 9.5 + 10 + 10

6= 9.85

que es considerablemente mejor que el anterior. Sin embargo elvalor de la mediana seguirıa siendo 9.35.

Este ejemplo muestra que la media se ve muy afectada porvalores extremos pero la mediana no. Por esta razon la medianasuele utilizarse para conjuntos de datos que tienen un numerorelativamente pequeno de valores extremos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 45: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Suponga, por ejemplo, que el estudiante tuvo la oportunidadde entregar la tarea faltante pero no obtuvo una buena nota,digamos que saco 6, entonces su promedio serıa

x =6 + 9 + 9.2 + 9.5 + 10 + 10

6= 9.85

que es considerablemente mejor que el anterior. Sin embargo elvalor de la mediana seguirıa siendo 9.35.

Este ejemplo muestra que la media se ve muy afectada porvalores extremos pero la mediana no. Por esta razon la medianasuele utilizarse para conjuntos de datos que tienen un numerorelativamente pequeno de valores extremos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 46: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Suponga, por ejemplo, que el estudiante tuvo la oportunidadde entregar la tarea faltante pero no obtuvo una buena nota,digamos que saco 6, entonces su promedio serıa

x =6 + 9 + 9.2 + 9.5 + 10 + 10

6= 9.85

que es considerablemente mejor que el anterior. Sin embargo elvalor de la mediana seguirıa siendo 9.35.

Este ejemplo muestra que la media se ve muy afectada porvalores extremos pero la mediana no. Por esta razon la medianasuele utilizarse para conjuntos de datos que tienen un numerorelativamente pequeno de valores extremos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 47: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Suponga, por ejemplo, que el estudiante tuvo la oportunidadde entregar la tarea faltante pero no obtuvo una buena nota,digamos que saco 6, entonces su promedio serıa

x =6 + 9 + 9.2 + 9.5 + 10 + 10

6= 9.85

que es considerablemente mejor que el anterior. Sin embargo elvalor de la mediana seguirıa siendo 9.35.

Este ejemplo muestra que la media se ve muy afectada porvalores extremos pero la mediana no. Por esta razon la medianasuele utilizarse para conjuntos de datos que tienen un numerorelativamente pequeno de valores extremos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 48: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Suponga, por ejemplo, que el estudiante tuvo la oportunidadde entregar la tarea faltante pero no obtuvo una buena nota,digamos que saco 6, entonces su promedio serıa

x =6 + 9 + 9.2 + 9.5 + 10 + 10

6= 9.85

que es considerablemente mejor que el anterior. Sin embargo elvalor de la mediana seguirıa siendo 9.35.

Este ejemplo muestra que la media se ve muy afectada porvalores extremos pero la mediana no. Por esta razon la medianasuele utilizarse para conjuntos de datos que tienen un numerorelativamente pequeno de valores extremos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 49: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la mediana

1 La mediana puede calcularse para conjuntos de datos connivel de medicion de intervalo o de razon.

2 No influyen en la mediana valores extremadamente grandeso pequenos en los datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 50: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la mediana

1 La mediana puede calcularse para conjuntos de datos connivel de medicion de intervalo o de razon.

2 No influyen en la mediana valores extremadamente grandeso pequenos en los datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 51: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Moda

Es el valor que se presenta con mayor frecuencia en unconjunto de datos.

Observaciones:

1 Cuando dos valores se presentan con la misma frecuencia yesta es la mas alta, ambos valores son modas y en este casose dice que el conjunto de datos es bimodal.

2 Cuando mas de dos valores se presentan con la mismafrecuencia y esta es la mas alta, todos esos valores sonmodas, y el conjunto de datos se llama es multimodal.

3 Cuando ningun valor se repite, se dice que no hay moda.

Rocıo Meza Moreno Estadıstica descriptiva

Page 52: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Moda

Es el valor que se presenta con mayor frecuencia en unconjunto de datos.

Observaciones:

1 Cuando dos valores se presentan con la misma frecuencia yesta es la mas alta, ambos valores son modas y en este casose dice que el conjunto de datos es bimodal.

2 Cuando mas de dos valores se presentan con la mismafrecuencia y esta es la mas alta, todos esos valores sonmodas, y el conjunto de datos se llama es multimodal.

3 Cuando ningun valor se repite, se dice que no hay moda.

Rocıo Meza Moreno Estadıstica descriptiva

Page 53: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplos

1 En el ejemplo anterior la moda es 10, pues este valoraparece dos veces en la lista.

2 Para el siguiente conjunto de datos

5 1 -10 -6 5 12 7 8 2 5 -1 11 5

la moda es 5, pues ese valor aparece 4 veces.

3 Para los siguientes datos

27 27 27 55 55 55 88 88 99

27 y 55 son ambos modas, pues ambos se presentan 3 veces.

Rocıo Meza Moreno Estadıstica descriptiva

Page 54: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplos

1 En el ejemplo anterior la moda es 10, pues este valoraparece dos veces en la lista.

2 Para el siguiente conjunto de datos

5 1 -10 -6 5 12 7 8 2 5 -1 11 5

la moda es 5, pues ese valor aparece 4 veces.

3 Para los siguientes datos

27 27 27 55 55 55 88 88 99

27 y 55 son ambos modas, pues ambos se presentan 3 veces.

Rocıo Meza Moreno Estadıstica descriptiva

Page 55: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplos

1 En el ejemplo anterior la moda es 10, pues este valoraparece dos veces en la lista.

2 Para el siguiente conjunto de datos

5 1 -10 -6 5 12 7 8 2 5 -1 11 5

la moda es 5, pues ese valor aparece 4 veces.

3 Para los siguientes datos

27 27 27 55 55 55 88 88 99

27 y 55 son ambos modas, pues ambos se presentan 3 veces.

Rocıo Meza Moreno Estadıstica descriptiva

Page 56: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplos

1 En el ejemplo anterior la moda es 10, pues este valoraparece dos veces en la lista.

2 Para el siguiente conjunto de datos

5 1 -10 -6 5 12 7 8 2 5 -1 11 5

la moda es 5, pues ese valor aparece 4 veces.

3 Para los siguientes datos

27 27 27 55 55 55 88 88 99

27 y 55 son ambos modas, pues ambos se presentan 3 veces.

Rocıo Meza Moreno Estadıstica descriptiva

Page 57: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplos

1 En el ejemplo anterior la moda es 10, pues este valoraparece dos veces en la lista.

2 Para el siguiente conjunto de datos

5 1 -10 -6 5 12 7 8 2 5 -1 11 5

la moda es 5, pues ese valor aparece 4 veces.

3 Para los siguientes datos

27 27 27 55 55 55 88 88 99

27 y 55 son ambos modas, pues ambos se presentan 3 veces.

Rocıo Meza Moreno Estadıstica descriptiva

Page 58: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la moda

1 La moda puede calcularse para datos con cualquier nivel demedicion: nominal, ordinal, de intervalo y de razon.

2 La moda tampoco se ve afectada por valores muy grandeso muy pequenos en los datos.

3 La moda es de especial utilidad para resumir datos de nivelnominal.

4 En conjuntos de datos que resultan multimodales, la modaresulta poco util para describir la localizacion de los datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 59: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la moda

1 La moda puede calcularse para datos con cualquier nivel demedicion: nominal, ordinal, de intervalo y de razon.

2 La moda tampoco se ve afectada por valores muy grandeso muy pequenos en los datos.

3 La moda es de especial utilidad para resumir datos de nivelnominal.

4 En conjuntos de datos que resultan multimodales, la modaresulta poco util para describir la localizacion de los datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 60: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la moda

1 La moda puede calcularse para datos con cualquier nivel demedicion: nominal, ordinal, de intervalo y de razon.

2 La moda tampoco se ve afectada por valores muy grandeso muy pequenos en los datos.

3 La moda es de especial utilidad para resumir datos de nivelnominal.

4 En conjuntos de datos que resultan multimodales, la modaresulta poco util para describir la localizacion de los datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 61: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la moda

1 La moda puede calcularse para datos con cualquier nivel demedicion: nominal, ordinal, de intervalo y de razon.

2 La moda tampoco se ve afectada por valores muy grandeso muy pequenos en los datos.

3 La moda es de especial utilidad para resumir datos de nivelnominal.

4 En conjuntos de datos que resultan multimodales, la modaresulta poco util para describir la localizacion de los datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 62: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Mitad del rango

Es la medida de tendencia central que constituye el valor (queno necesariamente es un dato) que esta a la mitad, entre elvalor maximo y el valor mınimo de un conjunto de datos.

En sımbolos,

mitad del rango =valor maximo + valor mınimo

2

Rocıo Meza Moreno Estadıstica descriptiva

Page 63: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Mitad del rango

Es la medida de tendencia central que constituye el valor (queno necesariamente es un dato) que esta a la mitad, entre elvalor maximo y el valor mınimo de un conjunto de datos.

En sımbolos,

mitad del rango =valor maximo + valor mınimo

2

Rocıo Meza Moreno Estadıstica descriptiva

Page 64: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

La mitad del rango del siguiente conjunto de datos

5 2 -10 -6 5 12 7 8 2 5 -1 11 5

es12 + (−10)

2= 1.

Rocıo Meza Moreno Estadıstica descriptiva

Page 65: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la mitad del rango

1 Puede calcularse para datos con nivel de medicion deintervalo o de razon.

2 Es facil de calcular.

3 Ayuda a reforzar la importante idea de que hay variasmaneras de definir el centro de un conjunto de datos.

4 Se emplea pocas veces pues solo se utilizan dos datos en suobtencion.

5 Es comun utilizar la mitad del rango incorrectamente envez de la mediana. Esto se evita teniendo claras ambasdefiniciones.

Rocıo Meza Moreno Estadıstica descriptiva

Page 66: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la mitad del rango

1 Puede calcularse para datos con nivel de medicion deintervalo o de razon.

2 Es facil de calcular.

3 Ayuda a reforzar la importante idea de que hay variasmaneras de definir el centro de un conjunto de datos.

4 Se emplea pocas veces pues solo se utilizan dos datos en suobtencion.

5 Es comun utilizar la mitad del rango incorrectamente envez de la mediana. Esto se evita teniendo claras ambasdefiniciones.

Rocıo Meza Moreno Estadıstica descriptiva

Page 67: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la mitad del rango

1 Puede calcularse para datos con nivel de medicion deintervalo o de razon.

2 Es facil de calcular.

3 Ayuda a reforzar la importante idea de que hay variasmaneras de definir el centro de un conjunto de datos.

4 Se emplea pocas veces pues solo se utilizan dos datos en suobtencion.

5 Es comun utilizar la mitad del rango incorrectamente envez de la mediana. Esto se evita teniendo claras ambasdefiniciones.

Rocıo Meza Moreno Estadıstica descriptiva

Page 68: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la mitad del rango

1 Puede calcularse para datos con nivel de medicion deintervalo o de razon.

2 Es facil de calcular.

3 Ayuda a reforzar la importante idea de que hay variasmaneras de definir el centro de un conjunto de datos.

4 Se emplea pocas veces pues solo se utilizan dos datos en suobtencion.

5 Es comun utilizar la mitad del rango incorrectamente envez de la mediana. Esto se evita teniendo claras ambasdefiniciones.

Rocıo Meza Moreno Estadıstica descriptiva

Page 69: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la mitad del rango

1 Puede calcularse para datos con nivel de medicion deintervalo o de razon.

2 Es facil de calcular.

3 Ayuda a reforzar la importante idea de que hay variasmaneras de definir el centro de un conjunto de datos.

4 Se emplea pocas veces pues solo se utilizan dos datos en suobtencion.

5 Es comun utilizar la mitad del rango incorrectamente envez de la mediana. Esto se evita teniendo claras ambasdefiniciones.

Rocıo Meza Moreno Estadıstica descriptiva

Page 70: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

¿Cual es la mejor medida de tendencia central?

1 Depende del conjunto de datos. No hay criterios objetivospara determinar la medida mas representativa para todoslos conjuntos de datos.

2 Las diferentes medidas de tendencia central ofrecendiversas ventajas y desventajas

3 Las medias muestrales tienden a ser mas consistentes queotras medidas de tendencia central, es decir, las medias demuestras obtenidas de la misma poblacion no varıan tantocomo las otras medidas de tendencia central.

Rocıo Meza Moreno Estadıstica descriptiva

Page 71: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

¿Cual es la mejor medida de tendencia central?

1 Depende del conjunto de datos. No hay criterios objetivospara determinar la medida mas representativa para todoslos conjuntos de datos.

2 Las diferentes medidas de tendencia central ofrecendiversas ventajas y desventajas

3 Las medias muestrales tienden a ser mas consistentes queotras medidas de tendencia central, es decir, las medias demuestras obtenidas de la misma poblacion no varıan tantocomo las otras medidas de tendencia central.

Rocıo Meza Moreno Estadıstica descriptiva

Page 72: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

¿Cual es la mejor medida de tendencia central?

1 Depende del conjunto de datos. No hay criterios objetivospara determinar la medida mas representativa para todoslos conjuntos de datos.

2 Las diferentes medidas de tendencia central ofrecendiversas ventajas y desventajas

3 Las medias muestrales tienden a ser mas consistentes queotras medidas de tendencia central, es decir, las medias demuestras obtenidas de la misma poblacion no varıan tantocomo las otras medidas de tendencia central.

Rocıo Meza Moreno Estadıstica descriptiva

Page 73: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Medidas de variacion (dispersion)

Considerense los siguientes tres conjuntos de datos

Muestra 1: 6 6 6Muestra 2: 3 7.5 7.5Muestra 3: 1 7 10

Los tres conjuntos tienen media 6. Sin embargo se observaque la variacion en los datos es muy distinta en las tresmuestras de datos.

Ası pues, las medidas de tendencia central no son suficientespara describir a un conjunto de datos y por lo tanto es necesarioestablecer algunas formas de medir la variacion.

Rocıo Meza Moreno Estadıstica descriptiva

Page 74: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Medidas de variacion (dispersion)

Considerense los siguientes tres conjuntos de datos

Muestra 1: 6 6 6Muestra 2: 3 7.5 7.5Muestra 3: 1 7 10

Los tres conjuntos tienen media 6.

Sin embargo se observaque la variacion en los datos es muy distinta en las tresmuestras de datos.

Ası pues, las medidas de tendencia central no son suficientespara describir a un conjunto de datos y por lo tanto es necesarioestablecer algunas formas de medir la variacion.

Rocıo Meza Moreno Estadıstica descriptiva

Page 75: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Medidas de variacion (dispersion)

Considerense los siguientes tres conjuntos de datos

Muestra 1: 6 6 6Muestra 2: 3 7.5 7.5Muestra 3: 1 7 10

Los tres conjuntos tienen media 6. Sin embargo se observaque la variacion en los datos es muy distinta en las tresmuestras de datos.

Ası pues, las medidas de tendencia central no son suficientespara describir a un conjunto de datos y por lo tanto es necesarioestablecer algunas formas de medir la variacion.

Rocıo Meza Moreno Estadıstica descriptiva

Page 76: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Medidas de variacion (dispersion)

Considerense los siguientes tres conjuntos de datos

Muestra 1: 6 6 6Muestra 2: 3 7.5 7.5Muestra 3: 1 7 10

Los tres conjuntos tienen media 6. Sin embargo se observaque la variacion en los datos es muy distinta en las tresmuestras de datos.

Ası pues, las medidas de tendencia central no son suficientespara describir a un conjunto de datos y por lo tanto es necesarioestablecer algunas formas de medir la variacion.

Rocıo Meza Moreno Estadıstica descriptiva

Page 77: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Rango

Es la medida de dispersion mas simple y se define como ladiferencia entre el valor maximo y el valor mınimo de los datos.

Esto es:

rango = valor maximo− valor mınimo

Para los datos anteriores, tenemos

Rango

Muestra 1: 6 6 6 0Muestra 2: 3 7.5 7.5 4.5Muestra 3: 1 7 10 9

Rocıo Meza Moreno Estadıstica descriptiva

Page 78: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Rango

Es la medida de dispersion mas simple y se define como ladiferencia entre el valor maximo y el valor mınimo de los datos.

Esto es:

rango = valor maximo− valor mınimo

Para los datos anteriores, tenemos

Rango

Muestra 1: 6 6 6 0Muestra 2: 3 7.5 7.5 4.5Muestra 3: 1 7 10 9

Rocıo Meza Moreno Estadıstica descriptiva

Page 79: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Rango

Es la medida de dispersion mas simple y se define como ladiferencia entre el valor maximo y el valor mınimo de los datos.

Esto es:

rango = valor maximo− valor mınimo

Para los datos anteriores, tenemos

Rango

Muestra 1: 6 6 6 0Muestra 2: 3 7.5 7.5 4.5Muestra 3: 1 7 10 9

Rocıo Meza Moreno Estadıstica descriptiva

Page 80: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

La principal caracterıstica del rango es que es facil decalcular, pero al depender solo de dos valores del conjunto dedatos, no es tan util como otras medidas de variacion.

Veremos a continuacion medidas de dispersion que tomen encuenta la variacion de todos los datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 81: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

La principal caracterıstica del rango es que es facil decalcular, pero al depender solo de dos valores del conjunto dedatos, no es tan util como otras medidas de variacion.

Veremos a continuacion medidas de dispersion que tomen encuenta la variacion de todos los datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 82: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Desviacion media

Es el promedio de los valores absolutos de las desviacionescon respecto a la media aritmetica.

En sımbolos:

dm =

n∑i=1

|xi − x|

n

Rocıo Meza Moreno Estadıstica descriptiva

Page 83: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Desviacion media

Es el promedio de los valores absolutos de las desviacionescon respecto a la media aritmetica.

En sımbolos:

dm =

n∑i=1

|xi − x|

n

Rocıo Meza Moreno Estadıstica descriptiva

Page 84: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo [2]

Se muestra el numero de capuchinos que se vendieron en ellocal de Starbucks de los aeropuertos de Orange County yOntario, California, entre las 4 y las 5 de la tarde durante 5 dıasdel mes pasado.

Aeropuertos

Orange County Ontario

20 2040 4950 5060 5180 80

Rocıo Meza Moreno Estadıstica descriptiva

Page 85: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Las medidas de tendencia central para este conjunto de datosson

Orange County Ontario

Media 50 50Mediana 50 50Mitad del rango 50 50

Las tres medidas son exactamente iguales, ¿podemos concluirque no hay diferencias entre los conjuntos de datos?

Para responder esta pregunta calculemos las medidas devariacion que hemos visto. El rango es, en ambos casos

80− 20 = 60.

Para la desviacion media calculamos,

Rocıo Meza Moreno Estadıstica descriptiva

Page 86: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Las medidas de tendencia central para este conjunto de datosson

Orange County Ontario

Media 50 50Mediana 50 50Mitad del rango 50 50

Las tres medidas son exactamente iguales, ¿podemos concluirque no hay diferencias entre los conjuntos de datos?

Para responder esta pregunta calculemos las medidas devariacion que hemos visto. El rango es, en ambos casos

80− 20 = 60.

Para la desviacion media calculamos,

Rocıo Meza Moreno Estadıstica descriptiva

Page 87: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Las medidas de tendencia central para este conjunto de datosson

Orange County Ontario

Media 50 50Mediana 50 50Mitad del rango 50 50

Las tres medidas son exactamente iguales, ¿podemos concluirque no hay diferencias entre los conjuntos de datos?

Para responder esta pregunta calculemos las medidas devariacion que hemos visto.

El rango es, en ambos casos

80− 20 = 60.

Para la desviacion media calculamos,

Rocıo Meza Moreno Estadıstica descriptiva

Page 88: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Las medidas de tendencia central para este conjunto de datosson

Orange County Ontario

Media 50 50Mediana 50 50Mitad del rango 50 50

Las tres medidas son exactamente iguales, ¿podemos concluirque no hay diferencias entre los conjuntos de datos?

Para responder esta pregunta calculemos las medidas devariacion que hemos visto. El rango es, en ambos casos

80− 20 = 60.

Para la desviacion media calculamos,

Rocıo Meza Moreno Estadıstica descriptiva

Page 89: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Las medidas de tendencia central para este conjunto de datosson

Orange County Ontario

Media 50 50Mediana 50 50Mitad del rango 50 50

Las tres medidas son exactamente iguales, ¿podemos concluirque no hay diferencias entre los conjuntos de datos?

Para responder esta pregunta calculemos las medidas devariacion que hemos visto. El rango es, en ambos casos

80− 20 = 60.

Para la desviacion media calculamos,

Rocıo Meza Moreno Estadıstica descriptiva

Page 90: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Orange County Ontario

xi xi − x |xi − x| xi xi − x |xi − x|20 -30 30 20 -30 3040 -10 10 49 -1 150 0 0 50 0 060 10 10 51 1 180 30 30 80 30 30

Total 80 Total 62

Ası pues, la desviacion media para Orange County es

dm =80

5= 16

y la de Ontario es

dm =62

5= 12.4

Rocıo Meza Moreno Estadıstica descriptiva

Page 91: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Orange County Ontario

xi xi − x |xi − x| xi xi − x |xi − x|20 -30 30 20 -30 3040 -10 10 49 -1 150 0 0 50 0 060 10 10 51 1 180 30 30 80 30 30

Total 80 Total 62

Ası pues, la desviacion media para Orange County es

dm =80

5=

16

y la de Ontario es

dm =62

5= 12.4

Rocıo Meza Moreno Estadıstica descriptiva

Page 92: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Orange County Ontario

xi xi − x |xi − x| xi xi − x |xi − x|20 -30 30 20 -30 3040 -10 10 49 -1 150 0 0 50 0 060 10 10 51 1 180 30 30 80 30 30

Total 80 Total 62

Ası pues, la desviacion media para Orange County es

dm =80

5= 16

y la de Ontario es

dm =62

5= 12.4

Rocıo Meza Moreno Estadıstica descriptiva

Page 93: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Orange County Ontario

xi xi − x |xi − x| xi xi − x |xi − x|20 -30 30 20 -30 3040 -10 10 49 -1 150 0 0 50 0 060 10 10 51 1 180 30 30 80 30 30

Total 80 Total 62

Ası pues, la desviacion media para Orange County es

dm =80

5= 16

y la de Ontario es

dm =62

5=

12.4

Rocıo Meza Moreno Estadıstica descriptiva

Page 94: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Orange County Ontario

xi xi − x |xi − x| xi xi − x |xi − x|20 -30 30 20 -30 3040 -10 10 49 -1 150 0 0 50 0 060 10 10 51 1 180 30 30 80 30 30

Total 80 Total 62

Ası pues, la desviacion media para Orange County es

dm =80

5= 16

y la de Ontario es

dm =62

5= 12.4

Rocıo Meza Moreno Estadıstica descriptiva

Page 95: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Concluimos entonces que los valores de las ventas delStarbukcs Ontario estan mas concentrados cerca de la mediaque los valores de las ventas de la tienda de Orange County.

Rocıo Meza Moreno Estadıstica descriptiva

Page 96: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

La principal desventaja de la desviacion media es que, debidoa que se calcula usando valores absolutos, carece de unapropiedad aditiva.

Ademas, es un estadıstico sesgado, es decir, cuando se tomala desviacion media para varias muestras de una poblacion,estos valores no tienden a ser cercanos a la desviacion mediapoblacional.

Rocıo Meza Moreno Estadıstica descriptiva

Page 97: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

La principal desventaja de la desviacion media es que, debidoa que se calcula usando valores absolutos, carece de unapropiedad aditiva.

Ademas, es un estadıstico sesgado, es decir, cuando se tomala desviacion media para varias muestras de una poblacion,estos valores no tienden a ser cercanos a la desviacion mediapoblacional.

Rocıo Meza Moreno Estadıstica descriptiva

Page 98: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Varianza

Es la medida de variacion que se define como el promedio delas desviaciones de la media elevadas al cuadrado.

Varianza poblacional: se denota por el sımbolo σ2 y secalcula por medio de la formula:

σ2 =

N∑i=1

(xi − µ)2

N

Observe que para calcular la varianza es indispensableconocer el valor de la media.

Rocıo Meza Moreno Estadıstica descriptiva

Page 99: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Varianza

Es la medida de variacion que se define como el promedio delas desviaciones de la media elevadas al cuadrado.

Varianza poblacional: se denota por el sımbolo σ2 y secalcula por medio de la formula:

σ2 =

N∑i=1

(xi − µ)2

N

Observe que para calcular la varianza es indispensableconocer el valor de la media.

Rocıo Meza Moreno Estadıstica descriptiva

Page 100: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Varianza

Es la medida de variacion que se define como el promedio delas desviaciones de la media elevadas al cuadrado.

Varianza poblacional: se denota por el sımbolo σ2 y secalcula por medio de la formula:

σ2 =

N∑i=1

(xi − µ)2

N

Observe que para calcular la varianza es indispensableconocer el valor de la media.

Rocıo Meza Moreno Estadıstica descriptiva

Page 101: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo (calculo de la varianza poblacional)

El informe anual de cierta empresa incluyo las siguientesganancias primarias por accion comun durante los pasados 5anos: $2.68, $1.03, $2.26, $4.30 y $3.58. Suponiendo que estosson los valores poblacionales, para calcular la varianza:

Primero se obtiene el valor de la media:

µ =

N∑i=1

xi

N=

2.68 + 1.03 + 2.26 + 4.30 + 3.58

5=

13.85

5= 2.77

y despues se calcula

Rocıo Meza Moreno Estadıstica descriptiva

Page 102: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo (calculo de la varianza poblacional)

El informe anual de cierta empresa incluyo las siguientesganancias primarias por accion comun durante los pasados 5anos: $2.68, $1.03, $2.26, $4.30 y $3.58. Suponiendo que estosson los valores poblacionales, para calcular la varianza:

Primero se obtiene el valor de la media:

µ =

N∑i=1

xi

N=

2.68 + 1.03 + 2.26 + 4.30 + 3.58

5=

13.85

5= 2.77

y despues se calcula

Rocıo Meza Moreno Estadıstica descriptiva

Page 103: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo (calculo de la varianza poblacional)

El informe anual de cierta empresa incluyo las siguientesganancias primarias por accion comun durante los pasados 5anos: $2.68, $1.03, $2.26, $4.30 y $3.58. Suponiendo que estosson los valores poblacionales, para calcular la varianza:

Primero se obtiene el valor de la media:

µ =

N∑i=1

xi

N=

2.68 + 1.03 + 2.26 + 4.30 + 3.58

5=

13.85

5= 2.77

y despues se calcula

Rocıo Meza Moreno Estadıstica descriptiva

Page 104: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo (calculo de la varianza poblacional)

El informe anual de cierta empresa incluyo las siguientesganancias primarias por accion comun durante los pasados 5anos: $2.68, $1.03, $2.26, $4.30 y $3.58. Suponiendo que estosson los valores poblacionales, para calcular la varianza:

Primero se obtiene el valor de la media:

µ =

N∑i=1

xi

N=

2.68 + 1.03 + 2.26 + 4.30 + 3.58

5=

13.85

5=

2.77

y despues se calcula

Rocıo Meza Moreno Estadıstica descriptiva

Page 105: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo (calculo de la varianza poblacional)

El informe anual de cierta empresa incluyo las siguientesganancias primarias por accion comun durante los pasados 5anos: $2.68, $1.03, $2.26, $4.30 y $3.58. Suponiendo que estosson los valores poblacionales, para calcular la varianza:

Primero se obtiene el valor de la media:

µ =

N∑i=1

xi

N=

2.68 + 1.03 + 2.26 + 4.30 + 3.58

5=

13.85

5= 2.77

y despues se calcula

Rocıo Meza Moreno Estadıstica descriptiva

Page 106: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo (calculo de la varianza poblacional)

El informe anual de cierta empresa incluyo las siguientesganancias primarias por accion comun durante los pasados 5anos: $2.68, $1.03, $2.26, $4.30 y $3.58. Suponiendo que estosson los valores poblacionales, para calcular la varianza:

Primero se obtiene el valor de la media:

µ =

N∑i=1

xi

N=

2.68 + 1.03 + 2.26 + 4.30 + 3.58

5=

13.85

5= 2.77

y despues se calcula

Rocıo Meza Moreno Estadıstica descriptiva

Page 107: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

xi xi − µ (xi − µ)2

2.68

-0.09 0.0081

1.03

-1.74 3.0276

2.26

-0.51 0.2601

4.30

1.53 2.3409

3.58

0.81 0.6561

Total 0 6.2928

finalmente, la varianza es:

σ2 =

N∑i=1

(xi − µ)2

N=

6.2928

5= 1.256

Rocıo Meza Moreno Estadıstica descriptiva

Page 108: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

xi xi − µ (xi − µ)2

2.68 -0.09

0.0081

1.03

-1.74 3.0276

2.26

-0.51 0.2601

4.30

1.53 2.3409

3.58

0.81 0.6561

Total 0 6.2928

finalmente, la varianza es:

σ2 =

N∑i=1

(xi − µ)2

N=

6.2928

5= 1.256

Rocıo Meza Moreno Estadıstica descriptiva

Page 109: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

xi xi − µ (xi − µ)2

2.68 -0.09

0.0081

1.03 -1.74

3.0276

2.26 -0.51

0.2601

4.30 1.53

2.3409

3.58 0.81

0.6561

Total 0 6.2928

finalmente, la varianza es:

σ2 =

N∑i=1

(xi − µ)2

N=

6.2928

5= 1.256

Rocıo Meza Moreno Estadıstica descriptiva

Page 110: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

xi xi − µ (xi − µ)2

2.68 -0.09 0.00811.03 -1.74

3.0276

2.26 -0.51

0.2601

4.30 1.53

2.3409

3.58 0.81

0.6561

Total 0 6.2928

finalmente, la varianza es:

σ2 =

N∑i=1

(xi − µ)2

N=

6.2928

5= 1.256

Rocıo Meza Moreno Estadıstica descriptiva

Page 111: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

xi xi − µ (xi − µ)2

2.68 -0.09 0.00811.03 -1.74 3.02762.26 -0.51 0.26014.30 1.53 2.34093.58 0.81 0.6561

Total 0 6.2928

finalmente, la varianza es:

σ2 =

N∑i=1

(xi − µ)2

N=

6.2928

5= 1.256

Rocıo Meza Moreno Estadıstica descriptiva

Page 112: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

xi xi − µ (xi − µ)2

2.68 -0.09 0.00811.03 -1.74 3.02762.26 -0.51 0.26014.30 1.53 2.34093.58 0.81 0.6561

Total

0 6.2928

finalmente, la varianza es:

σ2 =

N∑i=1

(xi − µ)2

N=

6.2928

5= 1.256

Rocıo Meza Moreno Estadıstica descriptiva

Page 113: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

xi xi − µ (xi − µ)2

2.68 -0.09 0.00811.03 -1.74 3.02762.26 -0.51 0.26014.30 1.53 2.34093.58 0.81 0.6561

Total 0

6.2928

finalmente, la varianza es:

σ2 =

N∑i=1

(xi − µ)2

N=

6.2928

5= 1.256

Rocıo Meza Moreno Estadıstica descriptiva

Page 114: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

xi xi − µ (xi − µ)2

2.68 -0.09 0.00811.03 -1.74 3.02762.26 -0.51 0.26014.30 1.53 2.34093.58 0.81 0.6561

Total 0 6.2928

finalmente, la varianza es:

σ2 =

N∑i=1

(xi − µ)2

N=

6.2928

5= 1.256

Rocıo Meza Moreno Estadıstica descriptiva

Page 115: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

xi xi − µ (xi − µ)2

2.68 -0.09 0.00811.03 -1.74 3.02762.26 -0.51 0.26014.30 1.53 2.34093.58 0.81 0.6561

Total 0 6.2928

finalmente, la varianza es:

σ2 =

N∑i=1

(xi − µ)2

N=

6.2928

5= 1.256

Rocıo Meza Moreno Estadıstica descriptiva

Page 116: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

xi xi − µ (xi − µ)2

2.68 -0.09 0.00811.03 -1.74 3.02762.26 -0.51 0.26014.30 1.53 2.34093.58 0.81 0.6561

Total 0 6.2928

finalmente, la varianza es:

σ2 =

N∑i=1

(xi − µ)2

N=

6.2928

5=

1.256

Rocıo Meza Moreno Estadıstica descriptiva

Page 117: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

xi xi − µ (xi − µ)2

2.68 -0.09 0.00811.03 -1.74 3.02762.26 -0.51 0.26014.30 1.53 2.34093.58 0.81 0.6561

Total 0 6.2928

finalmente, la varianza es:

σ2 =

N∑i=1

(xi − µ)2

N=

6.2928

5= 1.256

Rocıo Meza Moreno Estadıstica descriptiva

Page 118: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Consideraciones sobre el redondeo

1 No se deben redondear valores a la mitad de un calculo, seredondea solo la respuesta final.

2 Al redondear, se recomienda aumentar una posiciondecimal a las que hay en el conjunto original de datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 119: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Varianza muestral: se denota por el sımbolo s2 y se calculapor medio de la formula:

s2 =

n∑i=1

(xi − x)2

(n− 1)

Se divide entre n− 1 pues de esta manera se logra que s2 seaun estimador insesgado de la σ2, es decir, al tomar diferentesmuestras de una misma poblacion, los valores de la varianzamuestral tienden a igualar el valor de la varianza poblacional.

Rocıo Meza Moreno Estadıstica descriptiva

Page 120: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Varianza muestral: se denota por el sımbolo s2 y se calculapor medio de la formula:

s2 =

n∑i=1

(xi − x)2

(n− 1)

Se divide entre n− 1 pues de esta manera se logra que s2 seaun estimador insesgado de la σ2, es decir, al tomar diferentesmuestras de una misma poblacion, los valores de la varianzamuestral tienden a igualar el valor de la varianza poblacional.

Rocıo Meza Moreno Estadıstica descriptiva

Page 121: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.

Orange County Ontario

xi xi − x (xi − x)2 xi xi − x (xi − x)2

20

-30 900

20

-30 900

40

-10 100

49

-1 1

50

0 0

50

0 0

60

10 100

51

1 1

80

30 900

80

30 900

Total 2000 Total 1802

Las varianzas muestrales son entonces:

s2oc =2000

4= 500 y s2o =

1802

4= 450.5

Rocıo Meza Moreno Estadıstica descriptiva

Page 122: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.

Orange County Ontario

xi xi − x (xi − x)2 xi xi − x (xi − x)2

20 -30

900

20

-30 900

40

-10 100

49

-1 1

50

0 0

50

0 0

60

10 100

51

1 1

80

30 900

80

30 900

Total 2000 Total 1802

Las varianzas muestrales son entonces:

s2oc =2000

4= 500 y s2o =

1802

4= 450.5

Rocıo Meza Moreno Estadıstica descriptiva

Page 123: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.

Orange County Ontario

xi xi − x (xi − x)2 xi xi − x (xi − x)2

20 -30

900

20

-30 900

40 -10

100

49

-1 1

50 0

0

50

0 0

60 10

100

51

1 1

80 30

900

80

30 900

Total 2000 Total 1802

Las varianzas muestrales son entonces:

s2oc =2000

4= 500 y s2o =

1802

4= 450.5

Rocıo Meza Moreno Estadıstica descriptiva

Page 124: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.

Orange County Ontario

xi xi − x (xi − x)2 xi xi − x (xi − x)2

20 -30 900 20

-30 900

40 -10

100

49

-1 1

50 0

0

50

0 0

60 10

100

51

1 1

80 30

900

80

30 900

Total 2000 Total 1802

Las varianzas muestrales son entonces:

s2oc =2000

4= 500 y s2o =

1802

4= 450.5

Rocıo Meza Moreno Estadıstica descriptiva

Page 125: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.

Orange County Ontario

xi xi − x (xi − x)2 xi xi − x (xi − x)2

20 -30 900 20

-30 900

40 -10 100 49

-1 1

50 0 0 50

0 0

60 10 100 51

1 1

80 30 900 80

30 900

Total 2000 Total 1802

Las varianzas muestrales son entonces:

s2oc =2000

4= 500 y s2o =

1802

4= 450.5

Rocıo Meza Moreno Estadıstica descriptiva

Page 126: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.

Orange County Ontario

xi xi − x (xi − x)2 xi xi − x (xi − x)2

20 -30 900 20 -30

900

40 -10 100 49

-1 1

50 0 0 50

0 0

60 10 100 51

1 1

80 30 900 80

30 900

Total 2000 Total 1802

Las varianzas muestrales son entonces:

s2oc =2000

4= 500 y s2o =

1802

4= 450.5

Rocıo Meza Moreno Estadıstica descriptiva

Page 127: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.

Orange County Ontario

xi xi − x (xi − x)2 xi xi − x (xi − x)2

20 -30 900 20 -30

900

40 -10 100 49 -1

1

50 0 0 50 0

0

60 10 100 51 1

1

80 30 900 80 30

900

Total 2000 Total 1802

Las varianzas muestrales son entonces:

s2oc =2000

4= 500 y s2o =

1802

4= 450.5

Rocıo Meza Moreno Estadıstica descriptiva

Page 128: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.

Orange County Ontario

xi xi − x (xi − x)2 xi xi − x (xi − x)2

20 -30 900 20 -30 90040 -10 100 49 -1

1

50 0 0 50 0

0

60 10 100 51 1

1

80 30 900 80 30

900

Total 2000 Total 1802

Las varianzas muestrales son entonces:

s2oc =2000

4= 500 y s2o =

1802

4= 450.5

Rocıo Meza Moreno Estadıstica descriptiva

Page 129: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.

Orange County Ontario

xi xi − x (xi − x)2 xi xi − x (xi − x)2

20 -30 900 20 -30 90040 -10 100 49 -1 150 0 0 50 0 060 10 100 51 1 180 30 900 80 30 900

Total 2000 Total 1802

Las varianzas muestrales son entonces:

s2oc =2000

4= 500 y s2o =

1802

4= 450.5

Rocıo Meza Moreno Estadıstica descriptiva

Page 130: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.

Orange County Ontario

xi xi − x (xi − x)2 xi xi − x (xi − x)2

20 -30 900 20 -30 90040 -10 100 49 -1 150 0 0 50 0 060 10 100 51 1 180 30 900 80 30 900

Total 2000 Total 1802

Las varianzas muestrales son entonces:

s2oc =2000

4= 500 y s2o =

1802

4= 450.5

Rocıo Meza Moreno Estadıstica descriptiva

Page 131: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.

Orange County Ontario

xi xi − x (xi − x)2 xi xi − x (xi − x)2

20 -30 900 20 -30 90040 -10 100 49 -1 150 0 0 50 0 060 10 100 51 1 180 30 900 80 30 900

Total 2000 Total 1802

Las varianzas muestrales son entonces:

s2oc =2000

4=

500 y s2o =1802

4= 450.5

Rocıo Meza Moreno Estadıstica descriptiva

Page 132: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.

Orange County Ontario

xi xi − x (xi − x)2 xi xi − x (xi − x)2

20 -30 900 20 -30 90040 -10 100 49 -1 150 0 0 50 0 060 10 100 51 1 180 30 900 80 30 900

Total 2000 Total 1802

Las varianzas muestrales son entonces:

s2oc =2000

4= 500

y s2o =1802

4= 450.5

Rocıo Meza Moreno Estadıstica descriptiva

Page 133: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.

Orange County Ontario

xi xi − x (xi − x)2 xi xi − x (xi − x)2

20 -30 900 20 -30 90040 -10 100 49 -1 150 0 0 50 0 060 10 100 51 1 180 30 900 80 30 900

Total 2000 Total 1802

Las varianzas muestrales son entonces:

s2oc =2000

4= 500 y s2o =

1802

4=

450.5

Rocıo Meza Moreno Estadıstica descriptiva

Page 134: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.

Orange County Ontario

xi xi − x (xi − x)2 xi xi − x (xi − x)2

20 -30 900 20 -30 90040 -10 100 49 -1 150 0 0 50 0 060 10 100 51 1 180 30 900 80 30 900

Total 2000 Total 1802

Las varianzas muestrales son entonces:

s2oc =2000

4= 500 y s2o =

1802

4= 450.5

Rocıo Meza Moreno Estadıstica descriptiva

Page 135: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la varianza

1 La varianza es un estadıstico importante que se utiliza enalgunos metodos estadısticos relevantes.

2 Toma en cuenta las variaciones de todos los datos conrespecto de la media.

3 La varianza es un valor que nunca es negativo y solo escero cuando todos los valores de los datos son iguales.

4 Una desventaja de la varianza es que no esta en las mismasunidades que el conjunto original de datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 136: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la varianza

1 La varianza es un estadıstico importante que se utiliza enalgunos metodos estadısticos relevantes.

2 Toma en cuenta las variaciones de todos los datos conrespecto de la media.

3 La varianza es un valor que nunca es negativo y solo escero cuando todos los valores de los datos son iguales.

4 Una desventaja de la varianza es que no esta en las mismasunidades que el conjunto original de datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 137: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la varianza

1 La varianza es un estadıstico importante que se utiliza enalgunos metodos estadısticos relevantes.

2 Toma en cuenta las variaciones de todos los datos conrespecto de la media.

3 La varianza es un valor que nunca es negativo y solo escero cuando todos los valores de los datos son iguales.

4 Una desventaja de la varianza es que no esta en las mismasunidades que el conjunto original de datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 138: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la varianza

1 La varianza es un estadıstico importante que se utiliza enalgunos metodos estadısticos relevantes.

2 Toma en cuenta las variaciones de todos los datos conrespecto de la media.

3 La varianza es un valor que nunca es negativo y solo escero cuando todos los valores de los datos son iguales.

4 Una desventaja de la varianza es que no esta en las mismasunidades que el conjunto original de datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 139: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Desviacion estandar

Es la raız cuadrada de la varianza.

La desviacion estandar se denota por σ cuando se trata de unvalor poblacional y por s cuando es un valor muestral. Tenemospor definicion que:

σ =

√√√√√√N∑i=1

(xi − µ)2

Ny s =

√√√√√√n∑

i=1

(xi − x)2

(n− 1)

Rocıo Meza Moreno Estadıstica descriptiva

Page 140: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Desviacion estandar

Es la raız cuadrada de la varianza.

La desviacion estandar se denota por σ cuando se trata de unvalor poblacional y por s cuando es un valor muestral.

Tenemospor definicion que:

σ =

√√√√√√N∑i=1

(xi − µ)2

Ny s =

√√√√√√n∑

i=1

(xi − x)2

(n− 1)

Rocıo Meza Moreno Estadıstica descriptiva

Page 141: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Desviacion estandar

Es la raız cuadrada de la varianza.

La desviacion estandar se denota por σ cuando se trata de unvalor poblacional y por s cuando es un valor muestral. Tenemospor definicion que:

σ =

√√√√√√N∑i=1

(xi − µ)2

Ny s =

√√√√√√n∑

i=1

(xi − x)2

(n− 1)

Rocıo Meza Moreno Estadıstica descriptiva

Page 142: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Desviacion estandar

Es la raız cuadrada de la varianza.

La desviacion estandar se denota por σ cuando se trata de unvalor poblacional y por s cuando es un valor muestral. Tenemospor definicion que:

σ =

√√√√√√N∑i=1

(xi − µ)2

N

y s =

√√√√√√n∑

i=1

(xi − x)2

(n− 1)

Rocıo Meza Moreno Estadıstica descriptiva

Page 143: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Desviacion estandar

Es la raız cuadrada de la varianza.

La desviacion estandar se denota por σ cuando se trata de unvalor poblacional y por s cuando es un valor muestral. Tenemospor definicion que:

σ =

√√√√√√N∑i=1

(xi − µ)2

Ny s =

√√√√√√n∑

i=1

(xi − x)2

(n− 1)

Rocıo Meza Moreno Estadıstica descriptiva

Page 144: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Para el ejemplo de las tiendas Starbucks,

soc =√

500 = 22.4 y so =√

450.5 = 21.2

Rocıo Meza Moreno Estadıstica descriptiva

Page 145: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Formula alternativa para la desviacion estandar de unamuestra:

s =

√√√√√√n

n∑i=1

(x2i )−

(n∑

i=1

xi

)2

n(n− 1)

Esta forumla es mas facil de usar y elimina los errores deredondeo intermedios que se introducen en el calculo de ladesviacion estandar, cuando no se utiliza el valor exacto de lamedia.

Rocıo Meza Moreno Estadıstica descriptiva

Page 146: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Formula alternativa para la desviacion estandar de unamuestra:

s =

√√√√√√n

n∑i=1

(x2i )−

(n∑

i=1

xi

)2

n(n− 1)

Esta forumla es mas facil de usar y elimina los errores deredondeo intermedios que se introducen en el calculo de ladesviacion estandar, cuando no se utiliza el valor exacto de lamedia.

Rocıo Meza Moreno Estadıstica descriptiva

Page 147: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo.

Usemos la formula anterior para calcular nuevamente ladesviacion estandar para los datos de la tienda Starbucks delaeropuerto de Orange County:

Orange County

xi xi − x (xi − x)2 xi x2i20 -30 900 20

400

40 -10 100 40

1600

50 0 0 50

2500

60 10 100 60

3600

80 30 900 80

6400

Total 2000 250 14500

Rocıo Meza Moreno Estadıstica descriptiva

Page 148: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo.

Usemos la formula anterior para calcular nuevamente ladesviacion estandar para los datos de la tienda Starbucks delaeropuerto de Orange County:

Orange County

xi xi − x (xi − x)2 xi x2i20 -30 900 20 40040 -10 100 40

1600

50 0 0 50

2500

60 10 100 60

3600

80 30 900 80

6400

Total 2000 250 14500

Rocıo Meza Moreno Estadıstica descriptiva

Page 149: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo.

Usemos la formula anterior para calcular nuevamente ladesviacion estandar para los datos de la tienda Starbucks delaeropuerto de Orange County:

Orange County

xi xi − x (xi − x)2 xi x2i20 -30 900 20 40040 -10 100 40 160050 0 0 50 250060 10 100 60 360080 30 900 80 6400

Total 2000 250 14500

Rocıo Meza Moreno Estadıstica descriptiva

Page 150: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo.

Usemos la formula anterior para calcular nuevamente ladesviacion estandar para los datos de la tienda Starbucks delaeropuerto de Orange County:

Orange County

xi xi − x (xi − x)2 xi x2i20 -30 900 20 40040 -10 100 40 160050 0 0 50 250060 10 100 60 360080 30 900 80 6400

Total 2000 250 14500

Rocıo Meza Moreno Estadıstica descriptiva

Page 151: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ası

s =

√5(14500)− (250)2

5(5− 1)

=

√10000

20

=√

500

= 22.4

que es el valor obtenido antes.

Rocıo Meza Moreno Estadıstica descriptiva

Page 152: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ası

s =

√5(14500)− (250)2

5(5− 1)

=

√10000

20

=√

500

= 22.4

que es el valor obtenido antes.

Rocıo Meza Moreno Estadıstica descriptiva

Page 153: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ası

s =

√5(14500)− (250)2

5(5− 1)

=

√10000

20

=√

500

= 22.4

que es el valor obtenido antes.

Rocıo Meza Moreno Estadıstica descriptiva

Page 154: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ası

s =

√5(14500)− (250)2

5(5− 1)

=

√10000

20

=√

500

= 22.4

que es el valor obtenido antes.

Rocıo Meza Moreno Estadıstica descriptiva

Page 155: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ası

s =

√5(14500)− (250)2

5(5− 1)

=

√10000

20

=√

500

= 22.4

que es el valor obtenido antes.

Rocıo Meza Moreno Estadıstica descriptiva

Page 156: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la desviacion estandar

1 Toma en cuenta las variaciones de todos los datos conrespecto de la media.

2 La desviacion estandar nunca es negativa y solo es cerocuando todos los valores de los datos son iguales.

3 A mayor valor de s se tiene mayor variacion en los datos.

4 El valor de la desviacion estandar puede aumentardrasticamente si se incluyen uno o mas valores extremos.

5 Las unidades de la desviacion estandar son las mismas quelas unidades del conjunto original de datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 157: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la desviacion estandar

1 Toma en cuenta las variaciones de todos los datos conrespecto de la media.

2 La desviacion estandar nunca es negativa y solo es cerocuando todos los valores de los datos son iguales.

3 A mayor valor de s se tiene mayor variacion en los datos.

4 El valor de la desviacion estandar puede aumentardrasticamente si se incluyen uno o mas valores extremos.

5 Las unidades de la desviacion estandar son las mismas quelas unidades del conjunto original de datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 158: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la desviacion estandar

1 Toma en cuenta las variaciones de todos los datos conrespecto de la media.

2 La desviacion estandar nunca es negativa y solo es cerocuando todos los valores de los datos son iguales.

3 A mayor valor de s se tiene mayor variacion en los datos.

4 El valor de la desviacion estandar puede aumentardrasticamente si se incluyen uno o mas valores extremos.

5 Las unidades de la desviacion estandar son las mismas quelas unidades del conjunto original de datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 159: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la desviacion estandar

1 Toma en cuenta las variaciones de todos los datos conrespecto de la media.

2 La desviacion estandar nunca es negativa y solo es cerocuando todos los valores de los datos son iguales.

3 A mayor valor de s se tiene mayor variacion en los datos.

4 El valor de la desviacion estandar puede aumentardrasticamente si se incluyen uno o mas valores extremos.

5 Las unidades de la desviacion estandar son las mismas quelas unidades del conjunto original de datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 160: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Propiedades de la desviacion estandar

1 Toma en cuenta las variaciones de todos los datos conrespecto de la media.

2 La desviacion estandar nunca es negativa y solo es cerocuando todos los valores de los datos son iguales.

3 A mayor valor de s se tiene mayor variacion en los datos.

4 El valor de la desviacion estandar puede aumentardrasticamente si se incluyen uno o mas valores extremos.

5 Las unidades de la desviacion estandar son las mismas quelas unidades del conjunto original de datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 161: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Interpretacion de la desviacion estandar

La desviacion estandar se utiliza para medir la variacion entrelos valores de un conjunto de datos. Si los valores son cercanosentre sı, la desviacion estandar sera pequena, pero si los datosestan muy dispersos, la desviacion estandar sera mas grande.

Tambien se usa para comparar la variacion de dos o masconjuntos de datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 162: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Interpretacion de la desviacion estandar

La desviacion estandar se utiliza para medir la variacion entrelos valores de un conjunto de datos. Si los valores son cercanosentre sı, la desviacion estandar sera pequena, pero si los datosestan muy dispersos, la desviacion estandar sera mas grande.

Tambien se usa para comparar la variacion de dos o masconjuntos de datos.

Rocıo Meza Moreno Estadıstica descriptiva

Page 163: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Coeficiente de variacion

Como la desviacion estandar tiene las mismas unidades que elconjunto original de datos, su uso para comparar la variacion devalores tomados de distintas poblaciones es restringido.

Un valor que resuelve este problema, pues carece de unidades,es el coeficiente de variacion.

Rocıo Meza Moreno Estadıstica descriptiva

Page 164: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Coeficiente de variacion

Como la desviacion estandar tiene las mismas unidades que elconjunto original de datos, su uso para comparar la variacion devalores tomados de distintas poblaciones es restringido.

Un valor que resuelve este problema, pues carece de unidades,es el coeficiente de variacion.

Rocıo Meza Moreno Estadıstica descriptiva

Page 165: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Coeficiente de variacion

Es un porcentaje que indica que tan grande es la desviacionestandar en relacion con la media, puede calcularse tanto paradatos muestrales como para datos poblacionales. Se denota porCV y se define como

CV =desviacion estandar

media· 100 %

Esto es,

Para una muestra: CV =s

x· 100 %

Para una poblacion: CV =σ

µ· 100 %

Rocıo Meza Moreno Estadıstica descriptiva

Page 166: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Coeficiente de variacion

Es un porcentaje que indica que tan grande es la desviacionestandar en relacion con la media, puede calcularse tanto paradatos muestrales como para datos poblacionales. Se denota porCV y se define como

CV =desviacion estandar

media· 100 %

Esto es,

Para una muestra: CV =s

x· 100 %

Para una poblacion: CV =σ

µ· 100 %

Rocıo Meza Moreno Estadıstica descriptiva

Page 167: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

A continuacion se muestran los valores de las estataturas (encm) de 40 hombres seleccionados al azar [3],

179.8 168.1 182.1 174.5 171.7 175.8 168.9 170.7 173.5 166.6160.0 173.5 185.7 171.7 172.7 180.3 155.7 193.5 168.4 177.0166.1 177.8 159.8 174.0 173.5 176.3 175.8 172.7 182.6 167.9

183.9 185.4 172.7 174.5 178.6 161.8 180.6 166.6 173.5 168.4

y sus correspondientes estaturas (en kg),

76.7 65.4 81.3 79.7 69.2 75.7 61.2 91.4 79.5 63.070.9 84.6 86.7 68.6 95.0 107.5 80.1 100.1 75.3 62.374.5 73.7 68.9 65.4 92.8 87.9 78.4 73.4 79.3 77.096.8 89.8 78.6 97.3 62.2 54.2 85.8 74.7 77.2 68.5

Rocıo Meza Moreno Estadıstica descriptiva

Page 168: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

A continuacion se muestran los valores de las estataturas (encm) de 40 hombres seleccionados al azar [3],

179.8 168.1 182.1 174.5 171.7 175.8 168.9 170.7 173.5 166.6160.0 173.5 185.7 171.7 172.7 180.3 155.7 193.5 168.4 177.0166.1 177.8 159.8 174.0 173.5 176.3 175.8 172.7 182.6 167.9

183.9 185.4 172.7 174.5 178.6 161.8 180.6 166.6 173.5 168.4

y sus correspondientes estaturas (en kg),

76.7 65.4 81.3 79.7 69.2 75.7 61.2 91.4 79.5 63.070.9 84.6 86.7 68.6 95.0 107.5 80.1 100.1 75.3 62.374.5 73.7 68.9 65.4 92.8 87.9 78.4 73.4 79.3 77.096.8 89.8 78.6 97.3 62.2 54.2 85.8 74.7 77.2 68.5

Rocıo Meza Moreno Estadıstica descriptiva

Page 169: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Para estos datos tenemos

Media (x) Desviacion estandar (s)

Estatura 173.57 7.67Peso 78.27 11.94

Por tanto, los coeficientes de variacion son:

Estatura: CV =s

x· 100 % =

7.67

173.57· 100 % = 4.42 %

Peso: CV =s

x· 100 % =

11.94

78.27· 100 % = 15.25 %

Rocıo Meza Moreno Estadıstica descriptiva

Page 170: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Para estos datos tenemos

Media (x) Desviacion estandar (s)

Estatura 173.57 7.67Peso 78.27 11.94

Por tanto, los coeficientes de variacion son:

Estatura: CV =s

x· 100 % =

7.67

173.57· 100 % = 4.42 %

Peso: CV =s

x· 100 % =

11.94

78.27· 100 % = 15.25 %

Rocıo Meza Moreno Estadıstica descriptiva

Page 171: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Para estos datos tenemos

Media (x) Desviacion estandar (s)

Estatura 173.57 7.67Peso 78.27 11.94

Por tanto, los coeficientes de variacion son:

Estatura: CV =s

x· 100 % =

7.67

173.57· 100 % = 4.42 %

Peso: CV =s

x· 100 % =

11.94

78.27· 100 % = 15.25 %

Rocıo Meza Moreno Estadıstica descriptiva

Page 172: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Para estos datos tenemos

Media (x) Desviacion estandar (s)

Estatura 173.57 7.67Peso 78.27 11.94

Por tanto, los coeficientes de variacion son:

Estatura: CV =s

x· 100 % =

7.67

173.57· 100 % = 4.42 %

Peso: CV =s

x· 100 % =

11.94

78.27· 100 % = 15.25 %

Rocıo Meza Moreno Estadıstica descriptiva

Page 173: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Observese que las desviaciones estandar de estos conjuntos dedatos no pueden compararse directamente pues la primeraesta en centımetros y la segunda en kilogramos.

Sin embargo, comparando los coeficientes de variacion deambas muestras, vemos que las estaturas (CV = 4.42 %) tienenuna variacion considerablemente menor que los pesos(CV = 15.26 %). ¿Tiene sentido esta observacion?

Rocıo Meza Moreno Estadıstica descriptiva

Page 174: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Observese que las desviaciones estandar de estos conjuntos dedatos no pueden compararse directamente pues la primeraesta en centımetros y la segunda en kilogramos.

Sin embargo, comparando los coeficientes de variacion deambas muestras, vemos que las estaturas (CV = 4.42 %) tienenuna variacion considerablemente menor que los pesos(CV = 15.26 %).

¿Tiene sentido esta observacion?

Rocıo Meza Moreno Estadıstica descriptiva

Page 175: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Observese que las desviaciones estandar de estos conjuntos dedatos no pueden compararse directamente pues la primeraesta en centımetros y la segunda en kilogramos.

Sin embargo, comparando los coeficientes de variacion deambas muestras, vemos que las estaturas (CV = 4.42 %) tienenuna variacion considerablemente menor que los pesos(CV = 15.26 %). ¿Tiene sentido esta observacion?

Rocıo Meza Moreno Estadıstica descriptiva

Page 176: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Sesgo

En datos con sesgo a la izquierda, la media y la mediana seencuentran a la izquierda de la moda. (Los datos sesgados a laizquierda suelen tener una media menor a la mediana).

En datos con sesgo a la derecha, la media y la mediana seencuentran a la derecha de la moda. (En los datos sesgados a laderecha la media suele estar a la derecha de la mediana).

Rocıo Meza Moreno Estadıstica descriptiva

Page 177: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Sesgo

En datos con sesgo a la izquierda, la media y la mediana seencuentran a la izquierda de la moda. (Los datos sesgados a laizquierda suelen tener una media menor a la mediana).

En datos con sesgo a la derecha, la media y la mediana seencuentran a la derecha de la moda. (En los datos sesgados a laderecha la media suele estar a la derecha de la mediana).

Rocıo Meza Moreno Estadıstica descriptiva

Page 178: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

La siguiente figura fue tomada de [3].

Rocıo Meza Moreno Estadıstica descriptiva

Page 179: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Regla empırica para datos con distribucion normal

En un conjunto de datos con una distribucionaproximadamente normal, se cumplen las siguientespropiedades:

1 Aproximadamente el 68 % de todos los valores estan dentrode una desviacion estandar de la media.

2 Aproximadamente el 95 % de todos los valores estan dentrode 2 desviaciones estandar de la media.

3 Aproximadamente el 99.7 % (practicamente todos) de losvalores estan dentro de 3 desviaciones estandar de la media.

Rocıo Meza Moreno Estadıstica descriptiva

Page 180: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Regla empırica para datos con distribucion normal

En un conjunto de datos con una distribucionaproximadamente normal, se cumplen las siguientespropiedades:

1 Aproximadamente el 68 % de todos los valores estan dentrode una desviacion estandar de la media.

2 Aproximadamente el 95 % de todos los valores estan dentrode 2 desviaciones estandar de la media.

3 Aproximadamente el 99.7 % (practicamente todos) de losvalores estan dentro de 3 desviaciones estandar de la media.

Rocıo Meza Moreno Estadıstica descriptiva

Page 181: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Regla empırica para datos con distribucion normal

En un conjunto de datos con una distribucionaproximadamente normal, se cumplen las siguientespropiedades:

1 Aproximadamente el 68 % de todos los valores estan dentrode una desviacion estandar de la media.

2 Aproximadamente el 95 % de todos los valores estan dentrode 2 desviaciones estandar de la media.

3 Aproximadamente el 99.7 % (practicamente todos) de losvalores estan dentro de 3 desviaciones estandar de la media.

Rocıo Meza Moreno Estadıstica descriptiva

Page 182: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Regla empırica para datos con distribucion normal

En un conjunto de datos con una distribucionaproximadamente normal, se cumplen las siguientespropiedades:

1 Aproximadamente el 68 % de todos los valores estan dentrode una desviacion estandar de la media.

2 Aproximadamente el 95 % de todos los valores estan dentrode 2 desviaciones estandar de la media.

3 Aproximadamente el 99.7 % (practicamente todos) de losvalores estan dentro de 3 desviaciones estandar de la media.

Rocıo Meza Moreno Estadıstica descriptiva

Page 183: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

La siguiente figura ilustra la regla empırica [3].

Rocıo Meza Moreno Estadıstica descriptiva

Page 184: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Las puntuaciones de CI tienen una distribucion normal, conuna media de 100 y una desviacion estandar de 15. Con estainformacion se pueden responder preguntas como las siguientes:

1 ¿Entre que puntuaciones se encuentra el CI del 68 % de laspersonas?

2 ¿Que porcentaje de las puntuaciones se ubican entre 70 y130?

Rocıo Meza Moreno Estadıstica descriptiva

Page 185: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Las puntuaciones de CI tienen una distribucion normal, conuna media de 100 y una desviacion estandar de 15. Con estainformacion se pueden responder preguntas como las siguientes:

1 ¿Entre que puntuaciones se encuentra el CI del 68 % de laspersonas?

2 ¿Que porcentaje de las puntuaciones se ubican entre 70 y130?

Rocıo Meza Moreno Estadıstica descriptiva

Page 186: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Las puntuaciones de CI tienen una distribucion normal, conuna media de 100 y una desviacion estandar de 15. Con estainformacion se pueden responder preguntas como las siguientes:

1 ¿Entre que puntuaciones se encuentra el CI del 68 % de laspersonas?

2 ¿Que porcentaje de las puntuaciones se ubican entre 70 y130?

Rocıo Meza Moreno Estadıstica descriptiva

Page 187: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Para responder las preguntas, usamos la regla empırica. Deacuerdo con esta, el 68 % de las puntuaciones se encuentradentro de una desviacion estandar de la media, es decir, entrelos valores

100− 15 y 100 + 15,

se concluye que el 68 % de las puntuaciones se encuentran entre85 y 115.

Para la segunda pregunta, observamos que

70 = 100− 2(15) y 130 = 100 + 2(15),

es decir, 70 y 130 estan exactamente a dos desviacionesestandar de la media, ası que de la regla empırica concluimosque el 95 % de las puntuaciones estan entre 70 y 130.

Rocıo Meza Moreno Estadıstica descriptiva

Page 188: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Para responder las preguntas, usamos la regla empırica. Deacuerdo con esta, el 68 % de las puntuaciones se encuentradentro de una desviacion estandar de la media, es decir, entrelos valores

100− 15 y 100 + 15,

se concluye que el 68 % de las puntuaciones se encuentran entre85 y 115.

Para la segunda pregunta, observamos que

70 = 100− 2(15) y 130 = 100 + 2(15),

es decir, 70 y 130 estan exactamente a dos desviacionesestandar de la media, ası que de la regla empırica concluimosque el 95 % de las puntuaciones estan entre 70 y 130.

Rocıo Meza Moreno Estadıstica descriptiva

Page 189: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Para responder las preguntas, usamos la regla empırica. Deacuerdo con esta, el 68 % de las puntuaciones se encuentradentro de una desviacion estandar de la media, es decir, entrelos valores

100− 15 y 100 + 15,

se concluye que el 68 % de las puntuaciones se encuentran entre85 y 115.

Para la segunda pregunta, observamos que

70 = 100− 2(15) y 130 = 100 + 2(15),

es decir, 70 y 130 estan exactamente a dos desviacionesestandar de la media, ası que de la regla empırica concluimosque el 95 % de las puntuaciones estan entre 70 y 130.

Rocıo Meza Moreno Estadıstica descriptiva

Page 190: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Teorema de Chebyshev

En cualquer conjunto de datos, si z es un valor positivo mayorque 1, la proporcion de los valores que se encuentran dentro dez desviaciones estandar de la media es por lo menos 1− 1/z2.

Por ejemplo, la proporcion de valores que se encuentran a dosdesviaciones estandar de la media es por lo menos:

1− 1

z2= 1− 1

4= 3/4,

esto es, por lo menos el 75 % de los valores.

Rocıo Meza Moreno Estadıstica descriptiva

Page 191: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Teorema de Chebyshev

En cualquer conjunto de datos, si z es un valor positivo mayorque 1, la proporcion de los valores que se encuentran dentro dez desviaciones estandar de la media es por lo menos 1− 1/z2.

Por ejemplo, la proporcion de valores que se encuentran a dosdesviaciones estandar de la media es por lo menos:

1− 1

z2= 1− 1

4= 3/4,

esto es, por lo menos el 75 % de los valores.

Rocıo Meza Moreno Estadıstica descriptiva

Page 192: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

La proporcion de valores que se encuentran a tresdesviaciones estandar de la media es por lo menos:

1− 1

z2= 1− 1

9= 8/9,

es decir, por lo menos el 89 % de los valores.

Rocıo Meza Moreno Estadıstica descriptiva

Page 193: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Suponga que en las calificaciones obtenidas por 100 estudiantesen un examen de estadıstica la media es 70 y la desviacionestandar es 5. El teorema de Chebyshev permite responderpreguntas como las siguientes:

1 ¿Que proporcion de los estudiantes obtuvo puntuacionesentre 60 y 80?

2 ¿Que proporcion obtuvo puntuaciones entre 58 y 82?

Rocıo Meza Moreno Estadıstica descriptiva

Page 194: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Ejemplo

Suponga que en las calificaciones obtenidas por 100 estudiantesen un examen de estadıstica la media es 70 y la desviacionestandar es 5. El teorema de Chebyshev permite responderpreguntas como las siguientes:

1 ¿Que proporcion de los estudiantes obtuvo puntuacionesentre 60 y 80?

2 ¿Que proporcion obtuvo puntuaciones entre 58 y 82?

Rocıo Meza Moreno Estadıstica descriptiva

Page 195: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Para responder la primera pregunta, se observa que 60esta dos desviacones estandar por debajo de la media y 80esta dos desviaciones estandar sobre la media.

El teorema deChebyshev nos dice que la proporcion de estudiantes cuyapuntuacion esta entre 60 y 80 es por lo menos

1− 1

4= 3/4,

es decir, por lo menos el 75 % de los estudiantes tienenuna puntuacion entre 60 y 80.

Rocıo Meza Moreno Estadıstica descriptiva

Page 196: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Para responder la primera pregunta, se observa que 60esta dos desviacones estandar por debajo de la media y 80esta dos desviaciones estandar sobre la media. El teorema deChebyshev nos dice que la proporcion de estudiantes cuyapuntuacion esta entre 60 y 80 es por lo menos

1− 1

4= 3/4,

es decir, por lo menos el 75 % de los estudiantes tienenuna puntuacion entre 60 y 80.

Rocıo Meza Moreno Estadıstica descriptiva

Page 197: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Para la segunda pregunta, debemos determinar a cuantasdesviaciones estandar de la media se encuentran los valores 58 y82. Para ello resolvemos las ecuaciones:

58 = 70− 5z y 82 = 70 + 5z

esto es

z = (70− 58)/5 = 2.4 y z = (82− 70)/5 = 2.4

ası que 58 se encuentra 2.4 desviaciones estandar por debajo dela media y 82 dos desviaciones estandar por arriba. El teoremade Chebyshev nos dice que la proporcion de estudiantes cuyapuntuacion esta entre 58 y 82 es por lo menos

1− 1

(2.4)2= 0.826,

es decir, por lo menos el 82.6 % de los estudiantes tienenuna puntuacion entre 58 y 82.

Rocıo Meza Moreno Estadıstica descriptiva

Page 198: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Para la segunda pregunta, debemos determinar a cuantasdesviaciones estandar de la media se encuentran los valores 58 y82. Para ello resolvemos las ecuaciones:

58 = 70− 5z y 82 = 70 + 5z

esto es

z = (70− 58)/5 = 2.4 y z = (82− 70)/5 = 2.4

ası que 58 se encuentra 2.4 desviaciones estandar por debajo dela media y 82 dos desviaciones estandar por arriba. El teoremade Chebyshev nos dice que la proporcion de estudiantes cuyapuntuacion esta entre 58 y 82 es por lo menos

1− 1

(2.4)2= 0.826,

es decir, por lo menos el 82.6 % de los estudiantes tienenuna puntuacion entre 58 y 82.

Rocıo Meza Moreno Estadıstica descriptiva

Page 199: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Para la segunda pregunta, debemos determinar a cuantasdesviaciones estandar de la media se encuentran los valores 58 y82. Para ello resolvemos las ecuaciones:

58 = 70− 5z y 82 = 70 + 5z

esto es

z = (70− 58)/5 = 2.4 y z = (82− 70)/5 = 2.4

ası que 58 se encuentra 2.4 desviaciones estandar por debajo dela media y 82 dos desviaciones estandar por arriba.

El teoremade Chebyshev nos dice que la proporcion de estudiantes cuyapuntuacion esta entre 58 y 82 es por lo menos

1− 1

(2.4)2= 0.826,

es decir, por lo menos el 82.6 % de los estudiantes tienenuna puntuacion entre 58 y 82.

Rocıo Meza Moreno Estadıstica descriptiva

Page 200: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Para la segunda pregunta, debemos determinar a cuantasdesviaciones estandar de la media se encuentran los valores 58 y82. Para ello resolvemos las ecuaciones:

58 = 70− 5z y 82 = 70 + 5z

esto es

z = (70− 58)/5 = 2.4 y z = (82− 70)/5 = 2.4

ası que 58 se encuentra 2.4 desviaciones estandar por debajo dela media y 82 dos desviaciones estandar por arriba. El teoremade Chebyshev nos dice que la proporcion de estudiantes cuyapuntuacion esta entre 58 y 82 es por lo menos

1− 1

(2.4)2= 0.826,

es decir, por lo menos el 82.6 % de los estudiantes tienenuna puntuacion entre 58 y 82.

Rocıo Meza Moreno Estadıstica descriptiva

Page 201: Estadística descriptiva: medidas numéricas

Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion

Referencias

[1] Anderson, D., Sweeney D. y Thomas W., Estadıstica paraadministracion y economıa, Thompson Editores, Mexico,2008.

[2] Lind, D., Marchal, W. y Wathen, S., Estadıstica aplicada alos negocios y la economıa, McGraw-Hill interamericana,Mexico, 2012.

[3] Triola, M., Estadıstica, Pearson Educacion, Mexico, 2009,pp. 75-86.

Rocıo Meza Moreno Estadıstica descriptiva