Tema nº 61 - aporlaopo.es

10
TEMA Nº 61 DESIGUALDAD DE TCHEBYSCHEV. COEFICIENTE DE VARIACIÓN. VARIABLE NORMALIZADA. APLICACIÓN AL ANÁLISIS, INTERPRETACIÓN Y COMPARACIÓN DE DATOS ESTADÍSTICOS. ESPECIALIDAD: MATEMÁTICAS

Transcript of Tema nº 61 - aporlaopo.es

Page 1: Tema nº 61 - aporlaopo.es

TEMA Nº 61 DESIGUALDAD DE TCHEBYSCHEV. COEFICIENTE DE VARIACIÓN. VARIABLE

NORMALIZADA. APLICACIÓN AL ANÁLISIS, INTERPRETACIÓN Y COMPARACIÓN

DE DATOS ESTADÍSTICOS.

ESPECIALIDAD: MATEMÁTICAS

Page 2: Tema nº 61 - aporlaopo.es

aporlaopo.es Preparación curso 20/21 – Tema nº: 61

[aporlaopo.es] – Temario para la especialidad de Matemáticas Todos los derechos reservados. Prohibida su reproducción total o parcial. 1

Contenido 1. INTRODUCCIÓN ......................................................................................................................................................... 2

2. DESIGUALDAD DE TCHEBYSCHEV .............................................................................................................................. 2

2.1. DESIGUALDAD DE MARKOV .............................................................................................................................. 2

2.1.1. DEMOSTRACIÓN........................................................................................................................................ 2

2.2. DESIGUALDAD DE TCHEBYSCHEV ...................................................................................................................... 3

2.2.1. DEMOSTRACIÓN........................................................................................................................................ 3

3. COEFICIENTE DE VARIACIÓN ..................................................................................................................................... 3

4. LA CURVA NORMAL ................................................................................................................................................... 4

4.1. PROPIEDADES .................................................................................................................................................... 4

5. PUNTUACIONES ........................................................................................................................................................ 5

5.1. PUNTUACIONES DIRECTAS ................................................................................................................................ 5

5.2. PUNTUACIONES DE DESVIACIÓN ...................................................................................................................... 5

5.2.1. PROPIEDADES ............................................................................................................................................ 5

5.3. PUNTUACIONES TÍPICAS ................................................................................................................................... 6

5.3.1. PROPIEDADES ............................................................................................................................................ 6

6. PUNTUACIONES TÍPICAS Y ÁREAS BAJO LA CURVA NORMAL ................................................................................... 6

6.1. PROPOSICIÓN .................................................................................................................................................... 7

6.2. DEMOSTRACIÓN ............................................................................................................................................... 7

7. APLICACIÓN AL ANÁLISIS, INTERPRETACIÓN Y COMPARACIÓN DE DATOS ESTADÍSTICOS ...................................... 8

7.1. APLICACIONES DE LA DESIGUALDAD DE TCHEBYSCHEV ................................................................................... 8

7.2. APLICACIONES DEL COEFICIENTE DE VARIACIÓN ............................................................................................. 9

7.3. APLICACIONES DE LA VARIABLE NORMALIZADA .............................................................................................. 9

8. BIBLIOGRAFÍA ............................................................................................................................................................ 9

Page 3: Tema nº 61 - aporlaopo.es

aporlaopo.es Preparación curso 20/21 – Tema nº: 61

[aporlaopo.es] – Temario para la especialidad de Matemáticas Todos los derechos reservados. Prohibida su reproducción total o parcial. 2

1. INTRODUCCIÓN

Tchebyschev es uno de los célebres matemáticos del s.XIX, creador de varias escuelas matemáticas en Rusia. En lo que se refiere al trabajo de Tchebyschev sobre la Teoría de Probabilidades, es sabido que se le atribuyen las leyes principales de esta teoría, como la ley de los grandes números y el teorema central del límite, aunque quizás su contribución más conocida a la Teoría de la Probabilidad es la llamada desigualdad de Tchebyschev.

El concepto de probabilidad de un suceso aleatorio surgió de modo intuitivo y experimental y se ha ido desarrollando a lo largo del tiempo mostrando diversas formas de presentación. Uno de los enfoques iniciales fue la noción frecuencial de la probabilidad de un suceso como el nº al que se aproxima su frecuencia relativa al repetir el experimento un nº elevado de veces. Se planteaba la siguiente cuestión:

¿Cuál deberá ser el nº de experimentos, n, para qué 𝑝 (|𝑚

𝑛− 𝑝| < 𝜀) > 𝐾?, siendo m el nº de veces que se verifica el

suceso S, 𝑝 = 𝑝(𝑆) y K una cota dada.

La introducción de los conceptos de variable aleatoria, esperanza y varianza por parte de Tchebyschev fue fundamental para aclarar estas cuestiones.

Sea X una característica (atributo o fenómeno) que tratamos de estudiar en una población o en una muestra. Dicha característica se formaliza mediante una función del espacio muestral (conjunto de todos los posibles resultados del experimento) en ℝ que se llama variable aleatoria (variable porque son posibles diferentes valores numéricos y aleatoria porque el valor observado depende de cuál de los resultados experimentales posibles resulta). Esta variable aleatoria puede ser de naturaleza cualitativa o cuantitativa, y en caso de ser cuantitativa, puede ser discreta o continua.

Una variable aleatoria discreta toma solo un nº finito o infinito numerable de valores x1,…,xi,…, con p(X=xi)=pi la probabilidad correspondiente al valor xi. Se llama esperanza o media de la variable X al valor 𝑬(𝑿) = ∑ 𝒙𝒊 ∙𝒊 𝒑𝒊, supuesto ∑|𝑥𝑖| ∙ 𝑝𝑖 < +∞.

La variable aleatoria será continua cuando pueda tomar todos los valores de un cierto intervalo finito o infinito. En

este caso la esperanza sería 𝑬(𝑿) = ∫ 𝒙 𝒇(𝒙)𝒅𝒙+∞

−∞, con f(x) la función de densidad.

Se llama varianza de la variable aleatoria X a 𝝈𝟐 = 𝑬[𝑿 − 𝑬(𝑿)]𝟐.

Análogamente, se define el momento de orden r de la variable aleatoria X con respecto al valor c a 𝑬[(𝒙 − 𝒄)]𝒓.

2. DESIGUALDAD DE TCHEBYSCHEV

2.1. DESIGUALDAD DE MARKOV

La desigualdad de Markov nos permite acotar la probabilidad de una función no negativa de una variable aleatoria.

Dada una función no negativa g de la variable aleatoria X, ∀𝑎 > 0 se verifica que:

𝑝[𝑔(𝑋) ≥ 𝑎] ≤𝐸[𝑔(𝑋)]

𝑎

2.1.1. DEMOSTRACIÓN

1. Caso discreto:

Sea A = { i / g(xi) ≥ a}, y pi = p(X = xi). Entonces:

𝐸[𝑔(𝑋)] = ∑ 𝑔(𝑥𝑖) ∙ 𝑝𝑖 =

𝑖

∑ 𝑔(𝑥𝑖) ∙ 𝑝𝑖 +

𝑖∈𝐴

∑ 𝑔(𝑥𝑖) ∙ 𝑝𝑖

𝑖∉𝐴

≥ ∑ 𝑔(𝑥𝑖) ∙ 𝑝𝑖 ≥ ∑ 𝑎 ∙ 𝑝𝑖 = 𝑎 ∑ 𝑝𝑖 = 𝑎 ∙ 𝑝[𝑔(𝑋) ≥ 𝑎] → 𝑝[𝑔(𝑋) ≥ 𝑎] ≤𝐸[𝑔(𝑋)]

𝑎𝑖∈𝐴𝑖∈𝐴𝑖∈𝐴

Page 4: Tema nº 61 - aporlaopo.es

aporlaopo.es Preparación curso 20/21 – Tema nº: 61

[aporlaopo.es] – Temario para la especialidad de Matemáticas Todos los derechos reservados. Prohibida su reproducción total o parcial. 3

2. Caso continuo: (es análogo al caso discreto)

Sea A = { x / g(x) ≥ a}, y f su función de distribución:

𝐸[𝑔(𝑋)] = ∫ 𝑔(𝑥)+∞

−∞

∙ 𝑓(𝑥) 𝑑𝑥 ≥ ∫ 𝑔(𝑥) ∙ 𝑓(𝑥) 𝑑𝑥𝐴

≥ ∫ 𝑎 ∙ 𝑓(𝑥) 𝑑𝑥𝐴

= 𝑎 ∙ ∫ 𝑓(𝑥) 𝑑𝑥𝐴

= 𝑎 ∙ 𝑝[𝑔(𝑥) ≥ 𝑎]

→ 𝑝[𝑔(𝑋) ≥ 𝑎] ≤𝐸[𝑔(𝑋)]

𝑎

2.2. DESIGUALDAD DE TCHEBYSCHEV

Nos permite obtener, en términos de probabilidad, la dispersión de los valores de una variable aleatoria alrededor de su media usando la varianza como medida de la dispersión de la variable.

Sea X una variable aleatoria sobre un espacio muestral con media muestral �̅� y desviación típica muestral s.

Sea 𝐾 ∈ ℝ, 𝐾 > 0. Entonces:

𝑝( �̅� − 𝐾𝑠 < 𝑥 < �̅� + 𝐾𝑠) ≥ 1 −1

𝐾2

2.2.1. DEMOSTRACIÓN

Consideremos la variable aleatoria 𝑌 = (𝑋 − 𝐸[𝑋])2.

Vamos a aplicar la desigualdad de Markov para el caso concreto de la función 𝑔(𝑋) = (𝑋 − 𝐸[𝑋])2 y de la constante 𝑎 = (𝐾𝑠)2.

𝑝( �̅� − 𝐾𝑠 < 𝑥 < �̅� + 𝐾𝑠) = 𝑝(|𝑥 − �̅�| < 𝐾𝑠) = 𝑝(𝑌 < (𝐾𝑠)2) = 1 − 𝑝(𝑌 ≥ (𝐾𝑠)2) ≥ 1 −𝐸(𝑌)

(𝐾𝑠)2= 1 −

𝑠2

𝐾2𝑠2

= 1 −1

𝐾2

Nótese que tanto la desigualdad de Markov como la de Tchebyschev dan cotas de la probabilidad solo cuando la media y la desviación típica son finitas.

Existe el equivalente de la desigualdad en probabilidades: 𝒑(|𝒙 − 𝝁| < 𝑲𝝈) > 𝟏 −𝟏

𝑲𝟐

Dónde µ y 𝝈 representan la media y la desviación típica, respectivamente, de una distribución de probabilidad.

3. COEFICIENTE DE VARIACIÓN

Cuando queremos verificar que las desviaciones típicas de dos muestras son diferentes, no hay más que compararlas entre sí, puesto que ambas muestras se refieren a una misma variable y tienen el mismo tamaño. Cuando esto no sucede así, la comparación se hace prácticamente imposible.

Un método para realizar esta comparación de las desviaciones de dos muestras consiste en calcular los coeficientes de variación de ambas muestras y compararlos entre ellos.

Se llama coeficiente de variación a la relación que existe entre la desviación típica de una muestra y su media. Suele multiplicarse por 100 para explicarlo en porcentaje:

𝑪𝑽 =𝒔

�̅�∙ 𝟏𝟎𝟎, 𝒔𝒊 �̅� ≠ 𝟎

Este índice expresa un valor muy abstracto ya que es el resultado de relacionar un índice que representa una distancia s y otro que es un punto de escala �̅�.

Page 5: Tema nº 61 - aporlaopo.es

aporlaopo.es Preparación curso 20/21 – Tema nº: 61

[aporlaopo.es] – Temario para la especialidad de Matemáticas Todos los derechos reservados. Prohibida su reproducción total o parcial. 4

4. LA CURVA NORMAL

Al estudiar las distribuciones empíricas de muchas variables en los terrenos: biológico, físico, matemático, económico, etc., se han observado coincidencias o aproximaciones de estas distribuciones empíricas a las distribuciones que resultan de modelos matemáticos conocidos, como la distribución Normal y otras.

Las diferencias entre ambas, teóricas y empíricas, podrían explicarse por el tamaño limitado de las muestras utilizadas, puesto que a medida que aumenta éste (N), disminuyen las diferencias entre el modelo de distribución y la distribución empírica.

Parece, pues, justificado el interés que puede tener para cualquier investigador conocer a qué tipo de distribución teórica responde la variable que se está estudiando, ya que ello significa más información sobre la variable en cuestión y también sobre el tratamiento estadístico que puede admitir.

Pues bien, una de las distribuciones teóricas más conocidas y empleadas en todos los campos es la llamada distribución Normal de Gauss-Laplace. Su importancia está fundada en dos aspectos:

a) Muchas variables, tanto de tipo físico (altura, estatura) como de cualquier tipo, se distribuyen en forma Normal o aproximadamente Normal.

b) Gran cantidad de pruebas estadísticas utilizadas en la Inferencia Estadística se justifican por la curva Normal.

De Moivre (1733) fue el 1º en obtener la ecuación de la curva en respuesta a las demandas de los jugadores profesionales, como el caballero de Meré, que ya desde el siglo XVII intentaba conocer las probabilidades de aciertos en los juegos de azar.

Son, sin embargo, Gauss y Laplace quienes a finales del s.XVIII y principios del XIX encuentran una aplicación distinta a la distribución Normal: la curva de los errores de medida de distancias en astronomía coincide con la curva Normal, es decir, los errores de medida se distribuyen en forma Normal.

Quetelec es quien proporciona a la distribución el nombre por el que es más conocida: distribución Normal. Después de haber recogido una infinidad de datos relacionados con las medidas corporales, estatura, peso, etc. de miles de soldados escoceses, inaugurando así la biometría, observó una distribución de sus datos muy parecida a la distribución de los errores de Gauss y Laplace, interpretando las desviaciones de sus medidas respecto a la media como errores de medida cometidos por la Naturaleza en su intento de crear un hombre ”Normal”, en el sentido de hombre medio.

La ecuación que define la distribución Normal es:

𝒚 =𝟏

√𝟐𝝅𝝈𝟐𝒆

−(𝒙−𝝁)𝟐

𝟐𝝈𝟐

Siendo, y: la ordenada correspondiente a un valor (𝑥 − 𝜇) del eje de abscisas; 𝝈: la desviación típica de la población; 𝝁: la media de la población; y x: un valor cualquiera del eje de abscisas.

Para cada par de valores 𝝁, 𝝈 tendremos curvas Normales distintas, es decir, infinito nº de curvas Normales. Sin embargo, todas ellas tienen en común un conjunto de propiedades o características que las definen como tales curvas Normales.

4.1. PROPIEDADES

1. La curva Normal tiene forma de campana y es simétrica respecto al eje vertical que pasa por �̅� = 𝜇.

2. Es una curva asintótica: se acerca al eje de abscisas en los dos sentidos, pero no llega a tocarlo nunca.

3. El valor máximo de y corresponde a la puntuación 𝑥 = 𝜇, es decir, el punto más elevado de la curva se da en la media. La curva es monótona ascendente hasta ese punto y monótona descendente a partir de él.

Page 6: Tema nº 61 - aporlaopo.es

aporlaopo.es Preparación curso 20/21 – Tema nº: 61

[aporlaopo.es] – Temario para la especialidad de Matemáticas Todos los derechos reservados. Prohibida su reproducción total o parcial. 5

4. La curva Normal tiene dos puntos de inflexión (puntos donde cambia la concavidad de la curva), exactamente a las distancias (𝜇 − 𝜎) 𝑦 (𝜇 + 𝜎); (�̅� = 𝜇, 𝑠 = 𝜎).

5. Con independencia de los valores de 𝜇 𝑦 𝜎 que puede tener una distribución Normal entre dos puntos dados, cuya distancia se mide en unidades de desviación típica, puede hallarse la proporción de área encerrada bajo la curva Normal que contienen. Las cifras correspondientes a estas áreas son el resultado de una serie de complejos cálculos basados en la resolución de la ecuación matemática de la curva Normal, pero no es necesario realizarlos en cada paso, puesto que existen unas tablas de áreas bajo la curva Normal en las que se relacionan dichas proporciones con las distancias correspondientes entre la media y un punto, medidas en unidades de desviación típica, es decir:

𝒁 =𝑿 − 𝝁

𝝈

Al efectuar estas transformaciones, la forma de la curva no cambia y simplemente se trata de la transformación de una distribución Normal a una distribución Normal tipificada de media 𝝁 = 𝟎 y desviación típica 𝝈 = 𝟏.

Esta transformación es muy útil para calcular la proporción del área entre dos puntos mediante la tabla de áreas bajo la curva Normal.

5. PUNTUACIONES

5.1. PUNTUACIONES DIRECTAS

Por lo general, cuando aplicamos una prueba, examen o test a un grupo de sujetos para medir el grado en que poseen una característica determinada, damos a cada uno de ellos una puntuación. Esta clasificación atribuida directamente a cada sujeto se llama puntuación directa y se suele simbolizar por x.

5.2. PUNTUACIONES DE DESVIACIÓN

Sin embargo, cuando hablamos de que un sujeto ha obtenido una puntuación directa de por ejemplo 7 en una cierta prueba, donde la puntuación mínima es 0 y la máxima 10, es difícil a veces que entendamos cuál es el significado. Sabemos que este valor se acerca más a la puntuación máxima que a la mínima, pero no conocemos nada acerca de las calificaciones obtenidas por el resto de los sujetos sometidos a la misma prueba. En realidad, cualquier puntuación debe verse en relación con las puntuaciones de un grupo de referencia. Podríamos hablar entonces de esa puntuación 7 refiriéndonos a la media �̅� = 5,75; la puntuación 7 es superior a la media en 1,2 unidades.

7 − 5,75 = 1,25 es una puntuación de desviación o diferencia que simbolizaremos por 𝒙 − �̅�.

Si transformamos todas las puntuaciones directas en puntuaciones de desviación, obtendremos una nueva escala con las siguientes características o propiedades.

5.2.1. PROPIEDADES

1. Las puntuaciones positivas indican que la puntuación directa correspondiente es mayor que la media y las negativas significan que la puntuación directa a la que se refieren es menor que la media.

2. La media de esta nueva escala es 0, es decir, la puntuación directa correspondiente es la media de las puntuaciones directas.

3. La desviación típica de esta escala es igual a la desviación típica de la escala de puntuaciones directas.

4. Las unidades de la escala son unidades de desviación respecto a la media.

Por tanto, hemos transformado una escala con �̅� = 5,75 𝑦 𝑠 = 2, a otra con �̅� = 0 y con la misma desviación típica.

Page 7: Tema nº 61 - aporlaopo.es

aporlaopo.es Preparación curso 20/21 – Tema nº: 61

[aporlaopo.es] – Temario para la especialidad de Matemáticas Todos los derechos reservados. Prohibida su reproducción total o parcial. 6

A pesar de ello, las puntuaciones de desviación resultan incompletas. No es lo mismo una puntuación 𝑥 = 1,25 cuando �̅� = 5,75 y el grupo en cuestión es muy homogéneo, es decir, formado por sujetos muy parecidos entre sí, que esa misma puntuación de desviación siendo también �̅� = 5,75, pero de un grupo menos homogéneo, donde los sujetos son muy distintos unos de los otros, es decir, un grupo de mayor variabilidad. Es decir, las puntuaciones de desviación no son directamente comparables, puesto que hay que tener en cuenta la variabilidad del grupo o grupos de referencia (homogeneidad del grupo).

5.3. PUNTUACIONES TÍPICAS

Una forma de posibilitar la comparación entre puntuaciones de desviación típica consiste en transformar éstas en otras puntuaciones cuya unidad sea la variabilidad del grupo. Para ello solo es preciso dividir la puntuación diferencial por la desviación típica, obteniendo de esta forma una puntuación típica z:

𝑧 =𝑥 − �̅�

𝑠

Son equivalentes a las puntuaciones directas originales y a las correspondientes diferenciales pero además tienen en cuenta tanto la tendencia central como la variabilidad del grupo al que pertenecen.

Por ejemplo, sean dos puntuaciones x1=7 y x2=7 que pertenecen a dos grupos distintos con media �̅� = 5,75 en ambos casos, pero con distintas desviaciones típicas: s1=0,5 y s2=2. Entonces:

𝑧1 =7−5,75

0,5= 2,5 𝑧2 =

7−5,75

2= 0,625

que son distintas pues la variabilidad es distinta en ambos grupos.

En realidad, las puntuaciones típicas expresan el nº de desviaciones típicas que se aparta de la media una puntuación determinada.

Las puntuaciones típicas correspondientes a las puntuaciones directas de una distribución de frecuencias constituyen una escala, la escala de puntuaciones Z, que como viene expresada en unidades de desviación típica, constituye una escala de intervalo y tiene las siguientes características o propiedades.

5.3.1. PROPIEDADES

a) La suma de las puntuaciones típicas es 0: ∑ 𝒛 = 𝟎.

En efecto, como 𝑧 =𝑥−�̅�

𝑠→ ∑ 𝑧 = ∑

𝑥−�̅�

𝑠=

1

𝑠∑(𝑥 − �̅�) =

0

𝑠= 0

b) La media de las puntuaciones z es 0 (consecuencia de lo anterior).

c) La desviación típica de las puntuaciones típicas vale 1.

d) La varianza de las desviaciones típicas es 1 (consecuencia de lo anterior).

e) Se tiene entonces una escala con 𝑧̅ = 0 𝑦 𝑠 = 1.

f) Si se multiplican las puntuaciones típicas por una constante cualquiera b (un cambio de escala), y a este producto se le suma la constante arbitraria a (un cambio de origen), las nuevas puntuaciones así obtenidas tendrán como media a y desviación típica b.

6. PUNTUACIONES TÍPICAS Y ÁREAS BAJO LA CURVA NORMAL

Como sabemos existen infinitas curvas del tipo Normal, en función de la media y de la desviación típica que se

consideren. Una de las grandes ventajas de la escala de puntuaciones Z es que siempre 𝑧̅ = 0 𝑦 𝑠𝑧 = 1,

independientemente de la escala original. Por tanto, la distribución Normal típica es única; es decir, todas las

distribuciones Normales al ser expresadas en puntuaciones típicas, darán como resultado una única curva Normal

típica, con media 0 y desviación típica 1.

Se pueden calcular áreas encerradas bajo la curva Normal. En la siguiente figura, el área A representa la probabilidad

de obtener una puntuación igual o menor que ZA. Interpretada esta probabilidad como proporción, el área A

Page 8: Tema nº 61 - aporlaopo.es

aporlaopo.es Preparación curso 20/21 – Tema nº: 61

[aporlaopo.es] – Temario para la especialidad de Matemáticas Todos los derechos reservados. Prohibida su reproducción total o parcial. 7

representa la proporción de observaciones con puntuaciones ≤ ZA en el

supuesto de que dichas observaciones se distribuyan Normalmente.

Para calcular las áreas bajo la curva de la Normal con media 0 y desviación

típica 1, se utilizan las tablas de áreas acumuladas. Vamos a justificar la

propiedad que nos permite estudiar las probabilidades de cualquier

distribución Normal conocida la distribución N(0,1).

6.1. PROPOSICIÓN

Sean 𝑋~𝑁(𝜇, 𝜎), 𝑌~𝑁(0,1). Entonces 𝑃(𝑥1 < 𝑋 < 𝑥2) = 𝑃(𝑦1 < 𝑌 < 𝑦2).

6.2. DEMOSTRACIÓN

𝑝(𝑥1 < 𝑋 < 𝑥2) = ∫1

𝜎 ∙ √2𝜋∙ 𝑒

−(𝑥−𝜇)2

2𝜎2 𝑑𝑥 = ∫1

𝜎 ∙ √2𝜋∙ 𝑒

−(𝜎𝑦+𝜇−𝜇)2𝜎2 ∙ 𝜎 𝑑𝑌

𝑥2−𝜇𝜎

𝑥1−𝜇𝜎

𝑥2

𝑥1

= ∫1

√2𝜋∙ 𝑒

−𝑦2

2 𝑑𝑌 =𝑦2

𝑦1

= 𝑝(𝑦1 < 𝑌 < 𝑦2)

Para calcular las áreas bajo la curva de la N(0,1) existen, como ya hemos indicado, las tablas de áreas acumuladas que

nos dan la información para:

𝑃(𝑍 ≤ 𝐾) = ∫1

√2𝜋∙ 𝑒

−𝑧2

2 𝑑𝑍, 𝑐𝑜𝑛 𝑍~𝑁(0,1), 𝐾 ≥ 0𝐾

−∞

Veamos cómo calcular el resto de probabilidades a partir de las probabilidades tabuladas:

1. Sea K positivo, entonces 𝑃(𝑍 ≥ 𝐾) = 1 − 𝑃(𝑍 ≤ 𝐾).

2. Sea K positivo, entonces 𝑃(𝑍 ≤ −𝐾) = 𝑃(𝑍 ≥ 𝐾) ya que por la simetría de la función: 𝑃(𝑍 ≤ −𝐾) =𝑃(𝑍 ≥ 𝐾)

Cambio: 𝑌 =𝑋−𝜇

𝜎→ 𝑋 = 𝜎 ∙ 𝑌 + 𝜇 → 𝑑𝑥 = 𝜎𝑑𝑌

Page 9: Tema nº 61 - aporlaopo.es

aporlaopo.es Preparación curso 20/21 – Tema nº: 61

[aporlaopo.es] – Temario para la especialidad de Matemáticas Todos los derechos reservados. Prohibida su reproducción total o parcial. 8

3. Sea K positivo, entonces 𝑃(𝑍 ≥ −𝐾) = 𝑃(𝑍 ≤ 𝐾) por la simetría de la función:

4. Sean K1 y K2 positivos, entonces 𝑃(𝐾1 ≤ 𝑍 ≤ 𝐾2) = 𝑃(𝑍 ≤ 𝐾2) − 𝑃(𝑍 ≤ 𝐾1).

Problema inverso: a veces nos dan la probabilidad (o porcentaje) y nos piden calcular la puntuación directa (x) que

deja por encima o por debajo ese %:

𝑧 =𝑥 − �̅�

𝑠→ 𝑥 = 𝑧 ∙ 𝑠 + �̅�

Nota: en la tabla miramos el % más próximo al que nos den, y a qué valor de la puntuación típica z le corresponde ese %.

7. APLICACIÓN AL ANÁLISIS, INTERPRETACIÓN Y COMPARACIÓN DE DATOS

ESTADÍSTICOS

7.1. APLICACIONES DE LA DESIGUALDAD DE TCHEBYSCHEV

Son muchos los contextos en los que se utiliza la Desigualdad de Tchebyschev. Esta desigualdad nos permite calcular

el tamaño de la muestra para que la probabilidad pedida tenga unas cotas determinadas respondiendo a problemas

que generalmente se plantean en situaciones reales como por ejemplo:

Se tiene un lote grande de artículos y se desea estimar la fracción defectuosa usando muestreo aleatorio simple. Con

la Desigualdad de Tchebyschev podemos encontrar el tamaño de muestra n para que la probabilidad de que la fracción

defectuosa no difiera de la verdadera fracción defectuosa en no más de un, por ejemplo, 0’5, sea al menos del 95%.

Con la Desigualdad de Tchebyschev respondemos también a problemas como:

El espesor de la película protectora en un proceso de fabricación de un cierto tipo de tubos tiene una medida de 0,10

milímetros con una desviación estándar de 0,01 milímetros. Se quiere acotar la probabilidad de que el espesor sea

mayor que 0,06 o menor que 0,14 milímetros.

Aplicamos la Desigualdad de Tchebyschev: 𝒑(�̅� − 𝑲𝝈 < 𝑿 < �̅� + 𝑲𝝈) ≥ 𝟏 −𝟏

𝑲𝟐

Para K=4, y la media y la desviación típica dadas en el problema. Entonces:

𝑝(0,1 − 4 ∙ 0,01 < 𝑋 < 0,1 + 4 ∙ 0,01) = 𝑝(0,06 < 𝑋 < 0,14) ≥ 1 −1

42= 1 −

1

16=

15

16= 𝟎, 𝟗𝟑𝟕𝟓

Page 10: Tema nº 61 - aporlaopo.es

aporlaopo.es Preparación curso 20/21 – Tema nº: 61

[aporlaopo.es] – Temario para la especialidad de Matemáticas Todos los derechos reservados. Prohibida su reproducción total o parcial. 9

7.2. APLICACIONES DEL COEFICIENTE DE VARIACIÓN

Como ya hemos dicho, para medir de forma eficaz la dispersión de los datos de un conjunto con la seguridad de no

llegar a resultados erróneos utilizamos el coeficiente de variación de Pearson. Veámoslo en un ejemplo:

Tenemos las siguientes medidas sobre el nº de ventas de dos productos y nos interesa saber qué distribución tiene

mayor dispersión y cual menos.

Nº medio de ventas Desviación típica

Producto A 500 ventas 20 ventas

Producto B 6000 ventas 360 ventas

Para verlo utilizamos el coeficiente de variación de Pearson:

▪ Producto A: 𝐶𝑉 =20

500∙ 100 = 5%

▪ Producto B: 𝐶𝑉 =360

6000∙ 100 = 6%

Por tanto, la distribución de ventas del producto B es más dispersa que la distribución de ventas del producto A.

Es importante indicar también que en algunas ciencias usan el inverso del coeficiente de variación: 𝐶𝑉𝑖𝑛𝑣 =�̅�

𝑠.

Por ejemplo, para medir el ruido, algunas ingenierías usan este coeficiente, llamándolo, en este caso concreto,

coeficiente señal-ruido.

7.3. APLICACIONES DE LA VARIABLE NORMALIZADA

Una de las aplicaciones de la Normalización es que facilita la comparación de la forma de las distribuciones gracias a

que elimina los factores de posición y dispersión. Pero sin duda alguna, la aplicación más importante de la

Normalización de variables es que posibilita realizar cálculos de probabilidad con la función de densidad de variables

cuya distribución puede ajustarse mediante una distribución Normal.

Como ya hemos indicado, existen muchos fenómenos como pueden ser medidas corporales (altura, peso,…),

comportamientos sociales (aficiones, grado de aceptación,…), aptitudes (coeficiente intelectual, velocidad lectora,…),

etc, que pueden ajustarse mediante una distribución Normal. Para ajustar el estudio de una variable en una

distribución Normal se toma una muestra de la población, se obtiene su media y desviación típica y se procede a

estimar si la distribución Normal con la media y desviación típica calculadas a partir de los elementos de la muestra

proporciona un buen ajuste. Si el ajuste es bueno, podemos utilizar la distribución Normal para el cálculo de

probabilidades sobre la variable que estamos estudiando.

Estos cálculos de probabilidades se determinan, como ya vimos, mediante áreas bajo la curva de la función de

densidad, y la curva Normal permite, mediante relaciones lineales, pasar de una variable cualquiera a otra variable

tipificada o Normal estándar: 𝑋~𝑁(0,1) y cuyas probabilidades están tabuladas mediante las tablas de áreas

acumuladas y para calcular las áreas bajo la curva de la N(0,1) se procede como vimos en el apartado anterior.

8. BIBLIOGRAFÍA

▪ Kolmogorov. La Matemática: su contenido, métodos y significados. Alianza y Universidad.

▪ Ríos, S. Métodos Estadísticos. Ed. Del Castillo, 1985.

▪ Stanley, G. Métodos estadísticos aplicados a las Ciencias Sociales. Prentice Hall.

▪ Calot, G. Curso básico de Estadística Descriptiva. Ed. Paraninfo.