MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA 2º BACHILLERATO CCSS

27
APUNTES DE PROBABILIDAD Y ESTADISTICA 2º BACHILLERATO CCSS Teoría de probabilidades La teoría de probabilidades se ocupa de asignar un cierto número a cada posible resultado que pueda ocurrir en un experimento aleatorio, con el fin de cuantificar dichos resultados y saber si un suceso es más probable que otro. Suceso Es cada uno de los resultados posibles de una experiencia aleatoria. Espacio muestral Es el conjunto de todos los posibles resultados de una experiencia aleatoria, lo representaremos por E (o bien por la letra griega Ω). Tipos de sucesos Suceso elemental Suceso elemental es cada uno de los elementos que forman parte del espacio muestral. Suceso aleatorio Suceso compuesto es cualquier subconjunto del espacio muestral. Suceso seguro Suceso seguro, E, está formado por todos los posibles resultados (es decir, por el espacio muestral). Suceso imposible Suceso imposible, , es el que no tiene ningún elemento. Por ejemplo al tirar un dado obtener una puntuación igual a 7. Sucesos compatibles Dos sucesos, A y B, son compatibles cuando tienen algún suceso elemental común. Sucesos incompatibles Dos sucesos, A y B, son incompatibles cuando no tienen ningún elemento en común. Sucesos independientes

Transcript of MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA 2º BACHILLERATO CCSS

Page 1: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

APUNTES DE PROBABILIDAD Y ESTADISTICA 2º BACHILLERATO CCSS

Teoría de probabilidades

La teoría de probabilidades se ocupa de asignar un cierto número a cada posible resultado que pueda ocurrir en un experimento aleatorio, con el fin de cuantificar dichos resultados y saber si un suceso es más probable que otro.

Suceso

Es cada uno de los resultados posibles de una experiencia aleatoria.

Espacio muestral

Es el conjunto de todos los posibles resultados de una experiencia aleatoria, lo representaremos por E (o bien por la letra griega Ω).

Tipos de sucesos

Suceso elemental

Suceso elemental es cada uno de los elementos que forman parte del espacio muestral.

Suceso aleatorio

Suceso compuesto es cualquier subconjunto del espacio muestral.

Suceso seguro

Suceso seguro, E, está formado por todos los posibles resultados (es decir, por el espacio muestral).

Suceso imposible

Suceso imposible, , es el que no tiene ningún elemento.

Por ejemplo al tirar un dado obtener una puntuación igual a 7.

Sucesos compatibles

Dos sucesos, A y B, son compatibles cuando tienen algún suceso elemental común.

Sucesos incompatibles

Dos sucesos, A y B, son incompatibles cuando no tienen ningún elemento en común.

Sucesos independientes

Dos sucesos, A y B, son independientes cuando la probabilidad de que suceda A no se ve afectada porque haya sucedido o no B.

Sucesos dependientes

Dos sucesos, A y B, son dependientes cuando la probabilidad de que suceda A se ve afectada porque haya sucedido o no B.

Suceso contrario

Page 2: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

El suceso contrario a A es otro suceso que se realiza cuando no se realiza A., Se denota por .

Unión de sucesos

La unión de sucesos, A B, es el suceso formado por todos los elementos de A y de B.

Intersección de sucesos

La intersección de sucesos, A B, es el suceso formado por todos los elementos que son, a la vez, de A y B.

Diferencia de sucesos

La diferencia de sucesos, A − B, es el suceso formado por todos los elementos de A que no son de B.

Sucesos contrarios

El suceso = E - A se llama suceso contrario o complementario de A.

Axiomas de la probabilidad

1.0 ≤ p(A) ≤ 1

2.p(E) = 1

3.p(A B) = p(A) + p(B)

Propiedades de la probabilidad

1

2

3

4

5 Si A1, A2, ..., Ak son incompatibles dos a dos entonces:

6 Si el espacio muestral E es finito y un suceso es S = {x1, x2, ..., xn} entonces:

Ley de Laplace

Page 3: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

Probabilidad de la unión de sucesos incompatibles

A B =

p(A B) = p(A) + p(B)

Probabilidad de la unión de sucesos compatibles

A B ≠

p(A B) = p(A) + p(B) − p(A B)

Probabilidad condicionada

Probabilidad de la intersección de sucesos independientes

p(A B) = p(A) · p(B)

Probabilidad de la intersección de sucesos dependientes

p(A B) = p(A) · p(B/A)

Teorema de la probabilidad total

Si A 1, A 2 ,... , A n son sucesos incompatibles 2 a 2, cuya unión es el espacio muestral (A 1 A 2 ... A n = E) y B es otro suceso, resulta que::

p(B) = p(A1) · p(B/A1) + p(A2) · p(B/A2 ) + ... + p(An) · p(B/An )

Teorema de Bayes

Si A 1, A 2 ,... , A n son sucesos incompatibles 2 a 2, cuya unión es el espacio muestral (A 1 A 2 ... A n = E) y B es otro suceso, resulta que::

--------------------------------------------------------------------------------------------------------------------

Desviación media

La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.

La desviación media se representa por

Page 4: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

Desviación media para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es:

Varianza

La desviación típica es la raíz cuadrada de la varianza.

La desviación típica se representa por σ.

Desviación típica para datos agrupados

Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Desviación típica para datos agrupados

Desviación típica

La desviación típica es la raíz cuadrada de la varianza.

La desviación típica se representa por σ.

Page 5: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

Desviación típica para datos agrupados

Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Desviación típica para datos agrupados

Coeficiente de variación

El coeficiente de variación es la relación entre la desviación típica de una muestra y su media.

Puntuaciones típicas

Las puntuaciones típicas son el resultado de dividir las puntuaciones diferenciales entre la desviación típica. Este proceso se llama tipificación.

Inferencia estadística

Estudia cómo sacar conclusiones generales para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación de los resultados obtenidos.

Muestreo probabilístico

Consiste en elegir una muestra de una población al azar. Podemos distinguir varios tipos:

Muestreo aleatorio simple:

Page 6: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

    Para obtener una muestra, se numeran los elementos de la población y se seleccionan al azar los n elementos que contiene la muestra.

Muestreo aleatorio sistemático:

    Se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los demás hasta completar la muestra.

Muestreo aleatorio estratificado:

    Se divide la población en clases o estratos y se escoge, aleatoriamente, un número de individuos de cada estrato proporcional al número de componentes de cada estrato.

Intervalos característicos

El nivel de confianza (p) se designa mediante 1 - α.

El nivel de significación se designa mediante α.

El valor crítico (k) como z α/2 .

P(Z>z α/2) = α/2      P[-z α/2 < z < z α/2] = 1- α

En una distribución N(μ, σ ) el intervalo característico correspondiente a una probabilidad p = 1 - α es:

(μ - z α/2 · σ , μ + z α/2 · σ )

1 - α α/2 z α/2 Intervalos característicos

0.90 0.05 1.645 (μ - 1.645 · σ , μ + 1.645 · σ)

0.95 0.025 1.96 (μ - 1.96 · σ , μ + 1.96 · σ )

0.99 0.005 2.575 (μ - 2.575 · σ , μ + 2.575 · σ )

 

Distribución de las medias muestrales

Teorema central del límite

Si una población tiene media μ y desviación típica σ , y tomamos muestras de tamaño n (n>30, ó cualquier tamaño si la población es "normal"), las medias de estas muestras siguen aproximadamente la distribución:

Page 7: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

Consecuencias:

1.Permite averiguar la probabilidad de que la media de una muestra concreta esté en un cierto intervalo.

2.Permite calcular la probabilidad de que la suma de los elementos de una muestra esté, a priori, en un cierto intervalo.

3.Inferir la media de la población a partir de una muestra.

Estimación

Intervalo de confianza Se llama así a un intervalo en el que sabemos que está un parámetro, con un nivel de confianza específico.

Nivel de confianza Probabilidad de que el parámetro a estimar se encuentre en el intervalo de confianza.

Error de estimación admisible Que estará relacionado con el radio del intervalo de confianza.

Estimación de la media de una población

Intervalo de confianza para la media

El intervalo de confianza, para la media de una población, con un nivel de confianza de 1- α , siendo x la media de una muestra de tamaño n y σ la desviación típica de la población, es:

El error máximo de estimación es:

Tamaño de la muestra

Estimación de una proporción

  Si en una población, una determinada característica se presenta en una proporción p, la proporción p' , de individuos con dicha característica en las muestras de tamaño n, se distribuirán según:

Page 8: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

Intervalo de confianza para una proporción

El error máximo de estimación es:

Hipótesis estadísticas

Un test estadístico es un procedimiento para, a partir de una muestra aleatoria y significativa, extraer conclusiones que permitan aceptar o rechazar una hipótesis previamente emitida sobre el valor de un parámetro desconocido de una población.

La hipótesis emitida se designa por H0 y se llama hipótesis nula.

La hipótesis contraria se designa por H1 y se llama hipótesis alternativa.

Contrastes de hipótesis

1. Enunciar la hipótesis nula H0 y la alternativa H1.

Bilateral H0=k H1 ≠ k

Unilateral

H0≥ k H1 < k

H0 ≤k H1> k

2. A partir de un nivel de confianza 1 - α o el de significación α. Determinar:

El valor zα/2 (bilaterales), o bien zα (unilaterales)

La zona de aceptación del parámetro muestral (x o p').

3. Calcular: x o p', a partir de la muestra.

4. Si el valor del parámetro muestral está dentro de la zona de la aceptación, se acepta la hipótesis con un nivel de significación α. Si no, se rechaza.

Contraste Bilateral

Se presenta cuando la hipótesis nula es del tipo H0: μ = k (o bien H0: p = k) y la hipótesis alternativa, por tanto, es del tipo H1: μ≠ k (o bien H1: p≠ k).

El nivel de significación α se concentra en dos partes (o colas) simétricas respecto de la media.

Page 9: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

La región de aceptación en este caso no es más que el correspondiente intervalo de probabilidad para x o p', es decir:

o bien:

Contraste unilateral Caso 1

La hipótesis nula es del tipo H0: μ ≥ k (o bien H0: p ≥ k).

La hipótesis alternativa, por tanto, es del tipo H1: μ < k (o bien H1: p < k).

Valores críticos

1 - α α z α

0.90 0.10 1.28

0.95 0.05 1.645

0.99 0.01 2.33

La región de aceptación en este caso será:

o bien:

Caso 2

La hipótesis nula es del tipo H0: μ ≤ k (o bien H0: p ≤ k).

La hipótesis alternativa, por tanto, es del tipo H1: μ > k (o bien H1: p > k).

La región de aceptación en este caso será:

o bien:

Page 10: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

Errores

Error de tipo I. Se comete cuando la hipótesis nula es verdadera y, como consecuencia del contraste, se rechaza.

Error de tipo II. Se comete cuando la hipótesis nula es falsa y, como consecuencia del contraste se acepta.

H0 Verdadera Falsa

AceptarDecisón correcta

Probabilidad = 1 - α

Decisión incorrecta:

ERROR DE TIPO II

RechazarERROR DE TIPO I

Probabilidad = α Decisión correcta

La probabilidad de cometer Error de tipo I es el nivel de significación α.

La probabilidad de cometer Error de tipo II depende del verdadero valor del parámetro. Se hace tanto menor cuanto mayor sea n.

Función de probabilidad

Se llama función de probabilidad de una variable aleatoria discreta X a la aplicación que asocia a cada valor de xi de la variable su probabilidad pi.

0 ≤ pi ≤ 1

p1 + p2 + p3 + · · · + pn = Σ pi = 1

FUNCION DE DISTRIBUCION DE PROBABILIDAD Sea X una variable aleatoria discreta cuyos valores suponemos ordenados de menor a mayor. Llamaremos función de distribución de la variable X, y escribiremos F(x) a la función:

F(x) = p(X ≤ x)

La función de distribución asocia a cada valor de la variable aleatoria la probabilidad acumulada hasta ese valor.

Esperanza matemática o media

Page 11: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

Varianza

Desviación típica

Ejemplo

Calcular la esperanza matemática, la varianza, y la desviación típica, de la distribución de probabilidad de las puntuaciones obtenidas al lanzar un dado.

 x p i x · p i x 2 · pi

1

2

3

4

5

6 1 6

            

EJERCICIO RESUELTOSabiendo que p(X ≤ 2) = 0.7 y p(X ≥ 2) = 0.75. Hallar:

La esperanza matemática, la varianza y la desviación típica.

Page 12: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

 x p i x · p i x 2· pi

0 0.1 0 0

1 0.15 0.15 0.15

2 0.45 0.9 1.8

3 0.1 0.3 0.9

4 0.2 0.8 3.2

    2.15 6.05

μ =2.15

σ² = 6.05 - 2.15² = 1.4275

σ = 1.19

DISTRIBUCION BINOMIAL

Distribución binomial

La distribución binomial se suele representar por B(n, p).

n es el número de pruebas de que consta el experimento.

p es la probabilidad de éxito.

Page 13: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

La probabilidad de es 1− p, y la representamos por q.

La función de probabilidad de la distribución binomial, también denominada función de la distribución de Bernoulli, es:

n es el número de pruebas.

k es el número de éxitos.

p es la probabilidad de éxito.

q es la probabilidad de fracaso.

El número combinatorio

Ejemplo

La última novela de un autor ha tenido un gran éxito, hasta el punto de que el 80% de los lectores ya la han leido. Un grupo de 4 amigos son aficionados a la lectura:

1. ¿Cuál es la probabilidad de que el grupo hayan leido la novela 2 personas?

n = 4

p = 0.8

q = 0.2

B(4, 0.8)

2.¿Y cómo máximo 2?

Media Varianza Desviación típica

Ejemplo

La probabilidad de que un artículo producido por una fabrica sea defectuoso es 0.02. Se envió un cargamento de 10.000 artículos a unos almacenes. Hallar el número esperado de artículos defectuosos, la varianza y la desviación típica.

Page 14: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

DISTRIBUCION NORMAL

El área del recinto determinado por la función y el eje de abscisas es igual a la unidad.

Al ser simétrica respecto al eje que pasa por x = µ, deja un área igual a 0.5 a la izquierda y otra igual a 0.5 a la derecha.

La probabilidad equivale al área encerrada bajo la curva.

p(μ - σ < X ≤ μ + σ) = 0.6826 = 68.26 %

p(μ - 2σ < X ≤ μ + 2σ) = 0.954 = 95.4 %

p(μ - 3σ < X ≤ μ + 3σ) = 0.997 = 99.7 %

N(0, 1)

La distribución normal estándar, o tipificada o reducida, es aquella que tiene por media el valor cero, μ = 0, y por desviación típica la unidad, σ =1.

Su función de densidad es:

Su gráfica es:

La probabilidad de la variable X dependerá del área del recinto sombreado en la figura. Y para calcularla utilizaremos una tabla.

Tipificación de la variable

Para poder utilizar la tabla tenemos que transformar la variable X que sigue una distribución N(μ, σ) en otra variable Z que siga una distribución N(0, 1).

Page 15: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

Tabla de la curva normal (0, 1)

La tabla nos da las probabilidades de P(z ≤ k), siendo z la variable tipificada.

Estas probabilidades nos dan la función de distribución Φ(k).

Φ(k) = P(z ≤ k)

Búsqueda en la tabla de valor de k

Unidades y décimas en la columna de la izquierda.

Céntesimas en la fila de arriba.

P(Z ≤ a)

P(Z ≤ 1.47) = 0.9292

P(Z > a) = 1 - P(Z ≤ a)

P(Z > 1.47) = 1 − P(Z ≤ 1.47) = 1 − 0.9292 = 0.0708

P(Z ≤ −a) = 1 − P(Z ≤ a)

P(Z ≤ −1.47) = 1 − P(Z ≤ 1.47) = 1 − 0.9292 = 0.0708

P(Z > −a) = P(Z ≤ a)

Page 16: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

p(Z > −1.47) = p(Z ≤ 1.47) = 0.9292

P(a < Z ≤ b ) = P(Z ≤ b) − P(Z ≤ a)

P( 0.45 <Z ≤ 1.47) = P(Z ≤ 1.47) − P(Z ≤ 0.45) =

= 0.9292 − 0.6736 = 0.2556

P(−b < Z ≤ −a ) = P(a < Z ≤ b )

P(−1.47 <Z ≤ − 0.45) = P( 0.45 <Z ≤ 1.47) =

= P(Z ≤ 1.47) − P(Z ≤ 0.45) = 0.9292 − 0.6736 = 0.2556

P(−a < Z ≤ b ) = P(Z ≤ b) − [ 1 − P(Z ≤ a)]

P(-1.47 < Z ≤ 0.45) = P(Z ≤ 0.45) − [ 1 − P(Z ≤ 1.47)]=

= 0.6736 − (1 − 0.9292) = 0.6028

p = K

Nos encontramos con el caso inverso a los anteriores, conocemos el valor de la probabilidad y se trata de hallar el valor de la abscisa. Ahora tenemos que buscar en la tabla el valor que más se aproxime a K.

p = 0.75Z ≤ 0.68

Page 17: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

Para calcular la variable X nos vamos a la fórmula de la tipificación.

(X - μ)/σ = 0.68X = μ + 0.68 σ

Aproximación de la binomial por la normal

Teorema de Moivre

Si:

n·p ≥ 0 y n·q ≥ 0.

La distribución binomial B(n, p) se puede aproximar mediante una distribución normal:

Ejemplo

En una ciudad una de cada tres familias posee teléfono. Si se eligen al azar 90 familias, calcular la probabilidad de que entre ellas haya por lo menos 30 tengan teléfono.

DISTRIBUCIONES BIDIMENSIONALES

Page 18: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

La covarianza de una variable bidimensional es la media aritmética de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas.

La covarianza se representa por sxy o σxy.

La covarianza indica el sentido de la correlación entre las variables

Si σxy > 0 la correlación es directa.

Si σxy < 0 la correlación es inversa.

La covarianza presenta como inconveniente, el hecho de que su valor depende de la escala elegida para los ejes.

Es decir, la covarianza variará si expresamos la altura en metros o en centímetros. También variará si el dinero lo expresamos en euros o en dólares.

Ejemplos

Las notas de 12 alumnos de una clase en Matemáticas y Física son las siguientes:

Matemáticas 2 3 4 4 5 6 6 7 7 8 10 10

Física 1 3 2 4 4 4 6 4 6 7 9 10

Hallar la covarianza de la distribución.

xi yi xi · yi

2 1 2

3 3 9

4 2 8

4 4 16

5 4 20

6 4 24

6 6 36

7 4 28

7 6 42

8 7 56

10 9 90

10 10 100

Page 19: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

72 60 431

Después de tabular los datos hallamos las medias aritméticas:

Los valores de dos variables X e Y se distribuyen según la tabla siguiente:

Y/X 0 2 4

1 2 1 3

2 1 4 2

3 2 5 0

Hallar la covarianza de la distribución.

En primer lugar convertimos la tabla de doble entrada en tabla simple y calculamos las medias aritméticas.

xi yi fi xi · fi yi · fi xi · yi · fi

0 1 2 0 2 0

0 2 1 0 2 0

0 3 2 0 6 0

2 1 1 2 1 2

2 2 4 8 8 16

2 3 5 10 15 30

4 1 3 12 3 12

4 2 2 8 4 16

    20 40 41 76

El coeficiente de correlación lineal es el cociente entre la covarianza y el producto de las desviaciones típicas de ambas variables.

El coeficiente de correlación lineal se expresa mediante la letra r.

Page 20: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

Propiedades del coeficiente de correlación

1. El coeficiente de correlación no varía al hacerlo la escala de medición.

Es decir, si expresamos la altura en metros o en centímetros el coeficiente de correlación no varía.

2. El signo del coeficiente de correlación es el mismo que el de la covarianza.

Si la covarianza es positiva, la correlación es directa.

Si la covarianza es negativa, la correlación es inversa.

Si la covarianza es nula, no existe correlación.

3. El coeficiente de correlación lineal es un número real comprendido entre −1 y 1.

−1 ≤ r ≤ 1

4. Si el coeficiente de correlación lineal toma valores cercanos a −1 la correlación es fuerte e inversa, y será tanto más fuerte cuanto más se aproxime r a −1.

5. Si el coeficiente de correlación lineal toma valores cercanos a 1 la correlación es fuerte y directa, y será tanto más fuerte cuanto más se aproxime r a 1.

6. Si el coeficiente de correlación lineal toma valores cercanos a 0, la correlación es débil.

7. Si r = 1 ó −1, los puntos de la nube están sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional.

Ejemplos

Las notas de 12 alumnos de una clase en Matemáticas y Física son las siguientes:

Matemáticas 2 3 4 4 5 6 6 7 7 8 10 10

Física 1 3 2 4 4 4 6 4 6 7 9 10

Hallar el coeficiente de correlación de la distribución e interpretarlo.

xi yi xi ·yi xi2 yi

2

2 1 2 4 1

3 3 9 9 9

4 2 8 16 4

4 4 16 16 16

5 4 20 25 16

Page 21: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

6 4 24 36 16

6 6 36 36 36

7 4 28 49 16

7 6 42 49 36

8 7 56 64 49

10 9 90 100 81

10 10 100 100 100

72 60 431 504 380

1º Hallamos las medias aritméticas.

2º Calculamos la covarianza.

3º Calculamos las desviaciones típicas.

4º Aplicamos la fórmula del coeficiente de correlación lineal.

Al ser el coeficiente de correlación positivo, la correlación es directa.

Como coeficiente de correlación está muy próximo a 1 la correlación es muy fuerte.

Los valores de dos variables X e Y se distribuyen según la tabla siguiente:

Y/X 0 2 4

1 2 1 3

2 1 4 2

3 2 5 0

Determinar el coeficiente de correlación.

Convertimos la tabla de doble entrada en tabla simple.

xi yi fi xi · fi xi2 · fi yi · fi yi

2 · fi xi · yi · fi

Page 22: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

0 1 2 0 0 2 2 0

0 2 1 0 0 2 4 0

0 3 2 0 0 6 18 0

2 1 1 2 4 1 1 2

2 2 4 8 16 8 16 16

2 3 5 10 20 15 45 30

4 1 3 12 48 3 3 12

4 2 2 8 32 4 8 16

    20 40 120 41 97 76

Al ser el coeficiente de correlación negativo, la correlación es inversa.

Como coeficiente de correlación está muy próximo a 0 la correlación es muy débil.

RECTAS DE REGRESIÓN

La recta de regresión es la que mejor se ajusta a la nube de puntos.

La recta de regresión pasa por el punto llamado centro de gravedad.

Recta de regresión de Y sobre X

La recta de regresión de Y sobre X se utiliza para estimar los valores de la Y a partir de los de la X.

La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable X.

Recta de regresión de X sobre Y

Page 23: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

La recta de regresión de X sobre Y se utiliza para estimar los valores de la X a partir de los de la Y.

La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable Y.

Si la correlación es nula, r = 0, las rectas de regresión son perpendiculares entre sí, y sus eucaciones son:

y =

x =

Ejemplo

Las notas de 12 alumnos de una clase en Matemáticas y Física son las siguientes:

Matemáticas 2 3 4 4 5 6 6 7 7 8 10 10

Física 1 3 2 4 4 4 6 4 6 7 9 10

Hallar las rectas de regresión y representarlas.

xi yi xi ·yi xi2 yi

2

2 1 2 4 1

3 3 9 9 9

4 2 8 16 4

4 4 16 16 16

5 4 20 25 16

6 4 24 36 16

6 6 36 36 36

7 4 28 49 16

7 6 42 49 36

8 7 56 64 49

10 9 90 100 81

10 10 100 100 100

72 60 431 504 380

1º Hallamos las medias ariméticas.

Page 24: MATEMATICAS.2º BACHILLER.APUNTES DE PROBABILIDAD Y ESTADISTICA  2º BACHILLERATO CCSS

2º Calculamos la covarianza.

3º Calculamos las varianzas.

4ºRecta de regresión de Y sobre X.

4ºRecta de regresión de X sobre Y.