Coeficiente de pearson y spearman (estadistica)

19

Transcript of Coeficiente de pearson y spearman (estadistica)

Page 1: Coeficiente de pearson y spearman (estadistica)
Page 2: Coeficiente de pearson y spearman (estadistica)

Coeficiente de Correlación de Pearson

En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.

En el caso de que se esté estudiando dos variables aleatorias X y Y sobre una población; el coeficiente de correlación de Pearson se simboliza con la letra, siendo la expresión que nos permite calcularlo:

Page 3: Coeficiente de pearson y spearman (estadistica)

Significación del coeficiente de correlaciónUn coeficiente de correlación se dice que es significativo si se puede afirmar, con una cierta probabilidad, que es diferente de cero. Más estrictamente, en términos estadísticos, preguntarse por la significación de un cierto coeficiente de correlación no es otra cosa que preguntarse por la probabilidad de que tal coeficiente proceda de una población cuyo valor sea de cero.

En consecuencia, dado un cierto coeficiente de correlación rxy obtenido en una determinada muestra se trata de comprobar si dicho coeficiente es posible que se encuentre dentro de la distribución maestral especificada por la Hipótesis nula

Page 4: Coeficiente de pearson y spearman (estadistica)

Usos de enfoques de Pearson a problemas estadísticos

En la perspectiva de Pearson, para establecer el nivel de significación habría que tener en cuenta

algunos aspecto de que lleven a lugar a errores que conlleven a investigador tomar como objetos al cual se puedan minimizar lo mas que se pueda.

Pearson llamo alfa al error que se podría considerar tipo 1 y beta al que se podría tomar en cuenta como

error tipo 2,siendo estos quienes introdujeron el “poder de la prueba estadística”.

Las pruebas mas claras serian las paramétricas y usadas como la T de student, la prueba F, llamada

así en honor de Fisher y es por esto que es simbolizado con esta letra.

Page 5: Coeficiente de pearson y spearman (estadistica)
Page 6: Coeficiente de pearson y spearman (estadistica)

Ventajas del coeficiente de Pearson

El valor es independiente de cualquier unidad usada para medir variables.

Mientras mas grande es la muestra, mas grande es la estimación.

Page 7: Coeficiente de pearson y spearman (estadistica)

Desventajas del coeficiente de Pearson

Requiere supuestos acerca de la naturaleza o formas de las poblaciones afectadas.

Requiere que las dos variables hayan sido hasta un nivel cuantitativo continuo y que la división de ambas sea semejante a la de la curva normal.

Page 8: Coeficiente de pearson y spearman (estadistica)

Coeficiente de correlación de Spearman

En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.

Donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas.

Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia El coeficiente de correlación de Spearman es menos sensible que el de Pearson para los valores muy lejos de lo esperado. En este ejemplo: Pearson= 0.30706 Spearman = 0.76270

Page 9: Coeficiente de pearson y spearman (estadistica)

La aproximación moderna al problema de averiguar si un valor observado de ρ es significativamente diferente de cero (siempre tendremos -1 ≤ ρ ≤ 1) es calcular la probabilidad de que sea mayor o igual que el ρ esperado, dada la hipótesis nula, utilizando un test de permutación. Esta aproximación es casi siempre superior a los métodos tradicionales, a no ser que el conjunto de datos sea tan grande que la potencia informática no sea suficiente para generar permutaciones (poco probable con la informática moderna), o a no ser que sea difícil crear un algoritmo para crear permutaciones que sean lógicas bajo la hipótesis nula en el caso particular de que se trate (aunque normalmente estos algoritmos no ofrecen dificultad).

Determinando la significación estadística

Page 10: Coeficiente de pearson y spearman (estadistica)

Ventajas del coeficiente de Spearman

Una gran ventaja seria que su distribución es muestral por lo cual se puede calcular su error estándar de estimación.

No esta afectada por los cambios en las unidades de medida.

Es recomendables usarlo cuando los datos presentan valores extremos, ya que dichos valores extremos, ya que dichos valores afectan mucho

Al ser una técnica no paramétrica, es libre de distribución probabilística.

Page 11: Coeficiente de pearson y spearman (estadistica)

Desventajas de la correlación de Spearman

Requiere supuestos acerca de la naturaleza o formas de las poblaciones afectadas.

Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo continuo y que la distribución de ambas sea semejante a la curva normal.

Page 12: Coeficiente de pearson y spearman (estadistica)

Usos del coeficiente de correlación de Spearman

Para aplicar el coeficiente de

correlación de Spearman se

requiere que las diferentes

variables estén al menos en

una escala ordinal.

Muchas veces, este coeficiente

es denotada con la letra griega

que es pronunciada (rho), pero

en el momento de situarnos en

la estadística descriptiva es

denotada por rs.

Page 13: Coeficiente de pearson y spearman (estadistica)

Propiedades del coeficiente de correlación de Spearman

El coeficiente de correlación de Spearman se encuentra siempre comprendido entre los valores -1 y 1.

Cuando todos los sujetos se sitúan en el mismo puesto para la variable x y para la variable y, el valor de Rs ES 1.Si se ocupan de valores opuestos ,es decir; al primer sujeto en x le corresponde el ultimo lugar en y, el segundo en x le corresponde el penúltimo en Y etc. Entonces el valor de rs -1.

Page 14: Coeficiente de pearson y spearman (estadistica)

Usos de enfoques de Spearman a problemas estadísticos

Una generalización del coeficiente de Spearman es útil en situación en la cual poseemos mas de tres condiciones, varios individuos cada vez que predecimos las observaciones el orden que tendrán en particular.

El coeficiente de correlación de rangos de Spearman de utilizarse para series de datos en la que existan valores extremos, pues si calculamos la correlación de Pearson los resultados se verán afectados.

La interpretación del resultado del coeficiente de correlación de Spearman se encuentran entre los valores de -1 y 1.

Page 15: Coeficiente de pearson y spearman (estadistica)

Como determinar el uso de lo coeficientes de correlación de Spearman

Este coeficiente se emplea cuando una o ambas escalas de medidas de las variables son ordinales, es decir, cuando una o ambas escalas de medidas son posiciones. Ejemplo: orden de llegada en una carrera y peso de los atletas.

Se calcula aplicando: Nota: Los datos hay que traducirlos y tratar de ordenarlos en rangos. A los puntajes mas elevados le asignamos el rango 1 al 2 y el siguiente.

Luego se aplica la siguiente formula:

Page 16: Coeficiente de pearson y spearman (estadistica)

Ejemplos:xi yi Xi,y

ixi2 yi2

2 1 2 4 13 3 9 9 94 2 8 16 44 4 16 16 165 4 20 25 166 4 24 36 166 6 36 36 367 4 28 49 167 6 42 49 368 7 56 64 4910 9 90 100 8110 10 100 100 100

Las notas de 12 alumnos en la clase de física y matemática son los siguientes:

Matemáticas

Física

2 13 34 24 45 46 46 67 47 68 710 9 10 10

Hallar el coeficiente de relación de la distribución e interpretarlo.

72 60 431 504 380

Page 17: Coeficiente de pearson y spearman (estadistica)

Hallamos las medidas aritméticas Calculamos la covarianza

Calculamos las desviaciones típicas

Aplicamos la formula de coeficiente de correlación lineal

Nota: Al ser el coeficiente de relación positivo, es directo el coeficiente

Page 18: Coeficiente de pearson y spearman (estadistica)

Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t deStudent

La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre-1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kenda l es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.

Page 19: Coeficiente de pearson y spearman (estadistica)

REFERENCIAS BIBLOGRAFICAS (http://web.archive.org/web/http://www.psico.uniovi.es/

Dpto_Psicologia/metodos/tu tor.6/fcope.html) en el Departamento de Psicología de la Universidad de Oviedo.

Weisstein, Eric W. «Correlation Coefficient» (http://mathworld.wolfram.com/CorrelationCoefficient.html). En

Weisstein, Eric W. MathWorld (en inglés). Wolfram Research.

https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Spearman

https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pearson

http://www.uv.es/webgid/Descriptiva/31_coeficiente_de_pearson.html