3.distribuciónsbidimensionais

82
MÉTODOS ESTATÍSTICOS MÉTODOS ESTATÍSTICOS E NUMÉRICOS E NUMÉRICOS IES Isidro Parga Pondal. Departamento de matemáticas UNIDADE 3 UNIDADE 3 ÍNDICE ÍNDICE DISTRIBUCIÓNS BIDIMENSIONAIS

Transcript of 3.distribuciónsbidimensionais

Page 1: 3.distribuciónsbidimensionais

MÉTODOS ESTATÍSTICOSMÉTODOS ESTATÍSTICOS

E NUMÉRICOSE NUMÉRICOS

IES Isidro Parga Pondal. Departamento de matemáticas

UNIDADE 3UNIDADE 3

ÍNDICEÍNDICE

DISTRIBUCIÓNS BIDIMENSIONAIS

Page 2: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

ConceptosConceptos

1. Variables estatísticas bidimensionais.2.Táboas bidimensionais de frecuencias. Diagramas de dispersión.

3. Cálculo de parámetros.4. Dependencia funcional. Dependencia estatística.

5. Correlación.6. Correlación lineal. Coeficiente de Pearson.7. Regresión lineal. Rectas de regresión.

Page 3: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

1. Introdución1. Introdución

Cando vemos un rapaz de cinco anos e dicimos que está moi alto, estamos comparándoo co talle medio doutros nenos da mesma idade; é dicir, consideramos dúas variables, a idade e o talle, e a relación entre elas.

Page 4: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

1. Introdución 1. Introdución

Precisamente isto é o que imos tratar: a medida da relación entre dúas variables para ver o grao de relación que pode existir entre elas ou como poden influír unhas sobre outras.

Page 5: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

•Neste tema centrarémonos nas estatísticas de dúas variables chamadas Variables Estatísticas Bidimendionais

•En calquera investigación onde observemos dúas variables para o seu estudo conxunto, interesa coñecer dúas cuestións:

1. Introdución1. Introdución

Page 6: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

• A posible relación entre as variables e, se existe, obter un índice que mida o grao desa relación.

Teoría da Correlación.•A obtención dunha fórmula que as relacione para, se coñecemos o valor dunha das variables, poder predicir o valor da outra cun determinado erro.

Teoría da Regresión.

1. Introdución1. Introdución

Page 7: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Pero...........

Por que se chama Regresión?

1. Introdución1. Introdución

Page 8: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

As teorías da correlación e a regresión son moi recentes e o seu descubrimento débese, en grande parte, ao médico inglés Sir Francis Galton (1.822-1.917).

1. Introdución1. Introdución

Page 9: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

O contexto histórico que lle tocou vivir favoreceu o seu interese pola herdanza xenética: naceu o mesmo ano que George Mendel, co que mantiña unha grande afinidade, e ademais era curmán, por parte de nai, do célebre científico Charles Darwin.

1. Introdución1. Introdución

Page 10: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Estudou a relación entre: estatura media dun matrimonio - estatura media dos seus fillos adultos.

1. Introdución1. Introdución

Page 11: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Encontrou unha correlación forte: canto maior era a primeira, maior era a segunda. É dicir, canto máis altos son os pais, máis altos son os fillos. Pero...

1. Introdución1. Introdución

Page 12: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Sostiña a idea de que a pais de estatura moi, moi elevada corresponden fillos altos, pero non tanto. E pais moi baixos acostuman ter fillos baixos, mais non tan baixos.Esta observación levou a enunciar a Galton o seu principio da mediocridade:

“a estatura dos fillos regresa cara a media da poboación”.

1. Introdución1. Introdución

Page 13: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

De aí o termo de regresión que, desde entón, utilízase para designar unha relación estatística calquera.

1. Introdución1. Introdución

Page 14: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

•A observación de Galton é sen dúbida certa, pero o suposto da regresión é totalmente falso e considérase actualmente como a primeira falacia da teoría da regresión.•A xustificación que se dá hoxe a este feito é que os valores extremos dunha distribución débense en gran parte ao chou.

1. Introdución1. Introdución

Page 15: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

•Os traballos de Galton foron continuados, entre outros, por Pearson, que reelaborou e mellorou as súas ideas.

•A Galton e a Pearson considéraselles hoxe en día os pais da estatística moderna.

1. Introdución1. Introdución

Page 16: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Ao efectuar o estudo estatístico dun colectivo pode ser que en cada observación se considere un só carácter (peso, estatura, profesión, etc.), entón temos unha variable estatística unidimensional.

Se, pola contra, se consideran dous caracteres dun mesmo individuo (estatura- idade, profesión- sexo, etc) temos as variables estatísticas bidimensionais.

2. Variables estatísticas bidimensionais2. Variables estatísticas bidimensionais

Page 17: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Formalmente , defínese unha variable estatística bidimensional como o par (X,Y), onde X representa á primeira variable e Y á segunda. X e Y non teñen por que ter:

o mesmo número de valores ser da mesma clase sendo da mesma clase, unha pode ser

continua e outra discreta

2. Variables estatísticas bidimensionais2. Variables estatísticas bidimensionais

Page 18: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Exemplos: Sexo e estado civil Peso e altura Número de irmáns e idade Altura e perímetro torácico

2. Variables estatísticas bidimensionais2. Variables estatísticas bidimensionais

Page 19: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Sexa a variable (X,Y) que toma os valoresX={x1,x2,x3,…,xn} Y={y1,y2,y3,…,ym}

Coa expresión (xi,yj) representamos un valor da variable que terá unha frecuencia absoluta fij que representa o número de veces que se repite o par (xi,yj) na mostra.

Cando teñamos o mesmo número de observacións para as variables X e Y, os pares de observacións denotarémolos por (xi,yi) e a súa frecuencia por fi

2. Variables estatísticas bidimensionais2. Variables estatísticas bidimensionais

Page 20: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Dependendo das características das dúas variables estudadas, os datos represéntanse de diferentes xeitos. Vexamos os tres tipos máis utilizados de táboas:

3. Táboas bidimensionais de frecuencias. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersiónDiagramas de dispersión

Page 21: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Tipo I (Táboa bidimensional simple) Utilízase cando as dúas variables toman o mesmo número de valores e cando temos poucas observacións

X x1 x2 …. …..

…. …. xn

Y y1 y2 …….

…..

…..

yn

3. Táboas bidimensionais de frecuencias. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersiónDiagramas de dispersión

Page 22: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Exemplo:A distribución de idades e presión arterial de 10 persoas é:

Idade (X) 30 28 35 42 51 42 63 32 70 67

Tensión (Y) 11.5 11.3 12.5 13.5 14.6 13 16.6 12 16.9 17

3. Táboas bidimensionais de frecuencias. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersiónDiagramas de dispersión

Page 23: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Tipo II (Táboa bidimensional simple con frecuencia) Utilízase cando as dúas variables toman o mesmo número de valores e temos moitas observacións

Xx1 x2 …

…….. …

…xn

Y y1 y2 ….. ..... ……

yn

fi f1 f2 ….. ….. ….. fn

3. Táboas bidimensionais de frecuencias. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersiónDiagramas de dispersión

Page 24: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Exemplo:As cualificacións de 30 alumnos en Historia e en Xeografía foron:

X=nota Historia

3 4 5 6 6 7 7 8 10

Y=nota Xeografía

2 5 5 6 7 6 7 9 10

Número de alumnos (fi)

4 5 10 2 3 2 1 1 2

3. Táboas bidimensionais de frecuencias. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersiónDiagramas de dispersión

Page 25: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Tipo III (Táboa de dobre entrada) Utilízase cando hai un número elevado de observacións e ademais o número de parellas diferentes é tamén alto. As variables poden ter un número diferente de valores ou modalidades.

Podemos atopar exemplos na seguinte páxina de internet

3. Táboas bidimensionais de frecuencias. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersiónDiagramas de dispersión

Page 26: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Diagramas de dispersiónA representación gráfica proporciona unha imaxe visual que dá unha primeira relación entre as variables.

Para representar unha variable estatística bidimensional (X,Y), representamos no eixe horizontal os valores de X e no vertical os de Y. Obténse un conxunto de puntos sobre o plano que se denomina diagrama de dispersión ou nube de puntos.

3. Táboas bidimensionais de frecuencias. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersiónDiagramas de dispersión

Page 27: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Vexamos un exemploNa web do IGE (Instituto Galego de Estatística) podemos ver unha táboa que reflite a distribución conxunta das variables: -Renda por habitante. -Número de vehículos turismo por cada 1000 habitantes de todos os concellos da Coruña.

3. Táboas bidimensionais de frecuencias. 3. Táboas bidimensionais de frecuencias. Diagramas de dispersiónDiagramas de dispersión

Page 28: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Dada unha variable estatística bidimensional (X,Y), as distribucións X e Y estudadas por separado chámanse distribucións marxinais.Para cada unha destas variables, pódese calcular os parámetros media, varianza e desviación típica.

Definiremos un parámetro conxunto para ambas variables: A COVARIANZA

yx

N

fyx

N

fyyxxS

n

iiii

n

iii

XY

11

1

4. Cálculo de parámetros4. Cálculo de parámetros

Page 29: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

A relación entre dúas variables pode ser:Dependencia unilateral: A primeira variable inflúe sobre a segunda, pero a segunda non inflúe sobre a primeira. O consumo de alcohol inflúe sobre o número de accidentes de tráfico, pero non ao revés.Dependencia mutua: Unha variable inflúe sobre a outra e viceversa. O prezo dun produto e a demanda del.

4. Cálculo de parámetros4. Cálculo de parámetros

Page 30: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Dependencia non observable: Unha variable inflúe sobre a outra pero a través dunha variable que non observamos directamente. O número de ordenadores ten relación co número de accidentes; existe unha variable non observada que é o nivel de vida que fai que haxa máis coches onde hai máis ordenadores.

Dependencia espuria: Prodúcese cando nun determinado estudo illado, entre dúas variables hai unha relación debida a unha casualidade, á manipulación aritmética dos datos ou inclusive ser provocada polo observador que colle só os datos que lle interesan. Nun estudo feito en Babiera, G.M. Jenkins obtivo unha altísima relación entre o número de nacementos e o número de cegoñas.

4. Cálculo de parámetros4. Cálculo de parámetros

Page 31: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Imos ver que a relación que se pode dar entre dúas variables pode ser de dous tipos.

Vexamos dous casos:

5. Dependencia funcional. Dependencia estatística5. Dependencia funcional. Dependencia estatística

Page 32: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

CASO 1: Se un automobilista conduce durante unha hora, percorrerá tantos máis km canto maior sexa a súa velocidade.

5. Dependencia funcional. Dependencia estatística5. Dependencia funcional. Dependencia estatística

Page 33: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

CASO 1 As variables:

espazo percorrido – velocidade están claramente relacionadas, e hai

unha fórmula coa que podemos calcular, exactamente, o espazo en función da velocidade.

Diremos entón que neste caso a relación entre as dúas variables é funcional.

5. Dependencia funcional. Dependencia estatística5. Dependencia funcional. Dependencia estatística

Page 34: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

CASO 2: As persoas, en xeral, pesan máis canto máis altas son.

5. Dependencia funcional. Dependencia estatística5. Dependencia funcional. Dependencia estatística

Page 35: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

CASO 2As variables:

peso – estatura tamén están relacionadas, pero non se pode

dar unha fórmula que permita obter o peso dunha persoa coñecendo a súa estatura.

Neste caso dise que entre as variables hai unha relación estatística ou correlación.

5. Dependencia funcional. Dependencia estatística5. Dependencia funcional. Dependencia estatística

Page 36: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

O obxecto do noso estudo é a

relación estatística ou correlación

5. Dependencia funcional. Dependencia estatística5. Dependencia funcional. Dependencia estatística

Page 37: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Defínese a correlación entre dúas variables como a relación ou interdependencia que existe entre elas; a modificación nunha das variables produce o cambio da outra.

A relación estatística pode ser positiva ou negativa e tamén pode ser forte ou débil.

6. Correlación6. Correlación

Page 38: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Nos exemplos seguintes debes dicir se, entre as dúas variables:

Hai relación ou non.Se a hai, se é funcional ou relación

estatística (correlación). Neste último caso, indicar se é

positiva ou negativa, forte ou débil.

6. Correlación6. Correlación

Page 39: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

EXEMPLO 1:Velocidade coa que se lanza unha pedra cara arriba- Altura que alcanza

6. Correlación6. Correlación

Page 40: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

EXEMPLO 2: Talle de zapatos–estatura

6. Correlación6. Correlación

Page 41: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

EXEMPLO 3: Raio da circunferencia – Lonxitude da circunferencia

6. Correlación6. Correlación

Page 42: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

EXEMPLO 4Índice de mortalidade infantil dun país – nº de médicos por cada 1000 habitantes.

6. Correlación6. Correlación

Page 43: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

EXEMPLO 5: Kwh consumidos nunha vivenda en outubro – custo do recibo da luz

6. Correlación6. Correlación

Page 44: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

EXEMPLO 6: Nº de persoas que viven nunha casa – custo do recibo da luz

6. Correlación6. Correlación

Page 45: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Pero, como podemos saber, dun xeito fiable, se dúas variables están relacionadas?

6. Correlación6. Correlación

Page 46: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Podemos intentalo estudando as nubes de puntos da variable bidimensional correspondente.

6. Correlación6. Correlación

Page 47: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

6. Correlación6. Correlación

Page 48: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Nos gráficos 1 e 4 a medida que aumenta a variable X, aumenta a variable Y. Diremos que entre as variables existe unha correlación directa ou positiva.

6. Correlación6. Correlación

Page 49: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Nos gráficos 2 e 3, obsérvase que a medida que aumenta a variable X, diminúe a variable Y. Diremos que existe unha correlación inversa ou negativa.

6. Correlación6. Correlación

Page 50: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Nos gráficos 1 e 2 observamos que os puntos da nube se poden condensar arredor dunha recta. Diremos que entre as variables existe unha correlación lineal.

6. Correlación6. Correlación

Page 51: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Nos gráficos 3 e 4, obsérvase que os puntos da nube non se poden condensar arredor dunha recta, senón a unha curva. Diremos que existe unha correlación curvilínea.

6. Correlación6. Correlación

Page 52: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

No gráfico 5 observamos que non se pode establecer unha relación entre as variables. Diremos que as variables son incorreladas.

6. Correlación6. Correlación

Page 53: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Para mellorar o estudo gráfico proporcionado pola nube de puntos dunha variable estatística bidimensional definimos o coeficiente de correlación lineal de Pearson.

6. Correlación6. Correlación

Page 54: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

O coeficiente de correlación de Pearson defínese mediante a seguinte expresión:

sendo

Sxy a covarianza da variable bidimensional (X,Y)Sx a desviación típica de X

Sy a desviación típica de Y

yx

xy

SS

Sr

7. Correlación lineal. Coeficiente de Pearson7. Correlación lineal. Coeficiente de Pearson

Page 55: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

O coeficiente de correlación lineal de Pearson é un número, represéntase por r e cumpre:

Está comprendido entre -1 e 1.r = 1 corresponde á maior correlación positiva, neste caso entre as variables hai unha relación funcional.r = -1 corresponde á maior correlación negativa, neste caso entre as variables hai unha relación funcional.

7. Correlación lineal. Coeficiente de Pearson7. Correlación lineal. Coeficiente de Pearson

Page 56: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Se r é próximo a 1: o axuste é aceptablemente bo, distribuíndose as observacións (xi, yi) ao redor dunha recta crecente, a correlación entre as variables é positiva e forte.

Se r é próximo a -1: o axuste é aceptablemente bo, distribuíndose as observacións (xi, yi) ao redor dunha recta decrecente, a correlación entre as variables é negativa e forte.

Se r é próximo a 0: o axuste non é aceptable, indicando que non existe relación lineal entre as variables ou é débil.

7. Correlación lineal. Coeficiente de Pearson7. Correlación lineal. Coeficiente de Pearson

Page 57: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

EXEMPLO:Os seguintes coeficientes de correlación -0,73 ; 0,69 ; - 0,98 corresponden ás variables do primeiro exemplo: Á vista dos gráficos asígnalle a cada par de variables a súa correlación.

7. Correlación lineal. Coeficiente de Pearson7. Correlación lineal. Coeficiente de Pearson

Page 58: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Defínese a teoría de regresión entre dúas variables como unha parte da Estatística que trata de condensar a nube de puntos mediante unha función matemática coñecida para achar o valor dunha das variables coñecido o valor da outra.

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 59: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Entre todas as funcións matemáticas que se poidan axustar a unha nube de puntos, escolleremos a que mellor se adapte aos puntos e a que permita facer as predicións máis fiables.

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 60: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

As funcións máis utilizadas para facer regresións son:

RectaParábolaExponencial

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 61: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Neste tema, centrarémonos na Regresión Linear.

O noso problema será obter a ecuación da recta y=ax+b, que mellor se adapte á nube de puntos.

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 62: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

O método matemático que nos permite calcular esta recta é o Método dos Mínimos Cadrados e a recta así obtida chámase Recta de Regresión.Vexámolo graficamente

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 63: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Recta de regresión de y sobre x

Recta de regresión de x sobre y

Vexámolo graficamente:

xxS

Syy

X

XY 2

yyS

Sxx

y

XY 2

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 64: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Vexamos un exemplo:O ESTUDO, A TELE E O NÚMERO DE SUSPENSOS

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 65: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Un psicólogo escolar ten a sospeita de que os alumnos que estudan un número moi reducido de horas dedican, en cambio, moitas horas a ver a televisión e obteñen malas notas.

Quere probar se a súa sospeita é certa.

Organiza o traballo do seguinte xeito:

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 66: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

PASO 1:Decide que variables vai estudar. Neste caso son tres para cada alumno: Horas de estudo – Horas de tv. – Nº de suspensos, vai estudar a relación entre cada dúas:

Horas de estudo – Horas de tvHoras de estudo – Nº de suspensosHoras de tv – Nº de suspensos

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 67: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

PASO 2: Como non vai estudar a todos os alumnos da cidade (son demasiados) escolle ao azar 15, é o que se chama unha mostra.

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 68: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

PASO 3: Pásalles unha enquisa na que lles pregunta a cada un o nº de horas que dedican ao estudo e á tv, e o nº de suspensos.

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 69: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

PASO 4:Recolle os datos nunha táboaAlumno nº Nº horas de estudo N horas TV Nº de suspensos1 4 2 12 5 1.5 03 4 2.5 34 2.5 4 25 6 0.5 06 0.5 5.5 67 1 5 28 2 4 59 3 2.5 310 4.5 1.5 211 3 3.5 412 1.5 5 313 3.5 2.5 414 5.5 1 115 2.5 3.5 3

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 70: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

PASO 5:Representa en diagramas cartesianos os pares de variables seguintes:

Horas de estudo – Horas de tvHoras de estudo – Nº de suspensosHoras de tv – Nº de suspensos

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 71: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Horas de estudo – Horas de televisión

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 72: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

8.-Regresión linear. Rectas de regresión8.-Regresión linear. Rectas de regresión

Horas de estudo – Número de suspensos

Page 73: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

8.-Regresión linear. Rectas de regresión8.-Regresión linear. Rectas de regresión

Horas de televisión – Número de suspensos

Page 74: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Observa os diagramas e trata de contestar ás cuestións

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 75: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Existe relación entre as variables?Entre cales che parece que a correlación é máis forte? , e máis débil?Poderías distinguir, nos diagramas, entre a correlación positiva e a negativa?

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 76: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Podemos calcular, con certa aproximación, cantas horas dedicará ao estudo Xan, sabendo que dedica 3 a ver a televisión?E cantos suspensos terá?

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 77: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Podemos responder mellor a estas preguntas se axustamos unha recta aos puntos, debuxamos unha recta que se aproxime o mellor posible; é dicir, calculamos a

recta de regresión

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 78: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Podemos calcular, con certa aproximación, cantas horas dedicará ao estudo Xan, sabendo que dedica 3 a ver a televisión?E cantos suspensos terá?

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 79: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

EXEMPLO: Vimos a nube de puntos que representaba a distribución conxunta das variables: -Renda por habitante. -Número de vehículos turismo por cada 1000 habitantes de todos os concellos da Coruña. Existirá algún tipo de relación entre esas dúas variables?

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 80: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Existe unha certa correlación linear e positiva

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 81: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Para isto axúdanos a recta de regresión

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión

Page 82: 3.distribuciónsbidimensionais

IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

Podemos ver que serían, aproximadamente, 400 vehículos.

8. Regresión linear. Rectas de regresión8. Regresión linear. Rectas de regresión