Selección de variable

43
SELECCIÓN DE VARIABLES

Transcript of Selección de variable

SELECCIÓN DE VARIABLES

Uno de los problemas que afronta el analista, es de elegir que variables regresoras candidatas irán en el modelo.

Se generan dos objetivos contrapuestos:

1. Se desea que el modelo incluya tantos regresores como sea posible.

2. Se desea que el modelo incluya los menos regresores que sea posible.

El proceso de encontrar un modelo que sea un termino medio entre ambos objetivos se llama selección de la mejor ecuación de regresión.

 

CRITERIOS PARA EVALUAR MODELOS DE REGRESIÓN CON SUBCONJUNTOS DE VARIABLES

Coeficiente de determinación múltiple: 

  

Cuadrado medio de residuales: 

  

TÉCNICAS COMPUTACIONALES PARA SELECCIONAR VARIABLES

Todas las regresiones posibles: 

Coeficiente de determinación múltiple (

Todo el subconjunto de regresión para el que > es adecuado.

Matriz de correlación (W’W)

𝐶𝑀𝑒𝑟𝑟𝑜𝑟=𝑆𝑆𝑟𝑒𝑠

𝑛−𝑝

Cuadrado medio del error )

Estadística de Mallows

(x1,x4)

𝐶𝑝=𝑆𝐶𝑒𝑟𝑟𝑜𝑟

𝐶𝑀𝑒𝑟𝑟𝑜𝑟 (𝐹𝑀)−𝑛+2𝑝

- Ideal - Sobreexplicado - Infraexplicados

Estadística PRESS Press==

H=

Métodos de regresión por segmentos:

Pueden clasificarse en tres categorías principales:Selección hacia adelanteEliminación hacia atrásRegresión por segmentos

Selección hacia adelante: 

Selección hacia adelante: 

Salida Minitab 17

Eliminación hacia atrás: 

Eliminación hacia atrás: 

Ejemplo:Como se vio anteriormente, se tienen 4 regresores, por lo que la regresión se realizara con el modelo completo:

Se establece el

Regresión por segmentos:

 

Regresión por segmentos

Normalmente Fin =Fout, pero no es necesario.

Cuando se fija Fin>Fout, es mas fácil agregar que quitar una variable.

Función de correlaciones parciales

Ejemplo

La variable con mayor correlación x4.

Ejemplo

Ejemplo

Ejemplo

Ejemplo

Ejemplo