Qué puede aportar la econometría a mi estrategia de marketing online (parte 1)

17
15/01/2015 ¿Qué puede aportar la Econometría a mi Estrategia de Marketing Online? Parte 1 Álvaro Fierro - [email protected]

Transcript of Qué puede aportar la econometría a mi estrategia de marketing online (parte 1)

15/01/2015

¿Qué puede aportar la Econometría a mi Estrategia de Marketing Online?

Parte 1

Álvaro Fierro - [email protected]

ÍNDICE

2

Prólogo pág. 2

Introducción pág. 3

Usos de un modelo econométrico estimado pág. 8

Clasificación de variables pág. 9

Tema 1. El modelo de regresión lineal simple y general pág. 11

1. Prologo

3

Por un lado, este documento pretende ser una guía útil de iniciación a los «profanos» a la econometría, por lo que su objeto es explicar los conceptos básicos de la misma y cómo adaptarlos a casos concretos; conceptos que, si el lector lo demanda, se irán complejizando a lo largo del tiempo.

Por otro, se irán mostrando casos reales a los que nos hemos enfrentado desde la labor de consultoría. Una vez modelizados, veremos cómo su solución arroja más luz de la que se cree a preguntas, a priori, complejas.

Por ejemplo, ¿cuáles son los factores online que repercuten en las ventas de una empresa? En concreto, ¿en cuánto se monetiza la visibilidad? ¿Un aumento de una mención en Twitter incrementa las ventas? Si es así, ¿en cuánto?

Estas y otras preguntas se irán comprobando empíricamente mientras este documento se vaya ampliando. Por ahora, comencemos con la teoría…

1. Introdución

4

La econometría es la rama de la economía que se ocupa de medir desde el punto de vista empírico cualquier relación entre variables económicas. El econometra puede partir no de una teoría, sino del sentido común o de la intuición de que exista una relación entre un conjunto de variables. En la función de consumo keynesiana c= f(Y), se relacionan dos variables económicas, consumo y renta, y se postula que el consumo depende de la renta. Aquí, se puede contrastar si la relación entre C e Y es lineal, o estática, es decir, si el consumo depende de la renta en un momento determinado, pero también del consumo y renta pasadas.

1. Introdución

5

Para que la teoría económica pueda utilizarse en un estudio econométrico necesita de la elaboración matemática que de lugar a un modelo econométrico.

Las principales diferencias entre un modelo matemático y uno econométrico son:

1. La forma funcional ha de estar perfectamente definida. Por ejemplo, C=a+bY es una función lineal caracterizada por a y b, que son los parámetros de la misma. La idea es medir o estimar numéricamente a y b, dada una muestra de C e Y.

2. El carácter estocástico. Un modelo econométrico es estocástico porque aparecen en el mismo variables aleatorias. La excepción son las relaciones puramente deterministas como las identidades contables. En nuestro ejemplo, C= a+bY+e, donde e es la perturbación aleatoria, ya que no nos creemos que haya una relación exacta entre C e Y.

3. El tamaño. El modelo debe ser pequeño, escueto. Tiene que tener pocos parámetros que le caractericen.

1. Introdución

6

La interpretación de ξ es la influencia combinada sobre el C de variables distintas a la Y. Recogerá todos los

«fallos» del modelo (expectativas de los agentes, factores estacionales, tipos de interés…). Las hipótesis que

hagamos sobre estas variables aleatorias son fundamentales para decidir qué técnica econométrica usar.

1. Introdución

7

Una vez especificado el modelo, se trata de buscar los datos apropiados:

-Datos de series temporales: miden una variable en periodos de tiempo sucesivos (años, meses, días…): Ct=a+bYt+ξt

-Datos de sección cruzada: miden una variable en un momento determinado para distintas entidades, que pueden ser individuos, familias, empresas…: Ci= a+bYi+ξi

-Datos de panel: surgen al cruzar una sección cruzada con una serie temporal. Por ejemplo, estimaríamos el consumo de una familia a lo largo de una serie de años.

1. Introdución

8

Después de estimar el modelo, se valida y se comienza con un proceso iterativo en la modelización, ya que si no aceptamos un modelo, no lo usamos, sino que reformulamos el modelo teórico o tratamos de otra forma los datos.

2. Usos de un modelo econométrico estimado

9

3. Clasificación de variables

10

Variable endógena: es aquella explicada por otras variables. Se denota con y. Variable exógena: explican a la endógena pero no pueden estar influidas por ella. Puede haber k variables explicativas y son denotadas por x1, x2, xk… Variable continua: pueden tomar valores en todos los puntos de la recta real (C e Y). Variables discretas: sólo toman valores en algunos puntos de la recta real. Un ej. son las variables ficticias o dummies que toman el valor 1 o 0. L idea es que hay características que no se pueden medir (el sexo) y que pueden ser relevantes a la hora de explicar otra variable.

Tema 1 El modelo de regresión lineal simple y general

(MRLSG)

11

Tema 1 El modelo de regresión lineal simple y general (MRLSG)

12

El objetivo es especificar, estimar y contrastar relaciones entre variables económicas usando datos. Para ello, hay que hacer una serie de hipótesis: 1. Linealidad en los parámetros β1 y β2. Establece la linealidad en los parámetros en la relación

entre la variable endógena y las exógenas. 2. Especificación correcta: el incumplimiento de esta hipótesis se da en muchos casos. 3. Grados de libertad positivos: Los grados de libertad de un modelo se definen como la diferencia entre el nº de datos (n) y el nº de variables explicativas (k) gl= n-k≥0. Esta hipótesis supone que, como mínimo, es necesario disponer de más datos que parámetros a estimar. Para que la estimación sea estable, es mejor tener una nube de datos y pocos parámetros a estimar.

Tema 1 El modelo de regresión lineal simple y general (MRLSG)

13

4. Parámetros constantes: Esta hipótesis supone que los parámetros β1, β2, …, βk son

constantes en el tiempo. Si el periodo muestral con el que se trabaja es muy amplio y heterogéneo (crisis, etc.), es más difícil mantener esta hipótesis que si la muestra es homogénea. 5. Independencia lineal entre las variables explicativas: Esta hipótesis implica que cada variable explicativa contiene información adicional sobre la endógena que no está contenida en otras. Si hubiera información repetida, habría variables explicativas dependientes linealmente de otras. El hecho de que cada columna sea linealmente independiente de las otras implica que el rango de la matriz X es completo, es decir, igual a k (nº de parámetros). Si alguna variable x es linealmente dependiente de otra, existe un problema de multicolinealidad exacta.

Tema 1 El modelo de regresión lineal simple y general (MRLSG)

14

6. Regresores no estocásticos. Esta hipótesis implica que los datos de las variables explicativas son fijos en muestras repetidas. Es decir, el valor de las variables explicativas es constante en la función de distribución endógena. Existen tres situaciones en econometría donde no es posible mantener esta hipótesis:

a. Modelos de ecuaciones simultáneas: por ejemplo, en un modelo de oferta y demanda sucede cuando el precio es una variable exógena en la ecuación de la demanda y es endógena en la de oferta

b. Modelos dinámicos: son en los que aparecen como regresores sucesivos retardos de la variable endógena.

c. Modelos con errores de medida: en las variables explicativas.

Tema 1 El modelo de regresión lineal simple y general (MRLSG)

15

7. Perturbaciones aleatorias del modelo ξt

7.1 Esperanza (media)= 0 en todo el periodo de tiempo. Ε(ξt)= 0.

7.2 Varianza constante (homocedasticidad). Var (ξt)= E(ξt2). Si la variabilidad (o dispersión alrededor de la

media) de las perturbaciones cambia con el tiempo, hablamos de heterocedasticidad. Es muy frecuente la heterocedasticidad en modelos donde se usan datos de sección cruzada. Es fácil comprender que el consumo no es el mismo entre aquellas familias que tienen un nivel de renta alto, por lo que a mayor renta, mayor varianza en el consumo y mayor varianza en el error. 7.3 Ausencia de autocorrelación en todo instante de tiempo. Implica que la cov(ξt, ξs)=E(ξt, ξs)=0. Si hay

autocorrelación, el error en un momento del tiempo ayudaría a predecir el error en un momento posterior y los errores tendrían inercia. Si no hay autocorrelación, la historia pasada no ayuda a predecir el comportamiento futuro, y los errores son aleatorios e imprevisibles. Es muy frecuente esta hipótesis en datos de series temporales.

Tema 1 El modelo de regresión lineal simple y general (MRLSG)

16

Si suponemos un modelo lineal entre dos variables, dada una nube de puntos, una estimación del modelo viene dada por una rectan llamada recta de ajuste. Si dado un valor de la variable Yt, el modelo predice un valor de consumo tal que Ĉt<Ct, el modelo infraestima el verdadero valor del consumo en ese año, y comete un error.

Este error es medible y se llama residuo. El residuo puede ser nulo, negativo o positivo. El objetivo es conseguir una estimación de los parámetros de manera que cumpla algún criterio de optimalidad, como por ejemplo, minimizar la suma de los residuos cometidos en toda la muestra, en valor absoluto y elevarlo al cuadrado. Es lo que se conoce como Mínimos Cuadrados Ordinarios (M.C.O).

GRUPO URBEGI

Pol. Ind. El Páramo B7 - 48800 Balmaseda (España) +34 94 680 19 34

[email protected] 17

Delegación ESPAÑA

Ugasko Bidea 1 – 48014 Bilbao (España) +34 94 680 19 34 Ext. 5 [email protected]

Delegación COLOMBIA

Complejo Ruta N calle 67 N° 52-20, Oficina 4012, Barrio Sevilla de Medellín, Antioquia (Colombia) +57 316 765 5877 [email protected]

Delegación MÉXICO

Ejercito República Nº 121, 3. piso, oficina 323, Corporativo Empresarial Carretas – 76050, Santiago de Querétaro, Querétaro (México) [email protected]