CENTRO DE INVESTIGACIÓN EN MATEMÁTICAS, A.C.
Desagregación trimestral del PIB anual de
Turismo
1993 - 2011
Guanajuato, Gto. Diciembre de 2010
T E S I S
Que para obtener el grado de
Maestra en Ciencias en Estadística Oficial
P R E S E N T A
JOSEFINA CALVA MÁRQUEZ
DIRECTORES DE TESIS:
DR. ROGELIO RAMOS QUIROGA
C. DR. JOSÉ RAMÓN DOMÍNGUEZ MOLINA
Guanajuato, Gto. Febrero de 2016
CENTRO DE INVESTIGACIÓN EN MATEMÁTICAS, A.C.
Desagregación trimestral del PIB anual
de Turismo
1993 - 2011
T E S I S
Que para obtener el grado de
Maestra en Ciencias en Estadística Oficial
P R E S E N T A
JOSEFINA CALVA MÁRQUEZ
DIRECTORES DE TESIS:
DR. ROGELIO RAMOS QUIROGA
C. DR. JOSÉ RAMÓN DOMÍNGUEZ MOLINA
Guanajuato, Gto. Febrero de 2016
A mis hijos
Carlos David Martínez Calva y Daniel Alejandro Martínez Calva, quienes
fueron parte fundamental para estudiar la Maestría y concluir con la Tesis.
Por esperarme en las noches de regreso a casa y por acompañarme a clases.
Por su amor, aliento, comprensión y apoyo. Por la enseñanza de vida, por
todo lo que he aprendido de ellos y sigo aprendiendo, a lo largo de los años.
Por ser un regalo de Dios.
Agradecimientos
A mis maestros que compartieron su conocimiento y me apoyaron en mi estudio, en
particular al M. en C. José Ramón Domínguez Molina por su tiempo y dedicación
en la dirección de este trabajo, al igual que a su esposa, por acompañarlo en sus
viajes hacia la Cd. de Aguascalientes.
Al Dr. Rogelio Ramos Quiroga y a la Dra. Graciela González Farías por su apoyo
y aliento para concluir con la Tesis.
Al Director de Cuentas Satélite, Lic. Raúl Figueroa Díaz y al Subdirector de
Cuentas de Turismo, Lic. Víctor Jesús Pérez Pérez, por su tiempo y apoyo en la
realización de este trabajo.
Al Dr. Nelson Omar Muriel Torrero y al Dr. Netzahualcóyotl Castañeda Leyva
por ser sinodales en mi examen de tesis y por su valioso tiempo en la revisión de
este trabajo.
A las autoridades del INEGI, quienes hicieron posible que pudiera estudiar la
Maestría en Ciencias en Estadística Oficial. En particular a los Maestros que
contribuyeron a que me titulara: a la M. en C. Virginia Abrín Batule, al Mtro. José
Vences Rivera y al Mtro. José Paul Carrasco Escobar.
Contenido
Introducción
1. Métodos de Desagregación Temporal 1
1.1 Importancia . . . . . . . . . . . . . . . . . 1
1.2 Clasificación . . . . . . . . . . . . . . . . . 1
2. Producto Interno Bruto y Consumo Turístico 3
2.1 Marco Conceptual . . . . . . . . . . . . . . . 3
2.2 Captación . . . . . . . . . . . . . . . . . . 4
2.3 Presentación de la Información . . . . . . . . . 4
3. Metodología 6
3.1 Introducción . . . . . . . . . . . . . . . . . 6
3.2 Modelo Estadístico . . . . . . . . . . . . . . . 6
4. Desagregación del Producto Interno Bruto (PIB)
Turístico 12
4.1 Introducción . . . . . . . . . . . . . . . . . 12
4.2 Desagregación Trimestral del PIB Turístico . . . . 12
Conclusiones 27
Anexo: Programa en R 28
Apéndice 39
Bibliografía
Introducción
El objetivo de este trabajo consiste en desagregar la serie anual del Producto Interno
Bruto (PIB) de Turismo en una serie trimestral, aplicando un modelo que permita
contar con datos trimestrales del PIB de Turismo, con el fin de apoyar la toma de
decisiones en materia de política económica. El periodo de estudio para este trabajo
es de 1993 a 2011, considerando valores constantes del PIB Turístico, año base
2003.
El Sector Turismo es importante en la economía de México ya que participa en tercer
lugar en el PIB Nacional, además de que incide en diversas actividades económicas.
En particular, la participación promedio anual del PIB Turístico en el PIB Nacional,
fue del 8.0%, del 2005 al 2009; y de acuerdo a las cifras preliminares del 2014, el
porcentaje de participación del Producto Interno Bruto Turístico en el total nacional,
fue de 8.6%. Además, la actividad turística es considerada como sector estratégico
del Programa Nacional de Infraestructura 2014 – 2018 (PNI). Asimismo, debido a la
importancia de la actividad turística en la economía, organismos internacionales
como la OMT y la CEPAL, han apoyado para fortalecer sistemas estadísticos sobre
turismo.
Con el fin de llevar a cabo el objetivo de este trabajo, se revisó bibliografía con
respecto a varios modelos de desagregación y se decidió utilizar el modelo de
Guerrero (1990) - Wei y Stram (1990), ya que el modelo se caracteriza porque usa
variables correlacionadas para obtener una serie preliminar e incluye la estructura
de autocorrelación deducida de datos observados.
En el primer Capítulo se expone a grosso modo la clasificación de los métodos de
desagregación, con el fin de contextualizar el método utilizado.
El segundo Capítulo presenta el Marco Conceptual y su forma de captación y
presentación dentro del Sistema de Cuentas Nacionales, de las variables: Producto
Interno Bruto (serie de mayor frecuencia: anual) y Consumo Turístico (serie de
menor frecuencia: trimestral), las cuales se utilizan en el desarrollo de este trabajo.
En el tercer Capítulo se presenta el desarrollo del modelo de Guerrero – Wei y
Stram; y por último, en el cuarto Capítulo se expone la aplicación del modelo para
obtener los valores trimestrales del Producto Interno Bruto Turístico, a partir de la
serie anual del mismo y utilizando como variable relacionada al Consumo Turístico.
1
INEGI - CIMAT
Capítulo 1
Métodos de Desagregación
Temporal
1.1 Importancia
La importancia de los Métodos de Desagregación Temporal estriba en que las series
de mayor frecuencia que se generan a través de estos métodos aportan información
oportuna que se requiere sobre todo para la toma de decisiones. De aquí que se
hayan desarrollado diferentes métodos que permiten desagregar series de menor
frecuencia (por ejemplo anual) en series de mayor frecuencia (por ejemplo
trimestral).
1.2 Clasificación
De acuerdo al tipo de información y a las técnicas que se apliquen para desagregar,
los métodos se clasifican en los que utilizan indicadores y los que no.
Entre los métodos que no utilizan indicadores se encuentra el de Lisman y Sadee
(1964), este método supone que los datos desagregados trimestrales están en
función de los valores anuales de ese año, del anterior y del posterior; como
consecuencia, los datos desagregados del primero y último año, no se pueden
obtener. Otro método de esta misma categoría es el planteado por Boot, Feibes y
Lisman (1967), su método incorpora un criterio de minimización de una función
cuadrática sujeto a la restricción de que la suma de los trimestres de un año es igual
al valor anual.
Los métodos que utilizan indicadores a su vez se dividen en métodos de ajuste y
métodos basados en modelos. La principal diferencia entre estos dos grupos de
métodos es que con los métodos basados en modelos es posible utilizar diferentes
estadísticas de diagnóstico del ajuste y selección de modelos, así como obtener
pronósticos con sus intervalos de confianza.
2
INEGI - CIMAT
Los principales exponentes de los métodos de ajuste son el método de Denton
(1971), su variante denominada Denton Proporcional (Bloem, 2001), y el método de
Fernández (1981).
El método de Denton mantiene el comportamiento de las series ajustadas de forma
proporcional con respecto a las series de indicadores trimestrales. Utiliza la técnica
de mínimos cuadrados para minimizar la diferencia de ajuste relativo entre los
trimestres vecinos sujeta a las limitaciones impuestas por los datos de los totales
anuales. Denton expone su método para ser utilizado con un indicador, no obstante
puede aplicarse prescindiendo de éste. El método de Denton presenta las siguientes
limitantes: primero, que el indicador ha de estar expresado en las mismas unidades
que la variable agregada, objeto de la trimestralización, y que el número de
indicadores debe ser uno. Por esta razón, Fernández (1981) propone un método de
trimestralización que unifica el tratamiento para hacer compatible la variable
indicadora con la variable agregada y el procedimiento de desagregación temporal
de Denton.
Entre los métodos basados en modelos se encuentran el de Gregory C. Chow y An-
loh Lin (1971); Litterman R. B. (1983); y Víctor Guerrero (1990) – William W. S. Wei
y Daniel O. Stram (1990).
El método de Chow y Lin es muy general y contiene como casos particulares a otros
métodos tales como el de Litterman o el de Fernández, además de ser utilizado en
la mayoría de las oficinas estadísticas.
El método de Litterman ha sido desarrollado especialmente para la obtención de
datos mensuales y propone una modificación del método de Chow y Lin orientada
a flexibilizar la especificación de la perturbación del modelo mensual.
Por último, dentro de este conjunto de métodos basados en modelos, se encuentra
clasificado el Método de Guerrero – Wei y Stram, el cual se utiliza para el desarrollo
del presente trabajo y se explica ampliamente en el Capítulo 3.
3
INEGI - CIMAT
Capítulo 2
Producto Interno Bruto y Consumo
Turístico
2.1 Marco Conceptual
Las series de tiempo de las variables: Producto Interno Bruto y Consumo Turísticos,
que se utilizan en este trabajo, se presentan en la Cuenta Satélite del Turismo de
México, esta cuenta tiene como marco de referencia el Sistema de Cuentas
Nacionales de México (SCN). En general, las Cuentas Satélites están orientadas al
estudio particular de ciertas actividades económicas con el fin de analizar con mayor
detalle la contabilidad nacional. Las Cuentas Satélites suministran información
adicional de carácter funcional o de interrelaciones sectoriales, amplían el marco de
la contabilidad nacional y la cobertura de los costos y beneficios de las actividades
humanas, facilitan el análisis de los datos mediante indicadores y agregados
especiales, y vinculan el análisis de registros físicos con el sistema contable.
En particular, la actividad turística está relacionada con los bienes y servicios que
demandan los turistas; las empresas o establecimientos que los generan y
suministran; y las unidades institucionales localizadas en zonas turísticas. Por lo
tanto, para cuantificar el turismo es necesario contar con datos sobre la demanda
de bienes y servicios, lo que implícitamente lleva a identificar la oferta de las
actividades que directa o indirectamente están relacionadas con esta demanda. Es
decir, la demanda se refiere al consumo de los visitantes y la oferta a las actividades
que generan los bienes y servicios que requieren los visitantes.
El análisis de la actividad turística se puede realizar a través de dos enfoques: por
el lado de la oferta y por el lado de la demanda. La variable Consumo Turístico se
relaciona con la demanda y comprende las erogaciones realizadas de manera
directa por los visitantes, esta variable incluye el valor monetario del gasto en
consumo final de los visitantes; el monto que las unidades económicas destinan
para el desempeño de las actividades de sus empleados fuera de su entorno laboral,
como: viáticos, pasajes, etc.; así como todos los bienes y servicios que el visitante
adquiere antes, durante y después del viaje y que están relacionados con ese
propósito.
4
INEGI - CIMAT
Por el lado de la oferta, el análisis de la actividad turística se centra en las unidades
económicas que producen bienes y servicios para satisfacer los requerimientos de
los visitantes. La importancia de las unidades económicas se mide a través del Valor
Agregado Bruto que generan durante el proceso productivo, éste se refiere al valor
de la producción libre de duplicaciones, ya que excluye la utilización de los bienes
y servicios necesarios para llevar a cabo ése proceso productivo.
2.2 Captación
Para la elaboración de la Cuenta Satélite de Turismo se aplican los mismos
principios y reglas contables que utiliza el Sistema de Cuentas Nacionales (SCN)
2003, tales como el momento del registro, los principios de valuación y los precios.
Los cuadros y cuentas que se establecen para registrar las transacciones turísticas
que realizan las unidades institucionales que dan lugar a flujos económicos como
salarios, impuestos, etc., guardan correspondencia con el SCN y permiten la
cuantificación de sus flujos monetarios de manera homogénea y ordenada
2.3 Presentación de la información
La información de las series del Producto Interno Bruto (PIB) y Consumo Turístico
abarca el periodo 1993 – 2011, sin embargo, existe una ruptura en este periodo
debido a que los datos de 1993 a 2004 se encuentran expresados a precios de
1993, y los datos de 2003 a 2011 se encuentran expresados a precios de 2003, esto
debido al cambio de año base en el Sistema de Cuentas Nacionales (SCN). No
obstante, aplicando hacia atrás las variaciones anuales de los datos expresados a
precios de 1993, a los datos de 2003 expresados a precios de 2003, se obtuvieron
las series del PIB y Consumo Turísticos a precios de 2003 para todo el periodo
comprendido desde 1993 hasta 2011. Es importante señalar que el considerar los
precios constantes1 a una base, permite eliminar de las series el efecto de la
inflación.
1 Ver definición de precios constantes y precios corrientes o nominales, en la siguiente dirección en Internet: https://argumentoseconomicos.com/2014/02/28/los-precios-corrientes-constantes-y-en-paridad-de-poder-de-compra/
5
INEGI - CIMAT
La temporalidad de estas variables había sido anual, sin embargo, el Instituto
Nacional de Estadística y Geografía (INEGI) presenta como parte de los productos
del Sistema de Cuentas Nacionales de México, los Indicadores Trimestrales de la
Actividad Turística (ITAT), con una cobertura temporal que abarca, a la fecha de
concluir la Tesis, del primer trimestre de 2003 al cuarto trimestre de 2011. Esta
desagregación trimestral se realizó utilizando la metodología de Denton, la cual se
especifica en el siguiente Capítulo.
No obstante, a la fecha, el INEGI publica, la serie histórica del Indicador Trimestral
del PIB Turístico, del primer trimestre de 2003 al segundo trimestre de 2015, base
2008 = 100, utilizando la metodología de Klein, y para ajustar valores al pasar de un
trimestre a otro, utiliza el método proporcional de Denton.
6
INEGI - CIMAT
Capítulo 3
Metodología
3.1 Introducción
Como ya vimos en el Capítulo 1, las metodologías más utilizadas son las que
proponen Chow y Lin (1971) y Denton (1971), debido a que toman en cuentan la
información que proviene de variables relacionadas con la serie de menor
frecuencia y las restricciones temporales de la misma, no obstante, el inconveniente
de utilizar estas metodologías es que consideran de forma subjetiva a la estructura
de autocorrelación de las series de tiempo.
Por esta razón, se propone el Modelo de Guerrero (1990) - Wei y Stram (1990) el
cual se enfoca principalmente en el uso apropiado de una estructura correlacionada
con la serie que se desea estimar. En la siguiente sección se presenta dicho Modelo
Estadístico.
3.2 Modelo Estadístico
El planteamiento del Modelo Estadístico es el siguiente: sea {𝑍𝑡}, con 𝑡 = 1, . . . . , 𝑚𝑛,
la serie desagregada que se desea estimar, donde 𝑛 ≥ 1, se refiere al número de
períodos enteros (por ejemplo trimestres) y 𝑚 ≥ 2 la frecuencia entre periodos (por
ejemplo meses). Se parte del supuesto que {𝑊𝑡} es una serie no estacionaria de
estimadores preliminares de los datos no observados. Entonces, dada {𝑊𝑡}, el
Modelo Estadístico propuesto por Guerrero es:
𝑍𝑡 = 𝑊𝑡 + 𝑆𝑡 , (3.1)
con {𝑆𝑡} un proceso estacionario no observado de media cero,
donde 𝑊𝑡 se puede expresar de la forma
𝑊𝑡 = 𝛽1𝑋1𝑡+ . . . . +𝛽𝐺𝑋𝐺𝑡 para 𝑡 = 1, . . . . . . , 𝑚𝑛 , (3.2)
7
INEGI - CIMAT
con 𝑋1, . . . . . . , 𝑋𝐺 variables relacionadas con 𝑍, y donde 𝐺 ≥ 1. Estas variables se
escogen porque sus movimientos intra-periodo están correlacionados con los de
{𝑍𝑡}, los coeficientes 𝛽1, . . . . , 𝛽𝐺 se estiman de los datos. De aquí, se propone el
siguiente modelo de regresión lineal múltiple
𝑍𝑡 = 𝛽1𝑋1𝑡+ . . . . . +𝛽𝐺𝑋𝐺𝑡 + 𝜀𝑡, para 𝑡 = 1, . . . . . , 𝑚𝑛 , (3.3)
del cual se obtiene el siguiente modelo para la variable agregada, en donde el
superíndice 𝑎 se refiere a las series anuales
𝑌𝑖 = 𝛽1𝑋1𝑖𝑎 + . . . . . . +𝛽𝐺𝑋𝐺𝑖
𝑎 + 𝜀𝑖𝑎, para 𝑖 = 1, . . . . . , 𝑛 , (3.4)
donde 𝑋1𝑎, . . . . . . , 𝑋𝐺
𝑎 y 𝜀𝑎 están relacionadas con 𝑋1, . . . . . . , 𝑋𝐺 y 𝜀, de la misma forma
en la que 𝑌, está relacionada con 𝑍. Por lo tanto se tiene
𝑋𝑔𝑖𝑎 = ∑ 𝑐𝑗
𝑚𝑗=1 𝑋𝑔,𝑚(𝑖−1)+𝑗, para 𝑔 = 1, . . . . . , 𝐺 , (3.5)
y lo mismo sucede con 𝜀𝑖𝑎 como función de 𝜀𝑡. Los parámetros 𝛽 pueden ser
estimados de (3.4) por mínimos cuadrados ordinarios y los coeficientes de
estimación pueden ser reemplazados en (3.2) para estimar las series preliminares.
Un criterio para escoger una variable 𝑋𝑔, puede ser el siguiente:
(i) que ésta admita una adecuada interpretación económica en su relación
con 𝑍;
(ii) que satisfaga el supuesto de Friedman (1962) de alta correlación
intraperiodo con 𝑍;
(iii) que la longitud de la serie {𝑋𝑔𝑡} sea lo suficientemente grande para cubrir
los datos de 𝑡 = 1, . . . . . , 𝑚𝑛 y que sea observada también para 𝑡 ≥ 𝑚𝑛;
(iv) que sea observada oportunamente, para que la desagregación recursiva
tenga sentido; y
(v) que el método de medición no cambie con el tiempo. Además, la serie
preliminar debe reflejar todos los efectos que se espera tenga la serie
verdadera {𝑍𝑡}, incluyendo aquellos asociados con los rompimientos
estructurales y outliers.
El modelo de Guerrero se basa en los siguientes supuestos:
8
INEGI - CIMAT
Supuesto 1.
La estructura dinámica de {𝑆𝑡}, se capta a través de un Modelo Autorregresivo y de
Promedio Móviles (ARMA):
𝜙𝑆(𝐵)𝑆𝑡 = 𝜃𝑆(𝐵)𝑒𝑡 , (3.6)
donde
𝜙𝑆(𝐵) = 1 − 𝜙𝑆,1𝐵− . . . . . −𝜙𝑆,𝑝𝐵𝑝 y 𝜃𝑆(𝐵) = 1 + 𝜃𝑆,1𝐵+ . . . . . +𝜃𝑆,𝑞𝐵𝑞 son polinomios
con el operador regresor 𝐵 tal que 𝐵𝑋𝑡 = 𝑋𝑡−1 para cada variable 𝑋 y cada índice
𝑡. Se asume que los polinomios son primos, con las raíces de 𝜙𝑆(𝑥) = 0 y 𝜃𝑆(𝑥) =
0 fuera del círculo unitario, de tal forma que les corresponde un proceso invertible y
estacionario. Al mismo tiempo, {𝑒𝑡} es un proceso de Ruido Blanco Gaussiano de
media cero y varianza 𝜎𝑒2.
Supuesto 2.
Un Modelo Autorregresivo Integrado y de Promedio Móviles (ARIMA), puede
representar a las series {𝑊𝑡}, de la siguiente forma:
𝜙𝑊(𝐵)𝑑(𝐵)𝑊𝑡 = 𝜃𝑊(𝐵)𝑎𝑡 , (3.7)
donde 𝑑(𝐵) es un operador de diferencias que convierte estacionaria a la serie
{𝑑(𝐵)𝑊𝑡}, por lo tanto 𝜙𝑊(𝐵) y 𝜃𝑊(𝐵) son polinomios autorregresivos (AR) y de
promedios móviles (MA), respectivamente, cuyas raíces están fuera del círculo
unitario. El proceso {𝑎𝑡} es un Ruido Blanco Gaussiano con varianza 𝜎𝑎2 y no está
correlacionado con {𝑒𝑡}.
El Modelo (3.6), que capta la estructura dinámica de {𝑆𝑡}, también se puede
expresar de la siguiente forma:
𝑆𝑡 = 𝜓𝑠(𝐵)𝑒𝑡 , (3.8)
donde 𝜓𝑆(𝐵) = 1 + 𝜓𝑆,1𝐵 + 𝜓𝑆,2𝐵2 + . . . . . . . , 𝜓𝑆,𝑞𝐵𝑞 es el polinomio MA que se
obtiene equiparando los coeficientes de las potencias de 𝐵, de la expresión
𝜓𝑆(𝐵)𝜙𝑆(𝐵) = 𝜃𝑆(𝐵). La ecuación (3.8) se puede expresar en forma matricial como:
𝑆 = Ψ𝑆𝑒 , (3.9)
9
INEGI - CIMAT
donde 𝑆 = (𝑆1, . . . . . . , 𝑆𝑚𝑛)′ y 𝑒 = (𝑒1,, . . . . . . , 𝑒𝑚𝑛)′ son vectores transpuestos y Ψ𝑆 es
una matriz triangular inferior con unos sobre su diagonal principal, 𝜓𝑆,1 sobre su
primera subdiagonal, 𝜓𝑆,2 sobre su segunda subdiagonal, y así sucesivamente. Para
que (3.9) sea completamente equivalente a (3.8) se requiere que 𝑒𝑡 = 0, para 𝑡 ≤
0.
Además, la serie agregada {𝑌1, . . . . . . , 𝑌𝑛} puede ser escrita como
𝑌𝑖 = ∑ 𝑐𝑗 𝑍𝑚(𝑖−1)+𝑗𝑚𝑗=1 , con 𝑖 = 1, . . . . . , 𝑛 , (3.10)
donde las 𝑐𝑗′𝑠 son constantes conocidas definidas por el tipo de agregación de la
serie 𝑌𝑖 , como se muestra en la siguiente tabla:
Tipo de agregación de la Serie 𝑌𝑖 Forma del vector c’
Valores de flujo 𝒄′ = (𝑐1, . . . . . , 𝑐𝑚) = (1, . . . . . , 1)
Índices o flujos anualizados 𝑐′ = (1𝑚⁄ , . . . . . . , 1
𝑚⁄ )
Stocks 𝒄′ = (0, 0, . . . . . ,1) o
𝒄′ = (1, 0, . . . . . ,0)
Generalizando la expresión (3.10), se define la matriz 𝐶 = 𝐼 ⨂ 𝑐′ con ⊗ el producto
Kronecker, 𝒀 = (𝑌1, . . . . . . , 𝑌𝑛)′ y 𝑍 = (𝑍1, . . . . . . , 𝑍𝑚𝑛)′, obteniendo la siguiente
ecuación:
𝒀 = 𝐶𝒁 (3.11)
Sea 𝑊 = (𝑊1, . . . . . . , 𝑊𝑚𝑛)′, donde 𝐸(𝒁|𝑾) = 𝑾, de manera que 𝑾 es el estimador
lineal de mínimos cuadrados del error (ELMCE) de 𝒁 basado en 𝑾. Por otro lado
tenemos que (3.9) implica que ∑ = 𝜎𝑒2
𝑆 Ψ𝑆Ψ𝑆′, con base en estas expresiones, se
procede a obtener la solución teórica al problema de desagregación directa.
Considerando que el estimador lineal de mínimos cuadrados del error (ELMCE) de
𝒁, dados 𝑾 y 𝒀, está dado por
�� = 𝑾 + ��(𝒀 − 𝐶𝑾) , (3.12)
10
INEGI - CIMAT
y que la matriz de mínimos cuadrados del error (MCE), se puede expresar como
MCE(��) = 𝜎𝑒2(𝐼𝑚𝑛 − ��𝐶)Ψ𝑆Ψ𝑆
′ , (3.13)
donde
�� = Ψ𝑆Ψ𝑆′𝐶′(𝐶Ψ𝑆Ψ𝑆
′𝐶′)−1 , (3.14)
entonces, la expresión (3.12) quedaría de la siguiente forma:
�� = 𝑾 + Ψ𝑆Ψ𝑆′𝐶′(𝐶Ψ𝑆Ψ𝑆
′𝐶′)−1(𝒀 − 𝐶𝑾) (3.15)
Un estimador de Ψ𝑆 se puede obtener de un modelo de estimación para las
diferencias agregadas
𝑫 = 𝐶𝑺 = 𝐶𝒁 − 𝐶𝑾 = 𝒀 − 𝐶𝑾 (3.16)
Además, se asume que {𝐷𝑖} admite el modelo ARMA
𝜙𝐷(𝐿)𝐷𝑖 = 𝜃𝐷(𝐿)𝜀𝑖 para 1,....,i n , (3.17)
con 𝜙𝐷(𝐿) = 1 − 𝜙𝐷1𝐿− . . . . . −𝜙𝐷𝑃𝐿𝑃 y 𝜃𝐷(𝐿) = 1 − 𝜃𝐷1𝐿− . . . . . −𝜃𝐷𝑄𝐿𝑄 polinomios
en el operador de regresión {𝑆𝑡} que actúa sobre la variable agregada. En (3.17) se
usa un modelo ARMA porque la agregación temporal de un proceso ARMA, en este
caso el proceso {𝑌𝑖}, produce otro proceso ARMA. Los datos de {𝐷𝑖} se obtienen
de {𝑌𝑖} y {𝑊𝑡}, de tal forma que el modelo (3.17) puede construirse aplicando
técnicas de series de tiempo estándar.
En la aplicación del método de desagregación de Wei y Stram (1990), modelo
(3.17), se presentan dos casos: El primero se refiere a si la serie agregada es no
estacional y no tiene una periodicidad de orden m , entonces, su modelo ARMA
(P,Q) puede ser desagregado en un modelo ARMA (p,q). El modelo (3.17) es tal
que p=P, q=p+1 y sus parámetros pueden ser obtenidos de los P+Q originales.
Además, cuando se calculan los parámetros estimados MA, se obtiene también un
estimador de 𝜎𝑒2. El segundo caso es cuando la serie agregada {𝐷𝑖} sigue un modelo
estacional ARMA, la longitud de la estacionalidad está dada por 𝐸/𝑚 y los
polinomios estacionales AR y MA son Φ𝐷(𝐿𝐸/𝑚) = 1 − Φ1𝐿𝐸/𝑚− . . . . . −Φ𝑃𝐿𝑃𝐸/𝑚 y
Θ𝐷(𝐿𝐸/𝑚) = 1 + Θ1𝐿𝐸/𝑚+ . . . . . +Φ𝑄𝐿𝑄𝐸/𝑚. Wei y Stram proponen el siguiente
procedimiento, para obtener un modelo para la serie desagregada.
11
INEGI - CIMAT
Primero, se escogen los polinomios estacionales AR y MA:
Φ𝑆(𝐵𝐸) = 1 − Φ1𝐵𝐸− . . . . . −Φ𝑃𝐵𝑃𝐸 y Θ𝑆(𝐵𝐸) = 1 + Θ1𝐵𝐸+ . . . . . +Φ𝑄𝐵𝑄𝐸 , (3.18)
con los mismos parámetros de la serie agregada.
Segundo, las series agregada y desagregada se desestacionalizan por medio de
los filtros
𝐹𝐷𝑖 = Φ𝐷(𝐿𝐸/𝑚)Θ𝐷(𝐿𝐸/𝑚)𝐷𝑖 y 𝐹𝑆𝑡 = Φ𝑆(𝐵𝐸)Θ𝑆(𝐵𝐸)−1𝑆𝑡 (3.19)
Y se aplica el procedimiento para las series no estacionales, para obtener el modelo
𝜙𝑆(𝐵)𝐹𝑆𝑡 = 𝜃𝑆(𝐵)𝑒𝑡 (3.20)
El modelo completo para la serie desagregada de diferencias, queda de la siguiente
forma:
𝜙𝑆(𝐵)Φ𝑆(𝐵𝐸)𝑆𝑡 = Θ𝑆(𝐵𝐸)𝜃𝑆(𝐵)𝑒𝑡 (3.21)
La matriz de mínimos cuadrados del error MCE( Z ), indicada en (3.13), producirá
diferentes varianzas para los valores desagregados {��𝑡} porque los elementos en la
diagonal de Ψ𝑆Ψ𝑆′ son diferentes, debido en parte por las condiciones iniciales 𝑒𝑡 =
0 para 𝑡 ≤ 0. Para corregir esta situación no estacionaria se reemplazan los
elementos de la diagonal por la varianza teórica del modelo. Por ejemplo, si el
modelo es (1 − Φ𝐵𝐸)𝑆𝑡 = (1 + 𝜃1𝐵+ . . . . . +𝜃𝑞𝐵𝑞)𝑒𝑡, con 0 ≤ 𝑞 ≤ 𝐸, entonces su
varianza está dada por 𝑉𝑎𝑟(𝑆𝑡) = (1 + 𝜃12+ . . . . . +𝜃𝑞
2)𝜎𝑒2/(1 − Φ2).
12
INEGI - CIMAT
Capítulo 4
Desagregación del Producto
Interno Bruto (PIB) Turístico
4.1 Introducción
El siguiente capítulo muestra los resultados de aplicar el método de Guerrero (1990)
- Wei y Stram (1990) para desagregar trimestralmente a la variable anual del
Producto Interno Bruto (PIB) Turístico, base 2003. El periodo a considerar en este
trabajo, fue de 1993 a 2011. Primero, se calcularon los valores desagregados para
el periodo 1993 a 2011 y posteriormente se calcularon los valores predichos para
2012.
La variable que se utilizó para realizar las estimaciones preliminares es el Consumo
Turístico Interior (CTI), debido a que esta variable está altamente correlacionada
con el comportamiento intraperiodo del PIB. La ventaja de considerar al CTI es que
se puede obtener trimestralmente y nos va a permitir aplicar el método de Guerrero
- Wei y Stram.
Debido a que la serie de Consumo Turístico Interior se encuentra expresada a
precios constantes de 1993, para el periodo de 1993 a 2003; y para el periodo de
2003 a 2011 se encuentra expresada a precios constantes de 2003, fue necesario
rebasificar la serie, con el fin de contar con una serie larga, desde 1993 a 2011,
expresada a precios de 2003.
4.2 Desagregación trimestral del PIB Turístico
Al momento de concluir este trabajo de Tesis, el Instituto Nacional de Estadística y
Geografía (INEGI), presentaba como parte de los productos del Sistema de Cuentas
Nacionales de México, los Indicadores Trimestrales de la Actividad Turística (ITAT),
con una cobertura temporal que abarcaba, del primer trimestre de 2003 al cuarto
trimestre de 2011, considerando como año base 2003.
13
INEGI - CIMAT
Esta desagregación trimestral la realizó el área de Cuentas Satélite en el 2011, para
entonces, utilizando la metodología de Denton.
La metodología de Denton consiste en desagregar en trimestres los datos anuales
de la Cuenta Satélite de Turismo (2003 – 2009), utilizando los datos trimestrales de
la economía nacional, de este periodo.
La importancia de aplicar el método de Guerrero - Wei y Stram, a diferencia de la
metodología de Denton, es que incluye la estructura de autocorrelación apropiada
que se deduce de los datos observados.
La necesidad de contar con cifras oportunas de esta variable radica en que permite
formular políticas públicas en torno a este sector, debido entre otras razones, a la
importancia que tiene la actividad turística en la economía del país, a que la
actividad turística participa en diferentes actividades económicas, y a que es
generadora de ingresos y empleos.
Para desagregar el PIB Turístico de forma trimestral se utilizó la variable Consumo
Turístico Interior, esta variable cumple con los criterios mínimos que debe tener una
variable relacionada:
Tiene una interpretación económica adecuada con relación al PIB Turístico.
Satisface el supuesto de Friedman de alta correlación entre sus movimientos
intraperiodos y los del PIB Turístico.
Tiene una longitud suficiente para cubrir el periodo de estudio y se puede
seguir observando en el futuro.
Se puede disponer de los datos del Consumo Turístico de manera oportuna,
para que las estimaciones preliminares tengan sentido.
La calidad estadística de la variable Consumo Turístico, en el sentido de
coherencia en el método de su medición, es relativamente buena y se
mantiene a lo largo del tiempo.
El Consumo Turístico Interior está compuesto por el Consumo Turístico Receptivo
que se refiere a los gastos que realizan los visitantes que no tienen su residencia
14
INEGI - CIMAT
en la economía nacional, y el Consumo Turístico Interno que se refiere a los gastos
que realizan los turistas nacionales dentro de nuestro territorio y fuera de su entorno
habitual. El Consumo Turístico Interior se calcula con la misma metodología que el
PIB Turístico, su periodicidad es trimestral y está altamente correlacionado con el
PIB, como se puede ver en la siguiente Gráfica.
Gráfica 1
Para construir la Serie Estimada Preliminar (𝑊𝑡), primero se calculó el modelo de
regresión lineal, considerando al PIB como la variable dependiente y al CTI Anual
(CTIA) como la variable independiente, obteniendo los siguientes resultados:
Parámetro
estimado
Error
Estándar
t valor Pr(>|t|)
Intercepto -4.585e+07 2.915e+07 -1.573 1 0.134
CTI Anual 7.351e-01 3.080e-02 23.868 1.63e-14
𝑅2=0.971
PIB y Consumo Turístico, Correlación = 0.985
15
INEGI - CIMAT
𝑅2 Ajustada=0.9693
Prueba de significancia F, p-valor = 1.635e-14
Con estos resultados podemos decir que se tiene un modelo donde existe una fuerte
relación lineal entre el PIB y el Consumo Turístico Interior Anual (CTIA), además de
que el modelo de regresión es estadísticamente significativo.
Por lo tanto, el modelo de regresión lineal queda de la siguiente forma:
𝑃𝐼𝐵𝑖 = −4.585𝑒 + 07 + 7.351𝑒 − 01 𝐶𝑇𝐼𝐴𝑖 , (4.1)
para 𝑖 = 1, . . . . , 19.
Este modelo se aplicó a los datos del Consumo Turístico Interior Trimestral (CTIT),
para obtener la Serie Preliminar Estimada 𝑊𝑡
𝑊𝑡 = −4.585𝑒 + 07 + 7.351𝑒 − 01 𝐶𝑇𝐼𝑇𝑡 , (4.2)
para 𝑡 = 1, . . . . , 76.
Posteriormente se calcularon las diferencias (𝐷𝑖) entre el PIB y los promedios
anuales de 𝑊𝑡.
Las cifras anuales del PIB, los promedios anuales del CTI y 𝑊𝑡, las diferencias entre
el PIB y los promedios anuales de 𝑊𝑡, se presentan en la siguiente tabla.
Tabla 1. Producto Interno Bruto y Consumo Turístico Interior (en miles de pesos
constantes, base 2003=100), Promedios Anuales de la Serie Preliminar
Estimada (𝑊𝑡) y las diferencias (𝐷𝑖), entre el PIB y 𝑊𝑡
Año PIB CTI Wt Di
1993 552,601,715 801,426,045 543,301,052 9,300,663
1994 584,602,779 854,101,144 582,024,283 2,578,496
1995 558,179,206 827,326,131 562,341,074 -4,161,868
1996 578,434,333 838,728,219 570,723,131 7,711,202
1997 601,070,589 872,953,140 595,883,017 5,187,572
1998 615,470,550 901,337,477 616,749,294 -1,278,744
16
INEGI - CIMAT
1999 621,575,629 915,994,636 627,524,263 -5,948,634
2000 648,943,498 958,214,403 658,561,429 -9,617,931
2001 632,724,968 937,244,890 643,146,037 -10,421,069
2002 622,857,183 923,711,989 633,197,548 -10,340,365
2003 630,145,379 936,373,586 642,505,512 -12,360,133
2004 666,400,494 972,319,885 668,930,841 -2,530,347
2005 674,726,465 985,614,378 678,704,068 -3,977,603
2006 700,373,816 1,022,774,301 706,021,573 -5,647,757
2007 723,453,820 1,055,730,229 730,248,580 -6,794,760
2008 731,280,200 1,066,125,152 737,890,236 -6,610,036
2009 706,601,097 999,537,749 688,939,605 17,661,492
2010 722,113,913 1,018,377,586 702,789,400 19,324,514
2011 732,640,326 1,034,599,972 714,715,019 17,925,307
La Gráfica 2, muestra las Funciones de Autocorrelación (FAC) y Autocorrelación
Parcial (FACP) de la serie 𝐷𝑖 , que son útiles para determinar el modelo ARIMA
correspondiente para esta serie.
Con el comportamiento de la FAC y de la FACP se deduce que el modelo
correspondiente para esta serie es un MA(1), ya que el primer coeficiente de la FAC
es diferente de cero y en la FACP los coeficientes tienen un decrecimiento como
mezcla de exponenciales y senoidales.
Los resultados que se obtienen al aplicar éste modelo, son los siguientes:
𝜃 = 𝟏. 𝟎𝟕𝟖𝟔𝟓𝟏, con ��𝜖 = 6773477.68875
17
INEGI - CIMAT
Gráfica 2
Por lo tanto, la expresión del modelo queda de la siguiente forma:
(1 − (1.078651 )𝐿)𝐷𝑖 = 𝜀�� , (4.3)
Analizando los residuales (Gráfica 3) y aplicando la Prueba de autocorrelación de
Ljung-Box de primer orden, se obtiene un p-valor = 0.828, que para un 𝛼 = 0.05
implica que no se rechaza la hipótesis de independencia y se descarta la
autocorrelación de primer orden de los residuales, por lo que se concluye que el
modelo es adecuado.
18
INEGI - CIMAT
Gráfica 3
El valor de 𝜃 obtenido se utiliza para generar la serie desestacionalizada de 𝐷𝑖,
aplicando el siguiente filtro:
𝐹𝐷𝑖 = 𝐷𝑖 − (1.078651)𝐷𝑖−1 , (4.4)
para 𝑖 = 2, . . . . . . ,19.
19
INEGI - CIMAT
Gráfica 4
Analizando las autocorrelaciones de la serie 𝐹𝐷𝑖, se infiere un proceso MA(1), donde
𝑝 = 0 y 𝑞 = 𝑝 + 1 .
Como lo que se quiere es desagregar de forma trimestral, el valor anual del PIB,
entonces, se tiene que:
𝐹𝐷𝑖 =1
4(1 + 𝐵 + 𝐵2 + 𝐵3)𝐹𝑆4𝑖 , (4.5)
Siguiendo el proceso de desagregación de Wei y Stram, se obtienen las
autocovarianzas de la serie agregada y desagregada, y con ellas se calculan los
valores de 𝜃 para el modelo desagregado.
20
INEGI - CIMAT
𝜃1 = −64.34324 y 𝜃2 = −0.01554165
Eligiendo indistintamente el valor de 𝜃, el modelo estimado para la serie
desagregada queda de la forma:
(1 − 1.078651 𝐵4)𝑆𝑡 = (1 − 0.01554165 𝐵)��𝑡 (4.6)
Como se vio en el capítulo anterior, este modelo se puede expresar de la siguiente
forma:
𝑆𝑡 = 𝜓𝑠(𝐵)𝑒𝑡 (4.7)
Y de forma matricial se expresa como:
𝑆 = Ψ𝑆𝑒 (4.8)
Una vez obtenido este modelo se aplica la ecuación (3.13), vista en el capítulo
anterior:
MCE(��) = 𝜎𝑒2(𝐼𝑚𝑛 − ��𝐶)Ψ𝑆Ψ𝑆
′ . (4.9)
Obteniendo los siguientes resultados:
Tabla 2. Consumo Turístico Interior; Serie Preliminar (Wt) y Serie Desagregada (PIB);
en miles de pesos constantes, base 2003 = 100
Trimestre CTI Variación
anual Serie
Preliminar (Wt)
Serie Desagregada
(PIB)
Variación anual
1993 I 793,171,488 537,232,852 546,575,937
II 803,931,617 545,142,983 554,340,855
III 787,010,827 532,703,943 541,901,816
IV 821,590,246 558,124,433 567,588,239
1994 I 820,361,311 3.43 557,221,001 559,647,874 2.39
II 860,596,637 7.05 586,799,338 589,335,516 6.31
III 850,030,696 8.01 579,031,960 581,568,138 7.32
IV 885,415,930 7.77 605,044,832 607,859,582 7.10
1995 I 859,452,673 4.77 585,958,371 581,715,071 3.94
II 800,745,128 -6.95 542,800,488 538,666,814 -8.60
III 801,001,843 -5.77 542,989,208 538,855,534 -7.34
21
INEGI - CIMAT
IV 848,104,882 -4.21 577,616,230 573,479,426 -5.66
1996 I 813,310,010 -5.37 552,037,353 559,827,699 -3.76
II 828,968,992 3.52 563,548,796 571,153,771 6.03
III 830,060,264 3.63 564,351,027 571,956,003 6.14
IV 882,573,611 4.06 602,955,348 610,799,868 6.51
1997 I 819,792,479 0.80 556,802,834 561,878,480 0.37
II 875,254,257 5.58 597,574,645 602,693,264 5.52
III 872,002,757 5.05 595,184,358 600,302,977 4.96
IV 924,763,068 4.78 633,970,231 639,407,621 4.68
1998 I 876,154,787 6.88 598,236,655 596,801,022 6.22
II 901,115,419 2.95 616,586,052 615,257,163 2.08
III 900,537,339 3.27 616,161,086 614,832,197 2.42
IV 927,542,363 0.30 636,013,384 634,991,817 -0.69
1999 I 868,622,583 -0.86 592,699,479 586,614,535 -1.71
II 912,985,818 1.32 625,312,380 619,306,046 0.66
III 922,106,389 2.40 632,017,218 626,010,883 1.82
IV 960,263,754 3.53 660,067,975 654,371,029 3.05
2000 I 921,621,583 6.10 631,660,820 621,925,016 6.02
II 961,827,724 5.35 661,217,702 651,544,593 5.21
III 970,009,050 5.19 667,232,069 657,558,961 5.04
IV 979,399,256 1.99 674,135,123 664,745,397 1.59
2001 I 940,830,081 2.08 645,781,631 635,274,949 2.15
II 947,987,084 -1.44 651,042,983 640,553,589 -1.69
III 927,831,330 -4.35 636,225,813 625,736,418 -4.84
IV 932,331,066 -4.81 639,533,720 629,334,866 -5.33
2002 I 885,551,703 -5.88 605,144,643 594,715,109 -6.38
II 937,996,378 -1.05 643,698,480 633,272,459 -1.14
III 925,029,474 -0.30 634,166,075 623,740,054 -0.32
IV 946,270,400 1.50 649,780,992 639,701,066 1.65
2003 I 920,491,451 3.95 630,830,022 618,396,717 3.98
II 926,315,865 -1.25 635,111,744 622,714,937 -1.67
III 947,871,272 2.47 650,957,846 638,561,039 2.38
IV 950,815,757 0.48 653,122,436 640,908,793 0.19
2004 I 961,220,325 4.42 660,771,183 658,256,783 6.45
II 959,566,841 3.59 659,555,651 656,890,469 5.49
III 983,461,816 3.75 677,121,648 674,456,466 5.62
IV 985,030,557 3.60 678,274,882 675,998,224 5.47
2005 I 987,939,409 2.78 680,413,277 676,309,047 2.74
II 981,399,326 2.28 675,605,442 671,529,523 2.23
III 1,000,578,469 1.74 689,704,673 685,628,753 1.66
IV 972,540,307 -1.27 669,092,881 665,438,493 -1.56
2006 I 999,652,380 1.19 689,023,874 683,240,324 1.02
II 1,021,994,078 4.14 705,448,005 699,697,444 4.19
22
INEGI - CIMAT
III 1,032,622,289 3.20 713,261,159 707,510,598 3.19
IV 1,036,828,457 6.61 716,353,253 711,046,884 6.85
2007 I 1,043,576,601 4.39 721,314,040 714,386,728 4.56
II 1,053,260,041 3.06 728,432,661 721,530,441 3.12
III 1,062,208,875 2.87 735,011,249 728,109,029 2.91
IV 1,063,875,400 2.61 736,236,368 729,789,092 2.64
2008 I 1,070,342,923 2.56 740,990,860 734,351,362 2.79
II 1,055,968,125 0.26 730,423,465 723,786,852 0.31
III 1,066,220,994 0.38 737,960,692 731,324,079 0.44
IV 1,071,968,566 0.76 742,185,926 735,658,529 0.80
2009 I 1,000,807,158 -6.50 689,872,790 707,691,455 -3.63
II 924,031,374 -12.49 633,432,338 650,872,602 -10.07
III 1,021,158,355 -4.23 704,833,636 722,273,900 -1.24
IV 1,052,154,109 -1.85 727,619,654 745,566,443 1.35
2010 I 1,004,315,487 0.35 692,451,880 711,641,335 0.56
II 999,852,917 8.21 689,171,295 708,341,324 8.83
III 1,032,698,646 1.13 713,317,292 732,487,320 1.41
IV 1,036,643,292 -1.47 716,217,132 735,985,700 -1.29
2011 I 993,972,472 -1.03 684,848,383 702,600,505 -1.27
II 1,008,202,571 0.84 695,309,405 713,092,727 0.67
III 1,054,374,168 2.10 729,251,693 747,035,015 1.99
IV 1,081,850,676 4.36 749,450,596 767,833,103 4.33
En la siguiente Gráfica se presenta la serie del PIB Turístico, desagregada
trimestralmente, para el periodo 1993 – 2011.
Gráfica 5
23
INEGI - CIMAT
A continuación se presenta el proceso del cálculo de los valores predichos del PIB
Turístico para el 2012.
Al analizar el comportamiento de la FAC y de la FACP de la serie preliminar Wt, se
deduce que el modelo correspondiente para esta serie es un AR(6).
Gráfica 6
Aplicando la Prueba de autocorrelación de Ljung-Box de primer orden (ver Gráfica
7), se obtiene un p-valor = 0.7072, que para un 𝛼 = 0.05 implica que no se rechaza
24
INEGI - CIMAT
la hipótesis de independencia y se descarta la autocorrelación de primer orden de
los residuales, por lo que se concluye que el modelo es adecuado.
Gráfica 7
Aplicando el Modelo de Desagregación, se obtienen los siguientes valores
predichos del PIB Turístico, para los cuatro trimestres de 2012.
Tabla 3. Valores Predichos del PIB Turístico, 2012
Trimestre I Trimestre II Trimestre III Trimestre IV
725,483,272 732,135,663 745,059,608 749,134,589
La siguiente gráfica muestra los valores estimados del PIB Turístico para el periodo
de 1993 a 2011 y los valores predichos para los cuatro trimestres de 2012, con su
intervalo de confianza al 95%.
25
INEGI - CIMAT
Gráfica 8
Por último, se calcularon las variaciones anuales con los datos estimados y
predichos (de 2004 a 2012), y se compararon con las variaciones anuales
publicadas por el INEGI. La siguiente gráfica muestra estos valores:
Gráfica 9
-15.0
-10.0
-5.0
0.0
5.0
10.0
I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II
2004 2005 2006 2007 2008 2009 2010 2011 2012
Variaciones anuales
Variaciones anuales calculadas Variaciones anuales publicadas
26
INEGI - CIMAT
En la siguiente tabla se muestran los valores predichos del PIB Turístico, para los
cuatro trimestres del 2012, así como sus correspondientes variaciones anuales
calculadas y las variaciones anuales publicadas por el INEGI al momento de concluir
la tesis.
Trimestres 2012 PIB Turístico
predicho
Variaciones
anuales
Variaciones
publicadas
I 725,483,272 3.3 3.9
II 732,135,663 2.7 3.2
III 745,059,608 -0.3
IV 749,134,589 -2.4
27
INEGI - CIMAT
Conclusiones
La aplicación del método de Guerrero (1990) - Wei y Stram (1990) para desagregar
trimestralmente a la variable anual del Producto Interno Bruto (PIB) Turístico, se
desarrolló con el software estadístico de libre distribución denominado R, el cual se
encuentra en la siguiente dirección en Internet: http://www.r-project.org/
El programa desarrollado en R pretende ser un apoyo estadístico que contribuya a
la obtención de estadísticas derivadas de corto plazo, en el Instituto Nacional de
Estadística y Geografía (INEGI),
Si bien el trabajo de Tesis se centra en la aplicación de un solo método de
desagregación de series de tiempo, un trabajo de investigación posterior podría
referirse a la aplicación de algún otro método basado en modelos con el cual se
puedan comparar resultados. Asimismo, abre la posibilidad para que utilizando el
mismo programa desarrollado en R, con los ajustes necesarios, se pueda aplicar a
otras variables de interés y obtener así el desagregado de las mismas.
Por último, es importante considerar que el programa en R se desarrolló de acuerdo
con información del PIB y del Consumo Turístico Interior del periodo 1993 -2011,
con esta información se obtuvieron valores predichos para los cuatro trimestres del
2012; es necesario ir ajustando el programa conforme se tenga información
actualizada.
28
INEGI - CIMAT
Anexo
Programa en R
#==============================================================
# Producto Interno Bruto Anual
# Precios constantes, base 2003, periodo 93-2011
# Esta es la serie anual de la cual se parte y es la que se quiere desagregar
# a través del modelo
# ---------------VARIABLE Y -----------------------------------
PIB <- ts(
c(552601715,
584602779,
558179206,
578434333,
601070589,
615470550,
621575629,
648943498,
632724968,
622857183,
630145379,
666400494,
674726465,
700373816,
723453820,
731280200,
706601097,
722113913.304885,
732640326.198948), start = c(1993,1))
#==============================================================
# Consumo Turístico Total Trimestral
# Precios constantes, base 2003, periodo 93 I - 2011 IV
# ----------------------VARIABLE X ---------------------------------------
29
INEGI - CIMAT
CTUT <- ts(
c( 793171488.357769, 803931616.741574, 787010826.758590,
821590246.166391,
820361310.976244, 860596637.440393, 850030696.084249,
885415930.381220,
859452672.909101, 800745127.955429, 801001843.108819,
848104881.639621,
813310009.594831, 828968991.502366, 830060264.399474,
882573610.824505,
819792478.871309, 875254256.950379, 872002756.621320,
924763068.087923,
876154787.211489, 901115418.982534, 900537338.847952,
927542362.835472,
868622582.889686, 912985818.404912, 922106389.364512,
960263754.290327,
921621583.140155, 961827724.053649, 970009050.437721,
979399255.718805,
940830080.837670, 947987084.012699, 927831330.019867,
932331066.009587,
885551703.117705, 937996377.658840, 925029473.967067,
946270400.288704,
920491450.513370, 926315864.808488, 947871271.724599,
950815756.953543,
961220325.395073, 959566841.070956, 983461816.238605,
985030557.295366,
987939409.362156, 981399326.249862, 1000578469.219520,
972540307.168459,
999652380.188186, 1021994077.987950, 1032622288.994050,
1036828456.829810,
1043576600.714620, 1053260040.649300, 1062208874.667910,
1063875399.968170,
1070342922.784890, 1055968125.137550, 1066220993.603220,
1071968566.474340,
1000807158.315590, 924031373.974314, 1021158354.730970,
1052154108.979120,
1004315486.671160, 999852917.225354, 1032698646.485010,
1036643291.665420,
993972472.121754, 1008202570.674720, 1054374167.721500,
1081850676.343810), 1993, freq=4)
30
INEGI - CIMAT
m<- 4 # número de datos no observados en cada año
n <- length(PIB)
# Se obtiene un indicador anual, promediando las cifras del Consumo Turístico
indiAnual <- rep(1:n,each=m)
INDIANUAL <- ts(tapply(CTUT,indiAnual,mean), freq = 1, start = c(1993,1))
INDIANUAL
# Graficando las dos series
par(mfrow=c(2,1))
ts.plot(PIB, type="p", main='PIB anual', ylim= c(5e+08, 8e+08), pch=20);
lines(PIB, col='green');
ts.plot(INDIANUAL, type="p", main='Consumo Turístico anual', ylim= c(8.0e+08,
11.0e+08), pch=20);
lines(INDIANUAL, col='green');
Correl <- round(cor(PIB,INDIANUAL),4)
par(mfrow=c(1,1))
plot(scale(PIB),type="l",main=paste('Comparación PIB y Consumo Turísticos,
Correlación = ',Correl),
col=2,lwd=3,ylab="Escala estandarizada",xlab="",xaxt="n") #línea roja
lines(scale(INDIANUAL), col=3,lwd=3,lty=9) #línea verde
names <- c("PIB Turístico","Consumo Turístico")
legend("bottomright", names,lty= 1:9,lwd=3, col=2:3)
axis(1,1:n,1993:(1992+n))
31
INEGI - CIMAT
#==============================================================
# Modelo de Regresión
#==============================================================
modeloReg <- lm( PIB ~ INDIANUAL )
summary(modeloReg)
predict(modeloReg)
anova(modeloReg)
summary(resid(modeloReg))
opar <- par(mfrow = c(2,2), oma = c(0, 0, 1, 0))
plot(modeloReg)
par(opar)
#==============================================================
# Calculando la Serie Wt
#==============================================================
# Utilizando los coeficientes estimados en el modelo anterior,
# se genera la serie Wt
COEF <- coef(modeloReg)
Wt <- c( COEF[1] + COEF[2]*CTUT)
Wt
# Las cifras anteriores se agregan, calculando promedios simples
Wta <- tapply(Wt,indiAnual,mean)
Wta
#==============================================================
# Se calculan las diferencias entre el PIB anual y la serie anualizada estimada Wta
#==============================================================
32
INEGI - CIMAT
Di <- PIB - Wta
Di
#==============================================================
# Cálculo de la función de Autocorrelación y Autocorrelación Parcial para la Serie #
de Diferencias {Di}
#==============================================================
par(mfrow=c(3,1))
ts.plot(Di)
acf(Di)
pacf(Di)
#==============================================================
# Modelo ARIMA
#==============================================================
modeloAriDi <- arima(Di,seasonal=list(order=c(0,0,1), period=NA),include.mean=F,
method='CSS')
modeloAriDi
tsdiag(modeloAriDi)
Box.test(modeloAriDi$res, lag = 1, type = "Ljung-Box")
pacf(modeloAriDi$res,ylim=c(-1,1))
qqnorm (modeloAriDi$res)
qqline(modeloAriDi$res, col = 2)
hist (modeloAriDi$res)
theta <- coef(modeloAriDi)
theta
33
INEGI - CIMAT
FD <- rep(0,n-1)
for(i in 2:n)
FD[i-1] <- Di[i]-theta*Di[i-1]
par(mfrow=c(3,1))
ts.plot(FD)
acf(FD)
pacf(FD)
GamasFD <- acf(FD,type='covariance',plot=F)[[1]]
GamasFD
GamasFS <- matrix(c(3,0,0,3),2,2)%*%matrix(GamasFD[1:2])
GamasFS
aa <- GamasFS[1]/(2*GamasFS[2])
teta1 <- aa - sqrt(aa^2-1)
teta1
teta2 <- aa + sqrt(aa^2-1)
teta2
psi <- rep(0,n*m)
for(j in 1:19)
psi[1+4*(j-1)] <- teta2 * theta^(j-1)
for(j in 1:19)
psi[4*j] <- theta^j
PSI <- matrix(0,76,76)
diag(PSI) <- 1
for(i in 1:(76-1))
{
jj <- (i+1):76
print(jj)
34
INEGI - CIMAT
PSI[jj,i] <- psi[1:length(jj)]
}
cc <- matrix(rep(1/m,m))
II <- diag(n)
CC <- kronecker(II,t(cc))
AA <-
round(PSI%*%t(PSI)%*%t(CC)%*%solve(CC%*%PSI%*%t(PSI)%*%t(CC)),6)
AA
round(AA,2)
St <- AA%*%(PIB - CC%*%Wt)
Z <- Wt + St
Z
Za <- tapply(Z,indiAnual,mean)
Za
Za/PIB
Za/Wta
PIBEst <- ts(Z,1993,freq=4)
PIBEst
Wtg <- ts(Wt,1993,freq=4)
Wtg
sigma2 <- var(St)
errors <- sqrt(sigma2)
errors
verrors <- rep(errors,m*n)
verrors
lsup <- PIBEst + (1.96*verrors)
lsup
35
INEGI - CIMAT
linf <- PIBEst - (1.96*verrors)
linf
#==============================================================
# Gráfica de la Serie Desagregada (PIB)
#==============================================================
par(mfrow=c(1,1))
plot(lsup,type="l",main='Serie Desagregada (PIB Turístico)',
col=2,lwd=3,lty=6,ylab="",xlab="",ylim= c(5e+08, 8e+08))
abline(h=c(5.5e+08,6e+08,6.5e+08,7e+08,7.5e+08), v=c(1995,2000), col =
"gray60")
segments(2005,5.5e+08,2005,8.15e+08, col = "gray60")
segments(2010,5.5e+08,2010,8.15e+08, col = "gray60")
lines(PIBEst,col=3,lwd=2,lty=1)
lines(linf,col=2,lwd=3,lty=6)
names <- c("Límites 95% de confianza","Serie Desagregada (PIB Turístico)")
legend("bottomright", names,lwd=2:3,col=2:3,lty=c(6,1,6))
# Predicción de la serie preliminar Wt
par(mfrow=c(3,1))
ts.plot(Wt)
acf(Wt)
pacf(Wt)
modeloAriWt <-
arima(Wt,seasonal=list(order=c(6,0,0),period=NA),include.mean=F,method='CSS')
modeloAriWt
tsdiag(modeloAriWt)
Box.test(modeloAriWt$res, lag = 1, type = "Ljung-Box")
predict(modeloAriWt, n.ahead = 4)
36
INEGI - CIMAT
#==============================================================
# Valores estimados y predichos del PIB para los 4 trimestres de 2012
#==============================================================
# Promedio anual 2011
PWp2011 <- mean(c(725872260,732229529,745153474,748557827))
PWp2011
Wp <- c(Wt,725872260,732229529,745153474,748557827)
Wp
PIBp <- c(PIB,737953273)
PIBp
n <- 20
psi <- rep(0,n*m)
for(j in 1:20)
psi[1+4*(j-1)] <- teta2 * theta^(j-1)
for(j in 1:20)
psi[4*j] <- theta^j
PSI <- matrix(0,80,80)
diag(PSI) <- 1
for(i in 1:(80-1))
{
jj <- (i+1):80
print(jj)
PSI[jj,i] <- psi[1:length(jj)]
}
ccp <- matrix(rep(1/m,m))
IIp <- diag(n)
CCp <- kronecker(IIp,t(ccp))
37
INEGI - CIMAT
AAp <-
round(PSI%*%t(PSI)%*%t(CCp)%*%solve(CCp%*%PSI%*%t(PSI)%*%t(CCp)),6)
AAp
round(AAp,2)
St <- AAp%*%(PIBp-CCp%*%Wp)
Zpred <- Wp + St
Zpred
#====
Zpred <- ts(c(Zpred), 1993, freq=4)
#=====
sigma2 <- var(St)
errors <- sqrt(sigma2)
errors
verrors <- rep(errors,m*n)
verrors
Zpred1 <- Zpred[77:80]
Zpred1
verrors1 <- verrors[77:80]
verrors1
lsup <- Zpred1 + (1.96*verrors1)
lsup <- ts(c(lsup), 2012, freq=4)
linf <- Zpred1 - (1.96*verrors1)
linf <- ts(c(linf), 2012, freq=4)
par(mfrow=c(1,1))
38
INEGI - CIMAT
plot(Zpred,type="l",main="Valores Estimados y Predichos del PIB",
col=3,lwd=2,lty=1,ylab="",xlab="", ylim= c(5e+08, 8e+08))
abline(h=c(5.5e+08,6e+08,6.5e+08,7e+08,7.5e+08), v=c(1995,2000), col =
"gray60")
segments(2005,5.5e+08,2005,8.15e+08, col = "gray60")
segments(2010,5.5e+08,2010,8.15e+08, col = "gray60")
segments(2012,5.5e+08,2012,8.15e+08, col = "gray60", lwd=3)
lines(lsup,col=2,lwd=3,lty=6)
lines(linf,col=4,lwd=3,lty=9)
names <- c("Límite Superior","Valores Estimados del PIB","Límite Inferior")
legend("bottomright", names,lwd=3,col=2:5,lty=c(6,1,9))
39
INEGI - CIMAT
Apéndice
A.1 Definiciones y conceptos
Proceso estocástico.
Un proceso estocástico se describe como una secuencia de datos que evolucionan
en el tiempo. Las series temporales se definen como un caso particular de los
procesos estocásticos.
Proceso estocástico estacionario de segundo orden.
Un proceso estocástico se dice que es estacionario de segundo orden si su media
y su varianza son constantes en el tiempo y si el valor de la covarianza entre dos
periodos depende solamente de la distancia o rezago entre estos dos periodos de
tiempo y no del tiempo en el cual se ha calculado la covarianza.
Sea 𝑋𝑡 una serie de tiempo, se dice que la serie es estacionaria si cumple con estas
propiedades:
Media 𝐸(𝑋𝑡) = 𝐸(𝑋𝑡+𝑘) = 𝜇 ,
Varianza 𝑉(𝑋𝑡) = 𝑉(𝑋𝑡+𝑘) = 𝜎2 ,
Covarianza 𝐸[(𝑋𝑡 − 𝜇)(𝑋𝑡+𝑘 − 𝜇)] = 𝛾𝑘
En resumen si una serie de tiempo es estacionaria, su media, su varianza y su
autocovarianza (en diferentes rezagos) permanecen iguales sin importar el
momento en el cual se midan, es decir, son invariantes respecto al tiempo.
40
INEGI - CIMAT
Ruido blanco.
Es un caso simple de los procesos estocásticos, donde los valores son
independientes e idénticamente distribuidos a lo largo del tiempo con media cero e
igual varianza. Un ruido blanco se denota por 𝜀𝑡. Por ejemplo:
𝑒𝑡~𝑁(0, 𝜎2) 𝑐𝑜𝑣 (𝜀𝑡𝑖, 𝜀𝑡𝑗
) = 0 ∀𝑡𝑖 ≠ 𝑡𝑗
La siguiente gráfica muestra un ruido blanco con media cero y varianza constante e
igual a uno.
Función de autocorrelación.
La Función de autocorrelación mide la correlación entre los valores de la serie
distanciados un lapso de tiempo 𝑘. A este lapso de tiempo 𝑘 se le conoce como
“retardo”, “retraso”, “rezago”, etc. El coeficiente de correlación simple, dados N
pares de observaciones 𝑦, 𝑥 , es:
𝑟 =∑(𝑦𝑖−��)(𝑥𝑖−��)
√∑(𝑦𝑖−��)2 ∑(𝑥𝑖−��)2
De igual forma, dada una secuencia temporal de N observaciones 𝑥1, . . . . . , 𝑥𝑛, se
pueden formar N-1 parejas de observaciones contiguas (𝑥1, 𝑥2), (𝑥2, 𝑥3), . . . . (𝑥𝑛−1, 𝑥𝑛) y calcular el coeficiente de correlación de estas parejas, el cual se
denomina coeficiente de autocorrelación de orden 1 y se denota como 𝜌1.
41
INEGI - CIMAT
Análogamente se pueden formar parejas con puntos separados por una distancia
2, es decir: (𝑥1, 𝑥3), (𝑥2, 𝑥4), etc. y calcular el nuevo coeficiente de autocorrelación
de orden 2.
De forma general, si se conforman parejas con puntos separados una distancia 𝑘,
el coeficiente de autocorrelación que se calcule será de orden 𝑘.
Al igual que para el coeficiente de correlación lineal simple, se puede calcular un
error estándar y por tanto un intervalo de confianza para el coeficiente de
autocorrelación.
Función de Autocorrelación Simple (FAC).
La Función de Autocorrelación Simple es el conjunto de coeficientes de
autocorrelación 𝜌𝑘 desde 1 hasta un máximo que no puede exceder la mitad de los
valores observados, y es de gran importancia para estudiar la estacionalidad de la
serie, ya que si ésta existe, los valores separados entre sí por intervalos iguales al
periodo estacional deben estar correlacionados de alguna forma. Es decir, que el
coeficiente de autocorrelación para un retardo igual al periodo estacional debe ser
significativamente diferente de cero.
Los coeficientes de la Función de Autocorrelación Simple, 𝜌1, 𝜌2, . . . . . , 𝜌𝑘 están
acotados entre [-1, 1]. Cuando un 𝜌𝑖 vale cero, quiere decir que no existe efecto
entre una observación y la i-ésima posición posterior.
Para una serie 𝑥𝑡 de 𝑛 valores, el coeficiente de autocorrelación simple se obtiene
mediante la relación:
𝜌𝑘 =𝑐𝑜𝑣(𝑥𝑡−𝑘,𝑥𝑡)
√𝑣𝑎𝑟(𝑥𝑡−𝑘)𝑣𝑎𝑟(𝑥𝑡) ,
para 𝑡 = 𝑘 + 1, 𝑘 + 2, 𝑘 + 3, . . . . , 𝑛
La función de autocorrelación simple tiene las siguientes propiedades:
𝜌0 = 1
−1 ≤ 𝜌𝑗 ≤ 1
42
INEGI - CIMAT
Simetría 𝜌𝑗 = 𝜌−𝑗
Función de autocorrelación parcial (FACP).
La Función de Autocorrelación Parcial mide la correlación entre dos variables
separadas por k periodos cuando no se considera la dependencia creada por los
retardos intermedios existentes entre ambas.
𝜋𝑗 = 𝑐𝑜𝑟𝑟(𝑥𝑗 , 𝑥𝑗−𝑘 𝑥𝑗−1𝑥𝑗−2 . . . . 𝑥𝑗−𝑘+1⁄ ) ,
𝜋𝑗 =𝑐𝑜𝑣(𝑥𝑗 − 𝑥𝑗 , 𝑥𝑗−𝑘 − 𝑥𝑗−𝑘)
√𝑉(𝑥𝑗 − 𝑥𝑗)√𝑉(𝑥𝑗−𝑘 − 𝑥𝑗−𝑘)
Estacionalidad.
La estacionalidad se refiere a fluctuaciones periódicas de la variable, en periodos
relativamente cortos de tiempo. Por ejemplo, las ventas aumentan en los meses de
noviembre y diciembre por las festividades navideñas.
Prueba de Ljung-Box.
Esta prueba permite probar en forma conjunta que todos los coeficientes de
autocorrelación son simultáneamente iguales a cero, es decir, que son
independientes, y está definida como:
𝑄 = 𝑛(𝑛 + 2) ∑ (��𝑘
2
𝑛−𝑘) ~𝜒(𝑚)
2𝑚𝑘=1 ,
donde 𝑛 es el tamaño de la muestra y 𝑚 la longitud del rezago.
Ho: Todos los coeficientes de autocorrelación son cero.
Ha: Algunos de los coeficientes de autocorrelación no son cero.
En una aplicación, si el valor de Q calculado excede el valor Q crítico de la tabla ji
cuadrada al nivel de significancia seleccionado, no se acepta la hipótesis nula de
43
INEGI - CIMAT
que todos los coeficientes de autocorrelación son iguales a cero; por lo menos
algunos de ellos deben ser diferentes de cero.
Procesos autorregresivos 𝑨𝑹(𝒑).
Los procesos autorregresivos forman una familia de procesos tales que una
observación depende de las observaciones anteriores. Se denominan procesos AR
y se caracterizan por su orden (p). El proceso autorregresivo de primer orden es el
más sencillo de la familia de procesos autorregresivos. Se dice que un proceso o
serie es autorregresivo de primer orden si sigue la siguiente ecuación:
𝑍𝑡 = ∅𝑍𝑡−1 + 𝑎𝑡
Si una serie sigue un proceso 𝐴𝑅(1), cada observación se construye a partir de la
anterior, más una perturbación aleatoria.
En otras palabras, los procesos autorregresivos se basan en la idea de que el valor
actual de la serie, 𝑋𝑡, puede explicarse en función de 𝑝 valores pasados
𝑋𝑡−1, 𝑋𝑡−2, . . . . , 𝑋𝑡−𝑝 , donde 𝑝 determina el número de rezagos necesarios para
pronosticar un valor actual.
El modelo autoregresivo de orden 𝑝 está dado por:
𝑋𝑡 = 𝜙0 + 𝜙1𝑋𝑡−1 + 𝜙2𝑋𝑡−2 + ⋯ + 𝜙𝑝𝑋𝑡−𝑝 + 𝜀𝑡
Expresado en términos del operador de retardos,
(1 − 𝜙1𝐿 − 𝜙2𝐿2 − ⋯ − 𝜙𝑝𝐿𝑝)𝑋𝑡 = 𝜀𝑡
𝜙𝑝(𝐿)𝑋𝑡 = 𝜀𝑡 ,
donde 𝜀𝑡 es un proceso de ruido blanco y 𝜙0, 𝜙1, … . , 𝜙𝑝 son los parámetros del
modelo.
Proceso autorregresivo de orden 𝑨𝑹(𝟏).
En los procesos 𝐴𝑅(1) la variable 𝑋𝑡 está determinada únicamente por el valor
pasado, esto es 𝑋𝑡−1
44
INEGI - CIMAT
𝑋𝑡 = 𝜙𝑋𝑡−1 + 𝜀𝑡 ,
donde 𝜀𝑡 es un proceso de ruido blanco con media 0 y varianza constante 𝜎2.
Para verificar que el modelo 𝐴𝑅(1) es estacionario, es necesario probar las
siguientes condiciones:
a) Estacionario en media
𝐸(𝑋𝑡) = 𝐸(𝑋𝑡 = 𝜙𝑋𝑡−1 + 𝜀𝑡) = 𝜙𝐸(𝑋𝑡−1)
Para que el proceso sea estacionario la media debe ser constante y finita en
el tiempo. Esto implica que:
𝐸(𝑋𝑡) = 𝜙𝐸(𝑋𝑡) ,
(1 − 𝜙)𝐸(𝑋𝑡) = 0 ,
𝐸(𝑋𝑡) =0
1 − 𝜙= 0
Por tanto, para que el proceso sea estacionario el parámetro 𝜙 ≠ 1
b) Estacionario en covarianza:
Para que un proceso 𝐴𝑅(1) sea estacionario, la varianza tiene que ser
constante y finita en el tiempo:
𝛾0 = 𝐸(𝑋𝑡 − 𝐸(𝑋𝑡))2
= 𝐸(𝜙𝑋𝑡−1 + 𝜀𝑡 − 0)2 = 𝜙2𝑉(𝑋𝑡−1) + 𝜎2
Dada la autocorrelación del proceso
𝐸(𝑋𝑡−1𝜀𝑡) = 𝐸[(𝑋𝑡−1 − 0)(𝜀𝑡 − 0)] = 𝑐𝑜𝑣(𝑋𝑡−1𝜀𝑡) = 0
Bajo el supuesto de que el proceso es estacionario,
𝐸(𝑋𝑡−1)2 = 𝑉(𝑋𝑡−1) = 𝑉(𝑋𝑡) = 𝛾0
Por tanto 𝛾0 = 𝜙𝛾0 + 𝜎2, entonces 𝛾0 =𝜎2
1−𝜙2
45
INEGI - CIMAT
Función de autocovarianza de orden k.
𝛾𝑘 = 𝐸(𝑋𝑡 − 𝐸(𝑋𝑡))(𝑋𝑡−𝑘 − 𝐸(𝑋𝑡−𝑘)) = 𝐸[(𝜙𝑋𝑡−1 + 𝜀𝑡)𝑋𝑡−𝑘] ,
𝛾𝑘 = 𝜙𝐸(𝑋𝑡𝑋𝑡−𝑘) + 𝐸(𝜀𝑡𝑋𝑡−𝑘) = 𝜙𝛾𝑘−1
Por lo que:
𝛾1 = 𝜙𝛾0 ,
𝛾2 = 𝜙𝛾1 ,
𝛾3 = 𝜙𝛾2 ,
⋮
Se puede concluir, por tanto, que el proceso 𝐴𝑅(1) es estacionario sí y solo sí |𝜙| <
1.
La función de autocovarianza de un proceso 𝐴𝑅(1) estacionario es:
𝜎2
1−𝜙2 𝑘 = 0 ,
𝛾𝑘 =
𝜙𝛾𝑘−1 𝑘 > 0
Los coeficientes de autocorrelación de un proceso estacionario 𝐴𝑅(1) son:
𝜌𝑘 =𝛾𝑘
𝛾0=
𝜙𝛾𝑘−1
𝛾0= 𝜙𝜌𝑘−1 ,
La función de autocorrelación de un proceso 𝐴𝑅(1) estacionario, es:
1 𝑘 = 0 ,
𝜌𝑘 =
𝜙𝜌𝑘−1 𝑘 > 0
Se puede demostrar fácilmente que la Función de Autocorrelación de un modelo
𝐴𝑅(1) es una función potencia.
46
INEGI - CIMAT
𝜌1 = 𝜙𝜌0 = 𝜙 ,
𝜌2 = 𝜙𝜌1 = 𝜙2 ,
𝜌3 = 𝜙𝜌2 = 𝜙3 ,
⋮
Por lo que:
𝜌𝑘 = 𝜙𝑘, 𝑑𝑜𝑛𝑑𝑒 𝑘 = 1,2,3, . . ..
Una forma alterna de escribir el modelo AR(1) es la siguiente:
𝑋𝑡 = 𝜙𝑋𝑡−1 + 𝜀𝑡 ,
(1 − 𝜙𝐿)𝑋𝑡 = 𝜀𝑡 ,
𝑋𝑡 =1
1 − 𝜙𝐿𝜀𝑡
El cociente 1
1−𝜙𝐿 podemos expresarlo como un polinomio infinito, esto es:
1
1 − 𝜙𝐿= 1 + 𝜙𝐿 + 𝜙2𝐿2 + ⋯
Sustituyendo se tiene
𝑋𝑡 =1
1−𝜙𝐿𝜀𝑡 = (1 + 𝜙𝐿 + 𝜙2𝐿2 + ⋯ )𝜀𝑡 ,
𝑋𝑡 = 𝜀𝑡 + 𝜙𝜀𝑡−1 + 𝜙2𝜀𝑡−2 + 𝜙3𝜀𝑡−3 + ⋯
De los resultados obtenidos podemos señalar como características más relevantes
del modelo 𝐴𝑅(1), como:
El modelo 𝐴𝑅(1) es estacionario siempre que se cumpla |𝜙| < 1.
El correlograma, representación gráfica de la función de autocorrelación,
tendrá un comportamiento amortiguado hacia cero con todos los valores
positivos, en caso de que 𝜙 > 0, o bien alternando el signo, comenzando con
negativo, si 𝜙 < 0.
47
INEGI - CIMAT
La función de autocorrelación parcial se anula para retardos superiores a uno
(el orden del modelo).
Proceso autorregresivo de orden 𝑨𝑹(𝟐).
En los procesos 𝑨𝑹(𝟐) la variable 𝑋𝑡 está determinada por el valor inmediato
pasado y el anterior a este.
𝑋𝑡 = 𝜙1𝑋𝑡−1 + 𝜙2𝑋𝑡−2 + 𝜀𝑡 ,
donde 𝜀𝑡 es un ruido blanco.
Asumiendo estacionariedad, las características del proceso son:
a) Media
𝐸[(1 − 𝜙1𝐿 − 𝜙2𝐿2)𝑋𝑡] = 𝐸[𝜀𝑡] ,
(1 − 𝜙1𝐿 − 𝜙2𝐿2)𝐸[𝑋𝑡] = 0 ,
𝐸[𝑋𝑡] =0
1−𝜙1𝐿−𝜙2𝐿2 ,
𝐸[𝑋𝑡] = 0
b) Función de autocovarianza
𝛾0 = 𝐸(𝑋𝑡 − 𝐸[𝑋𝑡])2 = 𝐸(𝑋𝑡)2 = 𝐸(𝜙1𝑋𝑡−1 + 𝜙2𝑋𝑡−2 + 𝜀𝑡)2 ,
𝛾0 = 𝜙12𝛾0 + 𝜙2
2𝛾0 + 𝜎2 + 2𝜙1𝜙2𝛾1 ,
(1 − 𝜙12 − 𝜙2
2)𝛾0 = 𝜎2 + 2𝜑1𝜙2𝛾1 ,
𝛾0 =𝜎2+2𝜙1𝜙2𝛾1
1−𝜙12−𝜙2
2 ,
𝛾1 = 𝐸(𝑋𝑡 − 𝐸[𝑋𝑡])(𝑋𝑡−1 − 𝐸[𝑋𝑡−1]) = 𝐸(𝑋𝑡𝑋𝑡−1) ,
𝛾1 = 𝐸[(𝜙1𝑋𝑡−1 + 𝜙2𝑋𝑡−2 + 𝜀𝑡)𝑋𝑡−1] ,
48
INEGI - CIMAT
𝛾1 = 𝜙1𝐸(𝑋𝑡−1)2 + 𝜙2𝐸(𝑋𝑡−2𝑋𝑡−1) + 𝐸(𝜀𝑡𝑋𝑡−1) ,
𝛾1 = 𝜙1𝛾0 + 𝜙2𝛾1 ,
𝛾1 =𝜙1𝛾0
1−𝜙2
Lo valores 𝛾0 y 𝛾1 proporcionan las dos primeras autocovarianzas en función
de los parámetros 𝜙1 y 𝜙2 y de la varianza del ruido blanco 𝜎2.
Las autocovarizas de orden k, para todo k > 1, son:
𝛾𝑘 = 𝐸(𝑋𝑡 − 𝐸(𝑋𝑡))(𝑋𝑡−𝑙 − 𝐸(𝑋𝑡−𝑘)) = 𝐸(𝑋𝑡𝑋𝑡−𝑘) ,
𝛾𝑘 = 𝐸((𝜙1𝑋𝑡−1 + 𝜙2𝑋𝑡−2 + 𝜀𝑡)𝑋𝑡−𝑘) ,
𝛾𝑘 = 𝜙1𝛾𝑘−1 + 𝜙2𝛾𝑘−2
La función de autocovarianza de un modelo 𝐴𝑅(2), es:
𝜎2+2𝜙1𝜙2𝛾1
1−𝜙12
−𝜙22 𝑘 = 0 ,
𝛾𝑘 = 𝜙1𝛾0
1−𝜙2 𝑘 = 1 ,
𝜙1𝛾𝑘−1 + 𝜙2𝛾𝑘−2 𝑘 > 1
c) Coeficiente de autocorrelación
𝜌𝑘 =𝛾𝑘
𝛾0=
𝜙1𝛾𝑘−1 + 𝜙2𝛾𝑘−2
𝛾0= 𝜙1𝜌𝑘−1 + 𝜙2𝜌𝑘−2
Una forma general de escribir los coeficientes de autocorrelación es:
1 𝑘 = 0 ,
𝜌𝑘 = 𝜙1 + 𝜙2𝜌1 𝑘 = 1 ,
𝜙1𝜌𝑘−1 + 𝜙2𝜌𝑘−2 𝑘 > 1
49
INEGI - CIMAT
Proceso de Medias Móviles 𝑴𝑨(𝒒).
El modelo de promedios móviles de orden 𝑞 está dado por:
𝑋𝑡 = 𝜀𝑡 − 𝜃1𝜀𝑡−1 − 𝜃2𝜀𝑡−2 − ⋯ − 𝜃𝑞𝜀𝑡−𝑞
Expresado en términos del polinomio operador de retardo se tiene:
𝑋𝑡 = (1 − 𝜃1𝐿 − 𝜃2𝐿2 − ⋯ − 𝜃𝑞𝐿𝑞)𝜀𝑡 ,
𝑋𝑡 = 𝜃𝑞(𝐿)𝜀𝑡 ,
donde 𝜀𝑡 es un proceso de ruido blanco y 𝜃1, 𝜃2, … , 𝜃𝑞 son los parámetros del
modelo.
Proceso de Media Móvil de orden 1: 𝑴𝑨(𝟏).
Los modelos de medias móviles determinan el valor de 𝑋𝑡 en función de la
innovación actual y su primer retardo, esto es:
𝑋𝑡 = 𝜀𝑡 − 𝜃𝜀𝑡−1
Expresado en función del polinomio operador de retardos se tiene:
𝑋𝑡 = (1 − 𝜃)𝜀𝑡 ,
𝑋𝑡 = 𝜃1(𝐿)𝜀𝑡 ,
donde 𝜀𝑡 es un proceso de ruido blanco y 𝜃 es el parámetro.
a) Estacionario en media
𝐸(𝑋𝑡) = 𝐸(𝜀𝑡 − 𝜃𝜀𝑡−1) ,
𝐸(𝑋𝑡) = 𝐸(𝜀𝑡) − 𝜃𝐸(𝜀𝑡−1) ,
𝐸(𝑋𝑡) = 0
Es estacionario en media para todo valor del parámetro.
50
INEGI - CIMAT
b) Estacionario en covarianza
𝛾0 = 𝐸(𝑋𝑡 − 𝐸(𝑋𝑡))2
= 𝐸(𝑋𝑡)2 = 𝐸(𝜀𝑡 − 𝜃𝜀𝑡−1)2 ,
𝛾0 = 𝐸(𝜀𝑡)2 + 𝜃2𝐸(𝜀𝑡−1)2 − 2𝜃𝐸(𝜀𝑡𝜀𝑡−1) = 𝜎2 + 𝜃2𝜎2 − 0 ,
𝛾0 = (1 + 𝜃2)𝜎2 < ∞
La autocovarianza para el primer rezago, es:
𝛾1 = 𝐸(𝑋𝑡 − 𝐸(𝑋𝑡))(𝑋𝑡−1 − 𝐸(𝑋𝑡−1)) = 𝐸(𝜀𝑡 − 𝜃𝜀𝑡−1)(𝜀𝑡−1 − 𝜃𝜀𝑡−2) ,
𝛾1 = 𝐸(𝜀𝑡𝜀𝑡−1) − 𝜃𝐸(𝜀𝑡−1)2 − 𝜃𝐸(𝜀𝑡𝜀𝑡−2) + 𝜃2𝐸(𝜀𝑡−1𝜀𝑡−2) = −𝜃𝜎2,
para el resto de los rezagos la autocovarianza es cero.
Una forma general de la función de autocovarianza es:
(1 + 𝜃2)𝜎2 𝑘 = 0 ,
𝛾𝑘 = −𝜃𝜎2 𝑘 = 1 ,
0 𝑘 > 1
La función de autocovarianza es finita y depende sólo de 𝑘 más no del tiempo,
esto para cualquier valor del parámetro 𝜃. Esto implica que no es necesario
poner restricciones al parámetro 𝜃 para que el 𝑀𝐴(1) sea estacionario.
La función de autocorrelación de un proceso 𝑀𝐴(1) es:
1 𝑘 = 0
𝜌𝑘 = −𝜃
1+𝜃2 𝑘 = 1
0 𝑘 > 1
Cabe mencionar que de acuerdo a la función de autocorrelación si 𝜃 > 1, se
puede utilizar 1/𝜃.
51
INEGI - CIMAT
Proceso de Media Móvil de orden 2: 𝑴𝑨(𝟐).
Consideremos el modelo de medias móviles de orden 2:
𝑋𝑡 = 𝜀𝑡 − 𝜃1𝜀𝑡−1 − 𝜃2𝜀𝑡−2 ,
donde los parámetros son 𝜃1 y 𝜃2, además 𝜀𝑡 es un proceso de ruido blanco. Este
proceso es estacionario para cualquier valor de 𝜃1 y 𝜃2.
Las características más importantes son:
a) Estacionario en media
𝐸(𝑋𝑡) = 𝐸(𝜀𝑡 − 𝜃1𝜀𝑡−1 − 𝜃2𝜀𝑡−2) = 0
b) Función de autocovarianza 𝛾𝑘, 𝑘 = 0,1,2,3, …
𝛾0 = 𝐸(𝑋𝑡 − 𝐸(𝑋𝑡))2
= 𝐸(𝑋𝑡)2 ,
𝛾0 = 𝐸(𝜀𝑡 − 𝜃1𝜀𝑡−1 − 𝜃2𝜀𝑡−2)2 ,
𝛾0 = (1 + 𝜃12 + 𝜃2
2)𝜎2 ,
𝛾1 = 𝐸[(𝑋𝑡 − 𝐸(𝑋𝑡))(𝑋𝑡−1 − 𝐸(𝑋𝑡))] = 𝐸(𝑋𝑡𝑋𝑡−1) ,
𝛾1 = 𝐸[(𝜀𝑡 − 𝜃1𝜀𝑡−1 − 𝜃2𝜀𝑡−2)(𝜀𝑡−1 − 𝜃1𝜀𝑡−2 − 𝜃2𝜀𝑡−3)] ,
𝛾1 = (−𝜃1 + 𝜃1𝜃2)𝜎2 ,
𝛾2 = 𝐸[(𝑋𝑡 − 𝐸(𝑋𝑡))(𝑋𝑡−2 − 𝐸(𝑋𝑡))] = 𝐸(𝑋𝑡𝑋𝑡−2) ,
𝛾2 = 𝐸[(𝜀𝑡 − 𝜃1𝜀𝑡−1 − 𝜃2𝜀𝑡−2)(𝜀𝑡−2 − 𝜃1𝜀𝑡−3 − 𝜃2𝜀𝑡−4)] ,
𝛾2 = −𝜃2𝜎2 ,
52
INEGI - CIMAT
𝛾3 = 𝐸[(𝑋𝑡 − 𝐸(𝑋𝑡))(𝑋𝑡−3 − 𝐸(𝑋𝑡))] = 𝐸(𝑋𝑡𝑋𝑡−3) ,
𝛾3 = 𝐸[(𝜀𝑡 − 𝜃1𝜀𝑡−1 − 𝜃2𝜀𝑡−2)(𝜀𝑡−2 − 𝜃1𝜀𝑡−4 − 𝜃2𝜀𝑡−5)] ,
𝛾3 = 0
En resumen las autocovarianzas de un 𝑀𝐴(2) son:
(1 + 𝜃12 + 𝜃2
2)𝜎2 𝑘 = 0 ,
𝛾𝑘 = (−𝜃1 + 𝜃1𝜃2)𝜎2 𝑘 = 1 ,
−𝜃2𝜎2 𝑘 = 2 ,
0 𝑘 > 2
Las funciones de autocorrelación están dadas por:
−𝜃1+𝜃1𝜃2
1+𝜃12+𝜃2
2 𝑘 = 1 ,
𝜌𝑘 = −𝜃2
1+𝜃12+𝜃2
2 𝑘 = 2 ,
0 𝑘 > 2
Proceso Autorregresivo de Medias Móviles 𝑨𝑹𝑴𝑨(𝒑, 𝒒).
Es muy probable que una serie de tiempo 𝑋𝑡 tenga características de 𝐴𝑅 y de 𝑀𝐴 a
la vez y, por consiguiente, sea ARMA. Así 𝑋𝑡 sigue un proceso 𝐴𝑅𝑀𝐴(𝑝, 𝑞), en este
proceso habrá 𝑝 términos autorregresivos y 𝑞 términos de media móvil.
𝑋𝑡 = 𝜙1𝑋𝑡−1 + ⋯ + 𝜙𝑝𝑋𝑡−𝑝 − 𝜃1𝜀𝑡−1 − 𝜃2𝜀𝑡−2 − ⋯ − 𝜃𝑞𝜀𝑡−𝑞 − 𝜀𝑡 ,
𝐴𝑅(𝑝) 𝑀𝐴(𝑞)
donde 𝜀𝑡 es un proceso de ruido blanco, y 𝑐, 𝜙1, … , 𝜙𝑝, 𝜃1, … , 𝜃𝑞 son los parámetros
del modelo.
53
INEGI - CIMAT
Para un proceso 𝐴𝑅𝑀𝐴(𝑝, 𝑞) una condición de estacionariedad es la misma que
para un proceso 𝐴𝑅(𝑝), del mismo modo una condición de invertibilidad es la misma
que para el proceso 𝑀𝐴(𝑞).
El modelo 𝐴𝑅𝑀𝐴(𝑝, 𝑞) se puede escribir en términos del operador de retardos como
sigue:
(1 − 𝜙1𝐿 − 𝜙2𝐿2 − ⋯ − 𝜙𝑝𝐿𝑝)𝑋𝑡 = (1 − 𝜃1𝐿 − 𝜃2𝐿2 − ⋯ − 𝜃𝑞𝐿𝑞)𝜀𝑡 ,
𝜙𝑝(𝐿)𝑋𝑡 = 𝜃𝑞(𝐿)𝜀𝑡 ,
donde
𝜙𝑝(𝐿): es el polinomio autorregresivo,
𝜃𝑞(𝐿): es el polinomio de medias móviles
Proceso autorregresivo de media móvil: 𝑨𝑹𝑴𝑨(𝟏, 𝟏)
Consideremos el modelo 𝐴𝑅𝑀𝐴(1,1), donde 𝑋𝑡 se determina en función de su
pasado hasta el primer retardo, la innovación contemporánea y el pasado de la
innovación hasta el retardo 1.
𝑋𝑡 = 𝜙𝑋𝑡−1 + 𝜀𝑡 − 𝜃𝜀𝑡−1 ,
donde 𝜀𝑡 sigue un proceso de ruido blanco, 𝜙 y 𝜃 son los parámetros del modelo.
Para comprobar la estacionariedad del modelo, se calculan las raíces del polinomio
autorregresivo:
1 − 𝜙𝐿 = 0, entonces |𝐿| = |1
𝜙| esto es |𝜙|<1
Para comprobar la condición de invertibilidad del modelo se calculan las raíces del
polinomio de medias móviles:
1 − 𝜃𝐿 = 0, entonces |𝐿| = |1
𝜃| esto es |𝜃|<1
Características de un proceso 𝐴𝑅𝑀𝐴(1,1) estacionario
54
INEGI - CIMAT
a) Media
𝐸(𝑋𝑡) = 𝐸(𝜙𝑋𝑡−1 + 𝜀𝑡 − 𝜃𝜀𝑡−1) = 𝜙𝐸(𝑋𝑡−1) ,
𝐸(𝑋𝑡) = 0
b) Función de autocovarianzas
𝛾0 = 𝐸(𝑋𝑡 − 𝐸(𝑋𝑡))2
= 𝐸(𝑋𝑡)2 ,
𝛾0 = 𝐸(𝜙𝑋𝑡−1 + 𝜀𝑡 − 𝜃𝜀𝑡−1)2 ,
𝛾0 =(1+𝜃2−2𝜙𝜃)𝜎2
1−𝜙2
𝛾1 = 𝐸(𝑋𝑡 − 𝐸(𝑋𝑡))(𝑋𝑡−1 − 𝐸(𝑋𝑡−1)) = 𝐸(𝑋𝑡𝑋𝑡−1) ,
𝛾1 = 𝐸[(𝜙𝑋𝑡−1 + 𝜀𝑡 − 𝜃𝜀𝑡−1)𝑋𝑡−1] ,
𝛾1 = 𝜙𝛾0 − 𝜃𝜎2 ,
𝛾2 = 𝐸(𝑋𝑡 − 𝐸(𝑋𝑡))(𝑋𝑡−2 − 𝐸(𝑋𝑡−2)) = 𝐸(𝑋𝑡𝑋𝑡−2) ,
𝛾2 = 𝜙𝛾1
Resumiendo las autocovarianzas de un 𝐴𝑅𝑀𝐴(1,1)
(1+𝜃2−2𝜙𝜃)𝜎2
1−𝜙2 𝑘 = 0 ,
𝛾𝑘 𝜙𝛾0 − 𝜃𝜎2 𝑘 = 1 ,
𝜙𝛾𝑘−1 𝑘 > 1
La función de autocorrelación de un 𝐴𝑅𝑀𝐴(1,1) es
(1−𝜙𝜃)(𝜙−𝜃)
(1+𝜃2−2𝜙𝜃) 𝑘 = 1 ,
𝜌𝑘 =
𝜙𝜌𝑘−1 𝑘 > 1
55
INEGI - CIMAT
Bibliografía
Guerrero, Víctor M. “Temporal Disaggregation of Time Series: An ARIMA – Based
Approach”. International Statistical Review / Revue Internationale de Statistique.
Vol. 58, No. 1. (Apr., 1990), pp 29 -46. International Statistical Institute (ISI).
Guerrero, Víctor M. “Monthly Disaggregation of a Quarterly Time Series Forecasts
of Its Unobservable Monthly Values”. Journal of Official Statistics, Vol. 19, No. 3,
2003, pp. 215 – 235.
Instituto Nacional de Estadística y Geografía (INEGI). “Sistema de Cuentas
Nacionales de México. Cuenta satélite del turismo de México, 2003 – 2008”. México:
INEGI, c2010.
Instituto Nacional de Estadística y Geografía (INEGI). “Sistema de Cuentas
Nacionales de México. Cuenta satélite del turismo de México, 2005 – 2009. Año
base 2003”. México: INEGI, c2011.
Instituto Nacional de Estadística y Geografía (INEGI). “Sistema de Cuentas
Nacionales de México. Indicadores trimestrales de la actividad turística. Año base
2003. 2003/I – 2011/I”. México: INEGI, c2011.
Moauro, Filippo. Instituto Nazionale di Statistica, Istat. Savio, Giovanni. Statistical
Office of the European Communities, Eurostat. “Temporal Disaggregation Using
Multivariate Structural Time Series Models”.
Quilis, Enrique M. “Sobre el método de desagregación temporal de Litterman”. S.
G. Cuentas Nacionales. Instituto Nacional de Estadística. Madrid, España.
Quilis, Enrique M. “Notas sobre desagregación temporal de Series Económicas”.
P.T. No1/01. Instituto Nacional de Estadística. Madrid, España.
Villavicencio, John. “Introducción a Series de Tiempo”.
http://www.estadisticas.gobierno.pr/iepr/LinkClick.aspx?fileticket=4_BxecUaZmg%
3D&tabid=100
56
INEGI - CIMAT
Wei, William W. S. and Stram, Daniel O. “Disaggregation of Time Series Models”.
Journal of the Royal Statistical Society. Series B (Methodologiacla), Vol. 52, No. 3
(1990), pp. 453 - 467
Top Related