Guerrero & Silva 2013
-
Upload
naathgrayson2664 -
Category
Documents
-
view
9 -
download
0
Transcript of Guerrero & Silva 2013
-
Disponible en: http://www.redalyc.org/articulo.oa?id=31230010005
Red de Revistas Cientficas de Amrica Latina, el Caribe, Espaa y PortugalSistema de Informacin Cientfica
Guerrero, Vctor M.; Silva, EliudGraduacin no-paramtrica con suavidad y estructura impuestas por el analista: aplicaciones demogrficas
para MxicoEstudios Demogrficos y Urbanos, vol. 28, nm. 2, mayo-agosto, 2013, pp. 429-468
El Colegio de MxicoDistrito Federal, Mxico
Cmo citar? Nmero completo Ms informacin del artculo Pgina de la revista
Estudios Demogrficos y Urbanos,ISSN (Versin impresa): [email protected] Colegio de MxicoMxico
www.redalyc.orgProyecto acadmico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto
-
ESTUDIOS DEMOGRFICOS Y URBANOS, VOL. 28, NM. 2 (83), 2013, 429-468
Graduacin no-paramtrica con suavidad y estructura impuestas por el analista: aplicaciones demogrficas para Mxico*
Vctor M. Guerrero** Eliud Silva***
Se presenta un mtodo estadstico de carcter no-paramtrico para graduar datos demo-grficos de manera que se obtenga no slo suavidad, sino que los datos graduados sigan cierta estructura impuesta por el analista. El principal objetivo es que ste sea capaz de controlar tres aspectos fundamentales de la graduacin: la fidelidad de los datos gra-duados a los datos originales, la suavidad de dichos datos graduados, y la cercana de los mismos a determinada estructura. Las ilustraciones empricas utilizan datos referidos a la realidad demogrfica de Mxico y hacen uso de diversos indicadores al alcance de los analistas interesados.
Palabras clave: comparabilidad, Filtro de Kalman, graduacin, ndice de estructura, ndice de suavidad, Mnimos Cuadrados Genera-lizados, Modelo de Componentes No-Observables, Modelo de Espacio de Estados, Modelo de Seal Ms Ruido.
Fecha de recepcin: 5 de enero de 2011.Fecha de aceptacin: 26 de junio de 2012.
Nonparametric Graduation with Smoothness and Structure Imposed by the Analyst: Demographic Applications for Mexico
A non-parametric statistical method is presented for graduating demographic data so as to obtain not only smoothness, but also to ensure that the graduating data follow a certain structure imposed by the analyst. The main aim is for it to be able to control three fundamental aspects of graduation: the faithfulness of the graduated data to the original data, the smoothness of these graduated data, and their proximity to a particular struc-
* ** Trabajo ganador del tercer lugar del Premio Gustavo Cabrera 2010, vii Con-vocatoria, en la categora de Mejor Investigacin en el campo de Demografa o Poblacin. Los autores reconocen la valiosa aportacin de los dictaminadores annimos, as como la del editor, para la mejora del presente documento. Vctor M. Guerrero agradece a la Asociacin Mexicana de Cultura, A.C. el apoyo que le brind para la realizacin de esta investigacin.
*** Departamento de Estadstica, Instituto Tecnolgico Autnomo de Mxico. Correo electrnico: .
*** Escuela de Actuara, Universidad Anhuac del Norte. Correo electrnico: .
-
ESTUDIOS DEMOGRFICOS Y URBANOS, VOL. 28, NM. 2 (83), 2013, 429-468
430
ture. The empirical illustrations use data regarding the demographic reality of Mexico and make use of various indicators available to interested analysts.
Key words: comparability, Kalman Filter, graduation, structure index, smoothness index, Generalized Least Squares, Unobservable Components Model, State Space Model, Signal Plus Noise Model.
Introduccin
Los datos demogrficos, ya sea que provengan de censos, de encuestas o de estadsticas vitales, comnmente sufren diversas anomalas. Si bien algunas de ellas son atribuibles a errores humanos (de los informantes, de los encuestadores o del personal encargado de transcribir y captu-rar los datos), sta no es la nica fuente de errores ni necesariamente la ms importante, pues ciertas cuestiones climticas (como los hura-canes, las sequas, etctera) o fuera del control de los analistas (terre-motos, huelgas, etctera) provocan tambin la generacin de errores en las bases de datos. Desde luego, estos errores distorsionan el patrn verdadero del fenmeno que los datos pretenden cuantificar y su presencia hace necesaria la aplicacin de herramientas que corrijan, o al menos mitiguen, el efecto perverso de tales distorsiones en lo que respecta a los resultados de posibles anlisis que se efecten con los datos. Ello ocurre de esta manera sin importar lo elaborados que pue-dan ser tales anlisis, los cuales pueden ir desde una mera descripcin superficial de los patrones ms relevantes en los datos, hasta un anli-sis confirmatorio de alguna teora que explique el comportamiento de la poblacin bajo estudio.
Una de tales herramientas correctoras, que se utiliza con mucha frecuencia en la prctica, es la graduacin de datos. Puede aplicarse tanto en las instituciones gubernamentales, con fines muy generales para percibir de manera lo ms clara posible los patrones subyacentes en los datos, o en organizaciones privadas con fines muy particulares, para tomar decisiones especficas de las mismas. Esto se debe en buena medida a que es muy fcil efectuar la graduacin de datos debido a que se basa en ideas muy simples y su instrumentacin computacional es relativamente fcil; asimismo porque el costo asociado con su apli-cacin es muy bajo (un programa computacional sencillo permite hacer la aplicacin).
-
Guerrero y Silva, GRADUACIN NO-PARAMTRICA
431
Tanto la sencillez de representacin como la facilidad y el bajo costo de implementacin computacional se mantienen en la propues-ta que aqu se presenta. Adicionalmente, el nuevo mtodo que se su-giere produce ganancias en cuanto a la operatividad de conceptos como la fidelidad a los datos originales, la suavidad de los datos gra-duados y la cercana de stos a una estructura que se considera como meta. Para ello primero se formalizan estas ideas mediante una repre-sentacin de los datos disponibles a travs de un modelo estadstico de componentes no-observables, para el cual se asocia en forma natu-ral el mtodo de estimacin de parmetros denominado Mnimos Cuadrados Generalizados (mcg). Posteriormente se muestra que es posible cuantificar la suavidad y la cercana a la estructura meta por medio de unos ndices expresables en forma de porcentajes, con lo cual se sigue que es factible controlar estas caractersticas de la gradua-cin propuesta simplemente al fijar valores para tales ndices, de acuerdo con el criterio del analista.
La importancia de efectuar el control mencionado radica en que con ello se pueden realizar comparaciones vlidas entre datos con suavidades y cercanas a estructuras lmites similares, algo que de otra manera no tendra mucho sentido intentar siquiera comparar. Finalmente, los clculos de la graduacin aqu propuesta se realizan de manera muy sencilla al emplear una herramienta de clculo muy poderosa conocida como Filtro de Kalman, que es aplicable cuando el Modelo de Componentes No-Observables se interpreta en la for-ma de un Modelo de Espacio de Estados.
La estructura del documento es la siguiente: en la prxima seccin se presentan brevemente algunos modelos y tcnicas no-paramtricas que suelen usarse en la graduacin de datos; en la tercera se mencionan algunas tcnicas de carcter demogrfico que sirven para analizar y proyectar datos. Posteriormente, en la cuarta seccin se presenta el mtodo propuesto para llevar a cabo la graduacin; ah se muestran las ideas fundamentales, que se expresan por medio de ecuaciones y dan origen al Modelo de Componentes No-Observables por utilizar. En la quinta seccin se presentan los ndices de estructura y suavidad que se utilizan para cuantificar los respectivos conceptos y que permi-ten fijar los porcentajes deseados para los mismos. Una vez que se han fijado los valores para los ndices, se demuestra que se pueden deducir los valores para las constantes respectivas, las cuales forman parte de la especificacin del modelo. En la sexta seccin se pretende mostrar, mediante diversas aplicaciones a datos demogrficos de la realidad
-
ESTUDIOS DEMOGRFICOS Y URBANOS, VOL. 28, NM. 2 (83), 2013, 429-468
432
mexicana, la utilidad de la metodologa propuesta y el tipo de resulta-dos que se pueden obtener de la misma. En la ltima seccin se expo-nen algunas conclusiones para destacar los pros y contras del uso de la metodologa propuesta.
Mtodos no-paramtricos
Haberman y Renshaw (1996) definen la graduacin como un grupo integral de tcnicas y principios que permiten realizar el ajuste de probabilidades o datos en general para suavizarlos de manera que se puedan realizar inferencias y anlisis del tipo que sea necesario. La graduacin de datos puede efectuarse mediante procedimientos que tpicamente se clasifican en paramtricos o no-paramtricos. La segun-da clase de tcnicas no requiere del supuesto de que una cierta funcin represente el comportamiento de los datos globalmente y en forma estricta; por el contrario, se pretende suavizar las fluctuaciones que bsicamente oscurecen la tendencia subyacente en los datos observados y obtener representaciones localmente aceptables. Los mtodos no-paramtricos son ms flexibles y robustos, en tanto que son menos los supuestos que respaldan su uso. Adems, en muchas ocasiones resulta ms fcil emplear los mtodos no-paramtricos que su contraparte paramtrica, debido al menor rigor implcito en su aplicacin.
La propuesta de este trabajo se encuentra dentro del mbito de los mtodos no-paramtricos, ya que se pretende simplificar el anlisis de los datos observados despus de que se les ha eliminado una parte de la variabilidad que no es intrnseca de ellos. De hecho, los datos originales se convierten en estimaciones una vez que se les han cance-lado las fluctuaciones que oscurecen su tendencia. Dentro de las tc-nicas no-paramtricas que se utilizan ms frecuentemente se encuen-tran los mtodos grficos, los promedios mviles ponderados, el mtodo del ncleo y la graduacin en general, en especial la que se aplica a los datos demogrficos (Copas y Haberman, 1983; Papaioannou y Sachlas, 2004). Por ejemplo, algunas aplicaciones de los modelos no-paramtricos en demografa permiten obtener estimaciones de mortalidad en edades avanzadas (Fledelius et al., 2004). Asimismo, en el trabajo de Debn et al. (2006) se muestran diversas comparaciones entre mtodos no-paramtricos y de suavizamiento realizado con Mo-delos Aditivos Generalizados, en particular con splines, tambin dentro de un contexto demogrfico.
-
Guerrero y Silva, GRADUACIN NO-PARAMTRICA
433
La tcnica de graduacin que se usa ms frecuentemente en la prctica es la de Whittaker y Henderson. Esta forma de graduacin se aplica a los datos originales para obtener datos suavizados de manera tal que se satisfagan dos criterios: bondad de ajuste (es decir, fidelidad a los datos originales) y suavidad de los datos resultantes. Al lector interesado en detalles acerca de este tipo de graduacin y otros mto-dos similares se le recomienda consultar el libro de London (1985). Para lograr que los dos criterios se cumplan, se pondera en forma re-lativa su importancia mediante una constante o parmetro de suaviza-miento. De hecho, el mtodo surge al resolver un problema de mini-mizacin de la funcin siguiente:
(v-u) W(v-u) + l v K'd Kd v [1]
en donde sobresale la constante de suavizamiento l > 0 recin men-cionada, la cual se supone conocida al efectuar la minimizacin. El vector u = (u1, , un) contiene los valores observados de la variable en cuestin, y el vector de valores graduados v = (v1, , vn) es el que se desea obtener. Se usa tambin la matriz diagonal W = diag(w1,...,wn) que sirve para asignar ponderaciones a las diferencias entre valores observados y graduados. Finalmente, la matriz Kd, que permite aplicar diferencias a datos contiguos, es de dimensin (n d) n y est defi-nida de forma tal que su ij-simo elemento est dado por la expresin
K d(i,j)=(1)
d+i jd!/[(j i)!(d j+ i)!] [2]
la cual es vlida para i = 1, ..., n-d y j = 1, ..., n, junto con Kd (i, j) = 0 para j < i j > d+i.
El caso particular d = 2 del mtodo de Whittaker y Henderson fue redescubierto por Hodrick y Prescott en un trabajo que elaboraron dichos autores en 1980 dentro de un contexto de anlisis econmico, aunque el artculo correspondiente se public apenas en 1997 (vase Hodrick y Prescott, 1997). Por este motivo dicho mtodo se conoce como Filtro de Hodrick y Prescott (hp) en el rea econmica, donde se utiliza ampliamente para estimar tendencias y realizar anlisis de ciclos econmicos (vase Guerrero, 2008, para mayores detalles sobre el citado Filtro hp). El problema de minimizacin correspondiente al valor d = 2 puede plantearse como
min
YtS
102
(Yt YtS)2 + 112 (2 Yt
S)2 [3]
-
ESTUDIOS DEMOGRFICOS Y URBANOS, VOL. 28, NM. 2 (83), 2013, 429-468
434
donde ahora se define a Yt como la variable observada en el tiempo de observacin t, mientras que Yt
S es su correspondiente valor suavizado de tendencia, que no es observable y se pretende estimar, 0
2 es la va-rianza del componente cclico, definido como la desviacin del dato observado respecto a la tendencia
Yt YtS{ } , mientras que 12 es la
varianza del crecimiento de la tendencia, 2 Yt
S . Por su lado, el par-metro de suavizamiento es de la forma = 0
2 12 , lo cual permite in-terpretarlo como una constante con la cual se puede establecer un balance entre la fidelidad de la serie suavizada a los datos originales y la suavidad de la tendencia que se obtiene. Al resolver el problema de minimizacin, en trminos del vector de datos observados Y = (Y1, ..., Yn) se produce el siguiente estimador de la tendencia de los datos. Para detalles acerca de este resultado vase Hodrick y Prescott (1997) o Guerrero (2008),
YS =(In + K'2K 2)-1 Y [4]
con YS =(Y1
S ,..., YnS) , In la matriz identidad de dimensin n n y K2
la matriz definida mediante la expresin [2], con el valor d = 2, es decir, es de la forma
K 2 =
1 2 1 0 0 ... 0 0 0 00 1 2 1 0 0 0 0 0
...0 0 0 0 0 ... 0 1 2 1
[5]
La expresin [4] es precisamente el estimador producido por el Filtro hp cuyo uso requiere, adems del vector de datos Y, conocer el valor del parmetro de suavizamiento l, puesto que los dems ele-mentos de esa expresin son conocidos. La solucin que dieron Ho-drick y Prescott para elegir dicha constante de suavizamiento est ba-sada en argumentos del dominio de las frecuencias, aplicables al anlisis de ciclos econmicos, con los cuales se obtuvo como resultado el valor l = 1600, para series econmicas trimestrales de Estados Unidos en la poca de la posguerra, de longitud aproximada a los 100 datos. Para otros casos el analista debe ser responsable de elegir el valor ms apropiado, teniendo en mente que un valor pequeo conducir a una tendencia poco suave (muy semejante a los datos que se observaron originalmente). En cambio, al elegir un valor elevado para dicha cons-
-
Guerrero y Silva, GRADUACIN NO-PARAMTRICA
435
tante la tendencia ser muy suave (i. e., se aproximar a la lnea recta estimada para los datos observados mediante el mtodo de Mnimos Cuadrados Ordinarios).
Dado el xito del Filtro hp para realizar anlisis de ciclos econ-micos, Laxton y Tetlow (1992) propusieron una extensin de dicho resultado y desarrollaron el filtro conocido como Filtro hp Multivaria-do (hpmv), con el cual se extiende la aplicabilidad de la herramienta original, en el sentido de que adems de las ideas de fidelidad a los datos y suavidad se puede incorporar la cercana a una estructura dictada por algn tipo de teora del fenmeno en estudio. De esta forma se obtiene el filtro correspondiente al minimizar nuevamente una funcin de los valores estimados y que ahora considerar tambin la existencia de un error aleatorio asociado con la discrepancia entre lo que indica la teora y lo que muestran los datos observados. En consecuencia, el Filtro hpmv sirve para estimar la tendencia Yt
S (que no es observable) de una variable Yt (observable) mediante la solucin del siguiente problema de minimizacin:
min
YtS
(Yt YtS)2 + 1(2 YtS)2 + 2t [6]donde aparecen ahora dos parmetros de suavizamiento, l1 y l2. Desde luego debe notarse la similitud entre las expresiones [3] y [6], ya que esta ltima es una extensin de la anterior, en tanto que ahora incluye tambin el error aleatorio
t asociado con alguna teora del fenme-no que involucra a Yt
S. Una presentacin ampliada y con detalle del desarrollo del Filtro hpmv se puede consultar en Boone (2000).
Algunas tcnicas demogrficas de modelacin
La metodologa que se propone en este trabajo para corregir anoma-las en los datos demogrficos parte de la idea de que se puede repre-sentar el comportamiento de tales datos mediante un modelo estads-tico muy general. Conviene, por lo tanto, conocer algunas tcnicas que tambin se basan en representaciones o modelos generales para tratar de encontrar similitudes en los distintos enfoques. El Mtodo de Com-ponentes es, sin lugar a dudas, el que ms se utiliza en la prctica para efectuar proyecciones demogrficas. El mtodo como tal no ha variado en su esencia, y en trminos generales se ha usado para estudiar el comportamiento futuro de los diversos componentes demogrficos en
-
ESTUDIOS DEMOGRFICOS Y URBANOS, VOL. 28, NM. 2 (83), 2013, 429-468
436
forma separada, esto es, la fecundidad, la migracin y la mortalidad para horizontes previamente determinados (George et al., 2004).
El Mtodo de Componentes presenta variantes que permiten hacer supuestos acerca del patrn que siguen, por ejemplo, las tasas de mor-talidad. A partir de los supuestos, las tcnicas pueden agruparse de la siguiente manera: a) tcnicas extrapolativas; b) mtodos en que se piensa que la mortalidad de cierta rea geogrfica es vlida para otras reas; y c) modelos estructurales en que los cambios de las tasas de mortalidad se asocian con cambios en ciertas variables socioeconmi-cas. Para los grupos de tcnicas a) y b), las posibilidades existentes in-cluyen el uso de modelos del tipo Auto-Regresivo Integrado y de Promedios Mviles (arima), como sucede con el mtodo que propu-sieron Lee y Carter (1992), o bien modelos paramtricos como los de Makeham, Gompertz o Helligman y Pollard, entre otros. De igual manera, las tablas de vida de diferentes lugares del mundo se pueden utilizar como tablas base de referencia, dentro de las cuales estn las tablas modelo que presentan diferentes niveles de mortalidad y estruc-turas, as como la funcin logit y otras ms.
Otros mtodos que tambin se encuentran dentro de las categoras a) y b) tienen su fundamento en tablas lmite de mortalidad, de manera que hacen uso de los niveles ms bajos alcanzados para interpolar las tablas intermedias. La primera propuesta de tablas lmite de mortalidad fue presentada por Bourgeois-Pichat (1952) con el supuesto principal de que los niveles lmite se alcanzaran en el largo plazo. La hiptesis que subyace en este tipo de mtodos surge de la idea de que la morta-lidad cambia como funcin del nivel y la estructura de la mortalidad, dependiendo de la regin del mundo a la que corresponda. Por otra parte, en lo que toca a los lmites de la sobrevivencia humana los tra-bajos de Olshansky et al. (1990, 2001) y de Oeppen y Vaupel (2002) ofrecen aportaciones importantes a la literatura porque estudian la reduccin en mortalidad que se necesita para alcanzar una esperanza de vida al nacer que aumente de 80 a 120 aos y cmo puede afectar esto a distintas reas de la poltica pblica.
En el caso b), por ejemplo, se utiliza la tcnica de alcanzar una meta establecida de antemano. Dicha tcnica se basa en la idea de que, para una poblacin dada, las tasas de mortalidad convergen con las que se observan en otra poblacin y se consideran como una meta por alcanzar. La poblacin meta en cuestin debe elegirse de manera tal que brinde un conjunto de metas crebles que puedan ser alcanzadas por la poblacin que se proyecta. La eleccin de la poblacin meta se
-
Guerrero y Silva, GRADUACIN NO-PARAMTRICA
437
basa comnmente en similitudes que se refieren a caractersticas cul-turales, socioeconmicas, avances en la medicina y a las causas prima-rias de mortalidad (Olshansky, 1988). Una alternativa de presentar las metas consiste en referirlas a lo que se conoce como retraso de la causa; con este tipo de enfoque la poblacin meta que se elige es una cohorte ms joven de la misma poblacin en estudio, en lugar de la misma cohorte de una poblacin diferente. El objetivo se ubica por lo general en las implicaciones que conllevan el retraso o la eliminacin total de la ocurrencia de una o ms causas de mortalidad (Manton et al., 1980 y Olshansky, 1987).
Metodologa propuesta
Esta metodologa surge al reconocer que existe una fuerte conexin entre suavizar una serie de tiempo y estimar su tendencia (Guerrero y Silva, 2010). De hecho, al suavizar una serie se busca un valor central que represente el comportamiento local de la variable, y eso es lo que en esencia se busca tambin al estimar la tendencia. Debido a ello con-viene recordar algunos resultados importantes acerca de la estimacin de tendencias para series de tiempo univariadas. En ese contexto la extraccin de seal con el Filtro de Wiener y Kolmogorov, el Filtro de Kalman con suavizamiento y Mnimos Cuadrados Penalizados produce resultados que son equivalentes a los que arroja el Filtro hp que emplean los analistas de ciclos econmicos. De manera semejante se ha demos-trado que el mtodo estadstico de estimacin de mcg produce resulta-dos idnticos a los que resultan de los filtros anteriores (Guerrero, 2007). Adems, tambin se puede apreciar que el inverso de la matriz de Error Cuadrtico Medio (ecm) es la suma de dos matrices de precisin. A partir de estos hechos Guerrero propuso medir la participacin a la precisin de la tendencia estimada, que corresponde al elemento de suavidad del modelo estadstico implcito en el proceso de estimacin. Esa medida de participacin de la suavidad conduce a un ndice de suavidad que depende slo del parmetro de suavizamiento y del nme-ro de datos de la serie en estudio. Por lo tanto, dada una serie de longi-tud fija, el ndice de suavidad brinda la posibilidad de decidir el valor del parmetro de suavidad como funcin slo de un porcentaje deseado de suavidad, el cual puede elegirse en forma anticipada.
El enfoque tradicional para suavizar una serie de datos utiliza el parmetro de suavizamiento l seleccionado con ayuda de algn crite-
-
ESTUDIOS DEMOGRFICOS Y URBANOS, VOL. 28, NM. 2 (83), 2013, 429-468
438
rio numrico, por ejemplo el criterio de Akaike, conocido como aic, que se minimiza en forma automtica sin que el analista se entere de los efectos de la eleccin que surja (a este respecto vase Hastie y Tib-shirani, 1990). Sin embargo debe reconocerse que al suavizar los datos con un valor especfico de l se obtiene tambin un porcentaje de suavidad especfico para la tendencia. As pues, desde un punto de vista meramente descriptivo, un analista de los datos de la serie que aplique el suavizamiento debera, por lo menos, reportar el porcen-taje de suavidad alcanzado con el parmetro l que utilice. En esta lnea de pensamiento se considera aun mejor fijar por adelantado un monto deseado de suavidad para la tendencia, en lugar de elegir el valor de l en forma automtica. Esta idea es semejante a la que respalda la costumbre actual de fijar de antemano el nivel de confianza (digamos en 95%) para estimar parmetros en un anlisis estadstico, ya que as se pueden establecer comparaciones vlidas entre dos o ms intervalos de confianza. Este argumento se extiende en el presente trabajo al caso de fijar el porcentaje de suavidad, junto con el de estructura, que se pretende alcanzar con la estimacin de la tendencia. Lo cual es nece-sario, de nuevo, para poder establecer comparaciones vlidas. En re-sumen, lo que aqu se propone es calibrar los parmetros de suavidad y estructura que intervienen en el proceso de estimacin de la tenden-cia de datos demogrficos, de manera que se reduzca la subjetividad en el uso del procedimiento.
Es importante reconocer que el solo hecho de poder medir la suavidad con el ndice propuesto permite al analista comparar los re-sultados de dos series suavizadas no slo mediante inspeccin visual, sino numricamente. Es en este sentido que la decisin acerca de cul de las dos series tiene mayor suavidad se puede tomar objetivamente, o al menos con base en los datos disponibles, no en creencias subjeti-vas. Por estos motivos, la sugerencia que aqu se hace es usar el Filtro hpmv para estimar tendencias en datos demogrficos incorporando las ideas de suavidad y estructura. Para presentar la propuesta formal-mente se usar primero un modelo de seal ms ruido, o sea,
Yt = YtS + t [7]
donde Yt denota la variable de inters (digamos la mortalidad), YtS es
la seal, que en el presente caso representa la tendencia de la morta-lidad suavizada, y t es el ruido, que bsicamente oscurece el compor-tamiento de la tendencia, ya que en la prctica slo se observa Yt. Al
-
Guerrero y Silva, GRADUACIN NO-PARAMTRICA
439
penalizar por falta de suavidad y alejamiento de estructura respecto a Yt
S surge el siguiente problema de minimizacin:
min
YtS
(Yt YtS)2t=1
n
+ 1(d YtS)2 + 2t [8]
con dt el error aleatorio asociado con un modelo demogrfico en donde se hace uso de la variable Yt
S. Este problema es similar al que plantea Boone (2000), mediante el cual se intenta estimar ahora los valores de Yt
S como solucin de [8].Esta perspectiva consiste en definir primero un ndice de suavidad
que sirva de ayuda para elegir las constantes l1 y l2. La metodologa propuesta brinda la posibilidad de interpretar entonces los resultados de acuerdo con una teora demogrfica que permite realizar compa-raciones vlidas entre tendencias de los datos. Dicha estimacin se efecta mediante un balance de los siguientes tres elementos: los datos observados originalmente, la suavidad de la tendencia que se obtenga como resultado, y la cercana de dicha tendencia a cierta estructura terica presupuesta como meta. El modelo estadstico que se emplea surge del planteamiento de las siguientes representaciones: i) los datos observados pueden expresarse como una tendencia oscurecida por un error aleatorio; ii) el patrn de suavidad subyacente de la tendencia es de carcter polinomial de orden uno; y iii) la estructura terica que se supone como meta proviene de una fuente de informacin externa a los datos originales y sirve para incorporar una meta en los datos sua-vizados. Estas tres representaciones dan origen a las expresiones que siguen y que, en conjunto, forman el modelo
Y = YS + , ~ (0, 2 In) [9]
K2YS = e, e ~ (0,
2 In-2), E(e) = 0 [10]
y
U = YS + d, d ~ (0, 2 In), E(d) = 0, E(de) = 0 [11]
donde el smbolo ~ significa distribuido como (vector de medias, matriz de varianza-covarianza). De esta forma la ecuacin [8] expresa el vector de datos originales como un vector de valores de tendencia
-
ESTUDIOS DEMOGRFICOS Y URBANOS, VOL. 28, NM. 2 (83), 2013, 429-468
440
YS ms un vector de ruido aleatorio , con varianza de cada elemento dada por
2 . En [9] se tiene una ecuacin que induce suavidad en el
comportamiento YS al suponer un patrn polinomial de grado uno, esto es, Yt
S = 2Yt1S + Yt2
S + t para t = 3, ..., n donde et es un error alea-torio con varianza
2 . Por ltimo, en [10] se postula una experiencia demogrfica con estructura lmite o, dicho de otra manera, se hace uso de otra fuente de informacin para combinar sus datos con los que se observaron originalmente. A partir de las ecuaciones [9] a [11] se obtiene el sistema:
Y
0
U
Y
0
0
0
I
K
I
, con ,Sn
2
n
=
+
donde
=
2In 0 0
0 2In2 0
0 0 2In
[12]
Por ello, se puede emplear mcg para estimar YS y as se obtiene lo siguiente:
=
Y
Y
0
U
' 'Sn
2
n
1
n
2
n
1
n
2
n
1
=(-2In + -2K'2K 2 +-2In)-1 (-2 Y + -2InU) [13]
Entonces, si se hace 1 = 2 /2 y 2 = 2 /2, se llega a
Y
S =(In + 1K'2K 2 + 2In)-1 (Y + 2U) [14]
-
Guerrero y Silva, GRADUACIN NO-PARAMTRICA
441
que es el estimador buscado, cuya matriz de varianza-covarianza est dada por
= Var (YS)=(In + 1K'2K 2 + 2In)-12 [15]
Una manera alternativa de expresar los resultados anteriores surge al re-conocer que Y
S = M(Y + 2U) y que = M 2 con M = (In + 1K'2K 2 + 2In)
-1 M = (In + 1K'2K 2 + 2In)
-1 . Por lo tanto, si ahora se escribe
M =(In +
11+ 2
K'2K 2)-1(1+ 2)1 [16]
la ecuacin [13] puede reescribirse como
Y
S =(In + 1K'2K 2)-1(Y +(1)U), con =(1+ 2)1 [17]
Esta ltima expresin permite apreciar que YS U si 0 ,
de forma que la suavidad inducida por [10] desaparece y la tendencia converge a la estructura indicada en [11]. Por otro lado, si 1, Y
S (In + 1K'2K 2)-1Y y se obtiene entonces el resultado usual del Filtro hp. Debe notarse que el valor de a tiene que conocerse de ante-mano para calcular Y
S . Adems, esta tendencia puede interpretarse como la combinacin de dos fuentes de informacin cuyos pesos los decide implcitamente el analista al elegir el valor de la constante a. Existen dos posibles perspectivas para elegir los valores de las constan-tes de suavizamiento. La primera, llamada (A), indica elegir los valores de l1 y l2, de manera que se establezca un balance entre la suavidad y la estructura. A partir del conocimiento de l2 se obtiene el correspon-diente valor de a. La perspectiva (B), en cambio, indica elegir los va-lores de l1 y a, de manera que se tiene que decidir en principio el porcentaje de suavidad y despus cul de las dos fuentes de informacin (la observada y la propuesta como meta) tiene mayor credibilidad. Desde el punto de vista del clculo de la estimacin numrica de los valores de tendencia, el vector suavizado Y
S se puede obtener direc-tamente al aplicar el Filtro de Kalman con suavidad. Para aplicar este filtro se debe notar que los modelos [9] y [11] producen las expresio-nes siguientes, vlidas para todo valor de t,
Yt = YtS + t y Ut = YtS + t , t (0, 2 ), t (0,2), E(tt )= 0 [18]
por lo cual se sigue que
t
-
ESTUDIOS DEMOGRFICOS Y URBANOS, VOL. 28, NM. 2 (83), 2013, 429-468
442
Yt +(1)Ut = Yt
S +t +(1)YtS +(1)t == YtS + t [19]
con t = t +(1)t (0,
2) [20]y
2 = 22 +(1)22 [21]
A partir de estas ecuaciones puede escribirse un Modelo de Espa-cio de Estados con las siguientes ecuaciones de medicin y transicin, respectivamente:
Yt +(1)Ut = ct' X t + t [22]
y
X t = AtX t1 + w t , [23]
donde los vectores y matrices involucrados son de la forma
X t = Yt
S
Yt1S
, At =
2 1
1 0
,ct =1
0
y w t = t 0
[24]
Una vez expresado el modelo en forma de espacio de estados es factible utilizar el Filtro de Kalman como en Guerrero, 2008, pero en lugar de usar los datos originales Yt como en aquel artculo, ahora se hace uso de los datos combinados Yt +(1)Ut , para lo cual se re-quiere que el valor de a sea conocido.
Los ndices de suavidad y su empleo para elegir las constantes de suavizamiento
Para medir la proporcin de suavidad relativa I-2 n respecto a la pre-cisin total que se logra con el proceso de estimacin, que est dada por
2In + 2In + -2K'2K 2, se propone utilizar el ndice
(2In;2In + 2In + -2K'2K 2)= tr[2In(2In + 2In + -2K'2K 2)1]/n [25]
en donde tr(.) denote la traza de una matriz, mientras que 2In,
2In y -2K'2K 2 son matrices positivas definidas de dimensin n n.
-
Guerrero y Silva, GRADUACIN NO-PARAMTRICA
443
Este ndice es una medida que cuantifica la precisin relativa y que tiene las siguientes cuatro propiedades: 1) toma valores dentro del intervalo (0, 1), de manera que puede interpretarse como una propor-cin propia; 2) es invariante bajo transformaciones lineales de la varia-ble Y involucrada, por lo cual los resultados son vlidos aun si se transforma la variable linealmente; 3) se comporta en forma lineal, de manera que pueden aplicarse directamente herramientas de lgebra lineal para hacer los clculos necesarios; 4) la suma de las precisiones relativas es la unidad, lo cual significa que
(2In;2In + 2In + -2K'2K 2)+ (2In;2In + 2In + -2K'2K 2)
+(-2K'2K 2;2In + 2In + -2K'2K 2)= 1 [26]
La demostracin de que es la nica medida escalar que cumple con las cuatro propiedades enunciadas previamente, se sigue de la prueba que aparece en Theil, 1963, para el caso de dos matrices po-sitivas definidas A y B, donde el ndice est dado por (A; A+B). Lo que se requiere para adaptar la prueba a la situacin presente es re-conocer que, por ejemplo, ahora
2In juega el papel de A y la matriz
2In + 2K'2K 2 juega el de B. Este ndice es til para cuantificar la
precisin relativa atribuible a la suavidad y a la estructura inducida en el modelo, que forman parte de la matriz de precisin 1 dada por el inverso de [15]. En consecuencia, se define el ndice de suavidad
S (1, 2; n)= tr[2K'2K 2(2In + 2K'2K 2 + 2In)-1]/n
=1 tr[(In + K'2K 2)-1]/n [27]
con
=(2 + 2)12 = 1(1+ 2)1 = 1. [28]
Ahora bien, como el parmetro l est asociado con la suavidad de aY + (1 a)U, su valor se puede elegir con la ayuda del ndice de suavidad S(l1, l2; n). Posteriormente, ya que el parmetro l1 se asocia con la suavidad de los datos originales Y, puede obtenerse a partir de los valores de l y a; esto se debe a que l1 = l/ a con a > 0. Otra forma de seleccionar los parmetros necesarios comienza por elegir a l1 de manera que se fije la suavidad deseada para Y y despus se elige el
-
ESTUDIOS DEMOGRFICOS Y URBANOS, VOL. 28, NM. 2 (83), 2013, 429-468
444
valor de a (0,1) entonces se deduce el valor de l = a l1 que sirve para determinar la suavidad de la combinacin convexa a Y + (1 a)U.
Debe notarse que el porcentaje de suavidad para Y debe ser mayor o igual que el de la combinacin debido a que: i) l = a l1 l1, pues 0 < a 1, y ii) el ndice de suavidad es una funcin montona creciente de l. Adems, el parmetro l1 se elige a partir del ndice de suavidad S(l1; n) = 1 tr[(In + 1 K'2K 2)
-1]/n , el cual se asocia con la suavidad de Y, pues-to que equivale a usar el ndice de suavidad aplicable a aY + (1 a)U cuando a =1, en cuyo caso l2 = 0 y el estimador de la tendencia resulta ser Y
S =(In + 1K'2K 2)1 Y. Desde luego, para incluir tanto la suavidad como la estructura demogrfica en la solucin, se debe elegir a (0,1), de manera que se obtenga l2 > 0 y se utilice el estimador dado por
YS =(In + 1K'2K 2)1 (aY + (1 a)U). Por ltimo, es importante hacer
la siguiente aclaracin acerca del mximo porcentaje de suavidad que puede lograrse con un conjunto de datos determinado. Debido a que
tr[(In + K'dK d)1] d conforme l con d el orden de las diferencias
en la matriz Kd (Eilers y Marx, 1996: 94), se sigue que la mxima suavidad que se puede alcanzar con n observaciones cumple con S(l; n) 1-d/n conforme l . Este resultado es til para conocer de manera anticipa-da el mximo porcentaje de suavidad que es factible alcanzar en aplica-ciones prcticas y con base en ello decidir la suavidad deseada para la tendencia.
A continuacin se muestra la estrategia para suavizar un conjunto de datos { Y1, ..., YN } con el Filtro hpmv, de manera que se incorpore la informacin de los datos de estructura demogrfica { U1, ..., UN }. Se aplican las siguientes etapas, las cuales difieren slo en la segunda para las perspectivas (A) y (B): 1. Suavizar los datos { Y1, ..., YN } sin conside-rar la existencia de { U1, ..., UN }. Para esto se fija primero un porcen-taje de suavidad deseado para la tendencia y se aplica el procedimien-to de Guerrero, 2008. Como resultado se deduce el valor de l1 y se obtiene la tendencia con suavidad de 100S(l1; n)% (por ejemplo, de 80%). 2. A. Decidir el porcentaje de suavidad que ser intercambiado por estructura de manera que el porcentaje de suavidad de la tenden-cia se reduzca (digamos de 80% a 75%). Para lograr esto se fija el valor de 100S(l1, l2; n)% y se obtiene el valor que corresponda para a (0,1). 2. B. Decidir la credibilidad que se le asigna a cada una de las estruc-turas de datos disponibles (la observada y la considerada como meta) al fijar el valor de a (0,1), y simplemente medir la suavidad que se haya obtenido como resultado. 3. Aplicar el procedimiento de suavi-zamiento con estructura mediante la aplicacin del Filtro de Kalman
-
Guerrero y Silva, GRADUACIN NO-PARAMTRICA
445
al conjunto de datos { aYt + (1 a)Ut }. El suavizamiento que se logre con esto tendr suavidad de 100S(l1, l2; n)% y porcentaje de estruc-tura (es decir, cercana a U) de 100[S(l1; n) -S(l1, l2; n)]%.
Aplicaciones a datos demogrficos de Mxico
En las siguientes aplicaciones se ilustran las dos perspectivas que se sugieren en el marco terico del trabajo. Por un lado, se presentan ejemplos donde se combinan fuentes de informacin para obtener tendencias estimadas a partir del nivel de credibilidad que el analista otorgue a cada fuente. Por otra parte, se presentan aplicaciones donde se maneja una estructura por edades de un indicador demogrfico para algn pas que est en su ltima etapa de transicin demogrfica y se considera a esta estructura como meta futura, a la cual se pretende que aspire la situacin actual mexicana para un determinado horizon-te de previsin. De acuerdo con estas dos perspectivas, se rebasa la eventual dificultad que pudiese representar la distinta longitud de las series de indicadores demogrficos utilizados, gracias a la utilizacin del Filtro de Kalman. En general se hablar de tendencias en un sen-tido amplio y no exclusivamente en trminos predictivos.
Mortalidad en la Ciudad de Mxico en el siglo xviii
Se muestra que la metodologa presentada constituye una herramien-ta til en la tarea de aproximar la mortalidad de la poblacin de la Ciudad de Mxico en el siglo xviii. Se tienen datos de naturaleza pa-leodemogrfica que se obtuvieron en dos momentos diferentes: 1976 y 1982 (Hernndez, 1999). Tales datos fueron generados a partir de restos seos ubicados en la Catedral Metropolitana de la Ciudad de Mxico. En el primer momento de 1976 se observ un total de 1 642 individuos, con una esperanza de vida promedio de 24 aos. Estos restos corresponden a una poblacin civil integrada mayoritariamente por criollos y espaoles peninsulares, y en menor medida por mestizos e indgenas (Mrquez y Civera, 1987). El segundo momento fue en 1982, cuando se tuvo acceso a una serie de datos de restos para otra poblacin civil, principalmente mestiza y probablemente contempo-rneos a los estudiados en 1976. Estos ltimos con una esperanza de vida de 22.6 aos (Hernndez, 1991).
-
CMT8
2
0-4
10-14
20-24
30-34
40-44
50-54
60-64
65+
0.5
Log(qx)
Eda
des
0.5
2.5
1.0
2.0
3.0
1.50.0
CMT7
6
GR
FI
CA
1
Mor
talid
ad e
n la
Ciu
dad
de M
xic
o en
el s
iglo
xviii c
on C
MT
76 y
CM
T82
Fue
nt
e: L
ogar
itm
os d
e ta
sas
de m
orta
lidad
de
Her
nn
dez,
P. (
1999
),
Los
est
udio
s pa
leod
emog
rfi
cos
en M
xic
o, R
evis
ta A
rgen
tina
de A
ntro
polo
ga
Bio
lgi
ca, v
ol. 2
, pp.
335
-355
.
-
GR
FI
CA
2
Ten
denc
ia e
stim
ada
para
los
dato
s de
198
2
Fue
nt
e: C
lcu
los
prop
ios
y lo
gari
tmos
de
tasa
s de
mor
talid
ad d
e H
ern
nde
z, 1
999.
Tend
enci
a
0-4
10-1
420
-24
30-3
440
-44
50-5
460
-64
65+
0.5
N =
14,
sua
vida
d =
70.0
% y
lam
bda1
= 7
.0Log(qx)
Eda
des
0.5
2.5
1.0
2.0
3.0
1.50.0
CM
T76
-
ESTUDIOS DEMOGRFICOS Y URBANOS, VOL. 28, NM. 2 (83), 2013, 429-468
448
La idea es estimar una tendencia nica que proporcione una visin de la mortalidad en dicho siglo en la Ciudad de Mxico, es decir, se pretende combinar la informacin generada en ambos momentos. Al hacer esto se puede otorgar mayor o menor credibilidad a las fuentes de acuerdo con las creencias o conocimientos que tenga a priori el analista. En la grfica 1, donde se usan logaritmos de la mortalidad (Log(qx)), se aprecia que el tamao de las series es distinto. Sin em-bargo esto no representa un problema adicional, pues con la metodo-loga propuesta se genera una tendencia tan larga como sea la serie de mayor longitud, en este caso la de 1976. Se puede apreciar que las tasas de mortalidad de 1976 son ms bajas desde los 20-24 aos de edad que con la base de datos recabados en 1982 y ocurre a la inversa para antes de los 20 aos de edad. Se decidi iniciar el procedimiento con los datos de la serie ms reciente, es decir, con los correspondientes a 1982 (CMT82). Cabe advertir que se podra haber elegido como datos iniciales los de 1976 (CMT76) y se tendra una gran similitud de los resultados en general. Con 70% de suavidad, se puede apreciar en la grfica 2 la tendencia de dichos datos y, con base en la tendencia esti-mada, se podra apreciar cules hubiesen sido los niveles de mortalidad para grupos de edades que rebasan incluso los que no se estimaron en dicha fuente.
Si se estima la tendencia considerando la mortalidad de 1976 se observa en la grfica 3 que el procedimiento trata de conciliar las dos fuentes y que se preservan las caractersticas de ambas tendencias. Al intercambiar suavidad por estructura, se eligi 65% de suavidad y, en este caso, se otorg la misma credibilidad a ambas fuentes, i. e., se us a = 0.50.
La propuesta metodolgica de ninguna manera excluye la posibi-lidad de que el analista decida asignar distinta credibilidad a las fuen-tes, con base en sus conocimientos adicionales derivados de su cercana con el tema de investigacin. As pues, con fines puramente ilustrativos se supondr que se desea otorgar distinta credibilidad a las fuentes y con ello se puede apreciar que la tendencia estimada se apega ms a la fuente que el analista considera ms confiable. En primer lugar, al otorgar mayor credibilidad a los datos de 1976 con a = 0.20 se obtiene la grfica 4. Posteriormente se asigna mayor credibilidad a los de 1982 al elegir a = 0.80 y se obtiene la grfica 5. As pues, la credibilidad de las fuentes se otorga mediante el valor del parmetro a de la expresin [17], de manera que una situacin neutra o de misma credibilidad para ambas fuentes conduce a utilizar a = 0.50.
-
Tend
enci
a
0-4
10-1
420
-24
30-3
440
-44
50-5
460
-64
65+
0.5
N =
14,
sua
vida
d =
65.0
%, l
ambd
a =
4.0,
alfa
= 0
.50
Log(qx)
Eda
des
0.5
2.5
1.0
2.0
3.0
1.50.0
CM
T76
CM
T82
GR
FI
CA
3
Ten
denc
ia e
stim
ada
con
amba
s fu
ente
s de
info
rmac
in:
197
6 y
1982
Fue
nt
e: C
lcu
los
prop
ios
y lo
gari
tmos
de
tasa
s de
mor
talid
ad d
e H
ern
nde
z, 1
999.
-
0-4
10-1
420
-24
30-3
440
-44
50-5
460
-64
65+
0.5
N =
14,
sua
vida
d =
65.0
%, l
ambd
a =
4.0,
alfa
= 0
.80
Log(qx)
Eda
des
0.5
2.5
1.0
2.0
3.0
1.50.0
Tend
enci
aC
MT7
6
CM
T82
GR
FI
CA
4
Ten
denc
ia e
stim
ada
con
may
or c
redi
bilid
ad a
sign
ada
a lo
s da
tos
de 1
976
Fue
nt
e: C
lcu
los
prop
ios
y lo
gari
tmos
de
tasa
s de
mor
talid
ad d
e H
ern
nde
z, 1
999.
-
0-4
10-1
420
-24
30-3
440
-44
50-5
460
-64
65+
0.5
N =
14,
sua
vida
d =
65.0
%, l
ambd
a =
4.0,
alfa
= 0
.20
Log(qx)
Eda
des
0.5
2.5
1.0
2.0
3.0
1.50.0
Tend
enci
aC
MT7
6
CM
T82
GR
FI
CA
5
Ten
denc
ia e
stim
ada
con
may
or c
redi
bilid
ad e
n lo
s da
tos
de 1
982
Fue
nt
e: C
lcu
los
prop
ios
y lo
gari
tmos
de
tasa
s de
mor
talid
ad d
e H
ern
nde
z, 1
999.
-
ESTUDIOS DEMOGRFICOS Y URBANOS, VOL. 28, NM. 2 (83), 2013, 429-468
452
Hacia una fecundidad tpica de la cuarta etapa de la transicin demogrfica
Por medio de la presente propuesta metodolgica es posible hacer aplicaciones tocantes a la fecundidad, por ejemplo considerar la fe-cundidad masculina mexicana en relacin con la de otro pas ms avanzado en su transicin demogrfica, o bien estimar la fecundidad mixta a partir de los reportes de la fecundidad femenina y masculina existentes en Mxico (Quilodrn y Sosa, 2001). En particular, en la aplicacin de esta seccin se emplean las tasas especficas de fecundi-dad de Suecia de 2006 y se les visua-liza como una meta de estructura demogrfica de fecundidad que se aspirara fuera alcanzada por todas las edades de la poblacin femeni-na de Mxico en un horizonte de n dcadas. Para el caso mexicano se parte de estimaciones de Conapo, 2006.
En la grfica 6 se aprecia la diferencia estructural entre ambas experiencias de fecundidad. La mexicana es asimtrica a la derecha y parece bimodal, mientras que la sueca es sencillamente simtrica. Tambin se observa que las colas de la distribucin sueca son ms consistentes con lo que plantea la teora al inicio y al final de las edades fecundas. Dentro de este mismo rubro, en el caso mexicano se podra pensar que el registro de fecundidad no obedece necesariamente a los mejores estndares del mundo o, al menos, es claro que difiere bas-tante del de Suecia.
En este ejemplo se eligen como datos iniciales a los de Mxico y se estima su tendencia con suavidad de 75%. Como se advierte en la grfica 7, la tendencia estimada queda ligeramente por encima para las edades iniciales, en la parte superior la situacin de aparente bimo-dalidad se atena, y al final de las edades la estimacin se vuelve suave, pero la condicin de asimetra se preserva. Como se expone en el al-goritmo del procedimiento, ahora se reemplaza cierto porcentaje de suavidad por estructura. En este caso, al intercambiar suavidad por estructura, la grfica 8 muestra que se alcanza una suavidad de 70.9 por ciento.
De esta manera se percibe la estructura a la que podra aspirar la fecundidad mexicana en cierto horizonte de dcadas por definir, en relacin con la estructura sueca. Es importante notar que la tendencia estimada busca apegarse a la estructura sueca sin alejarse por comple-to de la estructura mexicana. Debe ser claro que el horizonte asociado con la transicin de una estructura a otra depende en gran medida de
-
TEF
Eda
des
Mxico
Sue
cia
15
0.15
0
0.12
5
0.10
0
0.07
5
0.05
0
0.02
5
0.00
017
1921
2325
2729
3133
3537
3941
4345
4749
GR
FI
CA
6
Tas
as e
spec
fica
s de
fec
undi
dad
Fue
nt
e: T
asas
esp
ecfi
cas
de fe
cun
dida
d de
Sue
cia
de 2
006,
dis
pon
ible
en
y C
onap
o, 2
006,
Ind
icad
o-re
s de
mog
rfic
os b
sic
os, M
xic
o
(11
de
mar
zo d
e 20
06).
-
TEF
Eda
des
Mx
ico
Tend
enci
a
15
0.15
0
0.12
5
0.10
0
0.07
5
0.05
0
0.02
5
0.00
017
1921
2325
2729
3133
3537
3941
4345
4749
N =
35,
sua
vida
df=
75.0
% y
lam
bda1
= 8
.0
GR
FI
CA
7
Ten
denc
ia in
icia
l con
dat
os d
e M
xic
o, 2
006
Fue
nt
e: C
lcu
los
prop
ios
y C
onap
o, 2
006.
-
TEF
Eda
des
Mx
ico
Tend
enci
a
Sue
cia
15
0.15
0
0.12
5
0.10
0
0.07
5
0.05
0
0.02
5
0.00
017
1921
2325
2729
3133
3537
3941
4345
4749
N =
35,
sua
vida
d= 7
0.9%
y la
mbd
a =
4.0,
alfa
= 0
.50
GR
FI
CA
8
Ten
denc
ia e
stim
ada
con
las
estr
uctu
ras
de f
ecun
dida
d de
Mx
ico
y Su
ecia
Fue
nt
e: C
lcu
los
prop
ios
con
dat
os d
el C
onap
o, 2
006
y .
-
ESTUDIOS DEMOGRFICOS Y URBANOS, VOL. 28, NM. 2 (83), 2013, 429-468
456
la agudeza y del conocimiento que el analista tenga sobre el tema. Ntese que la tasa especfica de fecundidad en edad 15 es la misma entre la tendencia y la mexicana, y tambin se podra decir que la masa de la funcin de distribucin de las probabilidades de fecundidad se redistribuye en un rango ms amplio de edades. Desde luego esta es-tructura conllevara nuevos retos en cuanto a las polticas de salud pblica de los mexicanos, entre otras muchas implicaciones.
Estimaciones de mortalidad infantil en Mxico (1990-2020)
La tasa de mortalidad infantil tiene un gran impacto en el clculo de la esperanza de vida al nacer y constituye un indicador del desarrollo social y econmico de un pas. Por ello las discrepancias que pudieran existir entre distintas fuentes sobre este indicador pueden conducir a diferentes perspectivas sobre la situacin real en determinada nacin. As pues, se considera oportuno hacer una aplicacin que combine dos fuentes de informacin respecto de la mortalidad infantil para el caso mexicano. En primer trmino se emplean las estimaciones de Aguirre (2009), y en segundo las que elabor Conapo (2010). La lon-gitud de las series es distinta en cada caso, por lo que la estimacin de la tendencia con la metodologa propuesta ser tan larga como la serie de Conapo.
Una vez realizada la estimacin de la tendencia con determinado porcentaje de suavidad, se contrastan los resultados con las cifras que reporta la Secretara de Salud (ss). De esta manera, en principio se genera una estimacin de la tendencia de la mortalidad infantil en Mxico para el periodo 1990 a 2020. Como se ilustra en la grfica 9, desde 1990 hasta 2005 las estimaciones que elabor Conapo superan a las de Aguirre: la diferencia es ms elevada al inicio y se reduce hacia 2005. Por otro lado, se observa que los datos de la Secretaria de Salud de 2000 a 2008 no presentan claramente una tendencia similar a la de las otras dos fuentes; de hecho parece que el valor de este indicador es relativamente constante durante el periodo de referencia.
Para esta aplicacin se eligieron como datos iniciales los de la serie de estimaciones de Aguirre, que incluye una cantidad de datos menor que la de Conapo. Se propuso entonces una suavidad de 75% y, como se observa en la grfica 10, se genera una tendencia cuya curvatura es acorde con las previsiones que elabor dicho especialista. Como valor agregado se obtienen estimaciones subsecuentes, o vistos de otra forma,
-
Guerrero y Silva, GRADUACIN NO-PARAMTRICA
457
pronsticos de la tasa de mortalidad infantil desde 2006 hasta 2020. Ntese que esto ocurre como consecuencia de la extensin de la serie de Conapo y del uso del Filtro de Kalman.
Al intercambiar una parte del porcentaje de suavidad inicial de 75% por estructura, se obtiene una suavidad final de 70.6%, como se presenta en la grfica 11. Por otra parte, se decidi brindar la misma credibilidad a ambas fuentes de informacin, es decir, se eligi a = 0.50. Con estos parmetros se genera una tendencia que cubre el periodo de 1990 a 2020, donde se aprecia un cruce entre la tendencia estimada y las proyecciones de Conapo de 2014 y 2015. Asimismo, las cifras que reporta la Secretaria de Salud muestran una dinmica distinta de la tendencia estimada a partir de las fuentes iniciales, aunque tambin se produce un cruce en el ao 2001.
Hacia una mortalidad tpica de la cuarta etapa de la transicin demogrfica
Para elaborar proyecciones de poblacin desde una perspectiva demo-grfica el mtodo ms empleado es el de Componentes, segn se mencion en la tercera seccin. Con este mtodo, de manera resumi-da, se proyectan las variables demogrficas de mortalidad, fecundidad y migracin, y se generan escenarios sobre lo que se espera en el futu-ro con base en el conocimiento y la experiencia del analista. Dentro de la tarea predictiva de la variable de mortalidad existen varias alter-nativas, como son: el uso de tablas lmite de mortalidad, la suposicin de determinado comportamiento de mortalidad dentro de un contexto ubicado en la ltima parte de la transicin demogrfica, etctera. Es en este espacio donde tambin se tiene oportunidad de aplicar la propuesta metodolgica de manera natural.
En este ejemplo se presenta una estimacin de estructura con suavidad de mortalidad mediante una tendencia generada para la experiencia mexicana de 2010 (mxh10) y la japonesa de 2008 (jph08), en el supuesto de que en cierto horizonte de H dcadas se presen-tar tal comportamiento. Para hacer la aplicacin se usan las tasas especficas de mortalidad por sexo que elabor Conapo (2010) y para Japn las de la base de datos de . En otras palabras, se estima la tendencia de manera que el escenario actual mexicano aspire al escenario de Japn. Cabe advertir que se tienen resultados anlogos tanto de estructura como de suavidad al hacer la
-
TMI
40 35 30 25 20 15 10 5
Ao
s19
9019
9219
9419
9619
9820
0020
0220
0420
0620
0820
1020
1220
1420
1620
1820
20
Agu
irre
SS
Con
apo
GR
FI
CA
9
Tas
as d
e m
orta
lidad
infa
ntil
en M
xic
o co
n tr
es f
uent
es d
isti
ntas
Fue
nt
e: A
guir
re, A
. (20
09),
L
a m
orta
lidad
infa
nti
l y la
mor
talid
ad m
ater
na
en e
l sig
lo x
xi
, Pap
eles
de
Pobl
aci
n, n
m. 1
5, p
p. 7
5-99
; C
onap
o (2
010)
, Ind
icad
ores
dem
ogr
ficos
bs
icos
, Mx
ico,
Con
sejo
Nac
ion
al d
e Po
blac
in
, dis
pon
ible
en
(11
de
ago
sto
de 2
010)
y d
atos
de
la S
ecre
tar
a de
Sal
ud, 2
000-
2008
, dis
pon
ible
en
(1
1 de
ago
s-to
de
2010
).
-
TMI
40 35 30 25 20 15 10 5
Ao
s19
9019
9219
9419
9619
9820
0020
0220
0420
0620
0820
1020
1220
1420
1620
1820
20
N =
31,
sua
vida
d =
75.0
% y
lam
bda1
= 8
.0
Agu
irre
Tend
enci
a
GR
FI
CA
10
Ten
denc
ia in
icia
l con
dat
os d
e A
guir
re
Fue
nt
e: C
lcu
los
prop
ios
con
dat
os d
e A
guir
re, 2
009.
-
TMI
40 35 30 25 20 15 10 5
Ao
s19
9019
9219
9419
9619
9820
0020
0220
0420
0620
0820
1020
1220
1420
1620
1820
20
N =
31,
sua
vida
d =
70.6
%, l
ambd
a =
4.0,
alfa
= 0
.50
Agu
irre
Tend
enci
aS
SC
onap
o
GR
FI
CA
11
Ten
denc
ia e
stim
ada
con
las
fuen
tes
de in
form
aci
n de
Agu
irre
y C
onap
o co
mbi
nada
s
Fue
nt
e: C
lcu
los
prop
ios
con
dat
os d
e A
guir
re, 2
009
y C
onap
o, 2
010.
-
Guerrero y Silva, GRADUACIN NO-PARAMTRICA
461
aplicacin con datos del sexo femenino o bien para el total de la po-blacin.
Conviene destacar algunos detalles de la grfica 12, por ejemplo que la serie de Japn llega hasta los 110 aos, mientras que la mexica-na se queda en 100 (pese a ello la metodologa es aplicable); adems, en ambas experiencias de mortalidad se presenta el comportamiento tpico de las distintas etapas de la vida, como se ha propuesto en la li-teratura (Thiele, 1871; Heligman y Pollard, 1980), y tambin se obser-va que en casi todo el rango de las series la mortalidad japonesa es inferior hasta el entorno de los 85 aos de edad, desde donde la mexicana se vuelve ms baja. En este sentido se debe tomar en cuenta que lo que se considera como experiencia mexicana son estimaciones, no datos observados, por lo cual tambin se explica la suavidad de la serie mexicana frente a la japonesa (sin que se haya aplicado el mto-do aqu propuesto a los datos nacionales). Por ltimo, la serie japone-sa a partir de los 85 aos presenta una ligera curvatura, semejante a las respectivas experiencias de mortalidad que se observan en algunos pases altamente desarrollados y que se han documentado ampliamen-te en la literatura demogrfica (vase Ham, 2005).
No se requiere una suavidad alta para estimar la tendencia de la serie mexicana, y con 65% de suavidad se obtienen resultados satisfac-torios (vase la grfica 13). Por medio de la aplicacin de la metodo-loga, la tendencia llega hasta los 110 aos de edad, lmite de edad mximo de la serie japonesa, y la estimacin para nios menores de un ao queda ligeramente baja.
Posteriormente, al asignar la misma credibilidad a ambas fuentes de informacin, es decir, al usar a = 0.50, se intercambia la suavidad por la estructura y la suavidad se reduce aproximadamente a 60%, con lo cual se obtiene la tendencia que muestra la grfica 14.
Una vez estimada la tendencia se puede advertir cmo podra sera la mortalidad mexicana en el horizonte futuro prefijado por el analis-ta. En esencia, la estimacin resultante es una mezcla entre ambas estructuras y con curvatura en edades jvenes. Sin embargo el efecto de mezcla no va ms all de los 85 aos, y si se quisiera lograr ese efec-to se tendra que asignar otro valor al parmetro a (pero se considera que Mxico dista mucho de alcanzar una estructura de tal naturaleza).
-
TEM
5.0
7.5
10.0
2.50.0
1040
3050
MXH10
JPH08
6070
8090
100
110
20
GR
FI
CA
12
Tas
as e
spec
fica
s de
mor
talid
ad m
ascu
lina
para
Mx
ico
en 2
010
y Ja
pn
en 2
008
Fue
nt
e: C
onap
o (2
010)
, Ind
icad
ores
dem
ogr
ficos
bs
icos
, Mx
ico,
Con
sejo
Nac
ion
al d
e Po
blac
in
, dis
pon
ible
en
(11
de
agos
to d
e 20
10),
y p
ara
Jap
n d
ispo
nib
le e
n la
bas
e de
dat
os
(11
de
agos
to d
e 20
10).
-
GR
FI
CA
13
Ten
denc
ia in
icia
l par
a la
s ta
sas
espe
cfi
cas
de m
orta
lidad
mas
culin
a en
Mx
ico
Fue
nt
e: C
lcu
los
prop
ios
y C
onap
o, 2
010.
TEM
5.0
7.5
10.
0
2.50.0
1040
3050
MX
H10
Ten
denc
ia
60
Eda
des
7080
9010
011
020
N =
110
, sua
vida
d =
65.0
% y
lam
bda1
= 2
.0
-
GR
FI
CA
14
Ten
denc
ia e
stim
ada
con
fuen
tes
de in
form
aci
n m
exic
ana
y ja
pone
sa
Fue
nt
e: C
lcu
los
prop
ios
con
dat
os d
e C
onap
o, 2
010
y
.
TEM
5.0
7.5
10.
0
2.50.0
1040
3050
MX
H10
Ten
denc
iaJP
H08
60
Eda
des
7080
9010
011
020
N =
110
, sua
vida
d =
60.0
%, l
ambd
a =
1.0,
alfa
= 0
.50
-
Guerrero y Silva, GRADUACIN NO-PARAMTRICA
465
Conclusiones
La metodologa que se describe en este trabajo puede utilizarse para estimar tendencias de datos demogrficos que tengan en cuenta la fidelidad a los datos, as como la suavidad que se desea y la estructura proveniente de alguna teora, o bien, que se le pueda considerar como una meta que se aspire alcanzar en algn horizonte futuro. El control que el analista puede tener sobre estas caractersticas de la tendencia, de acuerdo con sus intereses y su conocimiento del fenmeno, hacen que los resultados sean comparables en distintos anlisis. Debido a su facilidad de implementacin en paquetes del tipo Matlab o R o rats (en particular se utiliz rats y los programas estn disponibles a soli-citud del interesado), es factible que el mtodo sea utilizado por ana-listas con poca experiencia o con deficiente formacin demogrfica, por lo que se es un punto a cuidar en la prctica, porque los resulta-dos que se obtengan dependern fuertemente de los insumos que se usen, es decir, de los datos originales y de la teora o meta propuesta. Adems debe tenerse en mente que es el analista quien decide cul de las dos perspectivas de la metodologa debe utilizarse en cada caso.
En las aplicaciones aqu mostradas, as como en otras realizadas con la metodologa propuesta, se ha observado que el mtodo produ-ce mejores resultados en tanto mayor sea la desagregacin de los indi-cadores demogrficos. Es de resaltar el hecho de que la metodologa puede aplicarse sin dificultad alguna, aunque la longitud de las series que se combinen no sea la misma o incluso si se presenta la situacin de datos faltantes; esto se debe al uso del Filtro de Kalman con suavi-zamiento, que en los casos mencionados (longitud distinta de las series o datos faltantes) se aplica automticamente por el procedimiento sin realizar en realidad el suavizamiento, sino slo el filtrado. Es posible extender la propuesta metodolgica para incorporar ms fuentes de informacin, sin embargo ello representa una nueva lnea de investi-gacin en la cual los autores estn trabajando actualmente. De igual manera, una lnea futura de investigacin la constituye una extensin del mtodo a casos en que sea necesario aplicar diferentes suavidades o estructuras por rangos de edades de la poblacin. Finalmente se evidencia, de acuerdo con el criterio de los autores, que la herramien-ta metodolgica propuesta representa una herramienta alternativa ms para desarrollar diferentes estudios cuantitativos relacionados con distintos fenmenos demogrficos, en el sentido de complementar o potenciar lo hasta ahora existente en la literatura especializada. En
-
ESTUDIOS DEMOGRFICOS Y URBANOS, VOL. 28, NM. 2 (83), 2013, 429-468
466
concreto, un problema demogrfico que se podra resolver con el empleo de la presente propuesta es el de la llamada conciliacin demogrfica. Adicionalmente, y si as se deseara, se podra calcular la varianza de la estimacin de acuerdo con la expresin [15].
Bibliografa
Aguirre, A. (2009), La mortalidad infantil y la mortalidad materna en el siglo xxi, Papeles de Poblacin, nm. 15, pp. 75-99.
Bell, F. y M. Miller (2005), Life Tables for the United States Social Security Area 1900-2100, Actuarial Study, nm. 120, us Social Security Administra-tion, (11 de febrero de 2010).
Boone, L. (2000), Comparing Semi-Structural Methods to Estimate Unob-served Variables: The hpmv and Kalman Filters Approaches, Economics Department Working Papers, nm. 240, ocde.
Bourgeois-Pichat, J. (1952), Essai sur la mortalit biologique de lhomme, Population, vol. 7, nm. 3, pp. 381-394.
Conapo (2006), Indicadores demogrficos bsicos, Mxico, Consejo Nacional de Poblacin (11 de marzo de 2010).
Conapo (2010), Indicadores demogrficos bsicos, Mxico, Consejo Nacional de Poblacin (11 de agosto de 2010).
Copas, J. y S. Haberman (1983), Non Parametric Graduation Using Kernel Methods, Journal of the Institute of Actuaries, nm. 110, pp. 135-156.
Debn, A., F. Montes y R. Sala (2006), A Comparison of Nonparametric Methods in the Graduation of Mortality: Application to Data from the Valencia Region (Spain), International Statistical Review, nm. 74, pp. 215-233.
Eilers, P. y B. Marx (1996), Flexible Smoothing with B-Splines and Penalties, Statistical Science, nm. 11, pp. 89-121.
Fledelius, P., M. Guillen, J. Nielsen y K. Petersen (2004), A Comparative Stu-dy of Parametric and Nonparametric Estimators of Old-Age Mortality in Sweden, Journal of Actuarial Practice, nm. 11, pp. 101-126.
Galindo, C. y M. Ordorica (2007), Estimacin de nacimientos ocurridos y registrados, Mxico 1950-2000, Papeles de Poblacin, nm. 54, pp. 39-86.
George, V., S. Smith, D. Swason y J. Tayman (2004), The Methods and Mate-rials of Demography, en J. Siegel y D. Swanson (coords.), Population Projections, San Diego, Elsevier Academic Press.
Guerrero, V.M. (2007), Time Series Smoothing by Penalized Least Squares, Statistics and Probability Letters, nm. 77, pp. 1225-1234.
Guerrero, V.M. (2008), Estimating Trends with Percentage of Smoothness Chosen by the User, International Statistical Review, nm. 76, pp. 187-202.
-
Guerrero y Silva, GRADUACIN NO-PARAMTRICA
467
Guerrero, V.M. y E. Silva (2010), Non-parametric and Structured Graduation of Mortality Rates, Population Review, nm. 49, pp. 13-26.
Guerrero, V.M., R. Jurez y P. Poncela (2001), Data Graduation Based on Statistical Time Series Methods, Statistics and Probability Letters, nm. 52, pp. 169-175.
Haberman, S. y A. Renshaw (1996), Generalized Linear Models and Actuarial Science, The Statistician, nm. 45, pp. 407-436.
Ham, R. (2005), La supervivencia ms all de 100 aos y ms, Estudios Demo-grficos y Urbanos, vol. 20, nm. 1 (58), pp. 103-124. Disponible en .
Hastie, T. y R. Tibshirani (1990), Generalized Additive Models, Londres, Chapman and Hall.
Heligman, L. y H. Pollard (1980), The Age Pattern of Mortality, Journal of the Institute of Actuaries, nm. 107, pp. 49-80.
Hernndez, P. (1991), Los restos seos del atrio de la Catedral metropolitana. Temporada 1982. Mxico, tesis, Mxico, Escuela Nacional de Antropo-loga e Historia.
Hernndez, P. (1999), Los estudios paleodemogrficos en Mxico, Revista Argentina de Antropologa Biolgica, nm. 2, pp. 335-355.
Hodrick, R. y E. Prescott (1997), Post-War U.S. Business Cycles: An Empirical Investigation, Journal of Money, Credit and Banking, nm. 29, pp. 1-16.
Laxton, D. y R. Tetlow (1992), A Simple Multivariate Filter for the Measurement of Potential Output, Technical Report, nm. 59, Ottawa, Bank of Canada.
Lee, R. y L. Carter (1992), Modeling and Forecasting U.S. Mortality, Journal of the American Statistical Association, nm. 87, pp. 659-675.
London, D. (1985), Graduation: The Revision of Estimates, Reno, actex Publica-tions.
Manton, K., C. Patrick y E. Stallard (1980), Mortality Model Based on Delays in Progression of Chronic Diseases: Alternative to Cause Elimination Model, Public Health Reports, nm. 95, pp. 580-588.
Mrquez, L. y M. Civera (1987), Paleodemografa de una muestra de poblacin del periodo colonial mexicano. Estudios de Antropologa Biolgica, III Coloquio de Antropologa Fsica Juan Comas, Mxico, unam, pp. 405-417.
Oeppen, J. y J. Vaupel (2002), Broken Limits to Life Expectancy, Science, nm. 296, pp. 1029-1031.
Olshansky, S.J. (1987), Simultaneous/multiple Cause-delay (simcad): An Epidemiological Approach to Projecting Mortality, Journal of Gerontology, nm. 42, pp. 358-365.
Olshansky, S.J. (1988), On Forecasting Mortality, Milbank Quarterly, nm. 66, pp. 482-530.
Olshansky, S.J., B. Carnes y C. Cassel (1990), In Search of Methuselah: Estima-ting the Upper Limits to Human Longevity, Science, nm. 250, pp. 634-640.
Olshansky, S., B. Carnes y A. Dsesquelles (2001), Prospects for Human Lon-gevity in an Aging World, Science, nm. 291, pp. 14911492.
-
ESTUDIOS DEMOGRFICOS Y URBANOS, VOL. 28, NM. 2 (83), 2013, 429-468
468
Ordorica, M. (2001), Hoy. Un momento importante para revisar las estima-ciones demogrficas, Papeles de Poblacin, nm. 28, pp. 155-163.
Ortega, A. (2003), La paleodemografa: un instrumento para simular el comportamiento demogrfico del pasado? Anlisis comparativo con la demografa histrica en la Ciudad de Mxico del siglo xix, Estudios De-mogrficos y Urbanos, vol. 19, nm. 1 (55), pp. 181-214. Disponible en .
Papaioannou, T. y A. Sachlas (2004), Graduation of Mortality Rates Revisited. University of Piraeus (26 de julio de 2010).
Quilodrn, J. y V. Sosa (2001) Un primer acercamiento a la estimacin de niveles de fecundidad masculina en Mxico, Revista de Informacin y An-lisis, nm. 15, Aguascalientes, inegi, pp. 58-67.
Theil, H. (1963), On the Use of Incomplete Prior Information in Regression Analysis, Journal of the American Statistical Association, nm. 58, pp. 401-414.
Thiele, P. (1871), On a Mathematical Formula to Express the Rate of Morta-lity throughout the Whole of Life, Journal of the Institute of Actuaries, nm. 16, pp. 313-329.
University of California y Max Planck Institute for Demographic Research (2000), Human Mortality Database: Chile, Japan, United Kingdom and United States (11 de febrero de 2010).
Acerca de los autores
Vctor M. Guerrero es actuario por la unam y maestro y doctor en Estadstica por la Universidad de Wisconsin-Madison. Est adscrito al Departamento de Estadstica del itam como profesor de tiempo com-pleto. Ha publicado varios libros y una gran cantidad de artculos en revistas especializadas de estadstica, principalmente sobre anlisis de series de tiempo y pronsticos.
Eliud Silva es actuario egresado de la unam, diplomado en Modelos Economtricos Dinmicos por el itam, maestro en Demografa por El Colegio de Mxico y doctor en Ingeniera Matemtica con especialidad en Estadstica por la Universidad Carlos III de Madrid. Ha impartido cursos en Naciones Unidas (sede en Mxico), en la unam, El Colegio de Mxico, el itam, el itesm y en la Universidad Carlos III de Madrid. Actualmente es profesor de tiempo completo de la Universidad An-huac. Cuenta con artculos publicados en revistas nacionales y extran-jeras relacionados con series de tiempo y tpicos demogrficos. Fue ganador del tercer lugar del Concurso de Investigacin Demogrfica Gustavo Cabrera de El Colegio de Mxico, en su edicin 2010.