Programas de estadística y econometría - uned.es · Después Eviews importa los datos a ese...

12
1 Programas de estadística y econometría por Rubén Osuna © Esto es un breve resumen de algunas de las posibilidades existentes que no pretende ser una revisión detallada de las capacidades de ninguno de los programas, pues el objetivo es orientar a quienes se enfrentan al problema de encontrar un buen software para la estadística y econometría aplicadas. Me referiré especialmente a Mac OS X, el sistema operativo de Apple basado en FreeBSD Unix, por ser la plataforma en la que yo trabajo. Dos buenas plataformas alternativas son Linux y Windows. Con Mac OS X y Linux se puede sacar partido de los microprocesadores de 64 bits que multiplican la capacidad de cálculo de las máquinas 1 . La econometría es una rama de las matemáticas y la estadística que desarrolla procedimientos para trabajar con los datos y encontrar propiedades en ellos y relaciones entre determinadas variables (determinados grupos de datos pueden ser "observaciones" de una variable). Por ejemplo, el SPSS (www.spss.com), cuya versión 11 funciona ya en OS X, es el tipo de programa enorme compuesto por 1 Los 64 bits aluden a la unidad de enteros, mientras que los cálculos matemáticos se llevan a cabo en la unidad de punto flotante (floating point unit, FPU), que siempre ha sido de 64 bits. No obstante, el disponer de una unidad de enteros de 64 bits tiene sus ventajas, como disponer de mucha más memoria RAM para cada aplicación, rompiendo la barrera de los 4GB globales.

Transcript of Programas de estadística y econometría - uned.es · Después Eviews importa los datos a ese...

1

Programas de estadística y econometríapor Rubén Osuna ©

Esto es un breve resumen de algunas de las posibilidades existentesque no pretende ser una revisión detallada de las capacidades deninguno de los programas, pues el objetivo es orientar a quienes seenfrentan al problema de encontrar un buen software para laestadística y econometría aplicadas. Me referiré especialmente a MacOS X, el sistema operativo de Apple basado en FreeBSD Unix, por serla plataforma en la que yo trabajo. Dos buenas plataformasalternativas son Linux y Windows. Con Mac OS X y Linux se puedesacar partido de los microprocesadores de 64 bits que multiplican lacapacidad de cálculo de las máquinas1.

La econometría es una rama de las matemáticas y la estadística quedesarrolla procedimientos para trabajar con los datos y encontrarpropiedades en ellos y relaciones entre determinadas variables(determinados grupos de datos pueden ser "observaciones" de unavariable). Por ejemplo, el SPSS (www.spss.com), cuya versión 11funciona ya en OS X, es el tipo de programa enorme compuesto por

1 Los 64 bits aluden a la unidad de enteros, mientras que los cálculos matemáticos se llevana cabo en la unidad de punto flotante (floating point unit, FPU), que siempre ha sido de 64

bits. No obstante, el disponer de una unidad de enteros de 64 bits tiene sus ventajas, comodisponer de mucha más memoria RAM para cada aplicación, rompiendo la barrera de los

4GB globales.

2

una base y módulos para casi todo, de precio alto, relativamente fácilde usar pero no especializado en econometría propiamente dicha; lomismo puede decirse de SAS (www.sas.com, pero no tiene versiónpara OS X), ambos capaces de hacer algunos test econométricos,más que suficientes para muchos usuarios y con funcionalidadescomplementarias muy importantes (tratamiento de datos, presentaciónde resultados), pero quizás insuficientes para la mayoría de loseconómetras a tiempo completo. GAUSS (www.aptech.com, la versión6 corre en OS X), MATLAB (www.mathworks.com, las versiones 6.5 y7 funcionan en OS X) y Ox (http://www.nuff.ox.ac.uk/Users/Doornik/,programa gratuito si se emplea en la investigación o la enseñanza,que en su versión 3.3. soporta OS X) ofrecen lenguajes deprogramación basados en matrices, requiriendo un trabajo deprogramación de test que otras aplicaciones (de las que hablaremosahora) traen ya hecho, si bien hacer los test uno mismo evita trabajarcon "cajas negras" preprogramadas.

Tanto si el programa que usamos utiliza algoritmos que quedanocultos para el usuario como si éste los aplica por sí mismo, existe ungravísimo problema de fiabilidad en los cálculos. Y es que, por extrañoque parezca, no podemos saber en muchos casos si el programa queusamos nos está dando resultados correctos. Ello se debe a que laaritmética de las máquinas es distinta a la de “lápiz y papel” y a quelos ordenadores trabajan con un número determinado de dígitos másun sistema de redondeos.

3

Algunos de los resultados de nuestros programas favoritos pueden

ser falsos simplemente porque el ordenador toma unos valores

como aproximaciones de otros (los muy grandes o muy pequeños)

y porque hemos aplicado el procedimiento de cálculo equivocado

para los datos de que disponemos (forzando al programa a operar

con números que sobrepasan el límite).

Estos errores pueden conocerse mediante baterías de test que

ofrecen resultados de validez garantizada con los que comparar.

Pero hay muchas funcionalidades para las que no se han

desarrollado aún test, y en esos casos los programas pueden dar

resultados distintos, por lo que no sabemos qué resultado es el

correcto (o cuáles son aceptables). Es más, en muchos artículos

publicados no se dice qué software (o qué algoritmos) se ha

empleado, por lo que no hay forma de saber si los resultados

expuestos son correctos o no (se puede estar usando un programa

que sabemos que falla con determinados datos y cálculos). Es un

problema ciertamente grave. Un articulo excelente sobre el tema,

que todos deberían conocer, es McCullough, B.D. and Vinod, H.D.

(1999): "The Numerical Reliability of Econometric Software",

Journal of Economic Literature , vol. 27, june, pp. 633-665.

Pero centrémonos ahora en el tema: hay tres tipos de programas: losestadísticos genéricos, las aplicaciones para la programaciónmediante matrices y las colecciones de test o procedimientos. Enfunción de las necesidades cada uno utiliza el que más le conviene (ola combinación que más le interese). Veremos después el último tipo

4

de aplicaciones mencionado, si bien trataremos primero someramenteel segundo tipo.

Los "canned packages"Algunos de los más usados son TSP, Eviews, LIMDEP y Stata,aunque hay otros muchos. Son conocidos como "canned packages",es decir, programas en los que los test están ya hechos y uno sólotiene que invocarlos pulsando un botón, abriendo un menú oescribiendo un comando. Presentan el problema al que acabamos dealudir: no sabemos cómo hacen eso que hacen, aunque nos libera detener que conocer mucha econometría para poder aplicarla, lo que esuna ventaja y un inconveniente. Usualmente quienes se dedican a laeconometría aplicada utilizan un "canned package", mientras queaquellos que necesitan estar a la última incorporando por sí mismoslos últimos avances suelen usar un programa tipo GAUSS o MATLAB.En el caso de usuarios de OS X la elección de este segundo tipo deprogramas está clara: como hemos dicho sólo la última versión deMATLAB funciona sobre OS X (de manera admirable, dicho sea depaso, si bien es prácticamente una versión Unix recompilada coninterfaz X11). Pero veamos ahora qué opciones tenemos entre los"canned packages".

TSP y Eviews, los programas más popularesEl TSP era un software econométrico para mainframes. La empresaque lo hacía decidió hacer una versión "reducida" para ordenadorespersonales en 1981, y eligieron el mítico Apple II. El software se llamó

5

MicroTSP. Era un programa donde una serie de comandos ejecutabandeterminadas acciones. Decías, por ejemplo, "regresa la variable Xcon la variable Y y la variable Z" (con los comandos correspondientes),y el programa te daba una serie de resultados: los residuos, loscoeficientes, los errores estándar, el coeficiente de determinación (la Rcuadrado), etcétera. El MicroTSP acabó comercializándose por unaempresa independiente llamada QMS. En 1985 el TSP pudo funcionaren ordenadores personales, y quedó como el "hermano mayor" delMicroTSP. En 1995 QMS dio un paso muy inteligente: añadir unainterfaz gráfica al programa donde los comandos estaban recogidos enmenús. Esto convirtió al MicroTSP en el estándar para la enseñanzade la econometría y extendió su uso entre los investigadores. El nuevoMicroTSP con GUI pasó a llamarse Econometric Views (Eviews).Existió versión para Mac, pero no pasó de la 1.1 (creo recordar). Hoyel EViews va por la versión 5 y la empresa no sabe si desarrollarápara Mac OS X, pues todo del desarrollo desde 1995 se ha hechopensando sólo en Windows. Muchos manuales de econometría basansus ejercicios en Eviews. Es un programa fácil de aprender a manejar(dentro de lo que cabe) y muy potente, con herramientas para hacercasi de todo en econometría. El primer paso es disponer de una hojade Excel (aunque importa desde otros formatos) con los datos:variables y observaciones de dichas variables. Por ejemplo, la renta y50 observaciones (para 50 años) y el tipo de interés y susobservaciones (otras 50). Creas un "workfile" vacío, para un rango dedatos (50), le pones un nombre y lo guardas. Después Eviews importalos datos a ese "workfile". Cada variable aparecerá en la ventana del

6

"workfile" con un símbolo y el nombre que le hayas dado. Si hacesdoble click en el símbolo aparece la serie. Después ya puedes crear"objetos" en ese "workfile", por ejemplo una ecuación. Si has llamado ala renta "Q" y al tipo de interés "i" puedes ir al menú "objeto",seleccionar "ecuación" y decirle que "Q c i", es decir, que relacionelinealmente "Q" e "i", siendo la renta la variable explicada.Inmediatamente surge un panel con resultados. A ese "objetoecuación" puedes añadirle más cálculos, y pedir, por ejemplo, quehaga un test de normalidad a partir de los residuos de la relación linealestimada. Todo queda guardado en la "ecuación", que será otrosímbolo en la misma ventana del "workfile" donde están las variables.En cualquier momento puedes abrir esa ecuación y reestimarla, opedir nuevos cálculos, o hacer gráficos, o añadir variables al "workfile"y calcular nuevas ecuaciones, etc. Todo muy sencillo cuandoaprendes la mecánica. Los gráficos son simples pero funcionales. Lapresentación de los resultados se hace en tablas que se puedencopiar y pegar (igual que los gráficos, que el Word puede,curiosamente, "desagrupar"). El Eviews de hoy se ha convertido en unprograma tan completo y potente como el "viejo" TSP, que sinembargo, en su versión 4.5, sí soporta OS X (y otros muchos Unix).TSP además incorpora una interfaz gráfica suficiente llamadaGiveWin. Ambos son programas plenamente capaces de bregar contoda la macro y microeconometría que les echen. Eviews viene con unbuen manual, cosa que no puede decirse de TSP. Pero ladocumentación no es un problema para Eviews, en parte porque suaprendizaje es relativamente fácil, y en parte porque muchos

7

manuales de econometría traen ejercicios para el programa. En elcaso de TSP pueden encontrarse recursos adicionales en Internet. Encastellano hay editado un buen libro para aprender econometría conEviews: Carrascal, U.; González, Y.; y Rodríguez, B. (2001): Análisis

econométrico con EViews, Ed. RA-MA, Madrid.www.tspintl.comwww.eviews.com

Stata, un programa de eliteEl Stata 8, de Stata Corporation, es de naturaleza distinta a los dosanteriores, aunque quizás se parezca más a TSP. Para empezarexiste versión para OS X, Windows y distintos tipos de Unix. Stata 8 esuna aplicación Mach-O, es decir, una aplicación 100% nativa para MacOS X (empleando APIs Carbon), muy optimizada. Además, en suversión 8 Stata incorpora una nueva interfaz gráfica programable muydesarrollada y mejorada, que lo iguala prácticamente al Eviews eneste apartado, librando al usuario de la necesidad de aprender seriesinterminables de comandos, pues éstos han quedado recogidos enmenús desplegables. No obstante la antigua interfaz orientada a laentrada manual de comandos persiste (un panel en blanco quefunciona de forma similar al TSP, es decir, con comandos escritosseguidos del nombre de las variables y otras instrucciones adicionales,más ventanas para los resultados, más la lista de variables disponiblesy los comandos ejecutados hasta el momento). Se trata en definitivade un híbrido ideal entre la forma de trabajar clásica de las mainframeso las terminales Unix (mejoradas al dividir la ventana en dos partes,

8

comandos y resultados) y las modernas (y a veces molestas)interfaces gráficas, que en Stata queda “fuera” del área de trabajo,aportando menús cuando éstos son requeridos.

Stata es un programa muy abierto: puedes crear fácilmente archivosque contienen programaciones genéricas, y añadirlas después al Statafácilmente o compartirlas con otros. Existe de hecho una comunidadque desarrolla esas programaciones en Stata para todo tipo de testimaginables, y que puedes bajar de la red. Los resultados sepresentan de forma correcta y funcional, y los gráficos, muy mejoradosen la versión 8, se colocan a la altura de los ofrecidos por cualquier

9

otro paquete econométrico (aunque no de aquellos que tienen unpunto fuerte en la presentación de resultados, como SPSS y SAS). Endefinitiva, Stata es muy potente y ofrece soluciones para casi todo,directamente o a través de la aportación de investigadores de todo elmundo. Muchos económetras de alto nivel trabajan con esteprograma, y la versión 8 ha conseguido además que su curva deaprendizaje se suavice sustancialmente, haciéndolo cómodo de usaren la enseñanza. Además, para los usuarios de Unix que usen Macs,Stata te permite instalar un componente gratuito con el que puedesejecutar el programa desde el Terminal si tienes OS X (accediendo alas funcionalidades del programa sólo a base de comandos, claro).

Tres características curiosas más: a) en el mismo CD están lasversiones de todas las plataformas soportadas, aunque tu número delicencia activa una u otra la primera vez que ejecutas el programa (nocuando lo instalas); b) el programa no mete nada en la carpeta delsistema ni en otra parte que no sea la propia carpeta del Stata, por loque es fácil de desinstalar (y de copiar), además de muy estable; c)Stata coloca todos los datos en la RAM del ordenador, por lo que suslímites están en la RAM que tengas instalada, y es muy, muy rápido.Stata se ofrece en una versión Small (muy asequible); otra Intercooled,que es la estándar; y una Special Edition, más cara y potente. Lasdiferencias están básicamente en la cantidad de variables y el tamañode las matrices que puedes manejar. El Small se me antoja demasiadocorto para según qué cosas (sólo maneja, por ejemplo, matrices40x40).

10

Existe además un programa llamado Stat/Transfer 7(http://www.stattransfer.com), no demasiado caro y que corre en OS X,que convierte multitud de formatos de archivos en otros, sean basesde datos (como Access o FoxPro), hojas de cálculo (Excell, Lotus,QuatroPro...) o programas matemáticos y estadísticos (SPSS, Gauss,Matlab, Stata, JMP, SAS...). Es un programa útil para cualquierusuario de programas estadísticos y econométricos en general, pueste permite trabajar con dos o más de ellos sin problemas, haciendocon Stat/Transfer las conversiones necesarias (se ofrecen multitud deopciones para controlar con detalle el proceso de conversión). Visto deotra forma, aprender a manejar en profundidad un solo programa tieneindudables economías de escala, y Stat/Transfer te permite concentrarese esfuerzo de aprendizaje.

11

La documentación que trae Stata 8 añade mucho material a la yamasiva que venía con la versión anterior: Getting started with Stata(190 páginas), User's Guide (420 páginas), Graphics (500),Programming (470), Cluster Analysis (120 páginas), Cross-SectionalTime Series (240 páginas), Survey Data (101 páginas), SurvivalAnalysis&Epidemiological Tables (350 páginas), Time Series (340páginas), más cuatro volúmenes de 1830 páginas en total con elManual de Referencia; todo en inglés, claro. Como se ha dicho, en lared puede encontrarse mucha más documentación. El Stata TechnicalBulletin (STB) es una publicación que aparece cada dos meses yofrece extensiones y herramientas escritas por los usuarios,

12

analizadas y "validadas". Eso sin contar los numerosos libros ymanuales de econometría que hacen referencia a Stata. Ademásexiste una lista de correo, y la propia Stata Co. ofrece cursos on-lineun par de veces al año (Introducción y Programación, básica yavanzada). También se puede acceder a una enorme base de datosde desarrollos de terceras partes mantenido por Christopher Baum, enel Boston College (http://ideas.uqam.ca/ideas/data/bocbocode.html);¡allí hay más tareas programadas disponibles que las que ofrece elpropio Stata! Las referencias que tengo del soporte técnico sonexcelentes (responden siempre al momento).www.stata.com

En resumenMis recomendaciones para usuarios de Mac OS X son: paratratamiento de datos y presentación de resultados SPSS 11; y paraeconometría más completa TSP 4.5 o Stata 8. Si se desea utilizar unprograma para el desarrollo de test basado en matrices el usuario deOS X debe dirigirse a MATLAB 7 (o a GAUSS 6). En cualquier casoresulta interesante el programa Stat/Transfer 7 para importar oexportar archivos a los formatos propios de otros programas, ya seapara compartirlos o para poder utilizar más de uno con comodidad.Los usuarios de Mac OS X tienen opciones de sobra para el análisisestadístico y econométrico. Además, los procesadores G5 de IBM, de64 bits, hacen de Mac OS X (basado en FreeBSD Unix) unaplataforma ideal para el tratamiento masivo de datos a costerelativamente reducido.