Manual Stata 2

download Manual Stata 2

of 14

description

Didáctico manual del paquete estadístico STATA.

Transcript of Manual Stata 2

Prof. Luis Bustos M., Juan Orellana C., y Sergio Muoz N.

Stata

es un programa estadstico implementado para Windows 95 y superior, Unix y Macintosh. Este programa provee herramientas para el manejo de bases de datos, analizar datos utilizando estadstica descriptiva e inferencial. Esta gua ser desarrollada para Stata sobre Windows 95 / 98 y superior

Stata es totalmente compatible con todos los software de este sistema, tiene la filosofa Win95 y por lo tanto el sistema de men e iconos. La pantalla principal de Stata, contiene cuatro ventanas. La ms grande es la ventana de resultados; a la derecha, de arriba hacia a bajo, estn las ventanas comandos previos (Review) y la de variables. En la parte ms baja de la pantalla se encuentra la ventana de comandos (Stata Command). El propsito de esta gua es ejemplificar algunos comandos de Stata (entre muchos) y revisar algunas herramientas que Stata dispone para el manejo de bases de datos.

Objetivos1.1 Manejar el ambiente de Stata 9.0. 1.2 Conocer el concepto de base de datos en Stata 9.0. 1.3 Aplicar las herramientas de presentacin y resumen de datos usando el software Stata 9.0.

Partamos por lo primero!!! I.- Creacin de una base de datos Stata. Supongamos que estamos interesados en analizar los datos de un ESTUDIO EN UNA UNIDAD DE CUIDADOS INTENSIVOS (Hosmer and Lemeshow, pg. 21 and Appendix). Se selecciona una muestra de 200 pacientes que fueron parte de un estudio en adultos admitidos en una Unidad de Cuidados Intensivos (UCI), los datos se encuentran en una base de datos excel, denominada uci200.xls, el cuestionario utilizado para el registro de los datos fue el siguiente Nmero de la encuesta (id): Estado vital (estvital): Sexo (sexo) Edad (edad) Servicio de donde se hizo el ingreso (servuci) Presenta infeccin al ingreso (infecing) Presin sistlica al ingreso (psistoli) Presin diastlica al ingreso (pdiastol) 0: Vivo 1 Muerto 0: Mujer 1: Hombre En aos 0: Ciruga 1: Medicina 0: No En mmHG En mmHg 1: S Cuestionario

1

Pulso al ingreso (pulsoing) Tipo de admisin (tipoadm)

En minutos 0: Electiva 1 Urgencia

Base de datos uci200.xls

1ra fila se escriben las variables abreviadas

Ingresar 1era encuesta

Para crear una base de datos debemos considerar que sta ser una matriz que contendr en cada fila el perfil de un paciente y en las columnas las variables. En nuestro ejemplo, la matriz de datos ser de orden 200 filas (pacientes) por 10 columnas (variables). Para crear la base de datos anterior hay que hacer clic en datos, despus en formulario La tecla tabulador permite avanzar de variable en variable

2

I. Convertir una base de datos Excel en una base de datos Stata. Para crear esta matriz de datos en Stata se deben seguir los siguientes pasos: 1.- Seleccionar y Copiar los datos de la base de datos Excel.

2.- Abra Stata (obvio ), desde inicio, programas, stata o bien desde un acceso directo. 3.- Stata dispone de un editor de Datos llamado Data Editor. Con su mouse haga un click en el icono que le corresponde. 4.- Ubique el cursor en la primera fila, primera columna. Click en Edit, luego Paste (pegar)

Editor

5.- Defina las variables. En el encabezado de cada columna haga doble click y complete los campos Name, Label y Format con el nombre de la variable (no ms de 8 caracteres), la etiqueta ( no mas de 23 caracteres), y el tipo de variables (Ej. %8.0g indica que la variable es numrica de 8 dgitos y de formato general; %8.2f indica que la variable es numrica de 8 dgitos y de formato fijo con dos decimales). Para mas informacin sobre formato de

3

variables, recurra al men Help, luego Search y escriba format

Doble click para desplegar propiedades

Etiqueta del estado vital

Definir y modificar variables

6.- Una vez escrito los label y definir las etiquetas, cerrar el editor para comenzar a utilizar el stata De esta forma usted ha creado su propia base de datos!!!!!!! NO OLVIDAR GRABAR SU BASE DE DATOS. Tambin se dispone de un Programa de conversin de Datos, ste se llama StatTransfer y reconvierte datos de muchos formatos (Excel, Lotus, Dbase, etc.) a Stata y viceversa.

Nota: Si se desea crear una base de datos correspondiente a un gran cuestionario, entonces se recomienda usar un programa especializado, como el Epi Info o el Access. Estos softwares disponen de programas de entrada de datos ms amigables y eficientes que el Excel y Stata.

4

II.- Anlisis descriptivo de una base de datos. Si ya existe una base de datos stata, desde el men principal de Stata, click en (open) y seleccionarla. Inmediatamente abierta la base de datos, usted ver en la ventana de variables el listado de todas ellas.

Comando stata que permite cargar una base de datos

Procedamos a revisemos algunos comandos de Stata. Ellos se escriben en la "ventana de comando" y siempre en minsculas. Previo al anlisis se recomienda crear un archivo que guarde todos los resultados que se realicen con la sesin activa, para esto siga las instrucciones:4. Guardar

1. Presionar este botn para crear un archivo de texto donde se guarden todos los resultados desplegados en la ventana Results

2. Seleccionar Tipo de archivo log (texto)

3. Asignar un nombre con extensin *.doc o por defecto asigna *.log

5

1. describe (desc) : Describe el contenido de la base de datos activa.

2. codebook: Describe el contenido de los datos de una variable

6

3.- list : Permite listar datos en la ventana de resultados de las variables especificadas.

El operador == se usa para asignar un valor a una variable

. list

estvital sexo edad if edad==16

+------------------------+ | estvital sexo edad | |------------------------| 26. | Vivo Fem 16 | 142. | Vivo Masc 16 |

Veamos un poco de medidas de resumen.4.- summerize (sum): Entrega las medidas de resumen de las variables bajo estudio.

5.- sort : Ordenar datos. Suponga que desea listar las cinco ms bajas Presiones Sistlicas observados en la base. sort psistoli list id psistoli in 1/5

7

6. Preguntas y respuestas. 1.- Cul fueron los valores mnimos y mximos, el valor promedio y desviacin estndar de la presin sistlica. 2.- Quiero ms detalles?, percentiles. R: ok!

Despus de la coma se agrega la opcin de detalles

3.- Puedo obtener algunos Estadgrafos de edad y presin sistlica en funcin del estado vital? R: Si!!!!. bys = abreviacin del comando by sort

8

4.- Cmo puedo obtener algunas medidas de resumen de presin sistlica de los pacientes que ingresaron a la uci y que presentaron una edad superior o igual a 65 aos? R:. sum psistoli if edad>=65 Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------psistoli | 91 135.2418 35.74737 62 212 . sum psistoli if edad>=65 & estvital==1

Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------psistoli | 23 115.4348 36.52997 62 190

Nota: Si desea ms informacin del comando if o cualquier otro comando de Stata, dirjase a la opcin search del men Help y obtendr una lista completa de comandos relacionados con el que usted indic. Debe seleccionar el comando especfico (en letras verdes) y usted obtendr descripcin completa del comando y algunos ejemplos. Desea hacer tablas de resumen de Datos ..... de una entrada o dos o tres ..... ? 7.- tabulate (tabu): Despliega, en su forma simple, tablas de distribucin de frecuencia. 1. Cul es el estado vital de los pacientes que ingresaron a la uci?

2. Cul es el estado vital de los pacientes que ingresaron a la uci y que tenan una edad superior o igual a 65 aos?

9

3. Cul es la distribucin del estado vital de los pacientes segn tipo de admisin.

Fila

Columna

Opciones row = porcentajes por filas col = porcentajes por columnas nokey = para no desplegar los comandos de la tabla de contingencia. nofreq = despliega tabla de contingencia solamente con porcentajes

tab Sexo

sexo estvital, row nofreq nokey

| Estado Vital | Vivo Muerto | Total -----------+----------------------+---------Fem | 78.95 21.05 | 100.00 Masc | 80.65 19.35 | 100.00 -----------+----------------------+---------Total | 80.00 20.00 | 100.00

Seleccionar tabla y con botn secundario del Mouse elegir copy table Pegar en Excel: disear tabla y graficar

10

Click en opciones de graficos

Seleccionar

4. De la relacin entre tipo de admisin y estado vital, encuentre el promedio, desviacin estndar y frecuencia de presin sistlica: tabu tipoadm estvital, sum(psistoli)

11

III.- Creacin de nuevas variables. 8. generate y replace : Permiten la creacin de nuevas variables a partir de otras existentes o mediante supuestos y expresiones matemticas. Las variables generadas aparecen inmediatamente en la ventana de variables al final de las otras

Algunos ejemplos. 1. Es muy frecuente que en un anlisis estadstico sea necesario estandarizar variables, esto es reducirlas y centrarlas. A cada observacin se debe restar la media y se dividir esta diferencia por la desviacin estndar. En smbolos esto sera zi = (xi - media)/sd. Los datos estandarizados corresponderan a una nueva variable que hay que crear:

2. Si se desea crear una nueva variable que divida la edad en 4 grupos iguales, se deben usar los cuartiles y el siguiente procedimiento: a) Usar comando centile para encontrar los cuartiles pedidos. b) Usar generate y replace

Operadores lgicos:

&=y |=o

12

Para etiquetar las respuestas y recordar la codificacin se procede de la siguiente manera:

sum edad if edad=72 La opcin de o (|) indica unin de los valores extremos sum edad if sexo==1 Este comando entrega las medidas de resumen solo de los hombres, por esa razn doble igual para poder asignar lo que se desea evaluar Recordar: Una forma mas fcil de etiquetar es desde el editor 9. recode : Permite tambin generar una nueva variable, mediante el siguiente procedimiento 3. Se agrupar la edad en dos categoras, utilizando el percentil 50, mediante el siguiente procedimiento:

Opcin que considera los siguientes tramos: 16-63 y 64-92

13

4. Si deseamos convertir los missing values (.) de una variable en el valor 99, una forma sera: recode variable .=99 5. Para eliminar una variable recin creadas, se procede as: Drop z1

Observacin Una vez finalizada la sesin de trabajo hay que cerrar el archivo de texto para guardar los resultados para ello se escribe directamente en stata command o bien

Recordar de grabar los cambios realizados en la base de datos

Presionar este botn para cerrar archivo de texto con los resultados de la sesin activa. Este se puede abrir con cualquier editor de texto

Esta opcin permite guardar los comandos utilizados durante la sesin de trabajo. Se utiliza cuando se disea el plan de anlisis, escribiendo directamente los comandos que permitan realizar el anlisis propuesto, para ejecutar el archivo de programa (*.do) hay que presionar la siguiente opcin

14