Introduccion Stata Dia 1

18
30/05/2012 1 Introducción a Stata Alfonso Muriel Alfonso Muriel Unidad de Bioestadística Clínica. IRYCIS 4 de junio de 2012 1 La versión básica es Stata/IC ( Intercooled Stata) maneja hasta 2 047 variables STATA maneja hasta 2.047 variables La siguiente es Stata/SE (Special Edition ) maneja hasta 32.766 variables (variables cadena y matrices más grandes) La versión para Multicore/multiprocesadores es Stata/MP, mucho más rápida en ordenadores con Stata/MP, mucho más rápida en ordenadores con dos o mas cores Las observaciones están limitadas por la memoria no pudiendo exceder de 2 milllones

description

Manual de stata

Transcript of Introduccion Stata Dia 1

  • 30/05/2012

    1

    IntroduccinaStataAlfonso MurielAlfonsoMurielUnidaddeBioestadsticaClnica.IRYCIS

    4dejuniode2012

    1

    LaversinbsicaesStata/IC(IntercooledStata)maneja hasta 2 047 variables

    STATA

    manejahasta2.047variables LasiguienteesStata/SE(SpecialEdition)manejahasta32.766variables(variablescadenaymatricesmsgrandes)

    LaversinparaMulticore/multiprocesadoresesStata/MP, mucho ms rpida en ordenadores conStata/MP,muchomsrpidaenordenadorescondosomascores

    Lasobservacionesestnlimitadasporlamemorianopudiendoexcederde2milllones

  • 30/05/2012

    2

    AlmacndeSintaxis

    AlmacndeResultados

    AlmacndeVariables

    Comandosnicaventanaenlaquesepuedeescribir

    AbrirLogGuardarFichero

    Traeralfrenteungrfico

    Editarelficheroactivo

    PararVentana

    deVariables

    Abrir Nuevo Sigue elAbrirfichero

    AbrirAyuda(View)Imprimir

    Nuevoficherodo

    Verelfichero

    Sigueelproceso

  • 30/05/2012

    3

    dta:ficherosdedatosenformatoStata.

    Extensionescomunesdelosficheros

    raw:ficherosdedatosASCII/Text. log:outputdeSTATA. do:ficherodecomandos. gph:StataGraphicFile. ado:StataMacrofiles.

  • 30/05/2012

    4

    Directorio de Trabajo

    dirSt t t l fi h ti

    Utilidadesdefichero

    Statamuestralosficherosquecontieneesedirectorio.

    pwd Nosmuestralarutadondeestubicadolosficherosficheros.

    G:\CursoStata

  • 30/05/2012

    5

    help+nombredecomandoAyuda

    helpsumm

    Extension.dat Sintaxis

    Abrirbasedatos

    .use"G:\CursoStata\VAS.dta",clear

    .useVAS.dta(igualsianteshemoscd)

    .sysuse cancer.dat(ejemplosdeStata)

  • 30/05/2012

    6

    usesexoedadVAS//solamenteseleccional i bl d d

    Abrirbasedatos

    lasvariablessexoyedad useVASin1/5//seleccionaslolascincoprimerasobservaciones,todaslasvariables

    usesexoedadusingVASin1/5//selecciona dos variables y cinco primerasseleccionadosvariablesycincoprimerasobservaciones

    Similar a los archivos spo de SPSSlog using "G:\CursoStata\vas smcllog using G:\CursoStata\vas.smcllog using "G:\CursoStata\vas.smcl, texttranslate vas.smcl to vas.txt

  • 30/05/2012

    7

    SimilaralaventanadesintaxisdeSPSSSi se pone un asterisco no ejecuta la orden

    Ventanado

    SiseponeunasterisconoejecutalaordenPortanto,estilparacolocarnotasaclaratoriasycomentarios.

    Porejemplo: *Esteeselarchivodoparalaprctica1 Tambinsepuedenadjuntarcomentariosalcomandoponiendo/* Comentario*/

    sumvar1/*Calculaunresumendevar1*/

    Stata necesita hacer una copia de la base

    Memoriaversin11

    Stata necesitahacerunacopiadelabasededatosquevamosaanalizarenlamemoriaRAMdenuestroordenador

    ParaampliarlacapacidaddelamemoriaRAMparaStata:

    set mem 512msetmem 512msetmemory 512mclear,borralosdatosenmemoria

  • 30/05/2012

    8

    Losnombresdelasvariablespuedetenerentre 1 y 32 caracteres

    Variables

    entre1y32caracteres Nopuedenempezarporunnmero Nopuedehaberespacios Noutilizarsignos(&%$!) Cuidadoconlosacentos MuysensibleSexoSEXOsexosonvariablesdiferentes

    TiposdevariablesFormat%8.0g%8.0g%12.0g%9.0g %10.0g

    Format

    %#s

    Strings (Cadena) son guardadas como str# (,str1, str2, str3, ..., str244).El nmero despus de str indica la maxima extensin. Un str5 podravaler para varn", pero no para masculino.

    Nmeros son guardadas como byte, integer, long y float. Si se utilizanvalores con decimales el formato recomendado es float.

  • 30/05/2012

    9

    VariablesFecha

    CrearunanuevabaseenSTATA

  • 30/05/2012

    10

    ArchivodedatosCrearetiquetas

    Variable Valores

    use "G:\CursoStata\VAS.dta", clear

    Etiquetaarchivodatos

    use G:\CursoStata\VAS.dta ,clear label data "ESTEESELEJEMPLODELVAS" save "G:\CursoStata\VAS.dta",replacefile G:\CursoStata\VAS.dtasaved use"G:\CursoStata\VAS.dta",clear

    (ESTEESELEJEMPLODELVAS)

  • 30/05/2012

    11

    VariablesManager

    Etiquetarvaloresdevariables

  • 30/05/2012

    12

    Variables:N historia clnica

    Crearunanuevabasededatos

    Nhistoriaclnica Sexo Fechadenacimiento Fechadevisita Fumador(No,Si,EXfumador) AP DiabetesAPDiabetes APHTA APIAM Motivoconsulta(textolibre)

    Calculadora * ( )

    Utilidades

    display140+1.96*sqrt(15) 147.59105

    Describir labase describe

    (resumendebasedatosactiva) describeusing"G:\CursoStata\vas12pre.dta

    (otra basenoactiva) codebook(descripcin mas detallada debasedatos activa)

    Informe conlas 4primeras observacioneslistin1/4

  • 30/05/2012

    13

    Signostiles+ t * d t / di i i ^ t i

    Sintaxis

    + suma resta* producto/ divisin ^potencia>mayor=

  • 30/05/2012

    14

    .INSTRUCCCINVARIABLE(S),OPCIONESsummarize edad

    Sintaxis

    Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- edad | 107 49.61157 15.10253 4.775542 88.4566

    . SELECCIONAR

    summarize edadif sexo==1(slonosdalamediaensexo=)1 Variable|Obs MeanStd. Dev.MinMax + edad|2248.5753513.4584920.0883872.30259

    Si la variable es cadena entre comillas

    if sexo==hombre Un aspecto importante a tener en cuenta es que Stata considera a los valores missing (.) como valores mximos

    Realizarunlistadodelabaseconlosvaronescon fiebre menores de 50 aos o mujeres > 60

    Ejercicio

    confiebremenoresde50aosomujeres>60contos.(basedatostos.dta).

    Realizarunlistadodelospacientesconvaloresdeplaquetasmenoresque100omissing.R li t li t d l i tRealizarotrolistadoconlospacientesconvaloresdecolesterolporencimade300omissing(basedatosCirrosisBiliarPrimaria).

  • 30/05/2012

    15

    ImportarbasedatosaStata(1)

    ImportarbasedatosaStata(2)

  • 30/05/2012

    16

    DesdeSpssImportarbasedatosaStata(3)

    cd"G:\CursoStata(cambiadirectoriotrabajo) clear(borralabasededatos) usespsshipertensos120.sav(noponernombresconespacios)

    AadirCasos

    use"G:\CursoStata\vas5.dta",clear

    appendusing"G:\CursoStata\vas7.dta"

  • 30/05/2012

    17

    Merge

    AadirVariables

    permitecombinarbasesdedatosquetieneunavariableencomn.

    Requierequelasdosbasesdedatosestnordenadasdemaneraascendenteporlavariablevariable.

  • 30/05/2012

    18

    merge1:1nhcusingG:\CursoStata\vas12post.dta"Aadirvariables

    reshape wide,long Estecomandotransformalabasededatosdeunaformatoancho(wide)aunolargo(long)yviceversa

    reshape long inc i(id) j(year)

    Transformarbasedatos

    Data > Create or change data > Other variable- reshapelonginc,i(id)j(year)reshapewideinc,i(id)j(year)

    Wide

    idsexinc80inc81inc821050005500600021200022003300

    Long

    Data > Create or change data > Other variabletransformation commands > Convert data between wide and long

    Longi jx_ijidyearsexinc

    1800500018105500

    1820600028012000

    2811220028213300