IBM SPSS Regression

IBM SPSS Regression 23

NotaAntes de utilizar esta informacin y el producto al que hace referencia, lea la informacin en Avisos en la pgina 33.

Informacin del producto

Esta edicin se aplica a la versin 23, release 0, modificacin 0 de IBM SPSS Statistics y a todas las versiones ymodificaciones posteriores hasta que se indique lo contrario en nuevas ediciones.

ContenidoCaptulo 1. Seleccin de unprocedimiento para la regresinlogstica binaria . . . . . . . . . . . 1

Captulo 2. Regresin Logstica . . . . 3Regresin logstica: Establecer regla. . . . . . . 4Mtodos de seleccin de variables en el anlisis deregresin logstica . . . . . . . . . . . . 4Regresin logstica: Definir variables categricas . . 5Regresin logstica: Guardar nuevas variables . . . 6Regresin logstica: Opciones . . . . . . . . . 6Caractersticas adicionales del comando LOGISTICREGRESSION . . . . . . . . . . . . . . 7

Captulo 3. Regresin logsticamultinomial . . . . . . . . . . . . . 9Regresin logstica multinomial . . . . . . . . 9

Generar trminos . . . . . . . . . . . 10Categora de referencia de regresin logsticamultinomial . . . . . . . . . . . . . . 10Regresin logstica multinomial: Estadsticos . . . 11Regresin logstica multinomial: Criterios . . . . 11Opciones de Regresin logstica multinomial . . . 12Regresin logstica multinomial: Guardar . . . . 13Caractersticas adicionales del comando NOMREG 13

Captulo 4. Anlisis probit . . . . . . 15Anlisis probit: Definir rango . . . . . . . . 16Anlisis probit: Opciones . . . . . . . . . . 16Caractersticas adicionales del comando PROBIT . . 17

Captulo 5. Regresin no lineal . . . . 19Lgica condicional (Regresin no lineal) . . . . . 20Regresin no lineal: Parmetros. . . . . . . . 20

Modelos comunes de regresin no lineal. . . . . 21Regresin no lineal: Funcin de prdida . . . . . 21Regresin no lineal: Restricciones para losparmetros . . . . . . . . . . . . . . 22Regresin no lineal: Guardar variables nuevas . . . 22Regresin no lineal: Opciones . . . . . . . . 22Regresin no lineal: Interpretacin de los resultados 23Caractersticas adicionales del comando NLR . . . 23

Captulo 6. Estimacin ponderada . . . 25Estimacin ponderada: Opciones . . . . . . . 26Caractersticas adicionales del comando WLS . . . 26

Captulo 7. Regresin por mnimoscuadrados en dos fases . . . . . . . 27Regresin por mnimos cuadrados en dos fases:Opciones . . . . . . . . . . . . . . . 28Caractersticas adicionales del comando 2SLS . . . 28

Captulo 8. Esquemas de codificacinde variables categricas . . . . . . . 29Desviacin. . . . . . . . . . . . . . . 29Simple . . . . . . . . . . . . . . . . 29Helmert . . . . . . . . . . . . . . . 30Diferencia . . . . . . . . . . . . . . . 30Polinmico . . . . . . . . . . . . . . 30Repetido . . . . . . . . . . . . . . . 31Especial . . . . . . . . . . . . . . . 31Indicador . . . . . . . . . . . . . . . 32

Avisos . . . . . . . . . . . . . . . 33Marcas comerciales . . . . . . . . . . . . 35

ndice . . . . . . . . . . . . . . . 37

iii

iv IBM SPSS Regression 23

Captulo 1. Seleccin de un procedimiento para la regresinlogstica binariaLos modelos de regresin logstica binaria se pueden ajustar mediante el procedimiento de regresinlogstica y el procedimiento de regresin logstica multinomial. Cada uno de estos dos procedimientoscontiene opciones que no estn disponibles en el otro. Existe entre ambos una distincin tericaimportante: el procedimiento de Regresin logstica genera todas las predicciones, residuos, estadsticosde influencia y pruebas de bondad de ajuste utilizando los datos a nivel de los casos individuales,independientemente de la forma en que los datos hayan sido introducidos y de si el nmero de patronesen las covariables es o no menor que el nmero total de casos; el procedimiento de Regresin logsticamultinomial, por su parte, agrega los casos de manera interna para formar subpoblaciones con patronesen las covariables idnticos para las variables predictoras, generando predicciones, residuos y pruebas debondad de ajuste basadas en las citadas subpoblaciones. Si todas las variables predictoras son categricas,o si alguna variable predictora continua toma slo un nmero limitado de valores (de manera que hayavarios casos para cada patrn en las covariables), la aproximacin mediante subpoblaciones puedegenerar pruebas de bondad de ajuste vlidas y residuos que sean informativos, mientras que el mtodo anivel de los casos individuales no lo permite.

La opcin Regresin logstica ofrece una serie de caractersticas exclusivas que se detallan acontinuacin:v Prueba de bondad de ajuste del modelo de Hosmer-Lemeshowv Anlisis por pasosv Contrastes para definir la parametrizacin del modelov Puntos de corte alternativos para la clasificacinv Grficos de clasificacinv Aplicacin de un modelo ajustado mediante un conjunto de casos sobre otro conjunto de casos

reservadosv Almacenamiento de predicciones, residuos y estadsticos de influencia

La opcin Regresin logstica multinomial ofrece una serie de caractersticas exclusivas que se detallan acontinuacin:v Pruebas chi-cuadrado de Pearson y de desvianza sobre la bondad de ajuste del modelov Especificacin de subpoblaciones para el agrupamiento de los datos, para las pruebas de bondad de

ajustev Listado de las frecuencias, frecuencias pronosticadas y residuos por subpoblacionesv Correccin de las estimaciones de la varianza por sobredispersinv Matriz de covarianzas para las estimaciones de los parmetrosv Contrastes sobre combinaciones lineales de los parmetrosv Especificacin explcita de modelos anidadosv Ajuste de modelos de regresin logstica condicional con emparejamiento 1-1 usando variables

diferenciadas

Nota: Ambos de estos procedimientos ajustan un modelo para datos binarios que es un modelo linealgeneralizado con una distribucin binomial y la funcin de enlace logit. Si una funcin de enlacediferente es ms apropiada para sus datos, deber utilizar el procedimiento de modelos linealesgeneralizados.

Copyright IBM Corp. 1989, 2014 1

Nota: Si tiene mediciones repetidas de datos binarios, o registros que estn correlacionados de otraforma, deber tener en cuenta los procedimientos de modelos mixtos lineales generalizados o ecuacionesde estimacin generalizadas.

2 IBM SPSS Regression 23

Captulo 2. Regresin LogsticaLa regresin logstica resulta til para los casos en los que se desea predecir la presencia o ausencia deuna caracterstica o resultado segn los valores de un conjunto de predictores. Es similar a un modelo deregresin lineal pero est adaptado para modelos en los que la variable dependiente es dicotmica. Loscoeficientes de regresin logstica pueden utilizarse para estimar la odds ratio de cada variableindependiente del modelo. La regresin logstica se puede aplicar a un rango ms amplio de situacionesde investigacin que el anlisis discriminante.

Ejemplo. Qu caractersticas del estilo de vida son factores de riesgo de enfermedad cardiovascular ?Dada una muestra de pacientes a los que se mide la situacin de fumador, dieta, ejercicio, consumo dealcohol, y estado de enfermedad cardiovascular, se puede generar un modelo utilizando las cuatrovariables de estilo de vida para predecir la presencia o ausencia de enfermedad cardiovascular en unamuestra de pacientes. El modelo puede utilizarse posteriormente para derivar estimaciones de la oddsratio para cada uno de los factores y as indicarle, por ejemplo, cunto ms probable es que losfumadores desarrollen una enfermedad cardiovascular frente a los no fumadores.

Estadsticos. Casos totales, Casos seleccionados, Casos vlidos. Para cada variable categrica: paramtrocoding. Para cada paso: variables introducidas o eliminadas, historial de iteraciones, -2 log de laverosimilitud, bondad de ajuste, estadstico de bondad de ajuste de Hosmer-Lemeshow, chi-cuadrado delmodelo , chi-cuadrado de la mejora, tabla de clasificacin, correlaciones entre las variables, grfico de lasprobabilidades pronosticadas y los grupos observados, chi-cuadrado residual. Para las variables de laecuacin: coeficiente (B), error estndar de B, Estadstico de Wald, razn de las ventajas estimada (exp(B)),intervalo de confianza para exp(B), log de la verosimilitud si el trmino se ha eliminado del modelo. Paracada variable que no est en la ecuacin: estadstico de puntuacin. Para cada caso: grupo observado,probabilidad pronosticada, grupo pronosticado, residuo, residuo estandarizado.

Mtodos. Puede estimar modelos utilizando la entrada en bloque de las variables o cualquiera de lossiguientes mtodos por pasos: condicional hacia adelante, LR hacia adelante, Wald hacia adelante,Condicional hacia atrs, LR hacia atrs o Wald hacia atrs.

Regresin logstica: Consideraciones sobre los datos

Datos. La variable dependiente debe ser dicotmica. Las variables independientes pueden estar a nivel deintervalo o ser categricas; si son categricas, deben ser variables auxiliares o estar codificadas comoindicadores (existe una opcin en el procedimiento para recodificar automticamente las variablescategricas).

Supuestos. La regresin logstica no se basa en supuestos distribucionales en el mismo sentido en que lohace el anlisis discriminante. Sin embargo, la solucin puede ser ms estable si los predictores tienenuna distribucin normal multivariante. Adicionalmente, al igual que con otras formas de regresin, lamulticolinealidad entre los predictores puede llevar a estimaciones sesgadas y a errores estndar inflados.El procedimiento es ms eficaz cuando la pertenencia a grupos es una variable categrica autntica; si lapertenencia al grupo se basa en valores de una variable continua (por ejemplo CI alto encontraposicin a CI bajo), deber considerar el utilizar la regresin lineal para aprovechar lainformacin mucho ms rica ofrecida por la propia variable continua.

Procedimientos relacionados. Utilice el procedimiento Diagrama de dispersin para mostrar en pantallasus datos para multicolinealidad. Si se cumplen los supuestos de normalidad multivariante y de matricesde varianzas-covarianzas iguales, puede obtener una solucin ms rpida utilizando el procedimientoAnlisis discriminante. Si todos los predictores son categricos, puede adems utilizar el procedimiento

3

Loglineal. Si la variable dependiente es continua, utilice el procedimiento Regresin lineal. Puede utilizarel procedimiento Curva COR para realizar grficos de las probabilidades guardadas con el procedimientoRegresin logstica.

Para obtener un anlisis de regresin logstica1. Elija en los mens:

Analizar > Regresin > Logstica binaria...2. Seleccione una variable dependiente dicotmica. Esta variable puede ser numrica o de cadena.3. Seleccione una o varias covariables. Para incluir trminos de interaccin, seleccione todas las variables

contenidas en la interaccin y seleccione >a*b>.

Para introducir variables por grupos (en bloques), seleccione las covariables para un bloque y pulse enSiguiente para especificar un nuevo bloque. Repita estos pasos hasta que haya especificado todos losbloques.

Si lo desea, puede seleccionar casos para el anlisis. Elija una variable de seleccin y pulse Regla.

Regresin logstica: Establecer reglaLos casos definidos por la regla de seleccin se incluyen en la estimacin del modelo. Por ejemplo, si haseleccionado una variable y la opcin igual que y ha especificado 5 como valor, slo se incluirn en elanlisis aquellos casos para los cuales la variable seleccionada tenga un valor igual a 5.

Tanto para los casos seleccionados como para los no seleccionados se generan resultados declasificaciones y estadsticos. De esta manera, se ofrece un mecanismo para clasificar los nuevos casosbasndose en datos ya existentes; o tambin para realizar la particin de los datos en dos subconjuntos,uno de entrenamiento y otro de prueba, que permiten la validacin del modelo generado.

Mtodos de seleccin de variables en el anlisis de regresin logsticaLa seleccin del mtodo permite especificar cmo se introducen las variables independientes en elanlisis. Utilizando distintos mtodos se pueden construir diversos modelos de regresin a partir delmismo conjunto de variables.v Intro. Procedimiento para la seleccin de variables en el que todas las variables de un bloque se

introducen en un solo paso.v Seleccin hacia adelante (Condicional). Mtodo de seleccin por pasos que contrasta la entrada basndose

en la significacin del estadstico de puntuacin y contrasta la eliminacin basndose en laprobabilidad de un estadstico de la razn de verosimilitud que se basa en estimaciones condicionalesde los parmetros.

v Seleccin hacia adelante (razn de verosimilitud). Mtodo de seleccin por pasos hacia adelante quecontrasta la entrada basndose en la significacin del estadstico de puntuacin y contrasta laeliminacin basndose en la probabilidad del estadstico de la razn de verosimilitud, que se basa enestimaciones de la mxima verosimilitud parcial.

v Seleccin hacia adelante (Wald). Mtodo de seleccin por pasos hacia adelante que contrasta la entradabasndose en la significacin del estadstico de puntuacin y contrasta la eliminacin basndose en laprobabilidad del estadstico de Wald.

v Eliminacin hacia atrs (Condicional). Seleccin por pasos sucesivos hacia atrs El contraste para laeliminacin se basa en la probabilidad del estadstico de la razn de verosimilitud, el cul se basa a suvez en las estimaciones condicionales de los parmetros.

v Eliminacin hacia atrs (razn de verosimilitud). Seleccin por pasos sucesivos hacia atrs El contrastepara la eliminacin se fundamenta en la probabilidad del estadstico de la razn de verosimilitud, elcual se fundamenta en estimaciones de mxima verosimilitud parcial.


v Eliminacin hacia atrs (Wald). Seleccin por pasos sucesivos hacia atrs El contraste para la eliminacinse basa en la probabilidad del estadstico de Wald.

Los valores de significacin de los resultados se basan en el ajuste de un nico modelo. Por ello, estosvalores de significacin no suele ser vlidos cuando se emplea un mtodo por pasos.

Todas las variables independientes seleccionadas se aaden a un mismo modelo de regresin. Sinembargo, puede especificar distintos mtodos de introduccin para diferentes subconjuntos de variables.Por ejemplo, puede introducir en el modelo de regresin un bloque de variables que utilice la seleccinpor pasos sucesivos, y un segundo bloque que emplee la seleccin hacia adelante. Para aadir unsegundo bloque de variables al modelo de regresin, pulse en Siguiente.

Regresin logstica: Definir variables categricasPuede especificar los detalles sobre cmo el procedimiento Regresin logstica manipular las variablescategricas:

Covariables. Contiene una lista de todas las covariables especificadas en el cuadro de dilogo principalpara cualquier capa, bien por ellas mismas o como parte de una interaccin. Si alguna de stas sonvariables de cadena o son categricas, slo puede utilizarlas como covariables categricas.

Covariables categricas. Lista las variables identificadas como categricas. Cada variable incluye unanotacin entre parntesis indicando el esquema de codificacin de contraste que va a utilizarse. Lasvariables de cadena (sealadas con el smbolo < a continuacin del nombre) estarn presentes ya en lalista Covariables categricas. Seleccione cualquier otra covariable categrica de la lista Covariables ymuvala a la lista Covariables categricas.

Cambiar el contraste. Le permite cambiar el mtodo de contraste. Los mtodos de contraste disponiblesson:v Indicador. Los contrastes indican la presencia o ausencia de la pertenencia a una categora. La

categora de referencia se representa en la matriz de contrastes como una fila de ceros.v simples. Cada categora del predictor (excepto la propia categora de referencia) se compara con la

categora de referencia.v Diferencia. Cada categora del predictor, excepto la primera categora, se compara con el efecto

promedio de las categoras anteriores. Tambin se conoce como contrastes de Helmert inversos.v Helmert. Cada categora del predictor, excepto la ltima categora, se compara con el efecto promedio

de las categoras subsiguientes.v Repetidas. Cada categora de la variable de predictor (excepto la ltima categora) se compara con la

categora siguiente.v Polinmico. Contrastes polinmicos ortogonales. Se supone que las categoras estn espaciadas

equidistantemente. Los contrastes polinmicos slo estn disponibles para variables numricas.v Desviacin. Cada categora del predictor, excepto la categora de referencia, se compara con el efecto

global.

Si selecciona Desviacin, Simple o Indicador, elija Primera o ltima como categora de referencia.Observe que el mtodo no cambia realmente hasta que se pulsa en Cambiar.

Las covariables de cadena deben ser covariables categricas. Para eliminar una variable de cadena de lalista Covariables categricas, debe eliminar de la lista Covariables del cuadro de dilogo principal todoslos trminos que contengan la variable.

Captulo 2. Regresin Logstica 5

Regresin logstica: Guardar nuevas variablesPuede guardar los resultados de la regresin logstica como nuevas variables en el conjunto de datosactivo:

Valores pronosticados. Guarda los valores pronosticados por el modelo. Las opciones disponibles sonProbabilidades y Grupo de pertenencia.v Probabilidades. Para cada caso, guarda la probabilidad pronosticada de aparicin del evento. En los

resultados, una tabla muestra el nombre y el contenido de cualquier variable nueva. El "evento" es lacategora de la variable dependiente con el valor ms alto; por ejemplo, si la variable dependiente tomalos valores 0 y 1, se guarda la probabilidad pronosticada de categora 1.

v Grupo de pertenencia pronosticado. Grupo con la mayor probabilidad posterior, basado en puntuacionesdiscriminantes. El grupo pronosticado por el modelo al cual pertenece el caso.

Influencia. Guarda los valores de estadsticos que miden la influencia de los casos sobre los valorespronosticados. Las opciones disponibles son De Cook, Valores de influencia y DfBeta(s).v De Cook. El anlogo, en la regresin logstica, al estadstico de influencia de Cook. Una medida de

cunto cambiaran los residuos de todos los casos si un caso particular se excluyera del clculo de loscoeficientes de regresin.

v Valor de influencia. La influencia relativa de una observacin en el ajuste del modelo.v DfBetas. La diferencia en el valor de beta es el cambio en el valor de un coeficiente de regresin que

resulta de la exclusin de un caso particular. Se calcula un valor para cada trmino del modelo,incluyendo la constante.

Residuos. Guarda los residuos. Las opciones disponibles son No tipificados, Logit, Mtodo de Student,Tipificados y Desvianza.v Residuos no tipificados. Diferencia entre un valor observado y el valor predicho por el modelo.v Residuo logit. El residuo del caso si se pronostica en la escala logit. El residuo logit es el residuo

dividido por la probabilidad pronosticada multiplicada por 1 menos la probabilidad pronosticada.v Residuo estudentizado. El cambio en la desvianza del modelo si se excluye el caso.v Residuos tipificados. El residuo dividido por una estimacin de su error estndar. Los residuos

tipificados, que son conocidos tambin como los residuos de Pearson o residuos estandarizados, tienenuna media de 0 y una desviacin estndar de 1.

v Desvianza. Los residuos basados en la desvianza del modelo.

Exportar informacin del modelo a un archivo XML. Las estimaciones de los parmetros y (si lo desea)sus covarianzas se exportan al archivo especificado en formato XML (PMML). Puede utilizar este archivode modelo para aplicar la informacin del modelo a otros archivos de datos para puntuarlo.

Regresin logstica: OpcionesPuede especificar estas opciones para el anlisis de regresin logstica:

Estadsticos y grficos. Le permite solicitar estadsticos y grficos. Las opciones disponibles son Grficosde clasificacin, Bondad de ajuste de Hosmer-Lemeshow, Listado de residuos por caso, Correlaciones deestimaciones, Historial de iteraciones e IC para exp(B). Seleccione una de las alternativas del grupoMostrar para mostrar los estadsticos y los grficos En cada paso o bien slo para el modelo final, En elltimo paso.v estadstico de bondad de ajuste de Hosmer-Lemeshow. Este estadstico de bondad de ajuste es ms robusto

que el estadstico de bondad de ajuste tradicionalmente utilizado en la regresin logstica,especialmente para los modelos con covariables continuas y los estudios con tamaos de muestrapequeos. Se basa en agrupar los casos en deciles de riesgo y comparar la probabilidad observada conla probabilidad esperada dentro de cada decil.


Probabilidad para el mtodo por pasos. Le permite controlar los criterios por los cuales las variables seintroducen y se eliminan de la ecuacin. Puede especificar criterios para la Entrada o Eliminacin devariables.v Probabilidad para el mtodo por pasos. Una variable se introduce en el modelo si la probabilidad de su

estadstico de puntuacin es menor que el valor de Entrada, y se elimina si la probabilidad es mayorque el valor de Eliminacin. Para anular los valores predeterminados, introduzca valores positivos enlos cuadros Entrada y Eliminacin. Entrada debe ser menor que Eliminacin.

Punto de corte para la clasificacin. Le permite determinar el punto de corte para la clasificacin de loscasos. Los casos con valores pronosticados que han sobrepasado el punto de corte para la clasificacin seclasifican como positivos, mientras que aqullos con valores pronosticados menores que el punto de cortese clasifican como negativos. Para cambiar los valores predeterminados, introduzca un valorcomprendido entre 0,01 y 0,99.

N mximo de iteraciones. Le permite cambiar el nmero mximo de veces que el modelo itera antes definalizar.

Incluir constante en el modelo. Le permite indicar si el modelo debe incluir un trmino constante. Si sedesactiva, el trmino constante ser igual a 0.

Caractersticas adicionales del comando LOGISTIC REGRESSIONLa sintaxis de comandos tambin le permite:v Identificar los resultados por casos mediante los valores o las etiquetas de variable de una variable.v Controlar el espaciado de los informes de iteracin. En lugar de imprimir las estimaciones de los

parmetros despus de cada iteracin, puede solicitar las estimaciones de los parmetros despus decada nsima iteracin.

v Cambiar los criterios para finalizar la iteracin y para comprobar la redundancia.v Especificar una lista de variables para los listados por casos.v Ahorrar memoria manteniendo los datos para cada grupo de archivos segmentados en un archivo de

trabajo externo durante el procesamiento.

Consulte la Referencia de sintaxis de comandos para obtener informacin completa de la sintaxis.

Captulo 2. Regresin Logstica 7

Captulo 3. Regresin logstica multinomialLa opcin Regresin logstica multinomial resulta til en aquellas situaciones en las que desee poderclasificar a los sujetos segn los valores de un conjunto de variables predictoras. Este tipo de regresin essimilar a la regresin logstica, pero ms general, ya que la variable dependiente no est restringida a doscategoras.

Ejemplo. Para conseguir una produccin y distribucin de pelculas ms eficaz, los estudios de cinenecesitan predecir qu tipo de pelculas es ms probable que vayan a ver los aficionados. Mediante unaregresin logstica multinomial, el estudio puede determinar la influencia que la edad, el sexo y lasrelaciones de pareja de cada persona tiene sobre el tipo de pelcula que prefieren. De esta manera, elestudio puede orientar la campaa publicitaria de una pelcula concreta al grupo de la poblacin quetenga ms probabilidades de ir a verla.

Estadsticos. Historial de iteraciones, coeficientes de los parmetros, covarianza asinttica y matrices decorrelacin, pruebas de la razn de verosimilitud para los efectos del modelo y los parciales, -2 log de laverosimilitud. Chi-cuadrado de la bondad de ajuste de Pearson y de la desvianza. R 2 de Cox y Snell, deNagelkerke y de McFadden. Clasificacin: frecuencias observadas respecto a las frecuenciaspronosticadas, por cada categora de respuesta. Tabulacin cruzada: frecuencias observadas ypronosticadas (con los residuos) y proporciones por patrn en las covariables y por categora derespuesta.

Mtodos. Se ajusta un modelo logit multinomial para el modelo factorial completo o para un modeloespecificado por el usuario. La estimacin de los parmetros se realiza a travs de un algoritmo iterativode mxima verosimilitud.

Regresin logstica multinomial: Consideraciones sobre los datos

Datos. La variable dependiente debe ser categrica. Las variables independientes pueden ser factores ocovariables. En general, los factores deben ser variables categricas y las covariables deben ser variablescontinuas.

Supuestos. Se asume que la razn de las ventajas de cualquier par de categoras es independiente de lasdems categoras de respuesta. Segn esta suposicin, por ejemplo, si se introduce un nuevo producto enun mercado, las cuotas de mercado de todos los dems productos se vern afectadas de maneraigualmente proporcional. De igual manera, dado un patrn en las covariables, se asume que lasrespuestas son variables multinomiales independientes.

Obtencin de una regresin logstica multinomial1. Elija en los mens:

Analizar > Regresin > Logstica multinomial...2. Seleccione una variable dependiente.3. Los factores son opcionales y pueden ser numricos o categricos.4. Las covariables son opcionales, pero si se especifican deben ser numricas.

Regresin logstica multinomialDe forma predeterminada, el procedimiento de Regresin logstica multinomial genera un modelo con losprincipales efectos que producen las covariables y los factores, pero puede especificar un modelopersonalizado o solicitar la seleccin de un modelo por pasos con este cuadro de dilogo.


Especificar modelo. Un modelo de efectos principales contiene los efectos principales de las covariables ylos factores, pero no contiene efectos de interaccin. Un modelo factorial completo contiene todos losefectos principales y todas las interacciones factor por factor. No contiene interacciones de covariable.Puede crear un modelo personalizado para especificar subconjuntos de interacciones entre los factores obien interacciones entre las covariables, o solicitar una seleccin por pasos de los trminos del modelo.

Factores & Covariables. Muestra una lista de los factores y las covariables.

Trminos de entrada forzada. Los trminos aadidos a la lista de entrada forzada siempre se incluyen enel modelo.

Trminos por pasos. Los trminos aadidos a la lista por pasos se incluyen en el modelo segn uno delos mtodos por pasos seleccionados por el usuario siguientes:v Entrada hacia delante. Este mtodo se inicia sin trminos por pasos en el modelo. En cada paso se

aade al modelo el trmino ms significativo, hasta que ninguno de los trminos por pasos que quedefuera del modelo tenga una contribucin estadsticamente significativa si se aade al modelo.

v Eliminacin hacia atrs. Este mtodo se inicia introduciendo en el modelo todos los trminosespecificados en la lista por pasos. En cada paso se elimina del modelo el trmino menos significativo,hasta que todos los trminos por pasos restantes representen una contribucin estadsticamentesignificativa para el modelo.

v Pasos sucesivos hacia adelante. Este mtodo se inicia con el modelo que se seleccionara mediante elmtodo de entrada hacia delante. A partir de ah, el algoritmo alterna entre la eliminacin hacia atrsde los trminos por pasos del modelo, y la entrada hacia delante de los trminos fuera del modelo. Sesigue as hasta que no queden trminos que cumplan con los criterios de entrada o eliminacin.

v Pasos sucesivos hacia atrs. Este mtodo se inicia con el modelo que se seleccionara mediante elmtodo de eliminacin hacia atrs. A partir de ah, el algoritmo alterna entre la entrada hacia delantede los trminos fuera del modelo, y la eliminacin hacia atrs de los trminos por pasos del modelo. Sesigue as hasta que no queden trminos que cumplan con los criterios de entrada o eliminacin.

Incluir la interseccin en el modelo. Le permite incluir o excluir del modelo un trmino de interseccin.

Generar trminosPara las covariables y los factores seleccionados:

Interaccin. Crea el trmino de interaccin de mayor nivel con todas las variables seleccionadas.

Efectos principales. Crea un trmino de efectos principales para cada variable seleccionada.

Todas de 2. Crea todas las interacciones bidimensionales posibles de las variables seleccionadas.

Todas de 3. Crea todas las interacciones tridimensionales posibles de las variables seleccionadas.

Todas de 4. Crea todas las interacciones tetradimensionales posibles de las variables seleccionadas.

Todas de 5. Crea todas las interacciones quntuples posibles de las variables seleccionadas.

Categora de referencia de regresin logstica multinomialDe forma predeterminada, el procedimiento Regresin logstica multinomial hace de la ltima categora lacategora de referencia. Este cuadro de dilogo le otorga el control sobre la categora de referencia y sobrela forma de ordenar las categoras.

Categora de referencia. Especifique la primera, la ltima o una categora personalizada.


Orden de categoras. En orden ascendente, el valor mnimo define la primera categora, y el valor msalto la ltima. En orden descendente, el valor mximo define la primera categora y el valor inferiordefine la ltima.

Regresin logstica multinomial: EstadsticosPuede especificar los siguientes estadsticos para una regresin logstica multinomial:

Resumen de procesamiento de casos. Esta tabla contiene informacin sobre las variables categricasespecificadas.

Modelo. Estadsticos del modelo global.v Pseudo R cuadrado. Imprime el estadstico de Cox y Snell, de Nagelkerke y el R 2 McFadden.v Resumen de pasos. Esta tabla resume los efectos introducidos o eliminados en cada paso, mediante un

mtodo por pasos. No se produce salvo que se especifique un modelo por pasos en el cuadro dedilogo Modelo.

v Informacin de ajuste de los modelos. Esta tabla compara los modelos ajustado y de slo interseccino nulo.

v Criterios de informacin. Esta tabla imprime tanto el criterio de informacin de Akaike (AIC) como elcriterio de informacin bayesiano (BIC).

v Probabilidades de casilla. Imprime una tabla de las frecuencias observadas y esperadas (con losresiduos) y las proporciones por patrn en las covariables y por categora de respuesta.

v Tabla de clasificacin. Imprime una tabla de las respuestas observadas respecto a las respuestaspronosticadas.

v Estadsticos de bondad de ajuste de chi-cuadrado. Imprime los estadsticos de chi-cuadrado dePearson y de chi-cuadrado de la razn de verosimilitud. Los estadsticos se calculan para los patronesen las covariables determinados por todos los factores y las covariables o por un subconjunto de losfactores y las covariables definido por el usuario.

v Medidas de monoticidad. Muestra una tabla con informacin sobre el nmero de pares concordantes,pares discordantes y empates. La D de Somers, la gamma de Goodman y Kruskal, la tau-a de Kendally el ndice de concordancia C tambin se muestran en esta tabla.

Parmetros. Estadsticos relativos a los parmetros del modelo.v Estimaciones. Imprime las estimaciones de los parmetros del modelo con un nivel de confianza

especificado por el usuario.v Contraste de la razn de verosimilitud. Imprime los contrastes de la razn de verosimilitud para los

efectos parciales del modelo. El contraste para el modelo global se imprime de manera automtica.v Correlaciones asintticas. Imprime la matriz de las correlaciones entre las estimaciones de los

parmetros.v Covarianzas asintticas. Imprime la matriz de las covarianzas de las estimaciones de los parmetros.

Definir subpoblaciones. Le permite seleccionar un subconjunto de factores y covariables de manera quepueda definir los patrones en las covariables utilizados por las probabilidades de casilla y las pruebas debondad de ajuste.

Regresin logstica multinomial: CriteriosPuede especificar los siguientes criterios para una regresin logstica multinomial:

Captulo 3. Regresin logstica multinomial 11

Iteraciones. Le permite especificar el nmero mximo de veces que desea recorrer el algoritmo, elnmero mximo de pasos en la subdivisin por pasos, las tolerancias de convergencia para los cambiosen el log de la verosimilitud y los parmetros, la frecuencia con que se imprime el progreso del algoritmoiterativo y en qu iteracin el procedimiento debe comenzar a comprobar la separacin completa o casicompleta de los datos.v Convergencia del logaritmo de la verosimilitud. Se asume la convergencia si el cambio absoluto en la

funcin log-verosimilitud es menor que el valor especificado. Este criterio no se aplica si el valor esigual a 0. Especifique un valor no negativo.

v Convergencia de los parmetros. Se asume la convergencia si el cambio absoluto en las estimacionesde los parmetros es menor que este valor. Este criterio no se aplica si el valor es igual a 0.

Delta. Le permite especificar un valor no negativo inferior a 1. Este valor se aade a cada casilla vaca dela tabulacin cruzada de las categoras de respuesta por patrones de covariables. Se ayuda as aestabilizar el algoritmo y evitar sesgos en las estimaciones.

Tolerancia para la singularidad. Le permite especificar la tolerancia empleada en la comprobacin de lasingularidad.

Opciones de Regresin logstica multinomialPuede especificar las siguientes opciones para una regresin logstica multinomial:

Escala de dispersin. Le permite especificar el valor de escalamiento de la dispersin que se va a utilizarpara corregir la estimacin de la matriz de covarianzas de los parmetros. Desvianza estima el valor deescalamiento mediante el estadstico de la funcin de desvianza (chi-cuadrado de la razn deverosimilitud. Pearson estima el valor de escalamiento mediante el estadstico chi-cuadrado de Pearson.Tambin puede especificar su propio valor de escalamiento. Debe ser un valor numrico positivo.

Opciones por pasos. Estas opciones le ofrecen el control de los criterios estadsticos cuando se utilizanmtodos por pasos para generar un modelo. Se ignoran salvo que se especifique un modelo por pasos enel cuadro de dilogo Modelo .v Probabilidad de entrada. Se trata de la probabilidad del estadstico de la razn de verosimilitud para

la entrada de variables. Cuanto mayor sea la probabilidad especificada, ms fcil resultar que unavariable entre en el modelo. Este criterio se ignora a menos que se seleccione uno de los mtodossiguientes: hacia delante, pasos sucesivos hacia adelante o pasos sucesivos hacia atrs.

v Prueba de entrada. ste es el mtodo para introducir los trminos en los mtodos por pasos. Escojaentre la prueba de la razn de verosimilitud y la prueba de puntuacin. Este criterio se ignora a menosque se seleccione uno de los mtodos siguientes: hacia delante, pasos sucesivos hacia adelante o pasossucesivos hacia atrs.

v Probabilidad de eliminacin. Se trata de la probabilidad del estadstico de la razn de verosimilitudpara la eliminacin de variables. Cuanto mayor sea la probabilidad especificada, ms fcil resultar queuna variable permanezca en el modelo. Este criterio se ignora a no ser que se seleccione el mtodo deeliminacin hacia atrs, pasos sucesivos hacia adelante o pasos sucesivos hacia atrs.

v Prueba de eliminacin. ste es el mtodo utilizado para eliminar trminos en los mtodos por pasos.Puede elegir entre la prueba de la razn de verosimilitud o la prueba de Wald. Este criterio se ignora ano ser que se seleccione el mtodo de eliminacin hacia atrs, pasos sucesivos hacia adelante o pasossucesivos hacia atrs.

v Efectos por pasos mnimos en el modelo. Al utilizar los mtodos de eliminacin hacia atrs o pasossucesivos hacia atrs, se especifica el mnimo nmero de trminos que puede incluirse en el modelo. Lainterseccin no se cuenta como trmino de modelo.

v Efectos por pasos mximos en el modelo. Al utilizar los mtodos de entrada hacia delante o pasossucesivos hacia adelante, se especifica el mximo nmero de trminos que puede incluirse en elmodelo. La interseccin no se cuenta como trmino de modelo.


v Restringir jerrquicamente la entrada y la eliminacin de trminos. Esta opcin permite elegir si sedesea aplicar restricciones a la inclusin de trminos de modelo. La jerarqua precisa que para que seincluya un trmino, todos los inferiores que formen parte del que se desea incluir se encuentren antesen el modelo. Por ejemplo, si el requisito de jerarqua est activado, los factores Estado civil y Sexodeben estar en el modelo antes de poder aadir la interaccin Estado civil*Sexo. Las tres opciones enforma de botn radial determinan el papel de las covariables a la hora de determinar la jerarqua.

Regresin logstica multinomial: GuardarEl cuadro de dilogo Guardar permite guardar las variables en el archivo de trabajo, as como exportar lainformacin de modelo a un archivo externo.

Variables guardadas. Se guardarn las siguientes variables:v Probabilidades de respuesta estimadas. Son las probabilidades estimadas de la clasificacin de un

patrn de factores/covariables en las categoras de respuesta. Hay tantas probabilidades estimadascomo categoras de la variable de respuesta; se guardarn hasta 25.

v Categora pronosticada. Es la categora de respuesta con la mayor probabilidad esperada para unpatrn de factores/covariables.

v Probabilidades de la categora pronosticada. Mximo de las probabilidades de respuesta estimadas.v Probabilidad de la categora real. Es la probabilidad estimada de la clasificacin de un patrn de

factores/covariables en la categora observada.

Exportar informacin del modelo a un archivo XML. Las estimaciones de los parmetros y (si lo desea)sus covarianzas se exportan al archivo especificado en formato XML (PMML). Puede utilizar este archivode modelo para aplicar la informacin del modelo a otros archivos de datos para puntuarlo.

Caractersticas adicionales del comando NOMREGLa sintaxis de comandos tambin le permite:v Especifique la categora de referencia de la variable dependiente.v Incluir los casos con valores perdidos del usuario.v Personalizar los contrastes de hiptesis especificando las hiptesis nulas como combinaciones lineales

de los parmetros.


Captulo 3. Regresin logstica multinomial 13

Captulo 4. Anlisis probitEste procedimiento mide la relacin entre la intensidad de un estmulo y la proporcin de casos quepresentan una cierta respuesta a dicho estmulo. Es til para las situaciones en las que se dispone de unarespuesta dicotmica que se piensa puede estar influenciada o causada por los niveles de alguna oalgunas variables independientes, y es particularmente adecuada para datos experimentales. Esteprocedimiento le permitir estimar la intensidad necesaria para que un estmulo llegue a inducir unadeterminada proporcin de respuestas, como la dosis efectiva para la mediana.

Ejemplo. Qu efectividad tiene un nuevo pesticida para matar hormigas y cul es la concentracinadecuada que se debe utilizar? Podra llevar a cabo un experimento en el que se expongan muestras dehormigas a diferentes concentraciones del pesticida y despus registrar el nmero de hormigas muertas yel nmero de hormigas expuestas. Aplicando el anlisis probit a estos datos puede determinar la fuerzade la relacin entre concentracin y mortalidad, as como determinar la concentracin adecuada depesticida si desea asegurar la exterminacin de, por ejemplo, el 95% de las hormigas expuestas.

Estadsticos. Coeficientes de regresin y errores estndar, interseccin y su error estndar, chi-cuadradode Pearson de la bondad de ajuste, frecuencias observadas y esperadas e intervalos de confianza para losniveles efectivos de la variable o variables independientes. Plots: grficos de respuestas transformadas.

Este procedimiento utiliza los algoritmos propuestos y aplicados en NPSOL

por Gill, Murray, Saunders yWright para la estimacin de los parmetros de modelo.

Anlisis probit: Consideraciones sobre los datos

Datos. Para cada valor de la variable independiente (o para cada combinacin de valores para mltiplesvariables independientes), la variable de respuesta debe contener el recuento del nmero de casos quepresenta la respuesta de inters y que toma dichos valores de la variable independiente, y la variable deltotal observado debe ser el recuento del nmero total de casos con dichos valores para la variableindependiente. La variable de factor debe ser categrica, codificada como enteros.

Supuestos. Las observaciones deben ser independientes. Si dispone de un gran nmero de valores paralas variables independientes respecto al nmero de observaciones, como es probable que suceda en unestudio observacional, puede que no sean vlidos los estadsticos de chi-cuadrado y de bondad de ajuste.

Procedimientos relacionados. El anlisis probit est estrechamente relacionado con la regresin logstica;de hecho, si elige la transformacin logit, este procedimiento calcular esencialmente una regresinlogstica. En general, el anlisis probit es apropiado para los diseos experimentales, mientras que laregresin logstica es ms adecuada para los estudios observacionales. Las diferencias en los resultadosreflejan estas diferencias de nfasis. El procedimiento Anlisis probit informa de las estimaciones de losvalores efectivos para las diferentes tasas de respuesta (incluyendo la dosis efectiva para la mediana),mientras que la Regresin logstica informa de las estimaciones de las razones de las ventajas (oddsratios) para las variables independientes.

Para obtener un anlisis probit1. Elija en los mens:

Analizar > Regresin > Probit...2. Seleccione una variable para la frecuencia de respuesta. Esta variable indica el nmero de casos que

presentan una respuesta al estmulo de prueba. Los valores de esta variable no pueden ser negativos.3. Seleccione una variable para el total observado. Esta variable indica el nmero de casos a los que se

aplic el estmulo. Para cada caso, los valores de esta variable no pueden ser negativos ni menoresque los valores de la variable de frecuencia de respuesta.


Si se desea, puede seleccionarse una variable de factor. Si lo hace, pulse en Definir rango para definirlos grupos.

4. Seleccione una o varias covariables. La covariable contiene el nivel del estmulo aplicado en cadaobservacin. Si desea transformar la covariable, seleccione una transformacin de la lista desplegableTransformar. Si no se aplica ninguna transformacin y hay un grupo de control, ste se incluir en elanlisis.

5. Seleccione el modelo Probit o Logit.v Modelo Probit. Aplica la transformacin Probit (la inversa de la funcin acumulada de la distribucin

normal estndar) a las proporciones de respuesta.v Modelo Logit. Aplica la transformacin logit (log de la probabilidad) a las proporciones de respuesta.

Anlisis probit: Definir rangoPermite especificar los niveles de la variable de factor que sern analizados. Los niveles de factor debencodificarse como enteros consecutivos; se analizarn todos los niveles del rango que especifique.

Anlisis probit: OpcionesPuede especificar opciones para el anlisis probit:

Estadsticas. Permite solicitar las estadsticas opcionales siguientes: Frecuencias, Potencia relativa de lamediana, Prueba de paralelismo e Intervalos de confianza fiduciaria.v Potencia relativa de la mediana. Muestra la razn de las potencias de las medianas para cada pareja de

los niveles del factor. Tambin muestra los lmites de confianza al 95% para cada potencia relativa de lamediana. Las potencias relativas de la mediana no estn disponibles si no dispone de una variable defactor, o si dispone de ms de una covariable.

v Prueba de paralelismo. Contraste sobre la hiptesis de que todos los niveles del factor tienen unainclinacin comn.

v Intervalos de confianza fiduciaria. Intervalos de confianza para la dosis del agente requerida paraproducir una cierta probabilidad de respuesta.

Intervalos de confianza fiduciaria y Potencia relativa de la mediana no estn disponibles si se haseleccionado ms de una covariable. Potencia relativa de la mediana y Prueba de paralelismo slo estndisponibles si se ha seleccionado una variable de factor.

ndice de respuesta natural. Permite indicar un ndice de respuesta natural incluso en la ausencia delestmulo. Ninguna, Calcular a partir de los datos o Valor.v Calcular a partir de los datos. Estima el ndice de respuesta natural a partir de los datos de la muestra.

Los datos deben contener un caso que represente el nivel de control, para el cual el valor de lascovariables sea 0. Probit estima el ndice de respuesta natural utilizando como valor inicial laproporcin de respuestas para el nivel de control.

v Valor. Establece el ndice de respuesta natural del modelo (seleccione este elemento cuando conozca deantemano el ndice de respuesta natural). Introduzca la proporcin de respuesta natural (la proporcindebe ser menor que 1). Por ejemplo, si la respuesta ocurre el 10% de las veces cuando el estmulo es 0,introduzca 0,10.

Criterios. Permite controlar los parmetros del algoritmo iterativo de estimacin de los parmetros.Puede anular las opciones predeterminadas para N mximo de iteraciones, Lmite para los pasos yTolerancia de la optimalidad.


Caractersticas adicionales del comando PROBITLa sintaxis de comandos tambin le permite:v Solicitar simultneamente un anlisis con ambos modelos, probit y logit.v Controlar el tratamiento de los valores perdidos.v Transformar las covariables por bases diferentes de la base 10 o el logaritmo natural.


Captulo 4. Anlisis probit 17

Captulo 5. Regresin no linealRegresin no lineal es un mtodo para encontrar un modelo no lineal para la relacin entre la variabledependiente y un conjunto de variables independientes. A diferencia de la regresin lineal tradicional,que est restringida a la estimacin de modelos lineales, la regresin no lineal puede estimar modelos conrelaciones arbitrarias entre las variables independientes y las dependientes. Esto se lleva a cabo usandoalgoritmos de estimacin iterativos. Tenga en cuenta que este procedimiento no es necesario para losmodelos polinmicos simples de la forma Y = A + BX**2. Definiendo W = X**2, obtenemos un modelolineal simple, Y = A + BW, que se puede estimar usando mtodos tradicionales como el procedimientoRegresin lineal.

Ejemplo. Puede pronosticarse la poblacin basndose en el tiempo Un diagrama de dispersin muestraque parece haber una estrecha relacin entre la poblacin y el tiempo, pero la relacin es no lineal y poreso exige la utilizacin de los mtodos de estimacin especiales del procedimiento Regresin no lineal.Creando una ecuacin adecuada, como la del modelo logstico de crecimiento poblacional, podemosobtener una buena estimacin del modelo, lo que nos permitir hacer predicciones sobre la poblacinpara pocas que no se han sido medidas.

Estadsticos. Para las iteraciones: estimaciones de los parmetros y suma de cuadrados residual. Para losmodelos: suma de cuadrados para regresin, residual, total corregido y no corregido, estimaciones de losparmetros, errores estndar asintticos y matriz de correlaciones asintticas de estimaciones de losparmetros.

Nota: la regresin no lineal restringida utiliza los algoritmos propuestos y aplicados en NPSOL

por Gill,Murray, Saunders y Wright para la estimacin de los parmetros de modelo.

Regresin no lineal: Consideraciones sobre los datos

Datos. Las variables dependiente e independientes deben ser cuantitativas. Las variables categricas,como la religin, la mayora de edad o el lugar de residencia, han de recodificarse como variablesbinarias (dummy) o como otro de los tipos de variables de contraste.

Supuestos. Los resultados son vlidos slo si se ha especificado una funcin que describa con precisin larelacin entre las variables independientes y las dependientes. Adems, la eleccin de buenos valoresiniciales es muy importante. Incluso si se ha especificado la forma funcional correcta para el modelo, sino utiliza valores iniciales adecuados, puede que su modelo no logre converger o puede que obtenga unasolucin que sea ptima localmente en vez de una que sea ptima globalmente.

Procedimientos relacionados. Muchos modelos que en un principio parecen ser no lineales pueden sertransformados en un modelo lineal, el cual pueda ser analizado usando el procedimiento Regresinlineal. Si no est seguro de cul es el modelo adecuado, el procedimiento Estimacin curvilnea puedeayudarle a identificar relaciones funcionales tiles que estn presentes en los datos.

Para obtener un anlisis de regresin no lineal1. Elija en los mens:

Analizar > Regresin > No lineal...2. Seleccione una variable numrica dependiente de la lista de variables del conjunto de datos activo.3. Para generar una expresin para el modelo, introduzca la expresin en el campo Expresin del

modelo o bien pegue en el campo los componentes (variables, parmetros, funciones).4. Identifique los parmetros del modelo pulsando en Parmetros.


Un modelo segmentado (uno que adquiere diferentes formas en distintas partes de su dominio) se debeespecificar usando la lgica condicional dentro de la declaracin nica del modelo.

Lgica condicional (Regresin no lineal)Se puede especificar un modelo segmentado utilizando la lgica condicional. Para usar la lgicacondicional dentro de la expresin del modelo o de la funcin de prdida, debe generar la suma de unaserie de trminos, uno para cada condicin. Cada trmino se compone de una expresin lgica (entreparntesis) multiplicada por la expresin que resultar cuando esa expresin lgica es verdadera.

Por ejemplo, considere un modelo segmentado que sea igual a 0 para X

Nota: esta seleccin persistir en este cuadro de dilogo durante el resto de la sesin. Si cambia elmodelo, asegrese de desactivarla.

Modelos comunes de regresin no linealLa tabla que se muestra ms abajo proporciona ejemplos de la sintaxis del modelo para muchos modelosde regresin no lineal publicados. Es probable que los modelos seleccionados al azar no se ajusten bien asus datos. Son necesarios valores iniciales adecuados para los parmetros; algunos modelos requierenrestricciones para llegar a converger.

Tabla 1. Ejemplos de sintaxis de modeloNombre Expresin del modelo

Regresin asinttica b1 + b2 *exp( b3 * x )

Regresin asinttica b1 (b2 * (b3 ** x))

Densidad (b1 + b2 * x) ** (1 / b3)

Gauss b1 * (1 b3 * exp(b2 * x ** 2))

Gompertz b1 * exp(b2 * exp(b3 * x))

Johnson-Schumacher b1 * exp(b2 / (x + b3))

Log-modificado ( b1 + b3 * x ) ** b2

Log-logstica b1 ln(1 + b2 * exp(b3 * x))

Ley de Metcherlich de devolucionesdecrecientes

b1 + b2 * exp(b3 * x)

Michaelis Menten b1* x /( x + b2 )

Morgan-Mercer-Florin ( b1 * b2 + b3 * x ** b4 )/( b2 + x ** b4 )

Peal-Reed b1 / (1+ b2 * exp((b3 * x + b4 * x **2 + b5 * x ** 3)))

Razn de cbicas (b1 + b2 * x + b3 * x ** 2 + b4 * x ** 3) / (b5 * x ** 3)

Razn de cuadrticas ( b1 + b2 * x + b3 * x **2)/( b4 * x **2)

Richards b1 / ((1 + b3 * exp(b2 * x)) ** (1 / b4))

Verhulst b1 / (1 + b3 * exp(b2 * x))

Von Bertalanffy (b1 ** (1 b4) b2 * exp(b3 * x)) ** (1 / (1 b4))

Weibull b1 b2 * exp(b3 * x ** b4)

Densidad de rendimiento (b1 + b2 * x + b3 * x ** 2) ** (1)

Regresin no lineal: Funcin de prdidaLa funcin de prdida en regresin no lineal es la funcin que es minimizada por el algoritmo.Seleccione Suma de los residuos al cuadrado para minimizar la suma de los residuos al cuadrado o bienFuncin de prdida definida por el usuario para minimizar una funcin diferente.

Si selecciona Funcin de prdida definida por el usuario, debe definir la funcin de prdida cuya suma(en todos los casos) deber minimizarse por la eleccin de los valores de los parmetros.v La mayora de las funciones de prdida incluyen la variable especial RESID_, que representa el

residuo. La funcin de prdida predeterminada Suma de los residuos al cuadrado se podra introducirexplcitamente como RESID_**2. Si tiene que utilizar el valor predicho la funcin de prdida, ste esigual a la variable dependiente menos el residuo.

v Se puede especificar una funcin de prdida condicional utilizando la lgica condicional.

Captulo 5. Regresin no lineal 21

Puede escribir una expresin en el campo Funcin de prdida definida por el usuario, o bien pegar en elcampo los componentes de la expresin. Las constantes de cadena deben ir entre comillas o apstrofos ylas constantes numricas deben escribirse en formato americano, con el punto como separador de la partedecimal.

Regresin no lineal: Restricciones para los parmetrosUna restriccin es una limitacin sobre los valores permitidos para un parmetro durante la bsquedaiterativa de una solucin. Las expresiones lineales se evalan antes de realizar un paso, de modo que sepuedan utilizar restricciones lineales para omitir los pasos que pueden provocar desbordamientos. Lasexpresiones no lineales se evalan despus de realizar el paso.

Cada ecuacin o desigualdad requiere los siguientes elementos:v Una expresin que incluya al menos un parmetro del modelo. Escriba la expresin o bien utilice el

teclado, que le permita pegar nmeros, operadores o parntesis en la expresin. Puede escribir elparmetro o parmetros requeridos junto con el resto de la expresin o bien pegarlos de la lista deParmetros situada a la izquierda. No se pueden usar variables ordinarias en una restriccin.

v Una de los tres operadores lgicos =.v Una constante numrica, con la que se compara la expresin utilizando el operador lgico. Escriba la

constante. Las constantes numricas deben escribirse en formato americano, con el punto comoseparador de la parte decimal.

Regresin no lineal: Guardar variables nuevasPuede guardar una serie de variables nuevas en el archivo de datos activo. Las opciones disponibles son:Residuos, Valores pronosticados, Derivadas y Valores de la funcin de prdida. Estas variables se puedenutilizar en anlisis subsiguientes para contrastar el ajuste del modelo o para identificar casosproblemticos.v Residuos. Guarda los residuos con el nombre de variable resid.v Valores pronosticados. Guarda los valores pronosticados, con el nombre de variable pred_.v Derivadas. Se guarda una derivada para cada parmetro del modelo. Los nombres de las derivadas se

construyen aadiendo como prefijo una "d." a los primeros seis caracteres de los nombres de losparmetros.

v Valores de funcin de prdida. Esta opcin est disponible si especifica su propia funcin de prdida. Elnombre de variable loss_ est asignada a los valores de la funcin de prdida.

Regresin no lineal: OpcionesEste cuadro de dilogo permite controlar diversos aspectos del anlisis de regresin no lineal:

Estimaciones de simulacin de muestreo. Mtodo para la estimacin del error estndar de un estadstico queusa muestras repetidas del conjunto original de datos. Se realiza mediante muestreo con repeticin paraobtener numerosas muestras del mismo tamao que el conjunto de datos original. La ecuacin no linealse estima para cada una de estas muestras. A continuacin, se calcula el error estndar de cadaestimacin del parmetro como la desviacin estndar de las estimaciones creadas por simulacin demuestreo. Se utilizan los valores de los parmetros obtenidos a partir de los datos originales como losvalores de inicio para cada muestra de simulacin de muestreo. Requiere el algoritmo de programacincuadrtica secuencial.

Mtodo de estimacin. Permite seleccionar un mtodo de estimacin, si esto es posible. (Determinadasopciones de ste y otros cuadros de dilogo requieren el algoritmo de programacin cuadrticasecuencial.) Entre las alternativas disponibles se encuentran Programacin cuadrtica secuencial yLevenberg-Marquardt.


v Programacin cuadrtica secuencial. Este mtodo est disponible para los modelos restringidos y los norestringidos. La programacin cuadrtica secuencial se utiliza automticamente si especifica un modelorestringido, una funcin de prdida definida por el usuario o la simulacin de muestreo. Puedeintroducir nuevos valores para N mximo de iteraciones y Lmite para los pasos, puede cambiar laseleccin en las listas desplegables de Tolerancia de la optimidad, Precisin de la funcin y Tamaopara pasos infinitos.

v Levenberg-Marquardt. Algoritmo predeterminado para los modelos no restringidos. No puede utilizar elmtodo de Levenberg-Marquardt si especifica un modelo restringido, una funcin de prdida definidapor el usuario, o la simulacin de muestreo. Se pueden introducir nuevos valores para N mximo deiteraciones y cambiar las selecciones de las listas desplegables de Convergencia de la suma decuadrados y Convergencia en los parmetros.

Regresin no lineal: Interpretacin de los resultadosLos problemas de la regresin no lineal presentan con frecuencia dificultades de clculo:v La eleccin de valores iniciales para los parmetros influye en la convergencia. Intente elegir valores

iniciales que sean razonables y, si es posible, prximos a la solucin final esperada.v A veces, un algoritmo se ejecuta mejor que otro en un determinado problema. En el cuadro de dilogo

Opciones, seleccione el otro algoritmo si est disponible. Si especifica una funcin de prdida o ciertostipos de restricciones, no podr utilizar el algoritmo de Levenberg-Marquardt.

v Cuando la iteracin se detiene slo porque se ha dado el nmero mximo de iteraciones, el modelofinal probablemente no sea una buena solucin. Seleccione Usar los valores iniciales del anlisisprevio del cuadro de dilogo Parmetros para continuar la iteracin o, mejor an, elija otros valoresiniciales.

v Los modelos que requieren la exponenciacin de o por valores de datos grandes pueden causardesbordamientos (nmeros demasiado grandes o demasiado pequeos para que su equipo losrepresente). A veces esto se puede evitar eligiendo los valores iniciales adecuados o imponiendorestricciones sobre los parmetros.

Caractersticas adicionales del comando NLRLa sintaxis de comandos tambin le permite:v Nombrar un archivo del cual leer valores iniciales para las estimaciones de los parmetros.v Especificar ms de una sentencia de modelo y de funcin de prdida. Con ello se facilita la tarea de

especificacin de un modelo segmentado.v Suministrar sus propias derivadas en vez de utilizar las calculadas por el programa.v Especificar el nmero de muestras de simulacin de muestreo que se van a generar.v Especificar criterios de iteracin adicionales, incluyendo el establecer un valor crtico para la

comprobacin de las derivadas y definir un criterio de convergencia para la correlacin entre losresiduos y las derivadas.

Los criterios adicionales para el comando CNLR (regresin no lineal restringida) permiten:v Especificar el nmero mximo de iteraciones secundarias permitidas dentro de cada iteracin principal.v Establecer un valor crtico para la comprobacin de las derivadas.v Establecer un lmite para los pasos.v Especificar una tolerancia de colapso para determinar si los valores iniciales estn dentro de los lmites

especificados.


Captulo 5. Regresin no lineal 23

Captulo 6. Estimacin ponderadaLos modelos de regresin lineal estndar asumen que la varianza es constante en la poblacin objeto deestudio. Cuando ste no es el caso (por ejemplo cuando los casos con puntuaciones mayores en unatributo muestran ms variabilidad que los casos con puntuaciones menores en ese atributo), la regresinlineal mediante mnimos cuadrados ordinarios (MCO, OLS) deja de proporcionar estimaciones ptimaspara el modelo. Si las diferencias de variabilidad se pueden pronosticar a partir de otra variable, elprocedimiento Estimacin ponderada permite calcular los coeficientes de un modelo de regresin linealmediante mnimos cuadrados ponderados (MCP, WLS), de forma que se les d mayor ponderacin a lasobservaciones ms precisas (es decir, aqullas con menos variabilidad) al determinar los coeficientes deregresin. El procedimiento Estimacin ponderada contrasta un rango de transformaciones deponderacin e indica cul se ajustar mejor a los datos.

Ejemplo. Cules son los efectos de la inflacin y el paro sobre los cambios en el precio de las accionesDebido a que los valores con mayor valor de cotizacin suelen mostrar ms variabilidad que aquellos conmenor valor de cotizacin, la estimacin de mnimos cuadrados ordinarios no generar estimaciones quesean ptimas. El mtodo de Estimacin ponderada permite capturar el efecto del precio de cotizacinsobre la variabilidad de los cambios en el precio, al calcular el modelo lineal.

Estadsticos. Valores de la log-verosimilitud para cada potencia de la variable de origen de ponderacinpuesta a prueba,R mltiple, R-cuadrado, R cuadrado corregida, tabla de ANOVA para el modelo MCP,estimaciones de los parmetros tipificados y no tipificados y log-verosimilitud para el modelo MCP.

Estimacin ponderada: Consideraciones sobre los datos

Datos. Las variables dependiente e independientes deben ser cuantitativas. Las variables categricas,como la religin, la mayora de edad o el lugar de residencia, han de recodificarse como variablesbinarias (dummy) o como otro de los tipos de variables de contraste. La variable de ponderacin deberser cuantitativa y estar relacionada con la variabilidad de la variable dependiente.

Supuestos. Para cada valor de la variable independiente, la distribucin de la variable dependiente debeser normal. La relacin entre la variable dependiente y cada variable independiente debe ser lineal ytodas las observaciones deben ser independientes. La varianza de la variable dependiente puede cambiarsegn los niveles de la variable o variables independientes, pero las diferencias se deben poderpronosticar en funcin de la variable de ponderacin.

Procedimientos relacionados. El procedimiento Explorar se puede utilizar para inspeccionar los datos.Este procedimiento proporciona pruebas de normalidad y homogeneidad de la varianza, as comorepresentaciones grficas. Si la variable dependiente parece tener la misma varianza para todos losniveles de las variables independientes, puede utilizar el procedimiento Regresin lineal. Si los datosparecen violar un supuesto (como puede ser la normalidad), intente transformarlos. Si los datos no estnrelacionados linealmente y una transformacin no ayuda, utilice un modelo alternativo en elprocedimiento Estimacin curvilnea. Si la variable dependiente es dicotmica, por ejemplo si se lleva ono a cabo una determinada venta o si un artculo es o no defectuoso, utilice el procedimiento Regresinlogstica. Si la variable dependiente est censurada (por ejemplo, el tiempo de supervivencia despus deuna intervencin quirrgica), utilice los procedimientos Tablas de mortalidad, Kaplan-Meier o Regresinde Cox, disponibles en la opcin Estadsticas avanzadas. Si los datos no son independientes (por ejemplo,si observa a la misma persona en diversas condiciones), utilice el procedimiento Medidas repetidas,disponible en la opcin Estadsticas avanzadas.

Para obtener un anlisis de Estimacin ponderada1. Seleccione en los mens:


Analizar > Regresin > Estimacin ponderada...2. Seleccione una variable dependiente.3. Seleccionar una o ms variables independientes.4. Seleccione la variable que sea el origen de heterocedasticidad como variable de ponderacin.v Variable de ponderacin. Los datos son ponderados por el inverso de esta variable elevada a una

potencia. La ecuacin de regresin se calcula para cada uno de los valores del rango de potenciasespecificado y se indica la potencia que maximiza el logaritmo de la funcin de verosimilitud.

v Rango de potencia. Se utiliza en conjuncin con la variable de ponderacin para calcular lasponderaciones. Se ajustarn varias ecuaciones de regresin, una para cada valor del rango de potencias.Los valores introducidos en el cuadro Rango de potencias y en el cuadro Hasta, deben encontrarseentre -6,5 y 7,5, ambos inclusive. Los valores de la potencia irn del valor menor al mayor, con elincremento determinado por el valor especificado. El nmero total de valores del rango de potenciasest limitado a 150.

Estimacin ponderada: OpcionesPuede especificar las opciones para el anlisis de estimacin ponderada:

Guardar la mejor ponderacin como nueva variable. Aade la variable de ponderacin al archivo activo.Esta variable se denomina WGT_n, siendo n un nmero elegido para proporcionar a la variable unnombre exclusivo.

Mostrar ANOVA y estimaciones. Permite controlar cmo se muestran los estadsticos en los resultados.Las alternativas disponibles son Para la mejor potencia y Para cada valor de potencia.

Caractersticas adicionales del comando WLSLa sintaxis de comandos tambin le permite:v Proporcionar un nico valor para la potencia.v Especificar una lista de valores para la potencia o mezclar un rango de valores con una lista de valores

para la potencia.



Captulo 7. Regresin por mnimos cuadrados en dos fasesLos modelos de regresin lineal estndar asumen que los errores de la variable dependiente no estncorrelacionados con la variable o variables independientes. Cuando ste no es el caso (por ejemplo,cuando las relaciones entre las variables son bidimensionales), la regresin lineal mediante mnimoscuadrados ordinarios (OLS) deja de proporcionar estimaciones ptimas del modelo. La regresin pormnimos cuadrados en dos fases utiliza variables instrumentales que no estn correlacionadas con lostrminos de error para calcular los valores estimados de los predictores problemticos (en la primera fase) y despus utiliza dichos valores calculados para estimar un modelo de regresin lineal para la variabledependiente (la segunda fase). Dado que los valores calculados se basan en variables que no estncorrelacionadas con los errores, los resultados del modelo en dos fases son ptimos.

Ejemplo. Est relacionada la demanda de un artculo con su precio y con los ingresos del consumidor?La dificultad de este modelo radica en que el precio y la demanda tienen efectos recprocos el uno sobreel otro. Es decir, el precio puede influir en la demanda y la demanda tambin puede influir en el precio.Un modelo de regresin por mnimos cuadrados en dos fases permite utilizar los ingresos de losconsumidores y el precio retardado para calcular un predictor sustituto del precio, el cual no estcorrelacionado con los errores de medicin de la demanda. Se reemplaza el precio en el modeloespecificado originariamente por este sustituto y despus se estima el nuevo modelo.

Estadsticos. Para los modelos: coeficientes de regresin tipificados y no tipificados, R mltiple, R cuadrado,R cuadrado corregida, error estndar de la estimacin, tabla de anlisis de varianza, valores pronosticados yresiduos. Adems, los intervalos de confianza al 95% para cada coeficiente de regresin y las matrices decorrelacin y covarianza para las estimaciones de los parmetros.

Regresin por mnimos cuadrados en dos fases: Consideraciones sobre los datos

Datos. Las variables dependiente e independientes deben ser cuantitativas. Las variables categricas,como la religin, la mayora de edad o el lugar de residencia, han de recodificarse como variablesbinarias (dummy) o como otro de los tipos de variables de contraste. Las variables explicativas endgenasdeben ser cuantitativas (no categricas).

Supuestos. Para cada valor de la variable independiente, la distribucin de la variable dependiente debeser normal. La varianza de distribucin de la variable dependiente debe ser constante para todos losvalores de la variable independiente. La relacin entre la variable dependiente y cada variableindependiente debe ser lineal.

Procedimientos relacionados. Si piensa que ninguna de las variables predictoras est correlacionada conlos errores de la variable dependiente, puede utilizar el procedimiento Regresin lineal. Si los datosparecen violar alguno de los supuestos (como la normalidad o la varianza constante), pruebe atransformarlos. Si los datos no estn relacionados linealmente y una transformacin no ayuda, utilice unmodelo alternativo en el procedimiento Estimacin curvilnea. Si la variable dependiente es dicotmica,por ejemplo si se ha completado o no una determinada venta, utilice el procedimiento Regresin logstica.Si los datos no son independientes (por ejemplo, si observa a la misma persona en diversas condiciones),utilice el procedimiento Medidas repetidas, disponible en la opcin Modelos avanzados.

Para obtener un anlisis de regresin de mnimos cuadrados en dos fases1. Elija en los mens:

Analizar > Regresin > Mnimos cuadrados en dos fases...2. Seleccione una variable dependiente.3. Seleccione una o ms variables (predictoras) explicativas.4. Seleccione una o ms variables instrumentales.


v Instrumental. Estas son las variables utilizadas para calcular los valores pronosticados de las variablesendgenas en la primera etapa del anlisis de mnimos cuadrados en dos fases. Las listas de variablesexplicativas e instrumentales pueden contener las mismas variables. Debe haber al menos tantasvariables instrumentales como explicativas. Si las variables explicativas e instrumentales coinciden, losresultados sern los mismos que los del procedimiento de Regresin lineal.

Las variables explicativas no especificadas como instrumentales se consideran endgenas. Normalmente,todas las variables exgenas de la lista Explicativas se especifican tambin como variables instrumentales.

Regresin por mnimos cuadrados en dos fases: OpcionesPuede seleccionar las opciones siguientes para su anlisis:

Guardar variables nuevas. Permite aadir nuevas variables al archivo activo. Las opciones disponiblesson Predicciones y Residuos.

Mostrar covarianza de parmetros. Permite imprimir la matriz de covarianzas de las estimaciones de losparmetros.

Caractersticas adicionales del comando 2SLSEl lenguaje de sintaxis de comandos tambin permite estimar varias ecuaciones simultneamente.Consulte la Referencia de sintaxis de comandos para obtener informacin completa de la sintaxis.


Captulo 8. Esquemas de codificacin de variablescategricasEn muchos procedimientos, se puede solicitar la sustitucin automtica de una variable independientecategrica por un conjunto de variables de contraste, que se podrn introducir o eliminar de unaecuacin como un bloque. Puede especificar cmo se va a codificar el conjunto de variables de contraste,normalmente en el subcomando CONTRAST. Ese apndice explica e ilustra el funcionamiento real de losdistintos tipos de contrastes solicitados en CONTRAST.

DesviacinDesviacin desde la media global. En trminos matriciales, estos contrastes tienen la forma:

mean (1/k 1/k ... 1/k 1/k)df(1) (1-1/k -1/k ... -1/k -1/k)df(2) ( -1/k 1-1/k ... -1/k -1/k)

. .

. .df(k-1) ( -1/k -1/k ... 1-1/k -1/k)

donde k es el nmero de categoras para la variable independiente y, de forma predeterminada, se omitela ltima categora. Por ejemplo, los contrastes de desviacin para una variable independiente con trescategoras son los siguientes:( 1/3 1/3 1/3)( 2/3 -1/3 -1/3)(-1/3 2/3 -1/3)

Para omitir una categora distinta de la ltima, especifique el nmero de la categora omitida entre elparntesis que sucede a la palabra clave DEVIATION. Por ejemplo, el siguiente subcomando obtiene lasdesviaciones para la primera y tercera categoras y omite la segunda:/CONTRAST(FACTOR)=DEVIATION(2)

Suponga que factor tiene tres categoras. La matriz de contrastes resultante ser( 1/3 1/3 1/3)( 2/3 -1/3 -1/3)(-1/3 -1/3 2/3)

SimpleContrastes simples. Compara cada nivel de un factor con el ltimo. La forma de la matriz general es

mean (1/k 1/k ... 1/k 1/k)df(1) ( 1 0 ... 0 -1)df(2) ( 0 1 ... 0 -1)

. .

. .df(k-1) ( 0 0 ... 1 -1)

donde k es el nmero de categoras para la variable independiente. Por ejemplo, los contrastes simplespara una variable independiente con cuatro categoras son los siguientes:( 1/4 1/4 1/4 1/4)( 1 0 0 -1)( 0 1 0 -1)( 0 0 1 -1)

Para utilizar otra categora en lugar de la ltima como categora de referencia, especifique entreparntesis tras la palabra clave SIMPLE el nmero de secuencia de la categora de referencia, que no esnecesariamente el valor asociado con dicha categora. Por ejemplo, el siguiente subcomando CONTRASTobtiene una matriz de contrastes que omite la segunda categora:/CONTRAST(FACTOR) = SIMPLE(2)


Suponga que factor tiene cuatro categoras. La matriz de contrastes resultante ser( 1/4 1/4 1/4 1/4)( 1 -1 0 0)( 0 -1 1 0)( 0 -1 0 1)

HelmertContrastes de Helmert. Compara categoras de una variable independiente con la media de las categorassubsiguientes. La forma de la matriz general es

mean (1/k 1/k ... 1/k 1/k 1/k)df(1) ( 1 -1/(k-1) ... -1/(k-1) -1/(k-1) -1/(k-1))df(2) ( 0 1 ... -1/(k-2) -1/(k-2) -1/(k-2))

. .

. .df(k-2) ( 0 0 ... 1 -1/2 -1/2)df(k-1) ( 0 0 ... 0 1 -1)

donde k es el nmero de categoras de la variable independiente. Por ejemplo, una variableindependiente con cuatro categoras tiene una matriz de contrastes de Helmert con la siguiente forma:( 1/4 1/4 1/4 1/4)( 1 -1/3 -1/3 -1/3)( 0 1 -1/2 -1/2)( 0 0 1 -1)

DiferenciaDiferencia o contrastes de Helmert inversos. Compara categoras de una variable independiente con lamedia de las categoras anteriores de la variable. La forma de la matriz general es

mean (1/k 1/k 1/k ... 1/k)df(1) ( -1 1 0 ... 0)df(2) ( -1/2 -1/2 1 ... 0)

. .

. .df(k-1) (-1/(k-1) -1/(k-1) -1/(k-1) ... 1)

donde k es el nmero de categoras para la variable independiente. Por ejemplo, los contrastes dediferencia para una variable independiente con cuatro categoras son los siguientes:( 1/4 1/4 1/4 1/4)( -1 1 0 0)(-1/2 -1/2 1 0)(-1/3 -1/3 -1/3 1)

PolinmicoContrastes polinmicos ortogonales. El primer grado de libertad contiene el efecto lineal a travs detodas las categoras; el segundo grado de libertad, el efecto cuadrtico, el tercer grado de libertad, elcbico, y as sucesivamente hasta los efectos de orden superior.

Se puede especificar el espaciado entre niveles del tratamiento medido por la variable categrica dada. Sepuede especificar un espaciado igual, que es el valor predeterminado si se omite la mtrica, como enterosconsecutivos desde 1 hasta k, donde k es el nmero de categoras. Si la variable frmaco tiene trescategoras, el subcomando/CONTRAST(DRUG)=POLYNOMIAL

es idntico a/CONTRAST(DRUG)=POLYNOMIAL(1,2,3)

De todas maneras, el espaciado igual no es siempre necesario. Por ejemplo, supongamos que frmacorepresenta las diferentes dosis de un frmaco administrado a tres grupos. Si la dosis administrada alsegundo grupo es el doble que la administrada al primer grupo y la dosis administrada al tercer grupo es


el triple que la del primer grupo, las categoras del tratamiento estn espaciadas por igual y una mtricaadecuada para esta situacin se compone de enteros consecutivos:/CONTRAST(DRUG)=POLYNOMIAL(1,2,3)

No obstante, si la dosis administrada al segundo grupo es cuatro veces la administrada al primer grupo,y la dosis del tercer grupo es siete veces la del primer grupo, una mtrica adecuada sera/CONTRAST(DRUG)=POLYNOMIAL(1,4,7)

En cualquier caso, el resultado de la especificacin de contrastes es que el primer grado de libertad parafrmaco contiene el efecto lineal de los niveles de dosificacin y el segundo grado de libertad contiene elefecto cuadrtico.

Los contrastes polinmicos son especialmente tiles en contrastes de tendencias y para investigar lanaturaleza de superficies de respuestas. Tambin se pueden utilizar contrastes polinmicos para realizarajustes de curvas no lineales, como una regresin curvilnea.

RepetidoCompara niveles adyacentes de una variable independiente. La forma de la matriz general es

mean (1/k 1/k 1/k ... 1/k 1/k)df(1) ( 1 -1 0 ... 0 0)df(2) ( 0 1 -1 ... 0 0)

. .

. .df(k-1) ( 0 0 0 ... 1 -1)

donde k es el nmero de categoras para la variable independiente. Por ejemplo, los contrastes repetidospara una variable independiente con cuatro categoras son los siguientes:( 1/4 1/4 1/4 1/4)( 1 -1 0 0)( 0 1 -1 0)( 0 0 1 -1)

Estos contrastes son tiles en el anlisis de perfiles y siempre que sean necesarias puntuaciones dediferencia.

EspecialUn contraste definido por el usuario. Permite la introduccin de contrastes especiales en forma dematrices cuadradas con tantas filas y columnas como categoras haya de la variable independiente. ParaMANOVA y LOGLINEAR, la primera fila introducida es siempre el efecto promedio, o constante, y representa elconjunto de ponderaciones que indican cmo promediar las dems variables independientes, si las hay,sobre la variable dada. Generalmente, este contraste es un vector de contrastes.

Las restantes filas de la matriz contienen los contrastes especiales que indican las comparaciones entrecategoras de la variable. Normalmente, los contrastes ortogonales son los ms tiles. Este tipo decontrastes son estadsticamente independientes y son no redundantes. Los contrastes son ortogonales si:v Para cada fila, la suma de los coeficientes de contrastes es igual a cero.v Los productos de los correspondientes coeficientes para todos los pares de filas disjuntas tambin

suman cero.

Por ejemplo, supongamos que el tratamiento tiene cuatro niveles y que deseamos comparar los diversosniveles del tratamiento entre s. Un contraste especial adecuado sera(1 1 1 1) weights for mean calculation(3 -1 -1 -1) compare 1st with 2nd through 4th(0 2 -1 -1) compare 2nd with 3rd and 4th(0 0 1 -1) compare 3rd with 4th

Captulo 8. Esquemas de codificacin de variables categricas 31

todo lo cual se especifica mediante el siguiente subcomando CONTRAST para MANOVA, LOGISTIC REGRESSIONy COXREG:/CONTRAST(TREATMNT)=SPECIAL( 1 1 1 1 3 -1 -1 -1 0 2 -1 -1 0 0 1 -1 )

Para LOGLINEAR, es necesario especificar:/CONTRAST(TREATMNT)=BASIS SPECIAL( 1 1 1 1 3 -1 -1 -1 0 2 -1 -1 0 0 1 -1 )

Cada fila, excepto la fila de las medias suman cero. Los productos de cada par de filas disjuntas tambinsuman cero:Rows 2 and 3: (3)(0) + (1)(2) + (1)(1) + (1)(1) = 0Rows 2 and 4: (3)(0) + (1)(0) + (1)(1) + (1)(1) = 0Rows 3 and 4: (0)(0) + (2)(0) + (1)(1) + (1)(1) = 0

No es necesario que los contrastes especiales sean ortogonales. No obstante, no deben ser combinacioneslineales de unos con otros. Si lo son, el procedimiento informar de la dependencia lineal y detendr elprocesamiento. Los contrastes de Helmert, de diferencia y polinmicos son todos contrastes ortogonales.

IndicadorCodificacin de la variable indicadora. Tambin conocida como variable auxiliar o dummy, no estdisponible en LOGLINEAR o MANOVA. El nmero de variables nuevas codificadas es k1. Los casos en lacategora de referencia se codifican como 0 para todas las variables k1. Un caso en la categora i sima secodificar como 0 para todas las variables indicadoras excepto la i sima, que se codificar como 1.


AvisosEsta informacin se ha desarrollado para productos y servicios ofrecidos en EE.UU.

Es posible que IBM no ofrezca los productos, servicios o funciones que se tratan en este documento enotros pases. Pngase en contacto con el representante local de IBM si desea obtener informacin sobre losproductos y servicios disponibles en su zona. Cualquier referencia a un producto, programa o servicio deIBM no pretende afirmar ni implicar que solamente se pueda utilizar ese producto, programa o serviciode IBM. En su lugar, se puede utilizar cualquier producto, programa o servicio funcionalmenteequivalente que no infrinja los derechos de propiedad intelectual de IBM. Sin embargo, esresponsabilidad del usuario evaluar y comprobar el funcionamiento de todo producto, programa oservicio que no sea de IBM.

IBM puede tener patentes o solicitudes de patente en tramitacin que abarquen temas descritos en estedocumento. Este documento no le otorga ninguna licencia para estas patentes. Puede enviar preguntasacerca de las licencias, por escrito, a:

IBM Director of LicensingIBM CorporationNorth Castle DriveArmonk, NY 10504-1785EE.UU.

Para consultas sobre licencias relativas a informacin de doble byte (DBCS), pngase en contacto con elDepartamento de propiedad intelectual de IBM de su pas o enve sus consultas, por escrito, a:

Intellectual Property LicensingLegal and Intellectual Property LawIBM Japan Ltd.1623-14, Shimotsuruma, Yamato-shiXanagawa 242-8502 Japn

El prrafo siguiente no se aplica al Reino Unido ni a ningn otro pas donde estas disposiciones seanincompatibles: INTERNATIONAL BUSINESS MACHINES CORPORATION PROPORCIONA ESTAPUBLICACIN "TAL CUAL" SIN GARANTAS DE NINGN TIPO, NI EXPLCITAS NI IMPLCITAS,INCLUYENDO PERO NO LIMITNDOSE A ELLAS, LAS GARANTAS IMPLCITAS DE NOVULNERACIN, COMERCIALIZACIN O IDONEIDAD PARA UN FIN CONCRETO. Algunos estadosno permiten la renuncia a expresar o a garantas implcitas en determinadas transacciones , por lo tanto ,esta declaracin no se aplique a usted.

Esta informacin puede incluir imprecisiones tcnicas o errores tipogrficos. Peridicamente, se efectancambios en la informacin aqu y estos cambios se incorporarn en nuevas ediciones de la publicacin.IBM puede efectuar mejoras y/o cambios en los productos y/o programas descritos en esta publicacinen cualquier momento y sin previo aviso.

Cualquier referencia a sitios Web que no sean de IBM en esta informacin slo es ofrecida por comodidady de ningn modo sirve como aprobacin de esos sitios Web. Los materiales de dichos sitios Web noforman parte de los materiales para este producto de IBM y el uso de dichos sitios Web corre a cuenta yriesgo del Cliente.

IBM puede utilizar o distribuir la informacin que usted le suministre del modo que IBM considereconveniente sin incurrir por ello en ninguna obligacin para con usted.

33

Los propietarios de licencia de este programa que deseen tener informacin sobre el mismo con el fin de:(i) intercambiar informacin entre programas creados de forma independiente y otros programas(incluido ste) y (ii) utilizar mutuamente la informacin que se ha intercambiado, debern ponerse encontacto con:

Tel. 901 100 400ATTN: Licensing200 W. Madison St.Chicago, IL; 60606Estados Unidos

Esta informacin estar disponible, bajo las condiciones adecuadas, incluyendo en algunos casos el pagode una cuota.

El programa bajo licencia descrito en este documento y todo el material bajo licencia para el mismo sonproporcionados por IBM bajo los trminos del Acuerdo de Cliente de IBM, el Acuerdo Internacional dePrograma Bajo Licencia de IBM o cualquier acuerdo equivalente entre ambas partes.

Cualquier dato de rendimiento mencionado aqu ha sido determinado en un entorno controlado. Por lotanto, los resultados obtenidos en otros entornos operativos pueden variar de forma significativa. Esposible que algunas mediciones se hayan realizado en sistemas en desarrollo y no existe ninguna garantade que estas mediciones sean las mismas en los sistemas comerciales. Adems, es posible que algunasmediciones hayan sido estimadas a travs de extrapolacin. Los resultados reales pueden variar. Losusuarios de este documento deben consultar los datos que corresponden a su entorno especfico.

Se ha obtenido informacin acerca de productos que no son de IBM de los proveedores de esosproductos, de sus publicaciones anunciadas o de otros orgenes disponibles pblicamente. IBM no haprobado estos productos y no puede confirmar la precisin del rendimiento, la compatibilidad ocualquier otra reclamacin relacionada con productos no IBM. Las preguntas acerca de las aptitudes deproductos que no sean de IBM deben dirigirse a los proveedores de dichos productos.

Todas las declaraciones sobre el futuro del rumbo y la intencin de IBM estn sujetas a cambio o retiradasin previo aviso y representan nicamente metas y objetivos.

Esta informacin contiene ejemplos de datos e informes utilizados en operaciones comerciales diarias.Para ilustrarlos lo mximo posible, los ejemplos incluyen los nombres de las personas, empresas, marcasy productos. Todos esos nombres son ficticios y cualquier parecido con los nombres y direccionesutilizados por una empresa real es pura coincidencia.

LICENCIA DE COPYRIGHT:

Esta informacin contiene programas de aplicacin de muestra en lenguaje fuente, que se utilizan paracomplementar las explicaciones relacionadas con las tcnicas de programacin en diversas plataformasoperativas. Puede copiar, modificar y distribuir estos programas de muestra de cualquier modo sin pagara IBM con el fin de de desarrollar, utilizar, comercializar o distribuir programas de aplicacin que seajusten a la interfaz de programacin de aplicaciones para la plataforma operativa para la que se haescrito el cdigo de muestra. Estos ejemplos no se han probado exhaustivamente en todas lascondiciones. IBM, por lo tanto, no puede garantizar ni dar por supuesta la fiabilidad, la capacidad deservicio ni la funcionalidad de estos programas. Los programas de muestra son proporcionados "TALCUAL", sin garanta de ningn tipo. IBM no ser responsable de ningn dao resultante de la utilizacinde los programas de muestra por parte del usuario.

Cada copia, parcial o completa, de estos programas de ejemplo, o cualquier trabajo obtenido a partir delos mismos, debe incluir el siguiente aviso de copyright:


(nombre de la compaa) (ao). Algunas partes de este cdigo se derivan de programas de ejemplo deIBM Corp.

Copyright IBM Corp. _escriba el ao o aos_. Todos los derechos reservados.

Marcas comercialesIBM, el logotipo de IBM e ibm.com son marcas registradas o marcas comerciales registradas deInternational Business Machines Corp., registradas en muchas jurisdicciones en todo el mundo. Otrosnombres de producto y servicio pueden ser marcas registradas de IBM u otras compaas. Encontrar unalista actual de marcas registradas de IBM en la Web en "Informacin de copyright y marca registrada" enwww.ibm.com/legal/copytrade.shtml.

Adobe, el logotipo Adobe, PostScript y el logotipo PostScript son marcas registradas o marcas comercialesde Adobe Systems Incorporated en Estados Unidos y/o otros pases.

Intel, el logotipo de Intel, Intel Inside, el logotipo de Intel Inside, Intel Centrino, el logotipo de IntelCentrino, Celeron, Intel Xeon, Intel SpeedStep, Itanium y Pentium son marcas comerciales o marcasregistradas de Intel Corporation o sus filiales en Estados Unidos y otros pases.

Linux es una marca registrada de Linus Torvalds en Estados Unidos, otros pases o ambos.

Microsoft, Windows, Windows NT, y el logotipo de Windows son marcas comerciales de MicrosoftCorporation en Estados Unidos, otros pases o ambos.

UNIX es una marca registrada de The Open Group en Estados Unidos y otros pases.

Java y todas las marcas comerciales y los logotipos basados en Java son marcas comerciales o registradasde Oracle y/o sus afiliados.

Avisos 35

ndiceAAnlisis probit

Caractersticas adicionales delcomando 17

criterios 16definicin de rango 16ejemplo 15estadsticos 15, 16ndice de respuesta natural 16intervalos de confianza fiduciaria 16iteraciones 16potencia relativa de la mediana 16prueba de paralelismo 16

Bbondad de ajuste

en Regresin logsticamultinomial 11

Ccasillas con 0 observaciones

en Regresin logsticamultinomial 11

categora de referenciaen Regresin logsticamultinomial 10

chi-cuadrado de Pearsonbondad de ajuste 11estimacin del valor del escalamientopara la dispersin 12

clasificacinen Re

IBM SPSS Regression

Documents

Transcript of IBM SPSS Regression