1. Funciones básicas y distribuciones -...

34
I NSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones básicas y distribuciones 1.1 Definición de tiempos de falla ¿Qué es el análisis de supervivencia?. Es el análisis estadístico de datos de tiempo a la ocurrencia de un evento (time to event data ), o mejor dicho tiempo entre la ocurrencia de dos eventos, inicio y fin. Por lo general estos tiempos se conocen como tiempos de vida, tiempos de supervivencia o tiempos de falla, dependiendo de la aplicación. Las posibles aplicaciones del análisis de supervivencia son: o Biomédicas : tiempos de recuperación de un paciente, tiempos de vida de pacientes con cierta enfermedad, tiempo en que aparece un tumor, tiempo de recaída de una enfermedad, etc. o Industriales: duración de aparatos electrónicos hasta que presentan la primera falla, duración de un billete, etc. o Financieros y económicos : períodos de desempleo, pérdida económica entre dos eventos, etc. Independientemente de las unidades de medición del “tiempo” (discretas o continuas). Los datos de tiempo a la ocurrencia de un evento son

Transcript of 1. Funciones básicas y distribuciones -...

Page 1: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

1

1. Funciones básicas y distribuciones

1.1 Definición de tiempos de falla

Ø ¿Qué es el análisis de supervivencia?.

Es el análisis estadístico de datos de tiempo a la ocurrencia de un evento

(time to event data), o mejor dicho tiempo entre la ocurrencia de dos

eventos, inicio y fin. Por lo general estos tiempos se conocen como

tiempos de vida, tiempos de supervivencia o tiempos de falla,

dependiendo de la aplicación.

Ø Las posibles aplicaciones del análisis de supervivencia son:

o Biomédicas: tiempos de recuperación de un paciente, tiempos de vida

de pacientes con cierta enfermedad, tiempo en que aparece un tumor,

tiempo de recaída de una enfermedad, etc.

o Industriales: duración de aparatos electrónicos hasta que presentan la

primera falla, duración de un billete, etc.

o Financieros y económicos: períodos de desempleo, pérdida económica

entre dos eventos, etc.

Ø Independientemente de las unidades de medición del “tiempo” (discretas

o continuas). Los datos de tiempo a la ocurrencia de un evento son

Page 2: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

2

realización de de variables aleatorias no negativas. En este sentido el

análisis de supervivencia se puede entender como el análisis de variables

aleatorias no negativas.

Ø Los tiempos de falla, o de vida, deben de estar determinados de manera

precisa. Es decir, necesitamos definir un evento de origen, una escala de

medición y un evento de fin para cada individuo. El evento de origen no

necesita ocurrir en el mismo tiempo calendario para todos los individuos.

Ejemplos:

o En ensayos clínicos, el evento de origen puede ser la entrada del

paciente al estudio y el evento de fin puede ser la recuperación o a

muerte.

o En aplicaciones industriales, el evento de origen puede ser el momento

de creación del billete o el momento en el que sale a circulación, y el

evento de fin puede ser el momento en el que llega al banco central

como deteriorado, o el momento en el que se decide destruir.

o La escala de medición por lo general es el tiempo real, aunque también

se puede considerar como el tiempo de operación de un sistema, o el

kilometraje de un auto.

Ø Algo que caracteriza al análisis de supervivencia de otros análisis

estadísticos es la presencia de información parcial. Es decir, en algunos

Page 3: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

3

casos no se conocerá de manera exacta el valor observado de la variable

de interés T, sino que solo se tendrá cierta información parcial. La

información parcial se clasifica en dos tipos: censura y truncamiento. A su

vez estos dos tipos pueden ocurrir por la derecha o por la izquierda.

1.2 Ejemplos de datos de supervivencia

Ø A continuación se presentan algunos ejemplos de datos de supervivencia.

Estos ejemplos fueron obtenidos de Klein & Moeshberger (1997).

Ø EJEMPLO 1: Duración de remisión de un ensayo clínico para leucemia aguda.

Resultados de un ensayo clínico en donde se quería compara la

efectividad de la droga 6-MP versus placebo en 42 niños con leucemia

aguda. El evento de inicio es remisión parcial de la enfermedad después

de haber sido tratados con la droga prednisone. El evento de fin es recaída

o muerte. La escala de medición es tiempo calendario en meses. Algunos

individuos no presentaron el evento de fin al término del estudio. Estos

casos son marcados con un + y son llamados censurados por la derecha.

Más adelante los veremos con detalle.

Page 4: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

4

Ø EJEMPLO 2: Transplante de médula ósea en pacientes con leucemia.

Transplante de médula es un procedimiento estándar en pacientes con

leucemia aguda. La recuperación después del transplante es un proceso

complejo. La prognosis para la recuperación puede depender de factores

que se conocen al momento del transplante, como edad y sexo del

paciente y donador, etapa de la enfermedad inicial, tiempo entre el

diagnóstico y el transplante, etc. La prognosis final depende de cómo

evoluciona el paciente después del transplante. Puede generar aversión o

Page 5: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

5

rechazo de la medula transplantada (GVHD), que el conteo de plaquetas

se vuelva normal o desarrollar infecciones, etc. El transplante se considera

fracaso cuando el paciente recae o muere.

Page 6: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

6

Page 7: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

7

Ø EJEMPLO 3: Tiempos de muerte de adultos mayores residentes de un asilo.

Channing House es una casa de retiro en California. Datos con las edades

de muerte de 462 individuos (97 hombres y 365 mujeres) que estuvieron

en la residencia durante el periodo de enero de 1964 y julio de 1975. Se

reportó la edad a la muerte o al momento en que se salían del asilo (en

meses) y la edad a la que los individuos entraron al asilo.

Estos datos son un ejemplo de truncamiento por la izquierda que más

adelante veremos con detalle. Un individuo tiene que sobrevivir lo

suficiente para estar en edad de entrar al asilo. Individuos que mueren

previamente a la edad de retiro son excluidos del estudio.

Ø EJEMPLO 4. Tiempo al primer uso de marihuana. En este estudio a 191

estudiantes de preparatoria se les preguntó: ¿Cuál fue la primera vez que

probaste la marihuana?. Las respuestas fueron, “la edad exacta a la que la

probaron”, “nunca la he probado”, y “la probé pero no recuerdo cuando

Page 8: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

8

fue la primera vez”. En este último caso tenemos una censura por la

izquierda. El evento de interés ha ocurrido en algún momento previo a la

edad actual del estudiante!.

Ø EJEMPLO 5. Tiempo a desarrollar sida. Se reportan datos con tiempos de

infección y de inducción para 258 adultos y 37 niños que fueron

infectados con el virus del VIH y desarrollaron sida antes del 30 de junio

de 1986. Los datos consisten de los tiempos (en años) desde que adultos

fueron infectados por el virus por transfusión de sangre contaminada, y el

tiempo de espera hasta el desarrollo de sida. Para la población pediátrica,

los niños fueron infectados en útero o al nacer. El tiempo base de

medición es el 1 de abril de 1978.

Page 9: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

9

En este estudio, sólo los individuos que han desarrollado sida antes del

término del estudio son considerados. Individuos que no han desarrollado

sida no son incluidos en el estudio. Este tipo de datos es llamado

truncados por la derecha y más adelante los veremos con detalle.

Page 10: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

10

1.3 La función de supervivencia y la función de riesgo

Ø Como se mencionó anteriormente, el análisis de supervivencia es el

estudio de variables aleatorias no negativas. Sea T una v. a. no negativa

que puede ser discreta o continua.

Ø De los cursos de probabilidad recordamos que toda variable aleatoria T es

caracterizada por su función de densidad f(t) o por su función de

distribución (acumulada) F(t).

Ø Dependiendo si T es una variable aleatoria discreta o continua tenemos la

siguiente relación entre f(t) y F(t)

( ) ( )

=≤=

=

discreta v.a. es T si ,)u(f

continua v.a. es T si ,du)u(ftTPtF

t

0u

t

0 ,

y de manera inversa,

( ) ( )( ) ( )

−−=

discreta v.a. es T si ,tFtF

continua v.a. es T si ,tFdtd

tf ,

donde ( )−tF es un límite por la izquierda definido como

( ) ( )utFlimtF0u

−=−→

.

Ø En análisis de supervivencia existen otras funciones más útiles y más

interpretables que las funciones de densidad y de distribución. Estas son

Page 11: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

11

la función de supervivencia, denotada por S(t), y las funciones de riesgo

(tasa o intensidad y acumulada), denotadas por h(t) y H(t)

respectivamente.

Ø FUNCIÓN DE SUPERVIVENCIA.

La función de supervivencia S(t) es la función más importante para

describir el comportamiento de tiempos de falla y se define como la

probabilidad de que un individuo sobreviva más allá del tiempo t, es decir,

la probabilidad de que un individuo presente su evento de fin en un

tiempo posterior a t. En notación matemática tenemos,

( ) ( ) ( )tF1tTPtS −=>= .

Ø ¿Cómo se interpreta una función de supervivencia?. Como presentar el

evento de fin no es algo necesariamente bueno, es preferible tener una

probabilidad mayor de que el evento de fin ocurra posterior al tiempo t.

Ø Las funciones de supervivencia pueden diferir en forma, pero todas

mantienen las mismas propiedades básicas:

i. Son monótonas no crecientes,

ii. iguales a uno al tiempo cero y tienden a cero cuando el tiempo tiende

a infinito.

Ø La tasa de decaimiento de las funciones de supervivencia varía de acuerdo

al riesgo de presentar el evento de fin. Eventos más riesgosos presentan

una tasa de decaimiento mayor.

Page 12: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

12

Ø A continuación presentamos una figura con ejemplos de funciones de

supervivencia:

Ø La función de riesgo es una función fundamental en análisis de

supervivencia. Se le conoce también como la tasa de falla condicional en

análisis de confiabilidad, tasa de mortalidad en demografía o función de

intensidad en procesos estocásticos.

Page 13: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

13

Ø Como el tratamiento y la interpretación de la función de densidad es

distinto dependiendo si la v. a. T es discreta o continua, definiremos la

función de riesgo por separado en los casos discreto y continuo.

Ø FUNCIÓN DE RIESGO DISCRETA.

Sea T una v. a. discreta con soporte en { }K,u,u 21 . La función de riesgo

discreta se define como la probabilidad condicional de presentar el evento

de fin en el tiempo t, dado que se ha sobrevivido al tiempo t. Se denota

por h(t). En notación matemática,

( ) ( )tTtTPth ≥== .

o Sea hk la función de riesgo en el tiempo uk, la cual se puede obtener a

través de la función de densidad y de la función de supervivencia como

( ) ( )( )

( )( )1k

k

k

kkk uS

ufuTPuTPuhh

=≥=== ,

o Como la función de densidad se expresa en términos de la función de

supervivencia como

( ) ( ) ( )k1kk uSuSuf −= − ,

entonces

( )( )1k

kk uS

uS1h−

−= ,

por lo tanto

( ) ( )( ){ }

( ){ }∏∏

≤≤ −

−==tu:k

ktu:k 1.k

k

kk

h1uSuS

tS .

Page 14: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

14

o De la misma manera, la función de densidad en términos de la función de

riesgo se obtiene como

( ) ( ){ }∏

<

−=jk

kjj h1huf .

Ø En demografía, la función de riesgo se interpreta como la probabilidad de

morir en el momento t dado que se llegó vivo al tiempo t.

Ø Las funciones de riesgo discretas no tienen ninguna restricción más que

ser no negativas. Las formas que presentan son variadas. A continuación

se presentan algunos ejemplos:

Page 15: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

15

Ø FUNCIÓN DE RIESGO ACUMULADO DISCRETA.

La función de riesgo acumulado discreta es simplemente la acumulación

de la función de riesgo hasta el momento t y se denota por H(t). En

notación matemática,

( ){ }

∑≤

=tu:kk

k

htH .

Existe una definición alternativa de la función de riesgo acumulado

discreta, la cual obedece a la relación que prevalece en el caso continuo.

Esta es:

( ) ( ){ }

∑≤

−−=tu:k

kk

h1logtH .

Ø En cualquiera de las dos definiciones, las funciones de riesgo acumulado

discretas son funciones monótonas no decrecientes.

Ø FUNCIÓN DE RIESGO CONTINUA.

Sea T una v. a. continua con soporte en [0,∞). La función de riesgo

continua se define como la tasa instantánea de fallo al tiempo t, dado que

se ha sobrevivido al tiempo t. Se denota por h(t) al igual que en el caso

discreto. En notación matemática,

( ) ( )tTtTtP1limth0

≥ε+≤<ε

=→ε

,

la cual puede ser expresada como

( ) ( ) ( )( )

( )( )tStf

tStFtF

limth0

−ε+=

→ε

o Al observar que ( ) ( )t'Stf −= entonces

Page 16: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

16

( ) ( )tSlogdtdth −=

al integrar ambos lados tenemos

( ) ( )∫−=t

0

duuhtSlog

finalmente, como S(0)=1 obtenemos que

( ) ( )

−= ∫t

0

duuhexptS

o La función de densidad en términos de la función de riesgo se expresa

como

( ) ( ) ( )

−= ∫

t

0

duuhexpthtf .

Ø La expresión ( )εth se pude ver como la “probabilidad aproximada” de que

un individuo de edad t experimente el evento de fin en el siguiente

instante.

Ø Al igual que en el caso discreto, hay muchas formas para la función de

riesgo. La única restricción es que sea no negativa.

o Una función de riesgo creciente implica un envejecimiento natural.

o Una función de riesgo decreciente es menos común pero indica un

rejuvenecimiento.

o Más comúnmente son las funciones de riesgo en forma de “tina de

baño” que representan el riesgo de mortalidad en poblaciones que se

siguen desde el nacimiento.

Page 17: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

17

o Una función de riesgo en forma de montaña representaría el

comportamiento del riesgo de muerte por enfermedad después de un

tratamiento.

Ø A continuación se muestran algunos ejemplos:

Page 18: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

18

Ø FUNCIÓN DE RIESGO ACUMULADO CONTINUA.

La función de riesgo acumulado continua es la integral hasta el momento t

de la función de riesgo se denota por H(t). En notación matemática,

( ) ( )∫=t

0

duuhtH .

Esta función está relacionada con la función de supervivencia por

( ) ( ){ }tHexptS −= . Si ( ) 0S =∞ , entonces ( ) ∞=∞H .

Page 19: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

19

Ø Nota: Existe una formulación general de las funciones de supervivencia y

riesgo que engloba a los dos casos continuo y discreto. Para ello se

requiere de conocer integrales de Reimann-Stieltjes y de las integrales-

producto.

1.4 Algunos parámetros poblacionales

Ø Debido a la presencia de información parcial en el Análisis de

Supervivencia, es conveniente definir algunos parámetros de interés en

términos de la función de supervivencia.

Ø MEDIA:

( ) ( ) ( )∑∑∞

=

====µ

1kk

1kkk uSufuTE ,

si T es variable aleatoria discreta, y

( ) ( ) ( )∫∫∞∞

===µ00

dttSdttf tTE ,

si T es variable aleatoria continua. En ambos casos, la última igualdad se

puede obtener con un cambio de variable.

Ø VARIANZA:

( ) ( ) ( )2

1kk

1kkk

2 uSuSu2TVar

−==σ ∑∑∞

=

=

Page 20: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

20

si T es una v.a. discreta, y

( ) ( ) ( )2

00

2 dttSdttS t2TVar

−==σ ∫∫∞∞

,

Si t es una v.a. continua.

Ø CUANTILES DE ORDEN p:

El cuantil o percentil de orden p de la variable aleatoria T, tp es tal que

( ) ptF p ≥ y ( ) p1tS p −≥ .

Si T es v.a. continua, tp satisface

( ) p1tS p −= .

En particular, el tiempo de vida mediano es t0.5 tal que ( ) 5.0tS 5.0 = .

Ø VIDA MEDIA RESIDUAL:

La vida media residual es un cuarto parámetro que resulta de interés en

análisis de supervivencia. Para individuos de edad x, este parámetro mide

la esperanza de vida que les queda. Se define como,

( ) ( )( ) ( )

( )

( )

( )xS

dttS

xS

dttfxtxTxTExvmr xx

∫∫∞∞

=−

=>−= .

Ø Ejemplos:

Page 21: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

21

1.5 Algunos modelos paramétricos

Ø Existen varias familias de modelos paramétricos que se usan para el

análisis de tiempos de fallo. Algunos de estos modelos son populares

porque representan de manera adecuada el comportamiento aleatorio de

los fenómenos y otros porque sus parámetros tienen una interpretación

simple.

Page 22: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

22

Ø Dentro de las familias univariadas más importantes están: exponencial,

Weibull, log-normal, log-logistic y gamma.

Ø Alguna veces existe información acerca del proceso de envejecimiento o

del proceso de fallo en la población que sugiere una distribución en

particular, aunque por lo general esta información es muy específica

como para acotar a una sola familia de modelos.

Ø La motivación para usar un modelo en particular es, por lo general,

empírica. Por ejemplo, si se ha demostrado que un modelo describe

satisfactoriamente el comportamiento de los tiempos de fallo en

poblaciones similares a la que se está estudiando.

1) FAMILIA EXPONENCIAL.

Debido a su importancia histórica, a su simplicidad matemática y a sus

propiedades importantes, se presenta primero el modelo exponencial.

o Función de riesgo: Se caracteriza por tener una función de riesgo

constante.

( ) λ=th , t≥0, λ>0

o Función de supervivencia:

( ) tetS λ−= , t≥0

o Función de densidad:

( ) tetf λ−λ= , t≥0

Page 23: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

23

o Propiedad de pérdida de memoria:

( ) ( )xTPtTxtTP >=>+> ,

i.e., no hay desgaste. Esta es una consecuencia directa de la función de

riesgo constante.

o Parámetros:

( )λ

= 1TE , ( ) 21TVarλ

= ⇒ ( ) 1T.v.c =

( ) ( )λ

==>− 1TExTxTE

( )p1log1tp −λ

−=

• Aunque la distribución exponencial ha sido históricamente muy popular,

la función de riesgo constante es muy restrictiva en aplicaciones en salud

e industria.

Page 24: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

24

2) FAMILIA WEIBULL.

La distribución Weibull es quizás el modelo más utilizado para tiempos de

fallo. Se usa tanto para modelar tiempos de duración de piezas

manufacturadas como para modelar tiempos de aparición de tumores en

medicina.

o Función de riesgo:

( ) 1t th −αλα= , t≥0, α, λ>0

α es un parámetro de forma y λ es un parámetro de escala

o Función de supervivencia:

( ) ( )αλ−= texptS , t≥0

o Función de densidad:

( ) ( )αλ−λα= texptf , t≥0

o Parámetros:

( ) ( ) α−λα+Γ= 111TE , ( ) ( ) ( ){ }[ ] α−λα+Γ−α+Γ= 221121TVar ,

donde ( ) ( ) ( )1 1 −αΓ−α=αΓ

( )α

λ−=

1

p p1log1

t

si α−λ=β 1 , entonces β es el cuantil de orden 0.632

independientemente del valor de α. En ingeniería β es llamado la “vida

característica” de la distribución.

• El modelo Weibull es suficientemente flexible para acomodar funciones

de riesgo crecientes (α>1), decrecientes (α<1), o constantes (α=1).

Page 25: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

25

3) FAMILIA LOG-NORMAL.

La distribución log-normal ha sido popular en el modelado de tiempos de

fallo debido a su relación con el modelo normal. El tiempo de vida T se

dice que sigue una distribución log-normal, si Y=log(T) se distribuye

normal con parámetros µ y σ2. Haciendo el cambio de variable YeT =

obtenemos la distribución log-normal.

Page 26: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

26

o Función de densidad:

( ) ( )

σµ−

−πσ= −−2

1212 tlog21

expt2tf , t≥0, µ∈ℜ, σ2>0

donde µ y σ2 son la media y la varianza de Y=log(T).

La función de supervivencia y de riesgo dependen de Φ(t), la función de

distribución normal estándar.

o Función de supervivencia:

( )

σµ−

Φ−=tlog

1tS , t≥0

o Función de riesgo:

( ) ( ) ( )tStfth = , t≥0

o Parámetros:

( ) ( )2expTE 2σ+µ= , ( ) ( ){ } ( )22 2exp1expTVar σ+µ−σ= ,

( )pp zexpt σ+µ= , donde zp es el percentil de orden p de una variable

normal estándar. En particular µ= et 5.0 .

• La función de riesgo del modelo log-normal es en forma de montaña,

toma el valor de cero al tiempo t=0, crece hasta alcanzar un valor máximo

y luego decrece a cero conforme t→∞.

• Este modelo es criticado porque es decreciente para valores grandes de t,

lo que pareciera improbable en algunas situaciones.

• Este comportamiento ocurre cuando la población es una mezcla de

individuos que tienden a tener tiempos de vida cortos y largos,

Page 27: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

27

respectivamente. Por ejemplo, tiempo de supervivencia después de un

tratamiento para algunos pacientes de cáncer, donde las personas que

son curadas se convierten en sobrevivientes de periodo largo. Otro

ejemplo es la duración de los matrimonios, donde después de cierto

número de años, el riesgo de disolución del matrimonio por divorcio

decrece.

• A continuación presentamos algunos comportamientos de la función de

riesgo.

Page 28: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

28

4) FAMILIA LOG-LOGÍSTICA.

Una variable aleatoria T se dice que tiene una distribución log-logística, si

su logaritmo Y=logT sigue una distribución logística. La distribución

logística se parece mucho a la normal, con soporte en todos los reales,

pero con expresiones más sencillas.

• La función de densidad logística es,

( ) 2yexp1

yexpyf

σµ−

σµ−

= , −∞<y<∞

o Función de densidad: Haciendo el cambio de variable YeT = ,

obtenemos la función de densidad log-logística

( )( )2

1

t1

ttf

α

−α

λ+

αλ= , t≥0

con 01 >σ=α y ( ) 0exp >σµ−=λ .

o Función de supervivencia:

( ) αλ+=

t11tS , t≥0

o Función de riesgo:

( ) α

−α

λ+αλ

=t1

tth

1

, t≥0

o Parámetros:

( ) ( ) ( )111 11TE −−α− α−Γα+Γλ=

Page 29: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

29

απ

απ

λ= α− csc1 , si α>1

( ) ( ) ( ) ( )TE2121TVar 22 −α−Γα+Γλ= α−

( )TE2

csc2 22 −

απ

απ

λ= α− , si α>2

( )

α

−λ=

1

p p1pt .

• El numerador de la función de riesgo es igual a la función de riesgo

Weibull, pero el denominador causa que la función de riesgo cambie de

forma.

• La función de riesgo es monótona decreciente para α≤1, y para α>1 la

función de riesgo crece inicialmente hasta alcanzar un máximo en el

tiempo ( ){ } αλ−α 11 y luego decrece a cero conforme t→∞.

• Esta distribución es similar al modelo Weibull y exponencial por sus

expresiones simples para h(t) y S(t). Su función de riesgo es similar a la de

la log-normal, excepto en el extremo de la cola derecha, pero su ventaja

es la simplicidad de su función de riesgo h(t) y de su función de

supervivencia S(t).

• A continuación presentamos algunos comportamientos de la función de

riesgo.

Page 30: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

30

5) FAMILIA GAMMA.

El modelo gamma tiene propiedades similares al modelo Weibull, sin

embargo no es tan fácilmente tratable matemáticamente.

o Función de densidad:

( )( )

( )texpttf 1 λ−βΓ

λ= −β

β

, t≥0, λ, β > 0

Page 31: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

31

β es un parámetro de forma y λ es un parámetro de escala.

La función de supervivencia y la función de riesgo no tienen una forma

analítica explícita y dependen de la función gamma incompleta

( )( ) ∫

−−β

βΓ=β

t

0

u1 dueu1,tIg

o Función de supervivencia:

( ) ( )βλ−= ,tIg1tS , t≥0

o Función de riesgo:

( ) ( )( )tStf

th = , t≥0

o Parámetros:

( )λβ=TE , ( ) 2TVar

λβ=

• Al igual que el modelo Weibull, el modelo gamma incluyen al modelo

exponencial como caso particular (β=1), se aproxima a una distribución

normal cuando β→∞ y coincide con una distribución Ji-cuadrada con

ν=2β grados de libertad cuando β es un entero y λ=1/2.

• La función de riesgo es monótona creciente para β>1, con ( ) 00h = y

( ) λ→∞→t

th . Es monótona decreciente cuando β<1, con ( ) ∞=0h y

( ) λ→∞→t

th .

• Cuando β>1, la moda de la distribución es ( ) λ−β= 1t .

• El modelo gamma no es tan usado para modelar tiempos de fallo como

los modelos Weibull, log-normal y log-logístico, sin embargo sí ajusta

algunos comportamiento de manera adecuada.

Page 32: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

32

• A continuación presentamos algunos comportamientos de la función de

riesgo.

6) OTRAS FAMILIAS.

Existen muchos otros modelos paramétricos que se utilizan para

representar el comportamiento de tiempos de fallo. Algunos de estos son:

Page 33: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

33

o Distribución gama generalizada:

( )( )

( )α−αββ

λ−βΓ

αλ= texpttf 1

( ) ( )βλ−= α ,tIg1tS ,

para α, β, λ >0.

Esta distribución se reduce al modelo exponencial cuando 1=β=α , al

modelo Weibull cuando 1=β , al gamma cuando 1=α , y tiende a una

log-normal cuando ∞→β . Se usa para bondad de ajuste.

o Más familias se pueden encontrar en el siguiente cuadro resumen de

Klein & Moeshberger (1997):

Ø Comentarios finales:

o En el modelo exponencial se cumple que ( ) ttH λ= . Entonces, de

manera empírica podemos verificar el ajuste a una exponencial

graficando H(t) vs. t. La gráfica debe de ser una línea recta que pasa

por el origen con pendiente λ.

o En el modelo Weibull se cumple que ( ) αλ= ttH . De igual manera,

podemos verificar el ajuste a una Weibull graficando logH(t) vs. logt. La

gráfica debe de ser una línea recta con perndiente α y ordenada al

origen logλ.

Page 34: 1. Funciones básicas y distribuciones - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/CursoAS1.pdf · INSTRUCTOR: LUIS E. NIETO BARAJAS Curso: Análisis de Supervivencia 1 1. Funciones

INSTRUCTOR: LUIS E. NIETO BARAJAS

Curso: Análisis de Supervivencia

34

o Todas las distribuciones aquí presentadas pueden ser modificadas para

que incluyan un parámetro de “umbral” o “tiempo de garantía” γ. Este

parámetro es un tiempo γ≥0 antes del cual un individuo no puede

presentar el evento de fin. Esto se hace definiendo un nuevo tiempo

γ+= T'T , donde T≥0 sigue cualquiera de las distribuciones anteriores.