MONOGRAFÍAS EN ESCLEROSIS MÚLTIPLE · El diseño básico de un ensayo clínico es comenzar con...

55
MONOGRAFÍAS EN ESCLEROSIS MÚLTIPLE MONOGRAFÍAS EN ESCLEROSIS MÚLTIPLE Ensayos clínicos en la esclerosis múltiple ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE Avalado por Sociedad Española de Neurología

Transcript of MONOGRAFÍAS EN ESCLEROSIS MÚLTIPLE · El diseño básico de un ensayo clínico es comenzar con...

MONOGRAFÍAS EN ESCLEROSIS MÚLTIPLEM

ON

OG

RA

FÍA

S E

N E

SCLE

RO

SIS

LTIP

LE

Ens

ayos

clín

icos

en

la e

scle

rosi

s m

últip

le

ENSAYOS CLÍNICOSEN LA ESCLEROSIS MÚLTIPLE

Avalado por

Sociedad Española de Neurología

Fernández de la Hoz, 61, entreplanta. 28003 MadridTelf.: 91 536 08 14 • Fax: 91 536 06 07 • Correo electrónico: [email protected], 21-25, bajos, oficina 1. 08024 BarcelonaSV: 61/05 - R – CM • ISSN: 1885-5520 • Depósito legal:

Reservados todos los derechos. Ninguna parte de esta publicación puede ser reproducida, transmitida en ninguna forma o medio alguno, electrónico o mecánico, incluyendo fotocopias, grabaciones o cualquier sistema de producción, sin la autorización por escrito de los titulares del Copyright.

©Copyright 2010 de los autores.

Las manifestaciones aquí recogidas no reflejan necesariamente la opinión sustentada por Bayer Schering Pharma.

3

Dr. J. Carlos Álvarez CermeñoHospital Universitario Ramón y Cajal. Madrid

Dr. Txomin Arbizu UrdiainHospital Universitari de Bellvitge. L’Hospitalet de Llobregat (Barcelona)

Dr. Rafael Arroyo GonzálezHospital Clínico San Carlos. Madrid

Dr. Bonaventura CasanovaHospital Universitario La Fe. Valencia

Dr. Óscar Fernández y FernándezHospital Regional Universitario Carlos Haya. Málaga

Dr. Guillermo Izquierdo AyusoHospital Universitario Virgen Macarena. Sevilla

Dr. J. Antonio García MerinoHospital Universitario Puerta de Hierro. Madrid

Dr. Xavier Montalbán GairinHospital Universitari Vall d’Hebron. Barcelona

Dr. José M.ª Prieto GonzálezComplejo Hospitalario Universitario de Santiago de Compostela (A Coruña)

Dr. Alfredo Rodríguez-AntigüedadHospital de Basurto. Bilbao

[ Consejo Editorial ]

5

Aspectos generales de los ensayos clínicosAutor: A. EscobarEditores: A. Rodríguez-Antigüedad, R. Arroyo González .................. 7

Diseño de los ensayos clínicos en esclerosis múltipleAutores: J.A. García-Merino, Ó. Fernández y FernándezEditores: T. Arbizu Urdiain, J.M.ª Prieto González ........................ 31

Interpretación y evolución de los ensayos clínicosAutores: C. Nos, M. SallénEditores: B. Casanova, X. Montalbán Gairin ................................. 41

[ Sumario ] Ensayos clínicos en la

esclerosis múltiple

7

[ Índice ]{ Aspectos generales

de los ensayos clínicos }

1/ Introducción

2/ Definición

3/ Algunas características importantes de los ensayos clínicos

4/ Objetivos

5/ Pacientes y tamaño muestral

6/ Intervenciones

7/ Aleatorización

8/ Enmascaramiento o cegamiento

9/ Variables de resultado

10/ Análisis de resultados

11/ Fases de estudio

12/ Diferentes tipos de diseño de ensayos

13/ Aspectos de bioética

14/ Consentimiento informado

15/ Diferentes abordajes de comparación en los ensayos clínicos

16/ Algunas definiciones

Bibliografía

Autor: Antonio Escobar1

Editores: Alfredo Rodríguez-Antigüedad2, Rafael Arroyo González3

1 Unidad de Investigación. Hospital de Basurto. Bilbao2 Servicio de Neurología. Hospital de Basurto. Bilbao

3 Servicio de Neurología. Hospital Clínico San Carlos. Madrid

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

8

Resumen

El ensayo clínico controlado y aleatorizado se puede considerar el método estándar para

evaluar y comparar los resultados de diferentes alternativas, no solamente de diferentes pro-

ductos farmacéuticos, sino también diferentes alternativas tanto diagnósticas como preventivas

o de tratamiento sin fármacos.

En los ensayos clínicos, el hecho diferencial e importante con relación a otro tipo de dise-

ños es que los investigadores manipulan la exposición de los participantes, haciendo que un

grupo reciba el tratamiento experimental y otro grupo de sujetos reciban el tratamiento de

comparación.

En general, el desarrollo de un producto farmacéutico conlleva varias fases. En los centros

asistenciales, lo más frecuente es la participación en la fase III o IV del estudio.

Los ensayos clínicos pueden tener diferentes diseños, cada uno de ellos con sus ventajes e

inconvenientes. Frecuentemente, son diseños controlados, es decir, hay al menos dos grupos

participantes, uno de los cuales es un grupo de comparación. Dentro de los clásicos ensayos

controlados tenemos básicamente cuatro tipos diferentes de diseño, el más frecuente de los cua-

les es el diseño en grupos paralelos.

Entre los elementos a tener en cuenta en un ensayo clínico, destacan: a) la población

y la muestra participante, con sus criterios de inclusión/exclusión y tamaño muestral; b) la

intervención en estudio y el comparador, que debe ser el adecuado; c) la aleatorización y la

ocultación de la secuencia de aleatorización; d) el tipo de enmascaramiento del proceso; e) la

variable de resultado escogida para valorar la eficacia o seguridad del ensayo; f ) el tipo de

análisis estadístico y la población en la que se realiza y, finalmente, e) ciertos principios de

ética asistencial.

9

[ Aspectos generales de los ensayos clínicos ]

1/Introducción

Se puede considerar el ensayo clínico como una evaluación experimental que valora la eficacia y/o seguridad de una intervención. Las intervenciones evaluadas pueden ser de diferentes tipos. Entre ellas, destacan las de los fármacos, pero también se pueden evaluar pruebas diagnósticas, intervenciones quirúrgicas y psicológicas, productos sanitarios o actividades preventivas.

La investigación epidemiológica tendría como objetivo recoger información válida sobre causalidad, modos o alternativas de prevención, diagnóstico o tratamientos para las diferentes enfermedades o situaciones clínicas a las que nos podemos enfrentar en la práctica diaria. Los diferentes tipos de estudios representan básicamente distintas formas de recoger la información necesaria para poder sacar conclusiones.

Los estudios epidemiológicos se pueden clasificar desde diferentes puntos de vista. Una de las clasificaciones más clásicas de estos estudios los divide en estudios observa-cionales y estudios experimentales. Otra forma de clasificarlos distingue entre estudios descriptivos y analíticos. Independientemente del punto de vista, los diseños incluidos en cada grupo son los mismos (Tabla 1).

Entre los estudios observacionales, los más frecuentes serían los estudios caso-control y los de cohorte. En los primeros, se investiga una enfermedad en relación con la expo-sición previa a uno o más factores. En un estudio clásico de cohortes se medirían uno o

Tabla 1. Tipos de estudios epidemiológicos

Descriptivos Observacionales

En poblaciones:

• Estudios ecológicos Transversales/Prevalencia

En individuos: Estudios caso-control

• A propósito de un caso Estudios de cohorte

• Series de casos Estudios ecológicos

• Transversales/Prevalencia

Analíticos Experimentales

Observacionales:

• Estudios caso-control Ensayo clínico

• Estudios de cohorte Ensayo comunitario

Intervención:

• Ensayo clínico

• Ensayo comunitario

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

10

más efectos de la exposición a un factor. En su forma más simple, los sujetos se definen, en base a esa exposición, como expuestos y no expuestos. Los investigadores no intervie-nen en ningún caso en la asignación de la exposición de los pacientes. Los estudios eco-lógicos no utilizan la información de cada sujeto, sino que estudian datos agregados de toda la población. Estos estudios describen una situación o enfermedad en la población general con relación a algunas variables como, por ejemplo, consumo medio de bebidas alcohólicas y renta per cápita.

El ensayo clínico controlado y aleatorizado es el método estándar para evaluar los re-sultados de diferentes alternativas, que, como hemos dicho, pueden ser tanto diagnósticas como preventivas o de tratamiento. Este diseño se considera el paradigma de la investiga-ción en la clínica, ya que se acerca a la investigación totalmente controlada, como la que se puede aplicar, por ejemplo, en un laboratorio de física. Sin embargo, no siempre se obtienen respuestas claras y definitivas para todas las preguntas que nos podemos plantear en la práctica clínica habitual. Por otro lado, en muchos casos puede resultar excesivamente complicado y/o costoso llevar a cabo ensayos que den respuestas válidas a nuestras pregun-tas. Por lo tanto, creemos que no siempre estaría justificado emprender ensayos clínicos controlados y aleatorizados para responder a una pregunta clínica determinada.

En los ensayos clínicos, el hecho diferencial e importante es que los investigadores manipulan la exposición de los participantes, haciendo que un grupo reciba el trata-miento experimental y otro grupo de sujetos reciba el otro tratamiento en estudio o tratamiento de comparación. En el caso del ensayo clínico, la exposición, en general, es el tratamiento farmacológico asignado a cada paciente de forma aleatoria. La existencia de un grupo control permite realizar comparaciones.

La introducción de los ensayos clínicos aleatorizados a mediados del siglo pasado ha tenido un importante impacto en la práctica de la medicina tal y como hoy la conocemos, y sus características básicas están bien descritas(1,2). A pesar de las limitaciones que tienen, los ensayos clínicos son el mejor diseño para valorar la eficacia de diferentes alternativas, incluidas las diferentes intervenciones sanitarias, productos sanitarios o medicamentos. Para ello, a lo largo del tiempo se han ido adaptando soluciones a los diferentes proble-mas o sesgos que se pueden presentar en el desarrollo de estos estudios, implantando medidas encaminadas a solucionarlos, como la aleatorización, el enmascaramiento y el establecimiento de un correcto tipo de análisis estadístico(3).

El objetivo general de los ensayos clínicos debe ser estimar el efecto de las intervencio-nes llevadas a cabo para mejorar la salud de los pacientes o de la comunidad(4).

Los ensayos clínicos pueden ser descritos como explicativos o pragmáticos(5). Estos últimos miden la efectividad de las intervenciones, es decir, el beneficio que produce un tratamiento en la práctica clínica habitual, mientras que los explicativos miden la efica-cia, es decir, el beneficio producido en condiciones ideales. Nosotros vamos a centrarnos en estos últimos, ya que son los que se realizan con mayor frecuencia en el campo de la salud en el ámbito hospitalario.

El diseño básico de un ensayo clínico es comenzar con una población definida, ge-neralmente formada por los pacientes que acuden a las consultas, a los que se distribuye aleatoriamente para que reciban un tratamiento experimental o el tratamiento actual. Se realiza un seguimiento de los sujetos incluidos durante un tiempo adecuado, para ver cuántos mejoran con el tratamiento nuevo y compararlos con el grupo control.

11

[ Aspectos generales de los ensayos clínicos ]

2/Definición

Un ensayo clínico es un estudio prospectivo experimental. Esto consiste en que el inves-tigador controla las variables y los pacientes se asignan de forma aleatoria a los diferentes tratamientos que se comparan para evaluar la eficacia y/o seguridad de un producto ex-perimental. Un ensayo clínico controlado incluye, al menos, dos grupos de tratamiento, el grupo experimental y el grupo control, cuya asignación es aleatoria.

Los ensayos controlados presentan algunas ventajas sobre otros diseños de estudios, como que las condiciones (sujetos, tratamientos, mediciones, etc.) del estudio están controladas por los investigadores. Otra ventaja es que son prospectivos, es decir, se ejecutan a lo largo de un periodo de tiempo determinado por los investigadores, quienes seleccionan a los pacientes inicialmente y los siguen en el tiempo para observar los efectos de los tratamientos en estudio. Los ensayos controlados constituyen el diseño de mayor rigor para establecer que un efecto se debe a una causa. Asimismo, permiten evaluar efectos adversos, al menos los producidos tras el periodo de seguimiento del estudio. Hay algunos ensayos que quieren estudiar estos efectos adversos a más largo tiempo. Son los llamados estudios de seguridad, que se realizan después de haber comprobado la eficacia de los fármacos en ensayos controlados. Sin embargo, los en-sayos también presentan algún inconveniente con relación a otros diseños de estudios, como pueden ser la complejidad del diseño y la ejecución del ensayo, así como el coste del mismo.

3/Algunas características importantes de los ensayos clínicos

Los ensayos clínicos presentan una serie de características. Algunas de ellas son comunes a todos los diseños de los estudios y otras son propias de esta forma de diseño.

Una de las primeras características en el diseño es que debe existir una justificación del ensayo que incluya la información relevante así como las evidencias o pruebas que sustentan y justifican la realización del estudio.

La pregunta planteada, que marcará el objetivo del estudio, debe ser relevante, es decir, debe pretender aportar mejoras a la práctica clínica. Estas mejoras pueden ser vis-tas desde el punto de vista del paciente, del médico o personal de enfermería, o desde el punto de vista de la gestión sanitaria. En general, los ensayos se deben plantear con una pregunta u objetivo principal; aparte, deberían estar descritos otros interrogantes relacio-nados, que serían los denominados objetivos secundarios.

Los tratamientos en estudio, en general, denominados experimental y control (otro medicamento o placebo), así como todas aquellas intervenciones que se apliquen a los pacientes a lo largo del estudio deben estar claramente descritos. De esta forma, el estu-dio puede ser reproducible.

También se debe establecer con detalle cuál es la variable resultado del estudio. Fi-nalmente, esta variable debería ser relevante tanto desde el punto de vista clínico como desde el punto de vista del paciente.

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

12

4/Objetivos

Como hemos dicho, la pregunta debería ser razonable e importante, con relevancia clí-nica. Asimismo, la respuesta que se desea encontrar también debe ser relevante. La de-finición del objetivo del ensayo clínico ha de ser el primer paso en su desarrollo. Aquí se plantea la pregunta de investigación o hipótesis que se desea contrastar. En general, la denominada hipótesis nula se plantea en términos de igualdad, es decir, la eficacia del fármaco A es igual a la eficacia del fármaco B. En los estudios más frecuentemente presentados, la hipótesis alternativa establece que el fármaco experimental, el B, tiene mayor eficacia que el fármaco control, el A. Hay otros casos, cada vez más frecuentes en la práctica clínica, en que esto no es así y el objetivo principal del estudio es demostrar la no inferioridad o equivalencia de un nuevo producto frente a otro.

Los objetivos deben estar claramente definidos y expuestos de tal forma que permitan ser analizados de un modo cuantitativo, es decir, deben ser mensurables. Los objetivos se pueden clasificar en primarios y secundarios. Los objetivos primarios son el foco del estudio. Los objetivos secundarios permiten investigar preguntas menos relevantes, aun-que científicamente importantes, y no tienen la misma prioridad. Una posible excepción serían los objetivos secundarios de seguridad, que se consideran importantes aunque estén definidos como secundarios(6).

5/Pacientes y tamaño muestral

Con relación a los pacientes incluidos en el ensayo, se deben especificar claramente, al menos, los criterios de inclusión y de exclusión así como el procedimiento para la deter-minación del tamaño muestral. Los ensayos clínicos buscan una respuesta relevante para una población con una patología determinada. Por ello, los criterios de elegibilidad se deben presentar de forma precisa. Los criterios de exclusión buscan, en general, afianzar la seguridad de los pacientes que pueden ser incluidos en el ensayo. Es necesario especi-ficar de forma correcta estos criterios para poder verificar la validez externa del estudio o la capacidad de generalización de resultados del ensayo.

Los criterios de selección amplios se pueden utilizar si en un mismo estudio medimos diferentes variables de resultado que estén relacionadas entre sí. El uso de estos criterios amplios hace que la muestra incluida en el estudio sea más parecida a la población habitual que se ve en las consultas y, por lo tanto, hace que el ensayo tenga mayor validez externa.

Unos criterios de inclusión más restrictivos se usarán cuando pueda haber problemas éticos para incluir a algunos pacientes, como en el caso de que el tratamiento pueda resul-tar tóxico, o si se van a usar exploraciones invasivas con riesgo para los pacientes, o si se piensa que algún tipo de pacientes no va a poder cumplir con los requisitos del protocolo de estudio(7). La finalidad es conseguir un grupo homogéneo de pacientes en los que será más fácil detectar diferencias.

13

[ Aspectos generales de los ensayos clínicos ]

Asimismo, se debe especificar en qué lugares y en qué tipos de centros se va a realizar el estudio, ya que ello podría afectar a la validez externa debido a características propias y diferenciales de los centros participantes.

Por otro lado, el tamaño muestral debe ser planificado y calculado previamente, con el fin de garantizar que todos los recursos invertidos sean aprovechados. Se podría consi-derar que no es ético el desarrollo de un ensayo sin un número suficiente de individuos que garanticen que se puede dar respuesta al objetivo principal. Asimismo, un núme-ro insuficiente de sujetos incluidos puede no detectar diferencias que realmente existen entre los grupos del estudio. Para realizar un cálculo del tamaño muestral se necesitan ciertos datos previos. Entre ellos podemos citar los siguientes:

• La tasa de eventos: este valor debe ser establecido en base a experiencias anteriores, ya sean personales o extraídas de otros estudios publicados, aunque no sean ensayos clínicos. Esta tasa puede ser tanto la correspondiente al grupo experimental como la del grupo control.

• El tamaño del efecto buscado: este efecto puede ser una diferencia absoluta o relativa entre ambos grupos de estudio. En el primer caso, sería la diferencia entre la tasa de eventos en el grupo control y la tasa en el grupo experimental. La reducción relativa sería la proporción de cambio en el grupo experimental respecto al control. Por ejemplo, si tenemos una tasa de eventos en el grupo control del 16% y en el grupo experimental deseamos alcanzar una tasa del 12%, la reducción absoluta será del 4%, mientras que la reducción relativa en la tasa será del 25%. Este valor es importante por dos cosas:

– Porque tiene una influencia decisiva en el número necesario de pacientes a reclutar (a menor diferencia buscada, mayor tamaño muestral).

– Porque esta cifra debería ser la menor diferencia clínicamente importante para no incluir un número de pacientes más amplio del necesario.

• El poder del estudio: es la capacidad de detectar una diferencia en el efecto entre los resultados de las ramas del estudio cuando realmente existe. En general, se utiliza el valor del 80%, lo que significa que hay una probabilidad del 20% de no encontrar una diferencia cuando ésta realmente existe. Serían los llamados resultados falsos negativos.

• El nivel de significación: es la probabilidad de detectar un efecto cuando éste no existe. Serían los falsos positivos. El valor más usual es del 5%. Significa que los investi-gadores aceptan una probabilidad del 5% de aceptar una diferencia cuando en realidad no existe.

El objetivo de un ensayo debería ser tener un tamaño muestral que encuentre una diferencia estadísticamente significativa entre ambos grupos de tratamiento pero que, a la vez, sea también clínicamente relevante.

Finalmente, se deben tener en cuenta en este cálculo las pérdidas de pacientes que pueden producirse a lo largo del estudio, por lo que se incrementará el tamaño muestral necesario. Dichas pérdidas se pueden clasificar, según su origen, en tres tipos:

• Pérdidas prealeatorización: serían los pacientes que, cumpliendo todos los criterios de inclusión y ninguno de los de exclusión, no participan en el estudio, generalmente por decisión propia. Se deberían conocer las características de estos pacientes para comparar-las con las de los participantes y comprobar que son similares, ya que, si no fuera así, se pondría en peligro el principio de generalización de los resultados.

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

14

Después de aleatorizar a los pacientes, tendríamos los otros dos tipos: • Los abandonos (drop out): los pacientes que no quieren o no pueden seguir en el es-

tudio, como, por ejemplo, aquellos que cambian de dirección y no pueden ser atendidos en el centro donde se está realizando el ensayo.

• Las retiradas (withdrawal): los pacientes que deben abandonar el estudio, por ejem-plo, por falta de eficacia del tratamiento o reacciones adversas graves. No obstante, se puede realizar el seguimiento de estos pacientes.

Finalmente, cabe comentar que el tamaño muestral puede tener una implicación éti-ca. Los estudios con tamaños muestrales pequeños, no adecuados a sus objetivos, a veces concluyen que no hay diferencias entre ambos tratamientos, lo que es erróneo, ya que en realidad lo que no tienen es poder suficiente para detectar las diferencias establecidas pre-viamente. Por otro lado, con muestras innecesariamente grandes puede que estemos dan-do a los pacientes un tratamiento menos efectivo que el otro que estamos analizando.

En el caso de que seamos nosotros mismos los que queramos llevar a cabo un ensayo (es aplicable también a los desarrollados por la industria) y por diferentes causas no po-demos alcanzar el tamaño muestral necesario, ¿qué se puede hacer si necesitamos reducir el tamaño muestral calculado? En este caso, tenemos algunas alternativas:

• En primer lugar, podemos elegir sujetos cuyo riesgo de sufrir el evento de interés del estudio sea más elevado.

• En segundo lugar, se puede realizar una fase para valorar el cumplimiento de los pacientes, la denominada fase de run-in. Se lleva a cabo antes de aleatorizar a los pa-cientes. De esta forma, aquellos que tienen una baja tasa de adherencia al tratamiento o de asistencia a las visitas no son incluidos en el estudio. Esta fase se puede llevar a cabo con placebo o productos activos. El hecho de realizarla con un producto activo también permite descartar los pacientes que presentan efectos secundarios o no toleran bien la medicación.

• En tercer lugar, podemos escoger otra variable de resultado que sea más frecuente, aunque debe correlacionarse muy bien con la verdadera variable de interés. Este caso es frecuente en los ensayos clínicos del campo de la cardiología, donde se escogen variables combinadas como, por ejemplo, muerte, reinfarto, síndrome coronario agudo e ingreso en el hospital(8).

Un punto aparte merece el comentario sobre los resultados negativos obtenidos en un ensayo clínico, es decir, en el caso de que no se encuentren diferencias estadísticamente significativas en la eficacia de los tratamientos comparados. Este hecho puede ser debido básicamente a dos causas:

• Que sea verdad que no hay diferencias en la eficacia o, dicho de otra forma, éstas son tan pequeñas que son prácticamente indetectables. Éste sería el caso de un estudio verdaderamente negativo.

• Sesgos en el diseño o falta de poder estadístico. Como hemos dicho, el poder esta-dístico se puede definir como la probabilidad de rechazar la hipótesis nula cuando ésta es falsa, o la capacidad que posee una prueba para detectar diferencias cuando realmente las hay. Por lo tanto, en algunos ensayos, y en muchos análisis intermedios, no tenemos un número suficiente de pacientes incluidos para poder demostrar una diferencia entre dos tratamientos. Éstos serían estudios falsos negativos.

15

[ Aspectos generales de los ensayos clínicos ]

6/Intervenciones

Las intervenciones que se van a realizar en un ensayo clínico se deben especificar y definir con la suficiente claridad como para que puedan ser replicadas en otro estudio o en la práctica clínica habitual. Las descripciones deben ser similares en ambos grupos de tra-tamiento, aunque uno de ellos sea placebo. Se deben definir las dosis, los intervalos de administración, las vías de administración y la duración del tratamiento.

Además de la descripción de las intervenciones en estudio, las restantes actividades implicadas a lo largo de todo el periodo de estudio –como pruebas diagnósticas o de control realizadas, tratamientos concomitantes permitidos y prohibidos, medicación de rescate, etc.– deben estar correctamente explicadas.

Por otro lado, es importante la elección del grupo control que se va a usar. Dicha elección es un punto crítico en el diseño de los ensayos clínicos. ¿Para qué sirve un gru-po control? El objetivo principal de dichos grupos es permitir la discriminación de los resultados obtenidos por el tratamiento experimental frente a los obtenidos por otros factores, como la historia natural de la enfermedad, las expectativas de los pacientes o el efecto de la regresión a la media. Así, el grupo control nos dice cómo evolucionarían los pacientes si no hubieran recibido el tratamiento experimental. El grupo experimental y el control deberían ser iguales en lo relativo a todas las variables basales y los tratamientos complementarios o el seguimiento, salvo en el tratamiento en estudio. Esto, además, se consigue con la aleatorización y el enmascaramiento.

En el diseño de un ensayo clínico hay diferentes formas de establecer el tratamien-to de los controles (sin tratamiento, diferentes dosis del mismo producto en estudio, control activo, que es lo más frecuente, o placebo)(9). El primer grupo, o grupo de no tratamiento, es similar al que usa placebo, aunque no puede ser completamente enmas-carado. El control con diferentes dosis es aquel en que los sujetos son aleatorizados a dos o más grupos de dosis de un mismo producto. En el caso de utilizar control activo, es muy importante valorar si es el adecuado o aceptado habitualmente para el tratamiento de la enfermedad en estudio, tanto en lo concerniente a las dosis como a la duración del tratamiento y vías de administración del mismo. Esto es especialmente importante, por ejemplo, en el caso de que el fármaco experimental necesite menos tiempo para conseguir el efecto deseado. El mero hecho de conseguir antes el efecto no implica necesariamente que sea mejor. Deberíamos saber además si este efecto, por ejemplo, se produce en un porcentaje similar de pacientes al del grupo control.

Entre las diferentes intervenciones se encuentra el uso del placebo. En este caso se debería valorar la justificación de su uso. Se considera placebo a un agente inactivo desde el punto de vista farmacológico, pero ¿cuál es la utilidad del placebo en el contexto de los ensayos clínicos? En un diseño correcto, con doble enmascaramiento, permite una valoración no sesgada de la eficacia del producto en estudio.

Aparte de servir como tratamiento en el grupo control para establecer comparaciones, el placebo se puede usar de otras formas en los ensayos clínicos. Una primera sería en los denominados periodos de lavado previos al inicio del ensayo (wash-out) o en el periodo an-terior a la inclusión (run-in) de los pacientes. Otro uso sería el que se realiza en los ensayos

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

16

que comparan una nueva terapia frente a una establecida, pero añadiendo la nueva en una rama, y en la otra se añade el placebo sobre la terapia convencional (add-on trials).

El tema del uso del placebo continúa siendo controvertido. Podríamos decir que, en general, un sector lo apoya por sus bondades metodológicas y hay otro sector que se posiciona en contra por la falta de ética. Ambos grupos tienen una serie de ideas bien argumentadas, pero la explicación sería demasiado extensa para incluirla en el presente capítulo(10). Sin embargo, la Asamblea Médica Mundial redactó en el año 2002 una nota aclaratoria al artículo 29 de la actualización de Edimburgo de la declaración de Helsinki, nota en la que explica en qué circunstancias puede ser aceptable el uso del placebo. Según esta aclaración, es ético el uso del placebo, en primer lugar, si se aporta una información adecuada a los posibles participantes en el estudio, para que, una vez que han sido debi-damente informados, decidan su participación o no en un ensayo con placebo. El place-bo se podría usar cuando no hay una intervención de efectividad comprobada o cuando, a pesar de que exista, el no darla expone a los participantes únicamente a una molestia temporal o a un ligero retraso en el alivio de los síntomas. El uso del placebo sería clara-mente inapropiado para situaciones en las que un retraso u omisión de los tratamientos disponibles pueda causar la muerte o una morbilidad irreversible en los pacientes.

7/Aleatorización

La aleatorización es un proceso que consiste en asignar los participantes incluidos en un ensayo clínico a los diferentes grupos de tratamiento teniendo en cuenta el azar. Este proceso asigna a cada participante una probabilidad conocida (generalmente igual) de ser incluido en cada rama de tratamiento. El proceso de aleatorizar introduce el azar en la asignación de los tratamientos(11). Este proceso aporta una sólida base para los análisis estadísticos que se llevan a cabo posteriormente. El objetivo de la aleatorización es evitar un sesgo de selección, ya que intenta distribuir las características de los pacientes que pueden influir en los resultados de forma similar entre los grupos de tratamiento expe-rimental y control.

De esta forma, la aleatorización pretende que los diferentes grupos que participan en el ensayo estén balanceados, esto es, sean iguales, con relación a los posibles factores pronósticos de la enfermedad en estudio. Estos factores equilibrados serían aquellos que ya son conocidos, pero también los que son desconocidos hasta el momento actual, con lo que se conseguiría que cualquier diferencia en los resultados fuera achacable a la inter-vención en estudio.

Para proceder a la aleatorización de los participantes se deben cumplir al menos dos requisitos: la comprobación de que el paciente cumple todos los criterios de inclusión y ninguno de los de exclusión, y que el paciente haya dado su consentimiento para parti-cipar en el ensayo.

Hay diferentes formas de llevar a cabo el proceso de aleatorización. a) Aleatorización simple. Sería un proceso similar al hecho de tirar una moneda al

aire a cara o cruz para, de esta forma, asignar a los pacientes al grupo que les toque en ese

17

[ Aspectos generales de los ensayos clínicos ]

momento. Se puede generar por medio de tablas de números aleatorios producidas por cualquier programa estadístico. Esta secuencia de aleatorización producida se puede in-troducir en sobres opacos y abrir un sobre con el grupo asignado cada vez que incluimos un paciente. Un problema que puede presentar este proceso es que no se asigne un nú-mero igual de pacientes a cada grupo de tratamiento. Esto sería más frecuente en ensayos con tamaños muestrales pequeños.

b) Aleatorización en bloques. Es una forma de prevenir esta descompensación en el tamaño muestral. Este tipo de aleatorización garantiza que no habrá grandes diferencias en ningún momento y que en determinados momentos del proceso de asignación de pa-cientes los grupos sean iguales. El procedimiento consiste en forzar la aleatorización para que dentro de cada bloque haya el mismo número de pacientes en cada tratamiento estu-diado(12). Es importante señalar que los investigadores participantes deben desconocer el tamaño de los bloques. Por ejemplo(13), si decidimos hacer bloques de cuatro sujetos, hay seis posibilidades de asignar los dos tratamientos: AABB, ABAB, ABBA, BAAB, BABA y BBAA. El proceso se repetiría hasta alcanzar el tamaño muestral necesario.

c) Aleatorización estratificada. En este caso se preparan listas separadas según los criterios por los que se estratifica. Estos criterios de estratificación en los estudios multi-céntricos suelen incluir un estrato por hospital participante. Además, se puede estratificar por edad u otras variables de valor pronóstico conocido. De esta forma, se aumenta la probabilidad de que los grupos sean semejantes en las variables pronósticas selecciona-das. Además, facilita la interpretación de los resultados sin recurrir a modelos de ajuste estadístico más complicados(11).

Otro procedimiento, escasamente usado en los ensayos clínicos con fármacos, es el de aleatorización por clusters o conglomerados. Aquí se aleatorizan grupos del tipo de hospitales o centros de salud, en vez de individuos.

Finalmente, hay otro procedimiento alternativo, aunque también poco usado, para conseguir que los grupos sean comparables en cuanto a las diferentes variables pronósticas conocidas. Se llama minimización y consiste en determinar las variables importantes que deben estar balanceadas entre los grupos, diseñar diferentes estratos según estas variables, ver el número de pacientes en cada tratamiento en cada estrato y, finalmente, asignar el siguiente sujeto al tratamiento que tenga menos pacientes de esas características.

Además del proceso de aleatorización, hay otra característica que es tan importante como la aleatorización en el desarrollo adecuado del estudio, ya que si no las bondades metodológicas conseguidas por aleatorizar a los pacientes se pueden ver comprometidas por una asignación sesgada de los pacientes. Se trata de la denominada ocultación de la secuencia de aleatorización (OSA) (concealment). Sea cual sea el método de aleatorización elegido, si el investigador o clínico (o el paciente) son capaces de identificar el siguiente tratamiento asignado o pueden influir en el proceso de selección-inclusión de pacientes por efecto del siguiente tratamiento asignado, el valor añadido de la aleatorización se ve comprometido(14). Este problema se puede presentar más frecuentemente en los ensayos unicéntricos.

Es importante que los investigadores que deciden incluir a los pacientes en los estu-dios no sean conocedores del grupo al que será asignado el siguiente sujeto incluido. Esto evita la selección y asignación, consciente o inconsciente, de un paciente concreto a una rama de tratamiento específica. Cualquier investigador podría sesgar el proceso de alea-

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

18

torización si no se le oculta dicha secuencia de aleatorización. Si se conoce a qué rama de tratamiento se va a asignar al siguiente paciente, se pueden seleccionar y asignar pacientes de determinadas características a un brazo de tratamiento concreto, lo que sesgaría la asignación aleatoria. Es decir, si a mí, como investigador, me interesa (consciente o in-conscientemente) favorecer los resultados del producto experimental y sé que el siguiente paciente será asignado a la rama experimental y que el paciente que entra en mi consulta es de unas características que hacen más difícil conseguir el efecto perseguido, no lo in-cluyo en ese momento en el estudio y espero a que acuda un paciente con características basales más favorables para el resultado esperado.

La forma más frecuente de OSA se lleva a cabo mediante sistemas de aleatorización centralizados y remotos interactivos de voz, fax o por Internet que realizan la asignación aleatoria en el momento en que se llama desde el hospital participante. Estos sistemas, en general, están activos las 24 horas al día.

En los ensayos desarrollados en un único hospital o centro, este efecto se puede con-seguir mediante la colaboración en la aleatorización y ocultación de dicha secuencia de personal no implicado directamente en el desarrollo del ensayo clínico.

8/Enmascaramiento o cegamiento

Idealmente los ensayos clínicos deberían ser ciegos o, lo que es lo mismo, enmascarados. El enmascaramiento tiene dos efectos. En primer lugar, minimiza el sesgo de selección debido a una actuación consciente o inconsciente en la asignación de tratamientos. En segundo lugar, minimiza el sesgo debido a la diferente medición de los resultados según el grupo asignado tanto por parte del paciente como por parte del investigador(15). Asi-mismo, se evitan intervenciones o actuaciones diferentes durante el periodo de segui-miento entre ambas ramas del estudio.

Hay diferentes tipos de enmascaramiento:• Simple ciego: en este caso es el paciente (a veces el clínico) únicamente el que no

conoce la rama de tratamiento asignada. Presenta el problema de que el investigador puede tratar a los pacientes de diferente forma tanto en el seguimiento como a la hora de valorar los resultados, sobre todo si éstos son “subjetivos”, como en una medición del nivel de dolor.

• Doble ciego: en este caso, ni el paciente ni el investigador conocen la rama asignada. Es una alternativa mejor que la anterior.

• Triple ciego: en este caso, el significado exacto del enmascaramiento puede ser dife-rente según los ensayos. El más frecuente es que el paciente, el investigador y la persona que administra el tratamiento estén cegados. También puede ser el equipo que realiza los análisis estadísticos posteriormente el que desconozca a qué grupo de tratamiento pertenecen los pacientes incluidos.

• Ciego para terceros: en este caso, es el evaluador el único que no conoce el grupo de asignación. Esto podría ser necesario y útil, por ejemplo, en ensayos clínicos en cirugía lapa-roscópica frente a la abierta, intervenciones de psicoterapia u otras intervenciones similares.

19

[ Aspectos generales de los ensayos clínicos ]

El método más usado en la práctica clínica es el doble ciego. En este caso, habría que asegurarse de que algunas características de los fármacos del estudio, como su forma, vía de administración, color, tamaño, etc., no difieran, ya que si no se podría comprometer el objetivo del enmascaramiento.

Sin embargo, hay ocasiones en las que no se puede (o no se debe) realizar un estu-dio con doble ciego, como, por ejemplo, si como consecuencia del efecto buscado o algún efecto secundario o adverso característico de algún fármaco del estudio se pue-de identificar dicho fármaco (aumento de diuresis, efecto bradicardizante, cambio en el color de la orina), o en el caso de tener que administrar un placebo reiteradamente por vía parenteral. En otros casos no sería estrictamente necesaria su realización, como en el caso de un ensayo que quisiera medir solamente la mortalidad, ya que es una variable “muy” objetiva y difícilmente influenciable por la opinión del investi-gador o el paciente.

Es muy importante que en los estudios de tipo doble ciego exista un mecanismo rápi-do para romper el ciego y conocer el grupo asignado a cada paciente en casos en los que se presente una situación que requiera atención médica de urgencia.

Finalmente, en algunos ensayos en que comparamos dos fármacos activos, pero con diferentes dosis, vías de administración o frecuencia de administración, es necesario recurrir al doble enmascaramiento (double dummy). Éste consiste en administrar un placebo de características externas iguales a las del tratamiento activo. Así, si en un ensayo el fármaco A se toma cada 24 horas y el fármaco B cada 12 horas, deberíamos preparar un placebo para los pacientes asignados al grupo A y que tomasen en las 24 horas tanto su fármaco activo, el A, como el placebo del fármaco B, con lo que los pacientes del grupo A se igualarían a los pacientes asignados al tratamiento B en las dos tomas diarias.

9/Variables de resultado

Como hemos dicho, la variable principal del estudio debería ser relevante tanto para el clínico como para el paciente. Debería ser capaz de aportar evidencia relacionada con el objetivo principal del ensayo. En general, debe haber solamente una variable principal, que suele corresponder, al menos en los ensayos en fase III, a una variable que mide la eficacia. Hay otros casos en los que lo que interesa suele ser la seguridad o la tolerabilidad de los productos en estudio. Hoy en día están ganando aceptación otro tipo de variables como las relacionadas con la calidad de vida de los pacientes o las que tienen que ver con análisis económicos, aunque estas últimas aún se mantienen en segundo plano. Asimismo, esta variable principal debería ser la usada para el cálculo del tamaño muestral.

La variable principal de resultado debe estar descrita y definida de forma precisa, a través de mediciones estándares y aceptadas por la comunidad clínica. Las variables de resultado, al igual que los objetivos, serán primarias y secundarias, con las mismas carac-terísticas que tienen los objetivos(6).

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

20

Numerosas veces los investigadores no utilizan las variables de interés, como puede ser la supervivencia, sino otras variables respuesta sustitutas o subrogadas. Una caracte-rística de éstas es que se obtienen antes en el tiempo y acortan el desarrollo del ensayo, así como su presupuesto. Estas variables deberían ser realmente predictivas del resultado clínico de interés.

Otro tipo de variables comunes son las denominadas variables compuestas (composite end points). Son variables que están formadas por varios eventos de interés como, por ejemplo, una variable compuesta cuyo evento de interés se define por muerte, reingre-so o brote de la enfermedad. En los ensayos clínicos son más frecuentes en el campo de la cardiología. Entre sus objetivos más importantes se cuentan el reducir el tamaño muestral o aumentar el poder del estudio consiguiendo una tasa mayor de eventos de interés. Una de sus principales limitaciones es que los eventos que las componen pueden presentar amplias diferencias en cuanto a la importancia que tienen para los pacientes (como, por ejemplo, si se incluyen en la misma variable compuesta mortalidad e ingreso hospitalario). Otro problema relacionado es que la mayoría de los eventos de la variable que se producen a lo largo del estudio estén concentrados en un solo evento. Así, por ejemplo, en una variable compuesta por mortalidad cardiovascular, infarto de miocardio y revascularización, si la mayoría de los eventos que se producen son de revascularización y se encuentra al finalizar el estudio una eficacia importante del fármaco en estudio, se generalizaría a la variable compuesta, pero los pacientes solamente se verían beneficiados en uno de los componentes, no en el número de infartos ni en el de muertes(16). Habría que ver si hay o puede haber heterogeneidad entre los componentes de la variable con relación a la importancia y frecuencia de cada uno de los componentes.

10/Análisis de resultados

Una vez hallado el tamaño muestral adecuado para el objetivo principal del estudio, el tipo de análisis de datos debería seguir el principio de intención de tratar. Esta estrategia compara los pacientes de las ramas de estudio de acuerdo con el grupo al que fueron aleatorizados los pacientes, irrespectivamente del tratamiento que recibieron a lo largo del ensayo o de si se perdieron durante el desarrollo del mismo. De esta forma, se respeta la asignación aleatoria como procedimiento para evitar sesgos y se atribuyen todos los efectos al tratamiento asignado. Cualquier otro tipo de análisis puede introducir algún sesgo en las comparaciones entre grupos. Con este análisis se obtiene una estimación conservadora de los efectos del tratamiento. Si se aplica, se conservaría el balance entre grupos de los factores pronósticos conseguido mediante la aleatorización. Por otro lado, minimiza la influencia de las pérdidas o de los no cumplidores y permite una mayor generalización de los resultados(17). Sería más parecido a lo que ocurriría en la práctica clínica habitual.

A veces se presentan análisis modificados por intención de tratar, en los que se debería justificar en el protocolo completamente qué tipo de población se puede excluir y cuál va a ser la población incluida en el análisis.

21

[ Aspectos generales de los ensayos clínicos ]

Hay alternativas a este tipo de análisis por intención de tratar. El tipo más usado es el denominado análisis por protocolo, en el que solamente los pacientes que han cumplido determinados criterios (grupo de tratamiento, disponibilidad de las medidas de resultado, ausencia de violaciones mayores del protocolo) del estudio son incluidos en el análisis. En este caso se puede producir algún tipo de sesgo relacionado con los pacientes excluidos(18). Este caso es más parecido a la situación óptima de uso del pro-ducto en estudio.

En numerosos casos se utilizan ambos enfoques en el mismo ensayo. En caso de que obtengan las mismas conclusiones, se confirman mejor los resultados conseguidos.

Finalmente, hay que comentar que el análisis por intención de tratar se debe usar en los ensayos que pretenden demostrar la superioridad de un producto sobre el otro. En el caso de querer demostrar la no inferioridad o equivalencia, sería correcto utilizar el aná-lisis por protocolo y el análisis por intención de tratar, esperando encontrar los mismos resultados en ambos(19).

Uno de los posibles problemas que nos podemos encontrar en el apartado del análisis de datos es la realización del llamado análisis de subgrupos en vez del análisis de la totali-dad de la muestra. Son análisis que se realizan en grupos determinados de la totalidad de la muestra, como por ejemplo solamente en el subgrupo de hombres menores de 65 años, sin estar previamente planificados. La realización de este tipo de análisis adquiere mayor importancia cuando no estaban planeados a priori. En caso de que estuvieran ya descritos en el protocolo inicial, junto a una hipótesis, estos análisis secundarios pueden arrojar luz sobre diferencias en el efecto o diferentes aplicaciones en los subgrupos(20).

Otra situación diferente es la de los análisis intermedios. Su justificación vendría del hecho de que si, a lo largo del desarrollo de un ensayo con dos tratamientos en pacientes graves, se observan diferencias importantes a favor de uno de ellos, por motivos éticos no se debería continuar con la rama del otro tratamiento del ensayo. Estos análisis interme-dios deben estar fijados en el protocolo(21).

Finalmente, dentro del análisis de los datos, lo primero que se debería comprobar es si la aleatorización ha conseguido sus objetivos a la hora de distribuir a los pacientes inclui-dos en el ensayo. Una primera aproximación es la descripción y comparación de las ca-racterísticas y mediciones basales de los diferentes grupos de estudio. En general, se habla de características sociodemográficas, de la enfermedad en estudio (nivel de gravedad en cada grupo, niveles de marcadores biológicos de características radiológicas, puntuacio-nes de los cuestionarios de calidad de vida relacionada con la salud…) o de otras variables que pueden influir en los resultados que se van a analizar. Si a pesar de aleatorizar a los pacientes encontramos que hay factores pronósticos que no están balanceados entre los grupos del estudio, se debería proceder al ajuste de los mismos en la fase de análisis de los datos por medio de las técnicas estadísticas apropiadas. Uno de los métodos podría ser la estratificación en caso de ser pocos los factores implicados. Si nos encontramos con que son más numerosos, habría que recurrir a otras técnicas estadísticas, como la regresión múltiple o la regresión logística(21).

Las técnicas estadísticas aplicadas en el análisis de los datos son múltiples; dependen del objetivo del estudio. Pueden abarcar desde simples comparaciones de porcentajes o de medias hasta modelos más sofisticados o complejos de análisis multivariante que no creemos pertinente desarrollar en este capítulo.

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

22

11/Fases de estudio

Los ensayos clínicos se clasifican habitualmente en cuatro fases. Cada una de ellas se considera un ensayo diferente y necesita aprobación independiente. El proceso de apro-bación de un nuevo fármaco pasa por las tres primeras fases. Las autoridades reguladoras aprueban el uso de un nuevo producto después de pasar las fases I, II y III. La última fase, la IV, se realiza normalmente después de la aprobación para su uso en la población.

Antes de proceder a los estudios clínicos, se realizan una serie de estudios preclínicos, básicamente de seguridad, en los que se evalúan las características farmacocinéticas y toxicológicas del producto.

Fase I

Esta fase es una prolongación de las fases preclínicas. Se realiza en pequeños grupos de voluntarios sanos (10-40). Habitualmente valora la seguridad y tolerabilidad del princi-pio activo estudiado. También lleva a cabo estudios de farmacocinética y farmacodiná-mica de las nuevas moléculas. En los primeros se estudia la absorción, distribución, me-tabolización y excreción de los productos en estudio. Los estudios de farmacodinámica se ocupan de los efectos que los fármacos inducen en las personas.

Se llevan a cabo en unidades específicas de fase I en las que los sujetos participantes pueden ser observados a lo largo de todo el proceso. A pesar de que en general se realizan con voluntarios sanos, hay algunas circunstancias excepcionales en las que se realizan en pacientes (pacientes en estadios terminales de alguna enfermedad o en el caso de que no haya otras opciones de tratamiento, lo que puede suceder en algunos tipos de pacientes oncológicos). Estos estudios no suelen ser aleatorizados ni enmascarados.

Los estudios de tolerabilidad constituyen la primera etapa de la investigación de los fármacos en los seres humanos. Se determina la primera dosis a administrar, con sus incrementos y la frecuencia de administración. Para valorar los cambios que se pueden producir por las diferentes dosis administradas, se usan datos subjetivos de los pacientes, como los síntomas, y datos objetivos mediante variables de laboratorio o exploración(22).

Fase II

Si se confirma la seguridad del producto en estudio, comienza la fase II. Ésta ya se realiza en grupos mayores, de alrededor de 200-300 pacientes, y pretende evaluar algunas carac-terísticas del fármaco, estudiando diferentes dosis, así como realizar una valoración de su seguridad y un análisis exploratorio de la eficacia. A veces esta fase se subdivide en dos:

• Fase IIA: para estudiar las dosis necesarias del fármaco.• Fase IIB: para comenzar a evaluar la eficacia de las diferentes dosis.

23

[ Aspectos generales de los ensayos clínicos ]

Fase III

Ésta es la fase en la que se realizan los ensayos controlados y aleatorizados, en muestras amplias de pacientes en los hospitales u otros centros asistenciales. Se pretende valorar la eficacia del principio activo, es decir, demostrar o confirmar un efecto terapéutico. Nor-malmente es la parte más costosa, en cuanto a recursos y tiempo, así como la más difícil de diseñar y llevar a cabo, sobre todo en el caso de las enfermedades crónicas.

Fase IV

Es una fase que se conoce también como estudio post-autorización, es decir, se realiza después de la comercialización del producto. Está diseñada básicamente para recoger datos de seguridad a más largo plazo que los recogidos en las fases anteriores. Se realiza en muestras amplias de pacientes y con un periodo de seguimiento más amplio que los estudios desarrollados en la fase III. A veces, sus objetivos pueden ser distintos. Pueden estudiar nuevas indicaciones o nuevas vías de administración de un producto ya comer-cializado pero con una indicación o vía de administración distinta a la que se quiere estudiar en esta fase del desarrollo.

12/Diferentes tipos de diseño de ensayos

Los ensayos clínicos pueden tener diferentes diseños, cada uno de ellos con sus ventajes e inconvenientes. En general, son diseños controlados, es decir, hay al menos dos grupos participantes, uno de los cuales es un grupo de comparación.

Sin embargo, a veces se presentan casos en que se podría justificar un estudio no controlado –o controlado, pero no de forma concurrente, sino con controles históricos–. Éste sería el caso de una enfermedad grave y sin tratamiento eficaz en el momento del estudio o el de enfermedades con una incidencia baja y que tengan una evolución prede-cible. Estos estudios son más rápidos, son más baratos y necesitan menos pacientes.

Por otro lado, en general las autoridades reguladoras exigen que se realicen ensayos clí-nicos controlados. Siguiendo a la Agencia Europea de Medicamentos (EMA)(23) dentro de los clásicos ensayos controlados tenemos básicamente cuatro tipos diferentes de diseño:

a) Diseño de grupos paralelosEste tipo de diseño es el que se utiliza con mayor frecuencia en los ensayos clínicos.

En general, se trata de ensayos con dos ramas de estudio (aunque pueden ser más de dos), cada una de ellas con un tratamiento diferente. Se asigna de forma aleatoria a los pacientes a una rama u otra de tratamiento y se les sigue durante el tiempo que dure el ensayo.

Aunque no se utiliza de forma frecuente, dentro de este grupo existe el denomina-do diseño secuencial. En este caso no se realiza un cálculo formal del tamaño muestral necesario, sino que se analizan los datos según se incluyen parejas de pacientes con los

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

24

diferentes tratamientos. Requiere que la variable de resultado del estudio se produzca de forma rápida en el tiempo y tener una sola variable principal en el diseño del estudio. Esta forma de grupos paralelos permite incluir el menor número de pacientes para llevar a cabo la comparación de los tratamientos.

b) Diseño cruzadoEn este tipo de diseño, a diferencia del anterior, cada paciente recibe los dos o más

tratamientos en estudio. De forma aleatoria se asigna a los pacientes a las ramas del estudio. Cada rama consiste en una secuencia de dos o más fármacos administrados con-secutivamente (AB o BA). En este caso, cada paciente actúa como su propio control para las comparaciones de eficacia, lo que permite comparar la respuesta de cada paciente al producto A con respecto a la respuesta al B(24). En general, se necesitan menores tamaños muestrales para su desarrollo. Se debería utilizar en enfermedades crónicas y en general estables en el tiempo, en las que los sujetos de estudio presenten condiciones similares al recibir el primer y el segundo fármaco. Una precaución especial a tener en cuenta con este diseño es que no se produzca el efecto de arrastre, esto es, que el efecto del primer fármaco se mantenga cuando comenzamos con el segundo, haciendo que este último parezca más eficaz de lo que puede ser realmente. Para evitar esta circunstancia, en caso de que sea éticamente válido, se puede recurrir a los “periodos de lavado” (tiempo sin tratamiento después de la administración del primer fármaco asignado del estudio). Este tipo de diseño también puede presentar más dificultades en el análisis e interpretación de los datos que surgen de la pérdida de sujetos a lo largo del desarrollo del estudio.

c) Diseño factorialEn este diseño se pretende evaluar dos o más tratamientos utilizando combinaciones.

El tipo más simple es el diseño factorial de 2 × 2, es decir, se comparan dos tratamientos. En primer lugar, se aleatorizan los pacientes para recibir uno de los cuatro grupos de tratamientos: el A solo, el B solo, el AB (ambos), o ninguno de ellos. En este último caso, se suele utilizar un placebo. Permite estudiar interacciones entre los fármacos en estudio. También es un diseño útil para estudiar las características de diferentes dosis, al usar simultáneamente dos fármacos.

d) Diseño N = 1Este tipo de ensayo clínico se lleva a cabo con un solo paciente. No es un ensayo

frecuente, pero en general mantiene la misma base metodológica que los diseños más clásicos. Se puede utilizar cuando no encontramos ensayos clínicos aleatorizados que den respuesta sobre un tema particular de interés para el paciente o, incluso, si hay algún ensayo realizado, puede que nuestro paciente no cumpla los criterios de dicho estudio, y los resultados no le sean aplicables.

13/Aspectos de bioética

Antes de comentar diversos aspectos propios de la bioética, se debe decir que todos los estudios que no sean correctos desde el punto de vista metodológico no son aceptables éticamente.

25

[ Aspectos generales de los ensayos clínicos ]

Los inicios de la bioética son recientes, en cualquier caso posteriores a la segunda guerra mundial. El origen de la aplicación de la ética en la investigación se sitúa en la aparición del Código de Nüremberg, en el año 1947, publicado como consecuencia del proceso judicial desarrollado en la ciudad del mismo nombre a los responsables de los experimentos nazis.

La Asociación Médica Mundial, en su 18.ª Asamblea General, celebrada en Helsinki, publicó la denominada Declaración de Helsinki en el año 1964. Esta declaración ha te-nido varias actualizaciones, la última de las cuales data del año 2008 en Seúl (Corea).

Posteriormente, mediante una iniciativa del Congreso de EE UU en 1978, se redactó el Informe Belmont, en el que se establecen los principios básicos de la bioética. La des-cripción de los principios bioéticos está basada en diferentes documentos(9).

Más tarde, desde Europa surgió la iniciativa del denominado Convenio para la Pro-tección de los Derechos Humanos y la Dignidad del Ser Humano con respecto a las aplicaciones de la Biología y la Medicina, conocido como el Convenio de Oviedo del Consejo de Europa, que entró en vigor en el año 2000.

Como consecuencia del citado Informe Belmont, se enuncian los principios básicos de la ética. El primer principio establecido fue el principio de autonomía, es decir, el respeto a la persona. Aquellas personas capaces de tomar decisiones de acuerdo con sus valores o creencias deben ser consultadas y se ha de tener en cuenta la opinión expresada por ellas. Se plasma mediante la obtención del consentimiento informado antes de co-menzar el estudio.

El segundo principio es el de beneficencia. Sería la obligación de maximizar los be-neficios. Se plasma mediante la relación beneficio/riesgo que se debe considerar sobre la base individual. Es inseparable del principio de autonomía, ya que ambos se refieren a ámbitos de lo concreto y particular de cada persona, frente a lo general y universal de los dos principios siguientes.

El tercer principio se denomina de no maleficencia, es decir, no se puede hacer daño a otro (primun non nocere). Este principio está por encima incluso de producir beneficio y previene contra el daño evitable. Exige establecer una buena comunicación y ofrecer una información cierta, comprensible y continuada en el tiempo a los pacientes.

El último principio es el de justicia, de forma práctica sería contestar a la pregunta ¿quién debe recibir los beneficios de la investigación y sufrir sus cargas? La información aportada a los pacientes debe poder ser comprendida por todos. Hoy en día este princi-pio parece más respetado, a diferencia de los estudios más antiguos, en los que se experi-mentaba habitualmente con pacientes pobres y/o ignorantes.

Con estos cuatro principios se pueden establecer dos niveles: • En el primer nivel se encuentran los principios de justicia y no maleficencia. Cual-

quier estudio que los conculque debe ser prohibido. Por ejemplo, el fallo más frecuen-te son los ensayos que están mal diseñados, por lo que la sociedad no se beneficiará de ellos.

• En el segundo nivel encontramos los otros dos principios, beneficencia y auto-nomía. Estos principios no son absolutos, ya que el respeto máximo de cada uno de ellos no es posible sin lesionar el otro. Por ejemplo, si un paciente quiere tomar parte en un ensayo en la creencia de que se va a beneficiar por el tratamiento en estudio, pero su médico cree que le puede resultar más dañino que beneficioso, y no le reco-

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

26

mienda su participación, el principio de autonomía del paciente colisiona con el de beneficencia.

Por otro lado, el denominado código de buenas prácticas clínicas (BPC) ejerce una importante influencia en el desarrollo de los ensayos. Este código no está relacionado con la atención médica, sino que habla sobre cuestiones importantes que afectan al propio ensayo y su desarrollo. Entre ellas cabe destacar las responsabilidades del promotor, del investigador principal y del equipo investigador, el monitor, el desarrollo del protocolo, el archivo de la documentación, la publicación, el manejo de datos, la participación de los comités de ética e investigación clínica, etc.

Así, la Food and Drug Administration (FDA), que había exigido durante mucho tiempo que se cumplieran las especificaciones de la declaración de Helsinki, con sus ac-tualizaciones, abandonó recientemente esta directriz y la sustituyó por el cumplimiento de las especificaciones de las Recomendaciones de Buenas Prácticas Clínicas de la Confe-rencia Internacional de Armonización (ICH). En un reciente artículo(25) sobre este tema, los autores concluyen que las exigencias éticas de la FDA se han visto rebajadas al adoptar el nuevo código.

14/Consentimiento informado

El consentimiento informado es un proceso por el que los pacientes son informados sobre los aspectos relevantes del ensayo antes de aceptar libremente su participación o no en el mismo.

Los objetivos principales del consentimiento informado serían promover la autono-mía de los pacientes y estimular la toma de una decisión racional(12). La obtención de dicho consentimiento implica que ha habido una información tanto oral como escrita adecuada al nivel educativo de cada paciente para que éste pueda expresar voluntaria-mente su deseo o no de participación en el estudio.

La hoja de información al paciente debe reunir una serie de requisitos, entre los que se encuentra que la información aportada sea relevante y esté escrita en términos comprensibles para los pacientes. La hoja de información al paciente así como el resto de la documentación del ensayo deben ser aprobados por el Comité de Ética e Investiga-ción Clínica y seguir las directrices del BPC. La información que se aporta debe incluir detalles sobre el estudio tales como el objetivo, la duración, los procedimientos que se realizarán a lo largo del desarrollo, los tratamientos alternativos disponibles, los riesgos asociados a la participación, así como los posibles beneficios. Se debe explicitar que los sujetos pueden abandonar el ensayo cuando lo deseen sin consecuencias para su salud ni su relación con el personal sanitario que les atiende. Después de recibir la información oral y escrita, así como de realizar las preguntas que considere pertinentes, se le ofrece al paciente un documento para ser firmado en caso de aceptar participar en el ensayo. En esa misma hoja se explicita que el paciente puede abandonar su participación cuando lo desee, sin necesidad de justificación.

27

[ Aspectos generales de los ensayos clínicos ]

15/Diferentes abordajes de comparación en los ensayos clínicos

En general, el objetivo de los ensayos clínicos es demostrar la superioridad de un nue-vo fármaco frente a otro ya existente. Para este objetivo usamos el llamado contraste de hipótesis. Para ello tenemos dos hipótesis, la denominada hipótesis nula (en general se denomina H

0), que establece que no hay diferencias entre los grupos de estudio. Frente

a la hipótesis anterior, se propone la hipótesis alternativa (H1), que establece que sí hay

diferencias entre los fármacos en estudio. El objetivo es demostrar que hay diferencias entre los fármacos en estudio, y por tanto es rechazar la hipótesis nula.

Otro caso cada vez más frecuente es el denominado estudio de no inferioridad o equi-valencia. En estos casos ya no tenemos las mismas hipótesis de partida.

En los ensayos clínicos clásicos de superioridad, la intención es demostrar que el fármaco experimental tiene mayor eficacia que el control. Por otro lado, como hemos dicho, cada vez más frecuentemente se presentan ensayos de no inferioridad, en los que se pretende demostrar que el fármaco experimental no es peor que el control, con un margen establecido de indiferencia. Este tratamiento control debería ser el tratamiento estándar del proceso en estudio. Un problema en estos estudios radica precisamente en el establecimiento de ese margen de no inferioridad o indiferencia, denominado delta (δ).

Los ensayos diseñados para mostrar superioridad son los que tienen mejores bases científicas para demostrar la eficacia(23). En estos casos, sobre todo si la enfermedad en estudio es potencialmente grave, cuando un fármaco ha demostrado su eficacia, el plan-teamiento de un ensayo controlado con placebo se debe considerar no ético.

A veces un producto en investigación se compara con un tratamiento de referencia, aceptado como estándar, sin el objetivo de mostrar superioridad. Cuando la superioridad no es el objetivo, hay dos categorías: equivalencia y no inferioridad.

El aumento en el planteamiento de ensayos de equivalencia o no inferioridad se pue-de deber, entre otras razones, a la dificultad de desarrollar nuevos fármacos con mayor valor terapéutico que los disponibles, o al propio interés de la industria farmacéutica en registrar fármacos por interés comercial.

En los ensayos de equivalencia (no ensayos de bioequivalencia, que se refieren a pro-piedades farmacocinéticas, llevados a cabo, por ejemplo, con los fármacos genéricos) el objetivo es demostrar que la respuesta a dos (o más) tratamientos es diferente en una can-tidad que no tiene importancia clínica. Dicho de otra forma, el objetivo sería establecer que los efectos de ambos tratamientos son idénticos. La equivalencia completa significa una diferencia igual a cero. Como esto no es posible, el objetivo sería determinar si la diferencia en la eficacia entre dos tratamientos está entre un estrecho intervalo de valores (± δ) sin importancia clínica. Por lo tanto, en los ensayos de equivalencia se deben usar los intervalos de confianza para el análisis de resultados(26).

Los ensayos de no inferioridad quieren demostrar que la eficacia de un producto no es inferior a la de otro dentro de un intervalo especificado (–δ a 0) de no inferioridad(27), es decir, estos ensayos quieren demostrar que la eficacia es al menos tan alta como la del tratamiento estándar o es menor por una cantidad menor que δ, teniendo a menudo

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

28

alguna ventaja sobre el tratamiento de referencia, como puede ser el menor coste, me-nos efectos secundarios o la mayor facilidad de administración en cuanto a dosificación o vía(28).

Uno de los mayores problemas en ambos enfoques es establecer el valor de la diferencia (δ). Una aproximación sería que el margen de no inferioridad debería ser más pequeño o igual al valor más pequeño que represente una diferencia clínicamente importante(29). El problema surge porque no hay valores establecidos para el δ, sino que dependen de cada enfermedad estudiada y su variable principal así como de criterios estadísticos y clínicos.

Por lo tanto, hay diferentes aspectos entre los ensayos clásicos de superioridad y los di-señados como de equivalencia o no inferioridad. En estos últimos la hipótesis estadística es diferente; hay que estar atento al valor δ que se establece, al cálculo del tamaño mues-tral, así como a los intervalos de confianza y al uso del enfoque de análisis por protocolo además del de intención de tratar(30).

16/Algunas definiciones

Alfa (α): la probabilidad de cometer un error de tipo I o, dicho de otra forma, la proba-bilidad de concluir que los dos tratamientos son distintos, cuando en realidad no lo son.

Beta (β): la probabilidad de cometer un error de tipo II, o la probabilidad de concluir que dos tratamientos no difieren, cuando en realidad son diferentes.

Potencia (1 – β): es 1 – la probabilidad de cometer un error de tipo II, es decir, la probabilidad de concluir que dos tratamientos no son diferentes, cuando en realidad sí lo son (Tabla 2).

Análisis por intención de tratar: forma de análisis estadístico en el que se analiza a los pacientes en el grupo en el que fueron originalmente aleatorizados, independientemente de que completen o no el tratamiento y/o el seguimiento.

Asignación aleatoria: procedimiento sistemático y reproducible por el que los sujetos que toman parte en un ensayo clínico son distribuidos al azar entre los grupos de tratamiento.

Cegamiento/Enmascaramiento: medidas tomadas con la finalidad de que el paciente (simple), el médico (simple) o ambos (doble) desconozcan a qué tratamiento ha sido asig-nado el paciente. Se puede dar el caso denominado evaluación ciega por terceros, que se utili-za si no es posible realizar el doble ciego y, en su lugar, se recurre a una tercera persona.

Tabla 2. Pruebas de hipótesis. Diferentes conclusiones

Decisión Realidad

Tratamientos NO diferentes Tratamientos diferentes

Tratamientos NO diferentes Correcto Error de tipo II (β)

Tratamientos diferentes Error de tipo I (α) Correcto (1 – β)

29

[ Aspectos generales de los ensayos clínicos ]

Periodo de lavado (washout): tiempo destinado a eliminar los efectos de tratamientos previos. Suele ser previo al comienzo del ensayo.

Periodo de preinclusión (run-in): tiempo anterior a la aleatorización, que se puede usar para estabilizar a los sujetos o para ver su cumplimiento.

BIBLIOGRAFÍA

1 Jadad AR, Enkin MW. Randomized controlled trials. 2nd edn. London: BMJ Books; 2007. 2 Pocock SJ. Clinical trials: a practical approach. Chichester: John Wiley & Sons; 1983. 3 Sacristan JA, Soto J, Galende I. [Critical evaluation of clinical trials]. Med Clin (Barc) 1993; 100 (20):

780-7. 4 Cobo E. [Design and analysis of a clinical trial: its critical point]. Med Clin (Barc) 2004; 122 (5):

184-9. 5 Roland M, Torgerson DJ. What are pragmatic trials? BMJ 1998; 316 (7127): 285. 6 Gebski V, Marschner I, Keech AC. Specifying objectives and outcomes for clinical trials. Med J

Aust 2002; 176 (10): 491-2. 7 Sociedad Española de Farmacología Clínica. ICB. Criterios de selección: ¿restrictivos o amplios? 1995.

Report N.º 14. 8 Keech AC, Pike R, Granger RE, Gebski VJ. Interpreting the results of a clinical trial. Med J Aust 2007;

186 (6): 318-9. 9 Sociedad Española de Farmacología Clínica. ICB. Los principios básicos de la bioética; 1994. Report N.º 10.10 Emanuel EJ, Miller FG. The ethics of placebo-controlled trials--a middle ground. N Engl J Med

2001; 345 (12): 915-9.11 Beller EM, Gebski V, Keech AC. Randomisation in clinical trials. Med J Aust 2002; 177 (10): 565-7.12 Javier Sánchez-Caro, Fernando Abellán. Ensayos Clínicos en España. Aspectos Científicos, Bioeti-

cos y Jurídicos. EUROMEDICE. Ediciones Médicas; 2005.13 Roberts C, Torgerson D. Randomisation methods in controlled trials. BMJ 1998; 317 (7168): 1301.14 Forder PM, Gebski VJ, Keech AC. Allocation concealment and blinding: when ignorance is bliss.

Med J Aust 2005; 182 (2): 87-9.15 Rawlins MD. On the evidence for decisions about the use of therapeutic interventions. The

Harvetian Oration. London; 2008.16 Ferreira-Gonzalez I, Busse JW, Heels-Ansdell D, Montori VM, Akl EA, Bryant DM, et al. Problems with use of

composite end points in cardiovascular trials: systematic review of randomised controlled trials. BMJ 2007; 334 (7597): 786.

17 Fergusson D, Aaron SD, Guyatt G, Hebert P. Post-randomisation exclusions: the intention to treat principle and excluding patients from analysis. BMJ 2002; 325 (7365): 652-4.

18 Heritier SR, Gebski VJ, Keech AC. Inclusion of patients in clinical trial analysis: the intention-to-treat principle. Med J Aust 2003; 179 (8): 438-40.

19 Jones B, Jarvis P, Lewis JA, Ebbutt AF. Trials to assess equivalence: the importance of rigorous methods. BMJ 1996; 313 (7048): 36-9.

20 Fletcher J. Subgroup analyses: how to avoid being misled. BMJ 2007; 335 (7610): 96-7.21 Rubio TC. [Statistical design in clinical trials]. Med Clin (Barc ) 1996; 107 (8): 303-9.

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

30

22 Sociedad Española de Farmacología Clínica. ICB. Metodología de la Fase I. 1995; Report N.º 16.23 EMEA. ICH E9 Statistical Principles for Clinical Trials. /CPMP/ICH/363/96 1998.24 Sibbald B, Roberts C. Understanding controlled trials. Crossover trials. BMJ 1998; 316 (7146):

1719.25 Kimmelman J, Weijer C, Meslin EM. Helsinki discords: FDA, ethics, and international drug trials.

Lancet 2009; 373 (9657): 13-4.26 Fleming TR. Design and interpretation of equivalence trials. Am Heart J 2000; 139 (4): S171-

S176.27 Gotzsche PC. Lessons from and cautions about noninferiority and equivalence randomized

trials. JAMA 2006; 295 (10): 1172-4.28 Piaggio G, Elbourne DR, Altman DG, Pocock SJ, Evans SJ. Reporting of noninferiority and equivalence

randomized trials: an extension of the CONSORT statement. JAMA 2006; 295 (10): 1152-60.29 Wiens BL. Choosing an equivalence limit for noninferiority or equivalence studies. Control

Clin Trials 2002; 23 (1): 2-14.30 Delgado SO, Puigventos LF, Pinteno BM, Ventayol BP.v [Therapeutic equivalence: concept and evi-

dence levels]. Med Clin (Barc) 2007; 129 (19): 736-45.

31

[ Índice ]{ Diseño de los ensayos clínicos

en esclerosis múltiple }

1/ Introducción

2/ Finalidad de los ensayos clínicos en esclerosis múltiple

3/ Las variables y su valoración

4/ Medida de la eficacia en las formas progresivas de la esclerosis múltiple

5/ Aspectos éticos del uso de placebo en los ensayos clínicos

BIbliografía

Autores: J. Antonio García-Merino1, Óscar Fernández y Fernández2

Editores: Txomin Arbizu Urdiain3, José M.ª Prieto González4

1 Servicio de Neurología. Unidad de Neuroinmunología. Hospital Universitario Puerta de Hierro Majadahonda (Madrid)

2 Servicio de Neurología. Instituto de Neurociencias Clínicas. Hospital Regional Universitario Carlos Haya. Málaga

3 Servicio de Neurología. Unidad de Esclerosis Múltiple. Hospital Universitari de Bellvitge. L’Hospitalet de Llobregat (Barcelona)

4 Servicio de Neurología. Hospital Clínico Universitario. Santiago de Compostela (A Coruña)

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

32

Resumen

Los ensayos clínicos en EM se han multiplicado en los últimos años. Este capítulo trata de

los ensayos dirigidos a modificar el curso de la enfermedad. Debido a la variabilidad y croni-

cidad de la EM, la demostración de eficacia clínica requiere una duración de unos 2 años. La

duración de los ensayos de fase II, en cambio, suele limitarse a 6 meses.

Las variables principales que se analizan en las formas clínicas de EM con brotes son el

efecto sobre la discapacidad, habitualmente medida con la escala EDSS, que suele comple-

mentarse con otras escalas no validadas, como el MSFC, el efecto sobre las exacerbaciones, y

los cambios en la RM. La discapacidad es la variable más importante. Tanto ella como las

exacerbaciones son variables principales en ensayos de eficacia. La RM figura en estos ensayos

como una variable secundaria, ya que no se acepta como marcador subrogado. La RM, en

cambio, es la variable principal en ensayos de fase II.

El diseño de los ensayos en las formas progresivas puras es sumamente complicado por la

duración requerida, el escaso conocimiento de los mecanismos patogénicos y la escasa informa-

ción aportada por las pruebas paraclínicas.

El uso de placebo es una dificultad importante para el desarrollo de los ensayos clínicos en

EM. Su utilización es éticamente aceptable cuando se siguen las directrices que se comentan

en el texto.

33

[ Diseño de los ensayos clínicos en la EM ]

1/Introducción

La esclerosis múltiple (EM) es una enfermedad crónica con una variabilidad evolutiva consi-derable en sus fases iniciales, de alta complejidad patogénica, en la que se imbrican fenóme-nos de tipo autoinmune que producen áreas de desmielinización inflamatoria, acompañada ocasionalmente de traducción clínica en forma de brotes, junto con fenómenos de destruc-ción tisular en la que se pierden además fibras nerviosas y neuronas. Es bien sabido que los aspectos inflamatorios son los más representativos de los años iniciales de la forma a brotes, y que el aspecto propiamente degenerativo marca las fases tardías, en las que hay menor activi-dad inflamatoria cerebral y se asiste a un deterioro creciente sin exacerbaciones.

En las dos últimas décadas se ha producido un avance muy importante del cono-cimiento de virtualmente todas las facetas de la enfermedad y muy significativamente en áreas que son fundamentales en el diseño de los ensayos, como la neuroimagen, la identificación de fármacos con efectos beneficiosos en la evolución de la enfermedad, la genética y aspectos de la propia patogenia.

Con respecto a los aspectos clínicos, en la EM hay actualmente tres grandes grupos para la intervención terapéutica: la modificación del curso de la enfermedad, el tratamien-to de los brotes y el tratamiento de los síntomas residuales. En un futuro las intervencio-nes terapéuticas es posible que se orienten a mejorar o restaurar los déficit existentes. En este capítulo la discusión se centrará en el diseño de los ensayos destinados a modificar la evolución natural de la enfermedad, que son los ensayos que más han ocupado a los investigadores clínicos a lo largo de los últimos años.

La metodología de los ensayos clínicos ha sido objeto de numerosas publicaciones y extensas revisiones a lo largo de las dos últimas décadas. El lector interesado puede consultarlas en Cohen et al.(1). Existen además directrices de la Agencia Europea de Me-dicamentos (EMEA) para el desarrollo de este tipo de estudios en EM(2).

A la hora del diseño del estudio, es muy importante la definición de la población a estudiar, de los enfermos que se podrían incluir. Esto tiene que ver con las formas prin-cipales de enfermedad que, como es sabido, comprenden la forma recidivante-remitente (EMRR), la más común de las formas de presentación, que incluye un 80-85% de los pacientes. Por su parte, la forma primariamente progresiva (EMPP), relativa a pacientes con inicio progresivo sin brotes puede suponer un porcentaje variable entre las distintas series, en torno a un 10-15% de todas las formas. La forma secundariamente progresiva (EMSP) no es una forma específica de EM, sino una fase evolutiva de la forma a brotes que, tras un periodo variable de evolución, que oscila entre 10 y 15 años, comienza a desarrollar un deterioro mantenido y progresivo que puede cursar todavía con brotes al principio de su evolución. Otra forma evolutiva mucho menos común es la progresiva recidivante (EMPR). Gran interés terapéutico ofrece el denominado síndrome clínico aislado o síndrome desmielinizante aislado (SDA), que designa un único episodio des-mielinizante que no cumple criterios de diseminación como para considerarlo EM.

Con respecto a la evolución de la discapacidad en la EM, hay que distinguir dos formas distintas de progresión: la relacionada con brotes que cursan sin recuperación completa, y la que ocurre sin que el paciente presente brotes.

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

34

En la actualidad, existe la convicción de que los mecanismos que causan los brotes de la enfermedad son distintos de los que determinan la progresión (sin relación con brotes), y que responden de manera muy distinta a las intervenciones medicamentosas, entre otras razones porque la actividad inflamatoria que causa los brotes responde en buena medida, lo cual no es el caso de la progresión. Como los mecanismos inflamatorios relacionados con los brotes parecen ser comunes a las distintas formas clínicas, la EMEA ha agrupado bajo el encabezamiento de EM recidivante (EMR) a las formas clásicas de EMRR, a las formas de EMSP con brotes y al SDA con diseminación temporal en el seguimiento de neuroimagen. Éste es un grupo en el que resulta adecuado valorar la efi-cacia de los medicamentos destinados a modificar la inflamación del sistema nervioso.

En relación con las formas progresivas, los ensayos que pretenden modificar la pro-gresión deben excluir formalmente la existencia de brotes para evitar la interferencia del posible efecto de los brotes en la progresión; se trata idealmente de pacientes con la forma PP o SP sin brotes.

2/Finalidad de los ensayos clínicos en esclerosis múltiple

En la forma EMR, los aspectos más importantes que se pretenden modificar son los brotes de la enfermedad y el acúmulo de la discapacidad. Sin ninguna duda, la meta más importante a alcanzar es la prevención de la discapacidad en una enfermedad con un alto potencial de generarla. La prevención de los brotes es un objetivo claro que ha sido el argumento para la aprobación de los distintos interferones (IFN) y del acetato de glatirá-mero. Respecto a los brotes, hay varios aspectos a considerar, como la tasa anualizada de brotes, la gravedad de los mismos, el tiempo hasta las recaídas y el número de pacientes libres de brotes, entre otros.

La demostración de eficacia frente a los brotes requiere tiempo, particularmente si queremos, además, medir su efecto sobre la progresión de la discapacidad, lo cual va a ser un factor esencial para determinar la duración de los ensayos de eficacia. La prevención de los brotes se ha podido valorar en ensayos a corto plazo, que han demostrado una clara disminución de la frecuencia de los brotes, pero la eficacia a largo plazo es incierta.

Para juzgar fehacientemente la eficacia, son necesarios estudios de al menos 2 años de duración, e idealmente frente a placebo. La conveniencia del uso de placebo en estos ensayos se comenta más abajo en un apartado específico.

En el SDA, la finalidad de los ensayos es la prevención o el retraso en la conver-sión a EM, basándose en la información de la neuroimagen según los criterios de MacDonald o en la aparición del siguiente brote, si bien el aspecto más importante, de nuevo, es el efecto final sobre la discapacidad acumulada hasta el final del estudio. Se han efectuado hasta la fecha diversos ensayos –varios de ellos publicados, y alguno pendiente de finalizar–, con los mismos productos aprobados para el tratamiento de primera línea de la EMRR.

Los pacientes con EMSP sin brotes constituyen una población especial en la que se pretende modificar el acúmulo de discapacidad, y en la que resulta esencial excluir la coe-

35

[ Diseño de los ensayos clínicos en la EM ]

xistencia de actividad inflamatoria, que podría alterar la interpretación de los resultados. Sobre estas premisas, los ensayos sobre EMSP presentan rasgos que los diferencian nota-blemente de los destinados a EMR, fundamentalmente porque un posible efecto sobre la discapacidad puede requerir varios años y porque las variables no clínicas a considerar pueden diferir.

Respecto a los pacientes con EMPP, la finalidad es la misma que en el caso anterior, y el diseño de los estudios puede ser similar. En ambos casos, no existe hasta la fecha tratamiento alguno que haya demostrado una eficacia incontestable sobre la progresión de la discapacidad.

3/Las variables y su valoración

El efecto sobre la discapacidad acumulada es la variable de mayor importancia y signi-ficado clínico. La valoración de la discapacidad requiere la utilización de escalas acepta-das, validadas y reproducibles que permitan una medida objetiva de su evolución en el tiempo. La más utilizada es la EDSS (expanded disability status scale), si bien es una escala imperfecta, con una valoración incorrecta de aspectos fundamentales como la situación cognitiva, el uso de las extremidades superiores o aspectos finos de la función visual; sin embargo, es la que se ha utilizado en todos los estudios previos y la que permite hacer algunas comparaciones entre estudios. La escala funcional compuesta (MSFC, del inglés multiple sclerosis functional composite) solventa algunos de los problemas de la EDSS, pero no está validada y no puede sustituir a la anterior. En cualquier caso, es importante que se reduzca al mínimo la variabilidad intra e interobservador, con un entrenamiento suficiente del médico explorador, y que sea la misma persona quien examina y valora a los pacientes. Asimismo, sería ideal que las visitas se produjeran en horas similares.

La progresión de discapacidad se debe definir claramente en el protocolo, y es habitual considerar que se ha producido progresión cuando se asiste a un aumento de la puntua-ción en la EDSS de al menos 1 punto, confirmado en 2 visitas espaciadas en, al menos, 6 meses. En la mayoría de los estudios, este aumento es válido para pacientes con EDSS basales ≤ 5,5 puntos, pero si la puntuación del enfermo es > 5,5 un incremento de 0,5 puntos en el mismo periodo de tiempo se considera significativo. La inclusión de la EDSS es un aspecto obligatorio en los ensayos de eficacia, pero otras escalas, como la menciona-da MSFC, pueden completar la información sobre la evolución de la discapacidad.

Las exacerbaciones son otro aspecto fundamental en la EMR, aspecto que debe ser definido claramente en el protocolo para evitar confusiones con los pseudobrotes o em-peoramientos secundarios a infecciones, fiebre, etc. En este capítulo cuenta la modifi-cación de la tasa anualizada de brotes, la gravedad, la proporción de pacientes libres de brotes y el tiempo hasta el siguiente brote. Dado que los brotes son un aspecto común en la evolución de la EMR, en los ensayos también debe estar prevista y definida la pauta de actuación para el caso de que aparezcan.

La información de la resonancia magnética (RM) se ha convertido en una variable esencial de los ensayos en EM en los estudios realizados desde hace casi dos décadas. La

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

36

información aportada por esta técnica ha sido importantísima y muestra aspectos rela-tivos a la evolución de la enfermedad relacionados con su patogenia. Sin embargo, en el momento actual sigue sin ser considerada un marcador subrogado de la enfermedad. Tradicionalmente se han medido la carga lesional total en T2, el número de lesiones nue-vas o crecientes en T2, las lesiones captadoras de gadolinio, las lesiones hipointensas en T1 y aspectos de atrofia cerebral. No obstante, hay otras técnicas disponibles que pueden valorar la afectación cortical o cambios menos evidentes como es el caso de la transferen-cia de magnetización, o la espectroscopia. Algunas de estas técnicas pueden tener mayor importancia o aplicarse de modo distinto en ensayos destinados a la prevención de la progresión. En los ensayos es esencial que los pacientes sean examinados con el mismo protocolo de RM y que la lectura sea ciega y centralizada.

Una mayoría de estudios de fase II se han basado en variables de la RM, repetida varias veces a lo largo de un tiempo limitado, generalmente en torno a 6 meses. Se trata de estudios de productos con propiedades inmunoactivas cuya actividad se espera poder demostrar en la neuroimagen y que a menudo incluyen la búsqueda de la dosis idónea de cara a la demostración ulterior de eficacia en la fase III.

4/Medida de la eficacia en las formas progresivas de la esclerosis múltiple

Aunque debemos decir desde el principio que no existe ninguna medida validada para medir la eficacia de los tratamientos en las formas progresivas de la EM, sí existen inten-tos para alcanzar esta meta. Probablemente éste sea uno de los aspectos más importantes a conseguir en los próximos años, puesto que cerca del 50% de los pacientes de EM se encuentran en una fase progresiva, si sumamos los que han pasado de la forma EMRR a EMSP y las otras formas progresivas (EMPR y EMPP)(3).

La cuantificación de los brotes clínicos en las formas EMSP y EMPR es, en general, poco útil, ya que en estas formas la tasa anual de brotes es muy reducida y menor a medi-da que pasa el tiempo. A pesar de ello, se ha utilizado dicha cuantificación para conseguir la aprobación del tratamiento con IFN β-1b(4) e IFN β-1a(5) en las formas tempranas, con brotes, de EMSP.

La medición de la discapacidad mediante escalas clínicas (EDSS y MSFC) es, como se comentó previamente, probablemente la más adecuada, pero requiere de estudios muy prolongados en el tiempo, que son poco factibles, en parte también porque los fármacos disponibles o que se han ensayado no van dirigidos a los mecanismos subya-centes a la progresión sostenida. Estos mecanismos, por lo demás, son casi totalmen-te desconocidos (excitotoxicidad mediada por glutamato y toxicidad oxidativa, entre otros), motivo por el cual la selección de fármacos no se hace con bases patogénicas suficientes.

Los estudios del líquido cefalorraquídeo son útiles para el diagnóstico e incluso para el pronóstico del curso evolutivo de la enfermedad(6), pero no existen evidencias que ava-len su utilización para evaluar la eficacia de los diferentes tratamientos.

37

[ Diseño de los ensayos clínicos en la EM ]

La RM, en cambio, parece ofrecer posibilidades reales de evaluar el efecto de las dis-tintas terapias, al conocerse la evolución en RM de distintos aspectos de la enfermedad (ritmo de progresión de la atrofia cerebral, grado de progresión de la desmielinización cortical y evolución de las medidas de transferencia de magnetización y de espectroscopia por RM). En cualquier caso, estas medidas no están validadas, aunque se están utilizando en numerosos estudios para intentar obtener esta validación(7-11).

Los potenciales evocados son una promesa. Se utilizan todos (los visuales, auditivos, somatosensitivos, motores y cognitivos P-300), pero ofrecen un interés particular los potenciales evocados motores y la medición de la P-300, en las formas progresivas, por cuanto serían capaces de evaluar el grado de disfunción axonal y la disfunción cogniti-va, respectivamente. Sin embargo, aunque es posible utilizarlos en los ensayos clínicos terapéuticos, su interpretación es dudosa, al no estar suficientemente validados como marcadores subrogados(12,13).

Por último, es posible que una técnica relativamente nueva, la tomografía óptica de coherencia (TOC), que mide el grosor de la capa de las fibras (axones) de la retina, nos permita medir de forma objetiva el grado de progresión de la pérdida axonal y que éste se correlacione con la progresión de la discapacidad pero, al igual que sucedía con las técnicas anteriores, su uso está pendiente de validación(14,15).

5/Aspectos éticos del uso de placebo en los ensayos clínicos

Las cuestiones éticas han sido siempre uno de los aspectos de los ensayos clínicos que más debate han originado a lo largo del tiempo y que han dado lugar al establecimiento de códi-gos éticos específicos, el más importante de los cuales es la Declaración de Helsinki, elabo-rada por la Asociación Médica Mundial en 1964 y revisada periódicamente(16). En general, el uso de placebo en los ensayos ha sido objeto de fuerte controversia. En la revisión de la Declaración de Helsinki de 2000, se insistía en la necesidad de comparar cualquier método profiláctico, diagnóstico o terapéutico con el mejor método disponible, y que se permitiera el uso de placebo solamente cuando no existiese un método de eficacia demostrada. Este principio podría excluir, de hecho, el uso de placebo en la EM desde la disponibilidad de los IFN, pero una nota aclaratoria del artículo 29 de la Declaración añadida 2 años después matizaba que el uso de placebo estaba justificado cuando existían razones de peso con fun-damento científico para determinar la eficacia de un nuevo método, o cuando la exposición a placebo no entrañaba riesgo grave o irreversible. La redacción final de este punto aparece en el artículo 32 de la versión de 2008, actualmente en vigor(17,18).

La existencia de medicación aprobada para la EM con una eficacia limitada en sólo algunos aspectos de la enfermedad hace particularmente complicado el recurrir a placebo en los ensayos clínicos. Este aspecto ha sido objeto de varias revisiones a cargo de grupos de expertos, previamente publicadas(19-21).

No abordaremos la discusión general del uso de placebo en los ensayos(22), si bien recordaremos que este tipo de ensayos son los únicos que permiten demostrar de ma-nera concluyente la utilidad terapéutica de un producto y medir la magnitud del efecto

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

38

tanto en eficacia como en seguridad. Otros aspectos a favor del uso de placebo serían precisamente la limitada eficacia de los tratamientos contra los brotes, lo incierto de su efecto sobre la discapacidad a largo plazo en las formas recurrentes y el hecho de que son medicamentos de uso crónico no desprovistos de efectos secundarios. Además, hay una urgente necesidad de seguir avanzando en la investigación de nuevos productos que pue-dan abordar áreas de la enfermedad que hoy son inaccesibles a la terapéutica.

Para soslayar las dificultades éticas que el uso del placebo plantea en los ensayos clíni-cos de EM se han planteado diversas posibilidades que se resumen en lo siguiente:

• No disponibilidad de tratamiento alternativo, sea porque no existe, porque el enfer-mo lo rechaza, porque ha resultado ineficaz, o porque no está disponible.

• Limitación de la duración de los estudios.• Diseños alternativos.Con respecto a la no disponibilidad de tratamiento alternativo, resulta evidente que,

en las formas progresivas puras, secundarias o primarias, no se plantean objeciones signi-ficativas al uso del placebo.

El grupo de pacientes que rechazan el tratamiento disponible no es pequeño y di-chos pacientes son candidatos razonables para este tipo de estudios. Para no incurrir en dificultades éticas, las terapias disponibles deben ofrecerse en primer lugar y se debe pro-porcionar una información completa, detallada, objetiva y comprensible de las distintas opciones de tratamiento que permita un consentimiento voluntario sobre bases claras. Es muy importante que el investigador evite sesgos a la hora de informar al paciente. Ha de continuar ofreciéndose información a lo largo del estudio, particularmente la relativa a las opciones de nuevas terapias que puedan surgir en el curso del estudio o de las terapias alternativas que se puedan recibir en caso necesario.

Los pacientes que ya han probado sin éxito, por ineficacia o intolerancia, alguna de las medicaciones indicadas para su enfermedad constituyen otro grupo en el que pueden plantearse estos estudios. Hay que distinguir claramente al respecto si el fracaso de los trata-mientos de primera elección convierte o no a estos pacientes en candidatos a terapias de se-gunda elección. De nuevo, es esencial informar a los pacientes e individualizar cada caso.

Por último, en este capítulo de no disponibilidad entran los pacientes que, por razo-nes fundamentalmente económicas, no tienen posibilidad de recibir tratamiento(23). Esta opción es harto delicada, ya que, como consecuencia, y en último término, podrían ter-minar asumiendo los riesgos del estudio los pacientes más desfavorecidos. Para evitarlo, los ensayos deben tener las mismas restricciones al uso de placebo que en los países donde la medicación está disponible y, además, han de garantizar la posibilidad de continuar con los tratamientos que hayan demostrado eficacia y seguridad al acabar el estudio.

Limitar la duración del estudio con placebo es otra alternativa, que actualmente se emplea para la demostración del efecto de fármacos nuevos en estudios de fase II funda-mentalmente basados en aspectos de RM y cuya duración suele rondar los 6 meses. Si bien no se eliminan las dificultades, para muchos expertos esta duración limitada minimiza los riesgos teóricos de no utilizar tratamiento en una enfermedad de tan larga evolución como la EM. Sin embargo, esta estrategia puede no resultar aplicable para productos cuyo meca-nismo de acción no implique modificaciones apreciables a corto plazo en la RM.

Los diseños de ensayo clínico alternativos al uso de placebo son de diverso tipo(24) y se plantean sobre todo en estudios de eficacia que requieren una duración mayor

39

[ Diseño de los ensayos clínicos en la EM ]

que los clásicos de fase II diseñados para demostrar el efecto biológico de un fármaco. Puede tratarse de estudios de no inferioridad, de igualdad o de superioridad frente a un comparador activo, o de estudios add-on en los que el fármaco en cuestión se añade en uno de los brazos a la medicación aprobada; puede asimismo tratarse de estudios en los que el placebo se administra en proporciones menores de 1:1, o de di-seños cruzados con exposición secuencial. Cada uno de ellos plantea ventajas e incon-venientes, y no serán objeto de análisis en este capítulo. Es importante señalar que la demostración de eficacia en un ensayo para EM requiere una duración mínima, como se comentó más arriba, y que no es posible recurrir a marcadores subrogados, ya que ninguno está validado en el momento actual. Ha habido un esfuerzo importante por parte de instituciones como el Silvia Lawry Centre para intentar conseguir un modelo de placebo virtual, a partir de la información histórica de los brazos de placebo de los ensayos más importantes, que pudiese evitar el uso de placebo real en los ensayos futuros(25), pero dicho modelo no ha sido aceptado por las agencias reguladoras, de-bido, entre otras razones, a la variabilidad de comportamiento de dichos placebos en los distintos ensayos.

En resumen, el diseño de los ensayos clínicos en EM ha de ser siempre riguroso y de la más alta calidad posible para obtener una información útil, científicamente válida. La utilización de placebo, cada vez más difícil, sigue siendo éticamente aceptable en deter-minadas circunstancias y diseños. Una pieza esencial en cuanto a la ética y especialmente importante cuando se utiliza placebo es la información a los pacientes.

BIbliografía

1 Cohen JR, Rudick RA (eds.). Multiple Sclerosis Therapeutics. 2.ª ed. Londres: Martin Dunitz, Ltd.; 2003. p. 1-754.

2 Guideline on clinical investigation of medicinal products for the treatment of multiple scle-rosis. http://www.ema.europa.eu/pdfs/human/ewp/56198en.pdf

3 Fernández O, Fernández V, Guerrero M (eds.). Clínica. Esclerosis múltiple. 2.ª ed. Madrid: McGraw-Hill/Interamericana; 2005. p. 43.

4 Placebo-controlled multicentre randomised trial of interferon beta-1b in treatment of sec-ondary progressive multiple sclerosis. European Study Group on interferon beta-1b in sec-ondary progressive MS. Lancet 1998; 352 (9139): 1491-7.

5 Secondary Progressive Efficacy Clinical Trial of Recombinant Interferon-Beta-1a in MS (SPECTRIMS) Study Group. Randomized controlled trial of interferon- beta-1a in secondary progressive MS: Clinical results. Neurology 2001; 56 (11): 1496-504.

6 Thangarajh M, Gomez-Rial J, Hedström AK, Hillert J, Alvarez-Cermeño JC, Masterman T, Villar LM. Lipid-spe-cific immunoglobulin M in CSF predicts adverse long-term outcome in multiple sclerosis. Mult Scler 2008; 14 (9): 1208-13.

7 Filippi M, Falini A, Arnold DL, Fazekas F, Gonen O, Simon JH, et al. Magnetic resonance techniques for the in vivo assessment of multiple sclerosis pathology: consensus report of the white mat-ter study group. J Magn Reson Imaging 2005; 21 (6): 669-75.

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

40

8 Gonen O, Catalaa I, Babb JS, Ge Y, Mannon LJ, Kolson DL, Grossman RI. Total brain N-acetylaspartate: a new measure of disease load in MS. Neurology 2000; 54 (1): 15-9.

9 Horsfield MA, Barker GJ, Barkhof F, Miller DH, Thompson AJ, Filippi M. Guidelines for using quantitative magnetization transfer magnetic resonance imaging for monitoring treatment of multiple sclerosis. J Magn Reson Imaging 2003; 17 (4): 389-97.

10 van den Elskamp IJ, Boden B, Dattola V, Knol DL, Filippi M, Kappos L, et al. Cerebral atrophy as outcome measure in short-term phase 2 clinical trials in multiple sclerosis. Neuroradiology 2010 Jan 5. [Epub ahead of print]

11 Barkhof F, Calabresi PA, Miller DH, Reingold SC. Imaging outcomes for neuroprotection and repair in multiple sclerosis trials. Nat Rev Neurol 2009; 5 (5): 256-66.

12 Leocani L, Rovaris M, Boneschi FM, Medaglini S, Rossi P, Martinelli V, et al. Multimodal evoked potentials to assess the evolution of multiple sclerosis: a longitudinal study. J Neurol Neurosurg Psy-chiatry 2006; 77 (9): 1030-5.

13 Leocani L, Comi G. Neurophysiological markers. Neurol Sci 2008; 29 Suppl 2: S218-21.14 Henderson AP, Trip SA, Schlottmann PG, Altmann DR, Garway-Heath DF, Plant GT, Miller DH. An investigation

of the retinal nerve fibre layer in progressive multiple sclerosis using optical coherence tomography. Brain 2008; 131 (Pt 1): 277-87.

15 Toledo J, Sepulcre J, Salinas-Alaman A, García-Layana A, Murie-Fernandez M, Bejarano B, Villoslada P. Retinal nerve fiber layer atrophy is associated with physical and cognitive disability in multiple sclerosis. Mult Scler 2008; 14 (7): 906-12.

16 World Medical Association Declaration of Helsinki. Ethical principles for medical research involving human subjects. Proceedings of the 52nd WMA General Assembly. Edinburgh 2.

17 World Medical Association Declaration of Helsinki. 2008 http://www.wma.net/en/30publications/10policies/b3/index.html

18 Lewis JA, Jonsson B, Kreutz G, Sampaio C, van Zwieten-Boot B. Placebo-controlled trials and the Decla-ration of Helsinki. Lancet 2002; 359 (9314): 1337-40.

19 Lublin FD, Reingold SC. Placebo-controlled clinical trials in multiple sclerosis: ethical consider-ations. National Multiple Sclerosis Society (USA) Task Force on Placebo-Controlled Clinical Trials in MS. Ann Neurol 2001; 49 (5): 677-81.

20 McFarland HF, Reingold SC. The future of multiple sclerosis therapies: redesigning multiple scle-rosis clinical trials in a new therapeutic era. Mult Scler 2005; 11 (6): 669-76.

21 Polman CH, Reingold SC, Barkhof F, Calabresi PA, Clanet M, Cohen JA, et al. Ethics of placebo-controlled clinical trials in multiple sclerosis: a reassessment. Neurology 2008; 70 (13 Pt 2): 1134-40.

22 Emanuel EJ, Wendler D, Grady C. What makes clinical research ethical? JAMA 2000; 283 (20): 2701-11.

23 Shapiro HT, Meslin EM. Ethical issues in the design and conduct of clinical trials in developing countries. N Engl J Med 2001; 345 (2): 139-42.

24 Temple R, Ellenberg SS. Placebo-controlled trials and active-control trials in the evaluation of new treatments. Part 1: ethical and scientific issues. Ann Intern Med 2000; 133 (6): 455-63.

25 Silvia Lawry Centre for Multiple Sclerosis Research http://www.slcmsr.net

41

[ Índice ]{ Interpretación y evolución

de los ensayos clínicos }

1/ Interpretación de los ensayos clínicos: relevancia y aplicabilidad clínica

2/ Interpretación

3/ Aplicabilidad clínica

4/ Evolución, dificultades y retos futuros de los ensayos clínicos en esclerosis múltiple

BIbliografía

Autores: Carlos Nos1, Marta Sallén1

Editores: Bonaventura Casanova2, Xavier Montalbán Gairin3

1 Unitat de Neuroimmunologia Clínica. Centre d’Esclerosi Múltiple de Catalunya. Hospital Universitari Vall d’Hebron. Barcelona

2 Unidad de Esclerosis Múltiple. Servicio de Neurología. Hospital Universitario La Fe. Valencia

3 Unidad de Neuroinmunología. Hospital Universitari Vall d’Hebron. Barcelona

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

42

Resumen

La finalidad de un ensayo clínico es aportar información acerca de una intervención tera-

péutica que permita mejorar la práctica clínica, y la cualidad que determina si los resultados

de un ensayo clínico tendrán la capacidad de modificar la práctica clínica es su relevancia

clínica. La interpretación de los resultados de un ensayo clínico es el proceso que determina

su relevancia y pivota alrededor del grado de cumplimiento de los objetivos del estudio. Tras

evaluar la calidad del diseño y el desarrollo del ensayo clínico en relación con todos los facto-

res que pudieran introducir sesgos, los resultados serán considerados positivos, negativos o no

concluyentes.

En las últimas décadas, los resultados de ensayos clínicos con asignación aleatoria y con-

trolados con placebo han cambiado de forma drástica la práctica clínica en la EMRR. La

generalización del uso de los tratamientos ha tenido repercusiones tanto éticas como prácticas

para el desarrollo de nuevos ensayos clínicos. Los principales retos que afrontamos de cara al

futuro son, por un lado, aumentar la eficiencia –reduciendo el número de pacientes expuestos

al placebo y disminuyendo la duración de la exposición– de los ensayos clínicos en la EMRR y,

por otro, diseñar ensayos clínicos capaces de evaluar la seguridad y eficacia de los tratamientos

dirigidos a frenar la progresión de la enfermedad o de revertir la pérdida de mielina y axones

ya establecida.

43

[ Interpretación y evolución de los ensayos clínicos ]

1/Interpretación de los ensayos clínicos: relevancia y aplicabilidad clínica

La capacidad de un médico para juzgar las pruebas que aportan los ensayos clínicos sobre un nuevo tratamiento es un elemento fundamental a la hora de sopesar su valor frente al de los tratamientos disponibles y decidir si debe modificar su práctica clínica(1).

Relevancia clínica

La relevancia, importancia o significación clínica es la cualidad de un ensayo clínico que determina, más que cualquier otra, si sus resultados tendrán la capacidad de convencer a los médicos para cambiar su práctica clínica habitual. La relevancia clínica se valora principalmente, desde una perspectiva médica, por el tamaño del efecto obtenido, la ca-lidad del diseño y del desarrollo del ensayo clínico, y la probabilidad de que dicho efecto sea verdadero. La relevancia clínica también puede definirse desde el punto de vista del paciente teniendo en cuenta si los resultados pueden contribuir a su mejoría, a mantener su enfermedad en remisión o a incrementar su calidad de vida.

2/Interpretación

En el transcurso de un ensayo clínico, los datos contemplados en las evaluaciones previs-tas por el protocolo están en condiciones de ser analizados una vez han sido obtenidos y editados, se ha verificado que son correctos y están completos, recuperando en la medida de lo posible los que puedan faltar, y, tras ser trasladados al soporte adecuado, han sido sometidos a un nuevo control de calidad. El análisis aborda la evaluación de los datos de un ensayo clínico desde una perspectiva estadística y establece si las diferencias observa-das entre los grupos han alcanzado un determinado nivel de significación estadística. El análisis es, por tanto, un aspecto clave en los ensayos clínicos, y es preciso seleccionar los test estadísticos adecuados y utilizarlos correctamente.

El análisis, sin embargo, no permite alcanzar conclusiones firmes por sí solo, sino que se requiere además una valoración clínica de sus resultados que discrimine entre aque-llos que tienen importancia para los pacientes y los que carecen de ella. El proceso que determina la relevancia clínica de los datos de un ensayo clínico es su interpretación. La interpretación adecuada de los datos de un ensayo clínico requiere un alto grado de juicio clínico y, por tanto, un conocimiento profundo de la enfermedad en estudio, y deben llevarla a cabo, siempre que sea posible, profesionales sin intereses personales en los re-sultados. También se precisa un amplio conocimiento de los aspectos fundamentales del ensayo, como son sus objetivos, diseño, medidas de resultados y su desarrollo.

La base de la interpretación de los resultados de un ensayo clínico es su evaluación en relación con los objetivos del estudio. Sólo al completar esta etapa se tendrán en

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

44

consideración otras que permitan, no ya establecer conclusiones, sino formular nuevas hipótesis.

En primer lugar, es conveniente iniciar la interpretación con una lectura del informe estadístico que permita alcanzar una visión global de los resultados, antes de abordar cada uno de los procedimientos específicos. Es muy importante identificar el criterio que se va a utilizar en la interpretación de los datos de un ensayo clínico e, idealmente, haberlo establecido a priori y haberlo contemplado durante su diseño. El criterio más sólido es aquel que identifica el tamaño que debe alcanzar el efecto en la variable principal para demostrar de forma convincente que la intervención terapéutica evaluada ha de ser in-corporada a la práctica clínica. Los resultados de un ensayo clínico pueden, a grandes rasgos, interpretarse como positivos, negativos o no concluyentes. La conclusión, en los dos primeros casos, será tanto más firme cuanto mayor sea la probabilidad de excluir que los resultados sean falsamente positivos o negativos, algo que guarda una estrecha relación con la existencia de una definición precisa del efecto del tratamiento que será considerado significativo desde la perspectiva clínica.

Previamente conviene haber evaluado las características del diseño del ensayo clíni-co, y sus posibles limitaciones deben ser tenidas en cuenta en todo momento durante el proceso. Es muy importante conocer la precisión de la medida principal de resultados y, con ello, la probabilidad de enfrentarse a datos falsamente positivos o negativos. El desarrollo del ensayo clínico puede valorarse a través del grado de cumplimiento del protocolo, de los datos perdidos, de la proporción de pacientes incluidos en relación con los previstos inicialmente, del tiempo transcurrido hasta completar el reclutamien-to, y del número de pacientes que dejan de acudir a las visitas de seguimiento, que son retirados del ensayo o que dejan de recibir el tratamiento, y los motivos para ello. La calidad de los datos obtenidos es un factor determinante en la interpretación; por ello, debe determinarse la consistencia de los resultados obtenidos por distintos evaluadores y en distintos centros.

Pacientes

A continuación, es necesario confirmar que los grupos sean similares en cuanto a sus características demográficas y clínicas al inicio del ensayo clínico. Las diferencias menores en características demográficas no suponen necesariamente un gran inconveniente a la hora de interpretar los datos de un ensayo clínico; sin embargo, es imprescindible que los grupos sean similares en todas aquellas características clínicas relevantes que puedan de-terminar el pronóstico o la respuesta al tratamiento; de lo contrario, peligra la validez de la interpretación. Esta premisa debe haberse tenido en cuenta durante el diseño del en-sayo clínico, y la asignación aleatoria debe realizarse estratificando a los pacientes según dichas características, minimizando así la posibilidad de que éstas queden desequilibradas entre los grupos.

La descripción de la muestra debe, idealmente, incluir tanto a los participantes en el estudio como a los pacientes que fueron evaluados pero finalmente no fueron incluidos. La comparación de las características de ambos grupos, y a ser posible de su situación final en relación con la medida principal de resultados, aunque no es esencial

45

[ Interpretación y evolución de los ensayos clínicos ]

para evaluar los objetivos del estudio, permite alcanzar conclusiones más firmes con la extrapolación y da información muy valiosa acerca de la validez externa del ensayo clínico(2). Especial atención debe prestarse al grupo de pacientes que, habiéndoles sido asignado tratamiento, no completaron el estudio por distintos motivos –bien conoci-dos o, como en aquellos casos en los que no se dispone de datos del seguimiento, des-conocidos–, pues sus características pueden diferir de las del grupo de pacientes del que se dispone de datos completos. El análisis por intención de tratar minimiza el riesgo de que la exclusión de estos pacientes –caso de no estar distribuidos de forma homogénea entre los grupos de tratamiento– conduzca a conclusiones erróneas. Es conveniente dar incluso un paso más y llevar a cabo un análisis de sensibilidad que simule el peor esce-nario, al asumir que todos los pacientes de los que se carece de datos de seguimiento han experimentado un deterioro clínico, pues con ello se evita alcanzar conclusiones equivocadas en el caso de que la proporción de pacientes que abandonaron el segui-miento sea elevada y los motivos para ello estén relacionados con dicho deterioro.

Diseño

La validez de la interpretación también está fuertemente relacionada con la calidad del diseño del ensayo clínico y su posterior desarrollo. El diseño debe contemplar las posi-bles fuentes de variabilidad en la respuesta clínica, más allá del efecto de la intervención en estudio, en un intento de minimizar los factores que puedan introducir sesgos en la interpretación de los resultados.

En primer lugar, intentar interpretar la eficacia de una intervención terapéutica en un ensayo clínico que carece de controles lleva habitualmente a alcanzar conclu-siones erróneas. Esta premisa fue formulada por Muench como su segunda ley: “omi-tiendo los controles siempre se pueden mejorar los resultados”(3). Este hecho resulta patente con el fenómeno de regresión a la media, que previene a la hora de atribuir a la intervención terapéutica un aparente beneficio que en realidad es consecuencia exclusivamente de la historia natural de la enfermedad. El fenómeno de regresión a la media refleja la especial predisposición a participar en los ensayos clínicos, con la intención de encontrar solución a unos problemas no resueltos en la práctica clínica, de aquellas personas cuya enfermedad se ha agravado recientemente. En la esclerosis múltiple (EM) se traduce en una representación exagerada de pacientes con brotes frecuentes en el periodo anterior a su inclusión en el ensayo clínico. La existencia de un cierto efecto techo en este parámetro incrementa la probabilidad de que los cambios observados durante el ensayo clínico tiendan espontáneamente a la mejoría. La reducción de la tasa de brotes que se produce a lo largo del curso de la enfermedad puede incluso llegar a exagerar este fenómeno.

Es crucial que en aquellas variables en cuya evaluación interviene cierto grado de subjetividad los datos hayan sido obtenidos desconociendo la intervención asignada para evitar sesgos. En la EM, su impacto puede llevar a cambiar la interpretación de los resultados de un ensayo clínico, considerándolos erróneamente positivos de no cumplirse dicha condición(4). Este problema tiende a solventarse introduciendo la figura del evaluador cegado, que no participa en ningún aspecto de la atención

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

46

medica del paciente que podría hacerle sospechar a qué grupo de tratamiento ha sido asignado, y cuya función en el ensayo clínico es obtener las puntuaciones en las es-calas utilizadas para medir resultados. Su participación disminuye también el riesgo de una evaluación sesgada de variables con un mayor componente de subjetividad, como es el caso de los brotes; para ello se modifica la definición tradicional del brote requiriendo, además de la interpretación de los síntomas por parte del investigador, la demostración objetiva de cambios en una exploración realizada por el evaluador. La evaluación cegada tiene especial importancia en los ensayos clínicos en que los resultados se miden basándose en la opinión del paciente, como suele ocurrir en la evaluación de tratamientos sintomáticos. En estos casos, es aconsejable disponer de datos acerca del éxito del enmascaramiento para llevar a cabo la interpretación, pues la identificación correcta del tratamiento activo por parte del paciente puede influir positivamente en su percepción de los síntomas por un efecto placebo. Sin embargo, al preguntar a los pacientes qué tratamiento recibieron durante el ensayo clínico, las respuestas obtenidas están en gran medida influidas por el beneficio percibido o los acontecimientos adversos experimentados, de modo que los resultados relativos a la evaluación del cegamiento no pueden disociarse de los de eficacia o del perfil de efectos secundarios del tratamiento(5,6).

Objetivo

Los resultados de un ensayo clínico deben valorarse, en primer lugar, por su capa-cidad para responder a la pregunta principal, según permitan aceptar o rechazar la hipótesis; así, la clave para interpretar los datos de un ensayo clínico es comprobar si los resultados obtenidos se ajustan a los objetivos planteados. Cuanto más precisa haya sido la definición del objetivo principal, más firme será la conclusión alcanzada. Si los resultados obtenidos en relación con los objetivos secundarios son consistentes con los del objetivo principal, dicha conclusión se verá aún más reforzada. Por el contrario, si el objetivo ha sido definido de forma imprecisa o demasiado genéri-ca, sin especificar claramente cuál será la medida principal de resultados, los datos pueden fácilmente dar lugar a distintas interpretaciones que alcancen conclusiones opuestas. La interpretación desde una perspectiva alejada de los objetivos del ensayo clínico sólo debe abordarse en una etapa posterior, con el propósito de formular hipótesis que puedan ser evaluadas en estudios futuros.

La interpretación debe ser tan clara y categórica como sea posible, siendo conveniente valorar detenidamente todas sus posibles debilidades. Incluso en caso de que el ensayo clínico tenga un objetivo principal claramente definido y evaluable, puede contemplar-se el uso de una medida de resultados compuesta; en ese caso, es aconsejable evaluar individualmente cada uno de los componentes de la medida para determinar si todos contribuyen al efecto de forma similar, si éste tan sólo depende en gran medida de alguno de ellos o, incluso, si los resultados obtenidos en componentes con menor peso van en sentido contrario al resultado global. La interpretación de los datos de los componentes individuales nos indica en qué medida pueden éstos afectar, reforzándola o restándole firmeza, a la conclusión global.

47

[ Interpretación y evolución de los ensayos clínicos ]

Beneficio y riesgo

La interpretación aborda habitualmente la eficacia y seguridad, y se expresa en térmi-nos de beneficio y riesgo. En este contexto, la valoración clínica debe establecer si una intervención ofrece un balance entre beneficio y riesgo más favorable que el de otros tratamientos utilizados para la misma indicación justificando su uso.

Eficacia

En los ensayos clínicos en fase III realizados hasta la fecha en EM, la eficacia de los tra-tamientos se ha evaluado de forma casi constante a través de su capacidad para reducir la frecuencia de los brotes o el incremento de la discapacidad. El debate acerca de las ventajas e inconvenientes de ambas variables y de las escalas utilizadas para cuantificar la discapacidad ha sido y sigue siendo intenso.

Si bien está ampliamente aceptado que el acúmulo de discapacidad irreversible es el parámetro que posee mayor relevancia clínica, en las primeras etapas de la enfermedad se produce raramente, siendo la aparición de brotes el fenómeno clínico más frecuente. La primera ventaja del uso de la tasa de brotes como medida principal de resultados es que permite utilizar una estadística paramétrica. Como inconvenientes destacan la he-terogeneidad de los brotes, en cuanto a intensidad máxima y secuela, y el hecho de que dichos brotes vayan haciéndose menos frecuentes con el tiempo. El debate acerca de la importancia clínica que posee el que se reduzca la frecuencia de los brotes ha girado, por tanto, en torno a su validez predictiva principalmente y se ha visto alimentado por la limitación que supone la corta duración de los ensayos clínicos en relación con el tiempo que transcurre hasta que se alcanzan niveles significativos de discapacidad en la EM. En este sentido, algunos estudios de cohortes han aportado resultados contradictorios acerca del valor pronóstico de la actividad inflamatoria temprana en la EM. Así, algunos estu-dios, aunque no todos, han mostrado una débil asociación negativa entre una primera remisión corta o una elevada frecuencia de brotes en los 2 primeros años de la enferme-dad, y la aparición futura de discapacidad.

La expanded disability status scale (EDSS)(7) y previamente su antecesora la disabi-lity status scale (DSS) han sido el método tradicional para medir la discapacidad en las últimas décadas. Al interpretar los datos obtenidos mediante la EDSS, debe tenerse en cuenta que es una escala ordinal y no permite analizar los cambios que se producen en ambos grupos comparando sus medias mediante pruebas estadísticas paramétricas. En su lugar, se debe establecer un criterio de fracaso del tratamiento o respuesta inadecuada para llevar a cabo el análisis. Al definir este criterio, conviene tener en cuenta que la escala se usa en los ensayos clínicos con el propósito de medir la discapacidad irreversible, sien-do conveniente contemplar todos los factores que puedan restarle validez en este sentido al definir el criterio. El criterio con mejor validez tanto concurrente como predictiva(8) requiere que el incremento de uno o dos peldaños en la escala, dependiendo de cuál sea el punto de partida, sea confirmado en dos nuevas evaluaciones, cada una de ellas separada 3 meses de la anterior, con el objeto de minimizar el sesgo que puedan introducir en la medida tanto la variabilidad intraobservador e interobservador como la remisión tardía después de algunos brotes.

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

48

Las limitaciones de la EDSS, especialmente su escasa sensibilidad para detectar cam-bios durante el lapso de los ensayos clínicos, han motivado diversas iniciativas en la bús-queda de medidas alternativas que ofrezcan mejores propiedades psicométricas. Una de ellas condujo a la propuesta de la escala multiple sclerosis functional composite (MSFC)(9), que posee la ventaja de ser una escala continua y, por tratarse de una medida cuantitativa de la función neurológica, es más objetiva y reproducible. Sin embargo, es difícil de in-terpretar por el hecho de que desde la perspectiva clínica no resulta obvia la relación entre la puntuación obtenida y la situación del paciente. En este sentido, las opiniones globales se encuentran en el polo opuesto del espectro. Estas medidas, si bien presentan la ventaja de facilitar la interpretación de la relevancia clínica de los datos, tienen el inconveniente de que la sensibilidad para detectar cambios se ve limitada a aquellos que tienen una repercusión funcional evidente(10).

Seguridad

La interpretación de los datos de seguridad de un ensayo clínico es un proceso complejo que implica valorar individualmente la importancia clínica y la causalidad de los acon-tecimientos adversos y resultados anómalos de laboratorio. La evaluación clínica corres-ponde al investigador, por ser quien está en contacto directo con el paciente, o indirecto a través de un miembro de su equipo, y quien tiene por tanto la información necesaria para juzgar la relevancia clínica en última instancia; aunque también pueden participar aplicando diferentes criterios el promotor, el comité ético y las autoridades sanitarias.

La valoración de la relevancia clínica de un acontecimiento adverso aborda, en primer lugar, la determinación de su incidencia –su frecuencia en función de la duración del tra-tamiento–, pues nos ofrece información acerca de la probabilidad de que aparezca dicho acontecimiento adverso en un determinado paciente. A continuación, se deben evaluar las consecuencias que puede tener el acontecimiento adverso, en caso de que aparezca, para un paciente concreto. Este riesgo clínico guarda relación con la probabilidad de que el acontecimiento adverso sea grave, empeore a lo largo del tiempo, su duración se prolongue más allá de la retirada del tratamiento o reaparezca tras introducirlo de nuevo. Asimismo, es aconsejable contemplar la posibilidad de que aparezca tras la retirada del tratamiento o de que su intensidad se reduzca debido al desarrollo de tolerancia. El pro-ceso sigue con el intento de identificación de factores de riesgo que puedan incrementar la probabilidad de que el problema sea más frecuente o más intenso en determinados grupos de pacientes. Por último, se debe evaluar su posible tratamiento.

Interpretar adecuadamente la causalidad de un acontecimiento adverso relevante clí-nicamente tiene gran importancia por varios motivos: por un lado, determina las decisio-nes terapéuticas sobre el paciente que lo padece y, por otro, tiene implicaciones sobre el uso del tratamiento en otros pacientes que lo están recibiendo en ensayos clínicos o que pueden recibirlo en un futuro, tanto en condiciones de investigación como de práctica clínica. Conviene recordar que los datos de seguridad deben sopesarse cuidadosamente junto con los de eficacia y que la aparición de efectos adversos –ni siquiera si son muy graves– no implica por sí sola la retirada de un medicamento.

Idealmente, para evaluar la importancia clínica y la causalidad de un acontecimiento adverso, el investigador debe conocer con detalle y tener en consideración los anteceden-

49

[ Interpretación y evolución de los ensayos clínicos ]

tes patológicos del paciente, la enfermedad en estudio, el medicamento en investigación, las posibles interacciones y efectos secundarios de la medicación concomitante, y los efectos de la retirada y reintroducción del tratamiento. A la hora de juzgar si un aconteci-miento adverso es clínicamente relevante, interviene un alto grado de subjetividad. Para aumentar la consistencia de la evaluación entre distintos investigadores es conveniente utilizar para su registro escalas con categorías sencillas y bien definidas, que fuercen al investigador a decidir sopesando los factores mencionados anteriormente. La clasifica-ción de la intensidad de los acontecimientos adversos más comúnmente utilizada en la mayoría de los ensayos clínicos establece tres niveles: leve, moderada y grave. Un abor-daje frecuente del problema consiste en catalogar como clínicamente significativos los acontecimientos adversos moderados y graves. En la evaluación de la relación causal, las categorías habitualmente usadas son: no relacionado, relación posible, relación probable y relación confirmada.

En la interpretación es necesario comparar los datos con los de otros ensayos clínicos.También forma parte de la interpretación extrapolar a poblaciones o situaciones dife-rentes y desarrollar hipótesis que evaluar en nuevos ensayos clínicos. En este sentido, se puede adoptar un abordaje más o menos conservador al interpretar los resultados de un ensayo clínico, limitando las conclusiones a aquellas que están plenamente fundamen-tadas por los datos del ensayo, o pretendiendo generalizar a amplios grupos a partir de datos de subgrupos pequeños.

3/Aplicabilidad clínica

La finalidad de un ensayo clínico es, en última instancia, aportar información acerca de una intervención terapéutica que permita mejorar la práctica clínica, y la relevancia de sus resultados debería medirse por su capacidad para modificar dicha práctica.

En las dos últimas décadas, se ha ido imponiendo paulatinamente una práctica de la medicina que integra la experiencia clínica individual y las pruebas científicas aportadas por la investigación sistemática. En este contexto, la influencia que ejerza un ensayo clínico sobre la práctica clínica debería guardar una estrecha relación con la importancia real de sus resultados.

Con el propósito de evitar que ensayos clínicos importantes tengan escasa repercu-sión en la práctica médica, o que ensayos clínicos que no deberían influir en gran medida lo hagan, conviene conocer los factores que determinan dicha influencia y cómo pueden modificarse. La probabilidad de que un ensayo clínico acabe influyendo en la práctica clínica viene determinada por factores inherentes a los propios datos y otros inherentes a la práctica clínica.

En primer lugar, los resultados tendrán mayor aceptación y aumentará la probabili-dad de que se trasladen a la práctica clínica de forma inmediata si el ensayo clínico abor-da un problema de gran importancia desde una perspectiva médica. Las implicaciones sociales, económicas y políticas de los resultados también intervienen en su capacidad de influir sobre la práctica clínica. El diseño del ensayo clínico mejor aceptado es aquel que

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

50

sigue las últimas pautas más ampliamente establecidas y utiliza los criterios diagnósticos y las medidas de resultados mejor validados. La influencia del ensayo clínico también será mayor si los fundamentos médicos y científicos de la intervención terapéutica en estudio son sólidos, si se demuestra una relación entre dosis y respuesta, y si el efecto observado es importante y no aparece exclusivamente en un pequeño subgrupo de pacientes, sino en una elevada proporción de los mismos. Unos datos coherentes con resultados previos tienen mayor probabilidad de influir en la práctica clínica.

En cuanto a los factores relacionados con la práctica clínica, destaca la disponibilidad de terapias alternativas, así como su conveniencia, tolerabilidad y precio. Los resultados serán mejor aceptados si son coherentes con la práctica clínica habitual; por el contrario, si hacen recomendable una profunda revisión de ésta, cabe esperar una oposición a acep-tarlos, especialmente marcada si las repercusiones económicas son importantes.

Más allá de los factores inherentes a los datos del ensayo clínico y a las características de la práctica clínica, la probabilidad de influir en esta última está relacionada con la eficiencia en la difusión de los resultados. Entre los factores que afectan a esta eficiencia cabe destacar la presentación de los datos, el medio en que son publicados, la reputación y el tipo de actividad de los autores, y las valoraciones públicas realizadas por los líderes de opinión, las sociedades científicas y las asociaciones de pacientes. Un factor que ha experimentado un gran crecimiento en los últimos años es el alcance de la promoción del ensayo, que incluye dirigirse tanto al colectivo médico como directamente a la opinión pública a través de los medios de comunicación de masas, con lo que se estimula a los pacientes a solicitar el tratamiento a su médico. Las asociaciones de profesionales, como los colegios oficiales de médicos, tienen la capacidad, y por tanto la responsabilidad, de confrontar la promoción dirigida a sus miembros de los resultados de un ensayo si con-sideran que se está realizando de forma inadecuada.

Merece una mención especial el primero de los factores arriba citados, ya que la pre-sentación clara de los datos facilita en gran medida su comprensión y con ello tiene un gran impacto en la aceptación de los resultados de un ensayo clínico. Una presentación efectiva requiere seleccionar adecuadamente los datos que aportan información relevan-te, elegir el formato apropiado de tablas, gráficos o figuras y, especialmente, expresar los resultados principales de forma que permitan una percepción obvia. Si los resultados son presentados de manera que sea difícil comprender el beneficio clínico, lo más probable es que no sean trasladados a la práctica clínica.

La capacidad del tratamiento para evitar que aparezca la situación clínica predefinida como no deseada puede expresarse porcentualmente mediante la reducción relativa del riesgo. Este método no permite por sí solo juzgar de forma adecuada el beneficio clínico obtenido y puede conducir a interpretaciones erróneas si no se acompaña de informa-ción adicional como la reducción absoluta del riesgo. Así, una reducción relativa en la aparición del deterioro clínico del 40% puede estar indicando tanto que su frecuencia ha pasado del 50% al 30% como que ha pasado de aparecer en el 5% de los casos a hacerlo en el 3%, o del 0,5% al 0,3%. Es evidente que las implicaciones para la práctica clínica de las tres situaciones son completamente distintas. En el primer caso, el beneficio del tratamiento justificaría su incorporación inmediata a la práctica clínica, y en el último, difícilmente lo haría, mientras que en el caso intermedio probablemente deberían tenerse en cuenta otros factores. Por ello, es preferible utilizar un método más intuitivo desde la

51

[ Interpretación y evolución de los ensayos clínicos ]

perspectiva clínica y expresar los beneficios del tratamiento indicando cuántos pacientes es necesario tratar y durante cuánto tiempo para obtener una ganancia determinada. El número de pacientes que es necesario tratar es el inverso de la reducción absoluta del riesgo y puede utilizarse no sólo expresando los resultados de eficacia sino también los de seguridad.

4/Evolución, dificultades y retos futuros de los ensayos clínicos en esclerosis múltiple

Evolución

La evolución del tratamiento de la EM es otro claro ejemplo de cómo los resultados de los ensayos clínicos controlados, con asignación aleatoria de la intervención terapéutica, son capaces de cambiar de forma drástica la práctica clínica rutinaria en un breve lapso.

En la segunda mitad del siglo XIX, Jean-Martin Charcot manifestaba que aún no había llegado el momento de plantearse siquiera el tratamiento de la enfermedad(11). Una opinión tan autorizada no impedía a los médicos prescribir a sus pacientes todas las inter-venciones que, sin justificación científica alguna, les eran accesibles y estaban de moda. Sir August Frederick d’Este relató en su diario el curso de su EM y ofreció también una lista detallada de los tratamientos que le recomendaron algunos de los más prestigiosos médicos de Europa en la primera mitad del siglo XIX(12). La lista incluye las aguas terma-les en distintos balnearios, los eméticos, las sangrías con sanguijuelas, la dieta rica en pro-teínas y calorías, el sondaje vesical, las friegas con linimento y las descargas eléctricas.

La siguiente etapa estuvo marcada por el intento de incorporar una justificación cien-tífica al tratamiento de la EM(13). El fundamento se fue elaborando alrededor de las teo-rías acerca de la etiología de la enfermedad y en paralelo a los avances de la microbiología. Esta corriente condujo durante la primera mitad del siglo XX –en la creencia de que el origen de la enfermedad era la infección por una bacteria no identificada– a utilizar el arsénico, la inducción de fiebre y las vacunas. Los fármacos antivíricos se usaron en la segunda mitad del siglo, coincidiendo con el auge de la hipótesis vírica acerca de la causa de la EM. Un enfoque del problema desde una perspectiva anatomopatológica llevó a proponer el uso de tratamientos anticoagulantes al interpretarse el hallazgo de la distri-bución de las lesiones en la proximidad de las vénulas como indicativo de un mecanismo isquémico.

Finalmente, los primeros resultados positivos en el abordaje terapéutico de la EM llegaron cuando se enfocaron los mecanismos y no las causas de la enfermedad, coinci-diendo con la expansión del conocimiento de su patogenia y la irrupción de la hipótesis autoinmune. En los últimos años, el desarrollo simultáneo de la biotecnología ha per-mitido disponer de un gran arsenal de fármacos dirigidos cada vez más específicamente a un inmenso número de dianas terapéuticas. Algunos de ellos ya han pasado de ser tra-tamientos experimentales prometedores a usarse de forma generalizada en una práctica médica basada en las pruebas.

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

52

Este éxito también hay que atribuirlo, en gran medida, a los importantes avances en el perfeccionamiento del método para investigar la eficacia y seguridad de las interven-ciones terapéuticas. En el campo de los ensayos clínicos en EM cabe destacar dos hitos que han marcado el curso posterior de los acontecimientos: el ensayo clínico que evaluó la eficacia de la hormona adrenocorticotropa (ACTH) en el tratamiento de los brotes(14) y el que lo hizo con la eficacia del interferón (IFN) β-1b para reducir la tasa de brotes(15).

El primero de ellos, llevado a cabo en la década de los sesenta del siglo pasado, fue también el primer ensayo clínico que demostró no sólo el beneficio de un tratamiento en la EM sino también que existía la herramienta para detectarlo. Ésta no era otra que el resultado del esfuerzo colectivo de distintos investigadores, aplicando el método del ensayo clínico aleatorizado, doble ciego y controlado con placebo, y llevando a cabo un registro, cuidadoso y repetido a intervalos cortos, de los signos y síntomas de la enferme-dad mediante escalas capaces de detectar los posibles cambios.

Los resultados del ensayo de IFN-β-1b mostraron el camino a seguir en los poste-riores intentos de evaluar la eficacia y seguridad de un tratamiento para la enfermedad en cuanto a diseño, desarrollo del estudio y apoyo de los resultados clínicos con datos de resonancia magnética(16). La resonancia magnética ha supuesto una revolución en la investigación clínica de la enfermedad, que ha dado frutos especialmente al ser utilizada como medida principal de resultados en los ensayos clínicos en fase II, por su extraordi-naria capacidad para detectar la actividad de la EM que no tiene expresión clínica(17).

El ensayo clínico en que se evaluó la eficacia del IFN-β-1b también dio paso a una nueva época en la práctica clínica de la EM, la de la medicina basada en las pruebas. La Food and Drug Administration estadounidense (FDA) aprobó su uso el mismo año en que se hicieron públicos los resultados. En los años inmediatamente posteriores, se completaron nuevos ensayos clínicos, y otras dos formulaciones de IFN-β y el acetato de glatirámero obtuvieron la autorización al haber demostrado en ensayos clínicos una eficacia superior a la del placebo.

La EM pasó a considerarse una enfermedad potencialmente tratable y desde entonces los afectados se han beneficiado del uso generalizado de estos cuatro fármacos, que ofre-cen beneficios evidentes sobre el control de la actividad de la EM recurrente-remitente (EMRR) y han demostrado con los años un perfil de seguridad excelente. Sin embargo, debido a que su efecto es modesto y a que no carecen de efectos secundarios menores e inconvenientes relacionados con su administración por vía parenteral, pronto resultó evidente que la carrera en busca de nuevos tratamientos para la EM no había finalizado con la rápida incorporación de estos fármacos a la práctica clínica.

Dificultades

En lo referente a los futuros ensayos clínicos, la generalización del uso de los tratamientos anteriores tuvo como consecuencia el situar muy alto el listón para la evaluación de nue-vas intervenciones terapéuticas que pretendiesen ofrecer una mayor eficacia o una mejor tolerabilidad. Las dificultades tienen que ver, en primer lugar, con la elección del control adecuado, tanto por sus implicaciones éticas como prácticas, en relación con su efecto sobre el cálculo del tamaño de la muestra y la duración del ensayo clínico.

53

[ Interpretación y evolución de los ensayos clínicos ]

El ensayo clínico controlado con placebo requiere una valoración ética especialmente meticulosa, que ya ha sido abordada en los capítulos anteriores de esta monografía. La exposición al placebo durante periodos prolongados puede vulnerar el principio ético de la beneficencia, al negar a los pacientes el beneficio de los tratamientos que podrían recibir en caso de no participar en el ensayo clínico. Este riesgo se ha solventado en parte reforzando el principio del respeto a la autonomía de los pacientes para decidir volunta-riamente su participación. Sin embargo, en la actualidad parece más difícil cumplir con el principio ético de justicia, y estamos asistiendo a un desplazamiento de las cargas de la investigación hacia países con recursos económicos limitados que no les permitirán disfrutar de los beneficios de los resultados de dicha investigación.

Esta falta de equidad se ve favorecida por una valoración ética a nivel local de pro-yectos que se desarrollan globalmente. Así, la opinión predominante unos años atrás en nuestro país, que consideraba inaceptable la exposición de los pacientes con EM a place-bo durante 2 años, motivó que un ensayo clínico recibiese un dictamen desfavorable por parte del Comité Ético de Referencia y no pudiese llevarse a cabo en España. Este ensayo clínico ha concluido con éxito recientemente(18) y ha demostrado la eficacia para reducir la tasa de brotes de un tratamiento administrado por vía oral, la cladribina. Parece poco probable que, durante el proceso de evaluación del beneficio que puede aportar dicho tratamiento a los pacientes en nuestro país, las autoridades sanitarias españolas lleguen tan sólo a contemplar el hecho de que se descartó que pudiesen compartir las cargas de la investigación con los pacientes de los países en que se llevó a cabo el ensayo.

La alternativa obvia al ensayo clínico controlado con placebo es el ensayo que utiliza un control activo. Este diseño tiene enormes implicaciones de cara al cálculo del tamaño de la muestra. En el caso de los ensayos de superioridad, asumiendo las mismas condicio-nes en cuanto a la duración del ensayo clínico y a la sensibilidad de la medida principal de resultados, demostrar un incremento relativo de la eficacia frente a un comparador activo similar al que éste mostró frente al placebo requiere un número de pacientes osten-siblemente superior. Los ensayos clínicos de equivalencia y de no inferioridad con control activo tienen el inconveniente añadido de que no permiten garantizar la superioridad frente a placebo, dada la eficacia limitada de los tratamientos mencionados. Por lo tanto, salvo en el caso de presumir una gran eficacia del tratamiento experimental que pueda ser evaluada en un ensayo clínico de superioridad, la viabilidad de los ensayos con control activo se ve comprometida porque éstos incrementan en gran medida el número de pa-cientes expuestos a la terapia experimental, con los riesgos que ello supone.

En estas condiciones no parece existir en la EMRR una alternativa factible al ensayo clínico controlado con placebo, y hoy en día vuelve a ser posible realizar ensayos clíni-cos en fase III controlados con placebo en EMRR en España. El cambio de criterio de valoración, que lleva a considerar aceptable nuevamente el uso de placebo, se debe en gran medida al mayor énfasis que se pone en el proceso de consentimiento informado. Éste contempla inicialmente una exposición clara de las alternativas de tratamiento fuera del ensayo clínico y debe renovarse en el caso de que la situación clínica cambie durante el estudio, bien sea por la aparición de nuevos brotes o por el incremento de la discapacidad.

Sin embargo, al contemplar en el diseño de un ensayo clínico el control con placebo, no se debe perder de vista en ningún momento los grandes cambios que en el campo de

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

54

la EM han tenido lugar en las dos últimas décadas y que determinan que el comporta-miento actual de los grupos placebo difiera drásticamente del que mostraban años atrás. Estos cambios tienen que ver, por un lado, con la misma definición de la enfermedad, pues la actualización de los criterios diagnósticos conlleva una modificación del pronós-tico(19) y, por otro, con la disponibilidad de tratamientos, que hace muy poco probable que actualmente un paciente de alto riesgo participe en un ensayo clínico controlado con placebo. La consecuencia lógica ha sido que la tasa de brotes observada en los grupos placebo ha ido decreciendo a lo largo de los últimos años, lo que invalida el uso de un grupo placebo virtual como diseño alternativo.

Retos futuros

Los diseños de los ensayos clínicos que llevaron a la aprobación de los primeros trata-mientos para la EM adolecían de cierta inconsistencia que dificultaba las comparaciones de la eficacia entre los distintos fármacos. A medida que se dispone de más opciones terapéuticas para la enfermedad, aumenta la necesidad de disponer de datos acerca de la eficacia relativa de los tratamientos. Así, en los últimos años se ha ido imponiendo el diseño de ensayo clínico que incluye un grupo control con placebo y otro con trata-miento activo. Las ventajas que ofrece este diseño se ven contrarrestadas en parte porque aumentan las ya de por sí enormes dificultades en el reclutamiento, al quedar excluidos los pacientes que aceptarían participar en un ensayo clínico porque rechazan los trata-mientos disponibles debido a sus inconvenientes o por haberlos utilizado previamente sin obtener beneficio.

La disponibilidad de múltiples tratamientos también ha derivado en la puesta en marcha de diversos ensayos en los que se combinan distintas terapias. La demostración de eficacia en estos casos requiere un gran número de participantes, y estos ensayos deben mantener una minuciosa evaluación de la seguridad, como demuestra la identificación de dos casos de leucoencefalopatía multifocal progresiva en un ensayo de este tipo(20). Los aspectos relacionados tanto con la seguridad como con el coste de la combinación de terapias deben conducir a corto plazo a la puesta en marcha de ensayos clínicos en EM en los que se evalúe el efecto de la retirada de los tratamientos.

El reto fundamental que en el futuro deben afrontar los ensayos clínicos en EMRR es responder a las preguntas de un modo más eficiente, bien reduciendo el número de pa-cientes expuestos al placebo, bien disminuyendo la duración de la exposición(21). Algunas de las posibles alternativas en cuanto al diseño ya se han explorado con éxito en ensayos en fase III, como es el caso de aplazar la aleatorización durante el periodo necesario para obtener la información que permita identificar y excluir a aquellos pacientes que no res-ponden al tratamiento, aumentando así el poder estadístico del estudio.

Es en los ensayos clínicos en fase II, sin embargo, donde los diseños novedosos pueden tener más cabida, acelerando el proceso de la determinación de dosis, de eva-luación de la seguridad y eficacia potencial, y reduciendo el lapso entre la conclusión de éste y el inicio del ensayo en fase III. Especialmente prometedor parece el diseño adaptativo, hasta el punto de que se está utilizando actualmente en EM. El método aprovecha la información acumulada precozmente para establecer las futuras distri-

55

[ Interpretación y evolución de los ensayos clínicos ]

buciones de los pacientes asignados a las distintas intervenciones en aleatorizaciones secuenciales. Entre sus ventajas destaca que permite eliminar relativamente pronto las dosis del medicamento en investigación que no están dando los resultados deseados, a la vez que se reduce el número de pacientes expuestos al placebo. Es imprescindible que sea un comité independiente el que tome las decisiones, y tanto el promotor como los investigadores deben permanecer cegados a las nuevas distribuciones; por ejemplo, en el caso de revisar al alza el cálculo del tamaño de la muestra, podría mandarse un mensaje pesimista a ambos que disminuyese su interés en el estudio. El diseño adapta-tivo puede beneficiarse especialmente de un cambio de modelo en cuanto al método de análisis, con el paso del tradicional método frecuentista a la estadística bayesiana(22). El abordaje bayesiano incorpora al análisis la información previa y la actualiza a medida que se van obteniendo nuevos datos, ofreciendo con ello una estimación más precisa del efecto real del tratamiento especialmente útil en los ensayos clínicos en fase II, mientras que el método frecuentista va dirigido a obtener una demostración indepen-diente del efecto del tratamiento, establecido en la hipótesis, y parece intuitivamente más adecuado para los ensayos en fase III. Un problema adicional que afronta este cambio de paradigma en los ensayos clínicos en EM es la tendencia a la reducción de la tasa de brotes con el tiempo, que puede llevar a que las premisas procedentes de un análisis temprano no sean válidas para toda la duración del estudio(23).

Finalmente, los extraordinarios avances terapéuticos que han tenido lugar en las últimas décadas han estado limitados al control del fenómeno inflamatorio, y el ma-yor desafío al que se enfrentan los ensayos clínicos en EM en el futuro es el de encon-trar tratamientos capaces de frenar la progresión de la enfermedad, protegiendo a las neuronas frente al daño permanente, y el de revertir la pérdida de mielina y axones ya establecida. La necesidad más acuciante es identificar marcadores biológicos que permitan evaluar de forma eficiente la seguridad y eficacia de las múltiples terapias candidatas mediante ensayos en fase II. La evaluación de técnicas como la transferen-cia de magnetización y la tomografía de coherencia óptica en estudios multicéntricos es prioritaria, pero, mientras se dispone de datos acerca de su validez como medidas de resultados subrogadas, las técnicas de resonancia magnética más convencionales, como la determinación del volumen cerebral o el desarrollo de lesiones hipointensas en las secuencias potenciadas en T1, abren la puerta a los ensayos clínicos de neuro-protección en EM(24).

A la vez que determinan un aumento de la calidad, todas las consideraciones an-teriores también aumentan la complejidad y los costes de los ensayos clínicos en EM y, hoy en día, es inimaginable iniciar un ensayo en fase III con independencia de la industria farmacéutica. A la vez, el número de ensayos clínicos que se desarrolla simultáneamente ha experimentado un notable aumento en los últimos años. Por ello, es primordial establecer mecanismos de colaboración entre los investigadores que eviten el excesivo consumo de recursos derivado de la implicación en múltiples estu-dios, así como protocolos para la relación con la industria farmacéutica que permitan abordar con los ensayos clínicos cuestiones relevantes desde una perspectiva clínica, más allá de aspectos con un interés predominantemente comercial, como puede ser extender dentro del mismo espectro clínico de la enfermedad las indicaciones de un tratamiento aprobado(25).

[ ENSAYOS CLÍNICOS EN LA ESCLEROSIS MÚLTIPLE ]

56

BIbliografía

1 Spilker B. Guide to clinical trials. Philadelphia: Lippincott Williams & Wilkins; 2000. 2 Altman DG, Schulz KF, Moher D, Egger M, Davidoff F, Elbourne D, et al. The revised CONSORT statement

for reporting randomized trials: explanation and elaboration. Ann Intern Med 2001; 134: 663-94.

3 Ederer F. Practical problems in collaborative clinical trials. Am J Epidemiol 1975; 102: 111-8. 4 Noseworthy JH, Ebers GC, Vandervoort MK, Farquhar RE, Yetisir E, Roberts R. The impact of blinding on the

results of a randomized, placebo-controlled multiple sclerosis clinical trial. Neurology 1994; 44: 16-20.

5 Schulz KF, Chalmers I, Altman DG. The landscape and lexicon of blinding in randomized trials. Ann Intern Med 2002; 136: 254-9.

6 Schulz KF, Grimes DA. Blinding in randomised trials: hiding who got what. Lancet 2002; 359: 696-700.

7 Kurtzke JF. Rating neurologic impairment in multiple sclerosis: an expanded disability status scale (EDSS). Neurology 1983; 33: 1444-52.

8 Río J, Nos C, Tintoré M, Téllez N, Galán I, Pelayo R, et al. Defining the response to interferon-beta in relapsing-remitting multiple sclerosis patients. Ann Neurol 2006; 59: 344-52.

9 Rudick RA, Antel J, Confavreux C, Cutter G, Ellison G, Fischer J, et al. Clinical outcomes assessment in multiple sclerosis. Ann Neurol 1996; 40: 469-79.

10 Weinshenker BG, O’Brien PC, Petterson TM, Noseworthy JH, Lucchinetti CF, Dodick DW, et al. A randomized trial of plasma exchange in acute central nervous system inflammatory demyelinating dis-ease. Ann Neurol 1999; 46: 878-86.

11 Charcot JM. Lectures on the diseases of the nervous system. London: The New Sydenham Society; 1877.

12 Firth D. The Case of Augustus d’Este (1794-1848): The First Account of Disseminated Sclerosis: (Section of the History of Medicine). Proc R Soc Med 1941; 34: 381-4.

13 McDonald WI. The emergence of multiple sclerosis as a “treatable” condition: an historical perspective. En: Goodkin DE, Rudick RA (eds.). Treatment of Multiple Sclerosis: Trial Design, Results, and Future Perspectives. Londres: Springer-Verlag; 1992. p. 351-60.

14 Rose AS, Kuzma JW, Kurtzke JF, Namerow NS, Sibley WA, Tourtellotte WW. Cooperative study in the evaluation of therapy in multiple sclerosis. ACTH vs. placebo--final report. Neurology 1970; 20: 1-59.

15 The IFNB Multiple Sclerosis Study Group. Interferon beta-1b is effective in relapsing-remitting mul-tiple sclerosis. I. Clinical results of a multicenter, randomized, double-blind, placebo-con-trolled trial. Neurology 1993; 43: 655-61.

16 Paty DW, Li DK. Interferon beta-1b is effective in relapsing-remitting multiple sclerosis. II. MRI analysis results of a multicenter, randomized, double-blind, placebo-controlled trial. UBC MS/MRI Study Group and the IFNB Multiple Sclerosis Study Group. Neurology 1993; 43: 662-7.

17 Miller DH, Albert PS, Barkhof F, Francis G, Frank JA, Hodgkinson S, et al. Guidelines for the use of mag-netic resonance techniques in monitoring the treatment of multiple sclerosis. US National MS Society Task Force. Ann Neurol 1996; 39: 6-16.

57

[ Interpretación y evolución de los ensayos clínicos ]

18 Giovannoni G, Comi G, Cook S, Rammohan K, Rieckmann P, Soelberg Sørensen P, et al. A Placebo-Controlled Trial of Oral Cladribine for Relapsing Multiple Sclerosis. N Engl J Med 2010; 362: 416-26.

19 Sormani MP, Tintorè M, Rovaris M, Rovira A, Vidal X, Bruzzi P, et al. Will Rogers phenomenon in multiple sclerosis. Ann Neurol 2008; 64: 428-33.

20 Rudick RA, Stuart WH, Calabresi PA, Confavreux C, Galetta SL, Radue EW, et al. Natalizumab plus Interferon Beta-1a for Relapsing Multiple Sclerosis. N Engl J Med 2006; 354: 911-23.

21 McFarland HF, Reingold SC. The future of multiple sclerosis therapies: redesigning multiple scle-rosis clinical trials in a new therapeutic era. Mult Scler 2005; 11: 669-76.

22 Gönen M. Bayesian clinical trials: no more excuses. Clinical Trials 2009; 6: 203-4.23 Cofield SS, Cutter GR. Novel designs for clinical trials in multiple sclerosis: another excursion to

Sirenum scopuli? Therapy 2008; 5: 613-22.24 Mehta LR, Schwid SR, Arnold DL, Cutter GR, Aradhye S, Balcer LJ, et al. Proof of concept studies for tis-

sue-protective agents in multiple sclerosis. Multiple Sclerosis 2009; 15: 542-6.25 Kappos L, Polman C, Thompson AJ, Duda P, Clanet M, Comi G, et al. Towards a european network for

multiple sclerosis trials (ENMST). Mult Scler 2003; 9: 627-9.