Propuesta metodológica sobre la resolución de problemas Biomédicos que conducen a la...
-
Upload
demetrio-cantillo -
Category
Documents
-
view
14 -
download
9
Transcript of Propuesta metodológica sobre la resolución de problemas Biomédicos que conducen a la...
““Propuesta metodológica sobre la resolución de problemas Propuesta metodológica sobre la resolución de problemas
Biomédicos que conducen a la distribución Ji-cuadrado”.Biomédicos que conducen a la distribución Ji-cuadrado”.
VolverVolver
Resumen Introducción Desarrollo Bibliografía Datos del autor Ir a “Propuesta””
Trabajo publicado en www.ilustrados.com
La mayor Comunidad de difusión del conocimiento
Lic. Profesor Asistente Lorenzo Pérez Milanés
Facultad de Ciencias Médicas “Zoilo E. Marinello
Vidaurreta”
Las Tunas Cuba
E-mail: [email protected]
Este artículo está dirigido fundamentalmente a los profesionales de la Salud y en especial a
los estudiantes de 2do. Año de la carrera de Medicina, Estomatología y Enfermería de la
Facultad de Ciencias Médicas “Zoilo E. Marinello Vidaurreta” de Las Tunas, los cuales
reciben las asignaturas de Informática Médica II y Informática e Investigación III en la que se
aborda la problemática de la resolución de problemas biomédicos que conducen a la
distribución Ji-cuadradoJi-cuadrado en el marco de la Estadística Inferencial. En el mismo se presentan
algunas valoraciones teóricas sobre el tema y una propuesta metodológica con una serie de
pasos lógicos para realizar las pruebas de hipótesis que utilizan este modelo, así como
algunas indicaciones en el uso del procesador Statgraphics versión 2,1 en Inglés para el
cálculo y análisis de los resultados . Además este material puede ser también útil a otros
profesionales que aborden la Estadística Inferencial en general.
Regresar
En el desarrollo de los métodos estadísticos modernos las primeras técnicas de inferencia que aparecieron
fueron las que hicieron buen número de suposiciones acerca de la naturaleza de la población de la que
obtuvieron los datos.
Puesto que los valores de población son “parámetros” estas técnicas estadísticas son llamadas
“paramétricas”. Una técnica de inferencia, como ya hemos visto, puede basarse en la suposición de que los
datos se sacaron de una población distribuida normalmente. Tales técnicas nos conducen a conclusiones
que tienen limitaciones, por lo que más recientemente se han desarrollado gran número de técnicas de
inferencia que no hacen suposiciones numerosas ni severas acerca de los parámetros. Estas “distribuciones
libres” o “técnicas no paramétricas”“técnicas no paramétricas” permiten sacar conclusiones a las que hay que hacer menor reserva.
Existen multitud de situaciones en el ámbito de la salud en el que las variables de interés, las cuales no
pueden cuantificarse mediante cantidades numéricas, entre las que el investigador esté interesado en
determinar posibles relaciones. Ejemplos de este tipo de variables pueden ser las complicaciones tras una las complicaciones tras una
intervención quirúrgica, el sexo, el nivel socio-culturalintervención quirúrgica, el sexo, el nivel socio-cultural, etc. En este caso tendríamos, a lo sumo, las
observaciones agrupadas en forma de frecuencia, dependiendo de las modalidades que presente cada
paciente en cada una de las variables, por los que los métodos estudiados en los capítulos anteriores no
serían aplicables.
La experiencia nos ha conducido a tener en cuenta el fracaso que experimentan los principiantes y
estudiantes en el proceso de resolución de problemas que conducen a la distribución x2 y en especial en la
realización de pruebas de hipótesis por numerosos factores como, prestar su atención solamente en las
habilidades computacionales, en el quehacer metodológico o en la rama descriptiva de la Estadística como
ciencia. Para la Estadística Inferencial ha quedado el papel de “oveja negra” por razones diversas, que
incluyen desde la complejidad de su contenido hasta la predisposición a impartirla por predominio de
personal docente no afín a la especialidad; la realidad es que hay que buscar un enfoque de mayor acierto
para la docencia de esta temática en el contexto de los nuevos paradigmas de creación, difusión y
utilización del conocimiento, y los apuntes que se proponen es un elemento a considerar en este sentido.
Regresar
Test o contraste Ji-cuadradoTest o contraste Ji-cuadrado
En general este tipo de tests consisten en tomar una muestra y observar si hay diferencia significativa entre las frecuencias “observadas”“observadas” y las especificadas por la ley teórica del modelo que se contrasta, también denominadas frecuencias “esperadas”.“esperadas”.
Esta prueba 22 puede ser utilizada en forma útil en relación con la compatibilidad de frecuencia observada y esperadas (caso de haber independencia) en tablas de dos sentidos o “tablas de contingencia” ( ( Es un Es un contraste para determinarcontraste para determinar la dependencia o independencia de caracteres cualitativos la dependencia o independencia de caracteres cualitativos).).
Estas tablas se construyen generalmente con objeto de estudiar la relación entre las dos variables de clasificación. Por medio de la prueba 2 es posible probar la hipótesis de que las dos variables son son independientes.independientes.
La fórmula a utilizar para calcular 2 será la siguiente:
r k Donde:
(1) 2 = ( Qij – Eij)2 / Eij k: número de columnas.
i = 1 j = 1 r: “ “ filas.
Qij: Frecuencias absolutas observadas de casos clasificadoscasos clasificados en la fila i de la
columna j.
Eij : Frecuencias absolutas de casos esperadoscasos esperados conforme a Ho para ser
clasificados en la fila i de la columna j.
Para encontrar la frecuencia esperada para cada casilla, se multiplican los dos totales marginales de una casilla particular y dividimos el producto por el número total de casos “ n “. Regresar Continuar
i
A B Total
a *12 32 44
b 22 14 36
c 9 6 15
Total 43 52 95
iJ
Ejemplo:
Tabla que muestra las frecuencias observadas en cada casilla a partir de la cual determinaremos las frecuencias esperadas.
* Frecuencia esperada de la casilla situada en la primera fila y primera columna.
E11= ( 44)(43) / 95 = 19.9 , n = 95
Si las frecuencias observadas están estrechamente de acuerdo con las frecuencias esperadas, las diferencias ( Qij –Eij )serán por supuesto pequeñas y consecuentemente el valor 2 será pequeño. Con un valor pequeño de este estadígrafo “ “ no podemos rechazarno podemos rechazar la hipótesis de nulidadla hipótesis de nulidad”” que supone independientes entre si a los dos conjuntos de características.
Si hay una o varias diferencias grandes, el valor de 2 también será grande. Tanto mayor es 2 tanto más probable es que los dos grupos difieran con respecto a las clasificaciones.
Puede mostrarse que la distribución muestral de 2 , definida por la fórmula antes expuesta, se aproxima a la distribución Chi-cuadrado con el valor:
gl = ( r-1)(k-1)gl = ( r-1)(k-1) donde gl son los grados de libertad.
Las probabilidades asociadas con diferentes valores de Chi-cuadrado se encuentran en la tablatabla de valores de 2. Si un valor calculado de este estadígrafo es mayores mayor que el dado en la tabla en un nivel de significación prefijado-en un gl en particular, se rechaza Hse rechaza Hoo a ese nivel de significación.
Regresar Continuar
Nótese que hay una distribución muestral diferente para cada valor de gl, es decir, la significación de
cualquier valor particular de 2 depende del número de grados de libertad en los datos con los que ha sido
calculado.
Los grados de libertad para una tabla r x k pueden hallarse con :
gl = (r-1)(k-1) , donde :
r: número de clasificaciones(filas).
K: número de grupos(columnas).
¿ Tendrá limitaciones este test ?....¿ Qué pasará si gl = 1 ?.
Después de haber analizado los elementos teóricos anteriores aparecen gravitando alrededor del tema que
nos ocupa, las siguientes interrogantes: ¿ Cuándo tendríamos que realizar una prueba Ji-cuadrado ?,¿ Cómo
se hace este tipo de prueba ?, ¿ Cuáles serían los pasos a seguir para tener éxito en la realización de la
misma ?, ¿ Qué tendríamos que hacer en cada paso ?, en fin para responder a estas y a otras interrogantes
que puedan surgir les proponemos a continuación una “metodología”“metodología” de resolución de problemas
biomédicos que conducen a estas pruebas de hipótesis. La misma esta constituida por una serie de pasos
lógicos que recomendamos seguir y que han sido extraídos de la experiencia que hemos acumulado en la
impartición y en el trabajo metodológico a la Estadística Inferencial por parte del colectivo docente, así
como de resultados en la aplicación de exámenes y técnicas cualitativas para conocer el grado de
aceptación y satisfacción de esta metodología en los estudiantes con el propósito de facilitar y guiar a los
mismos en la obtención del éxito de estos tests.
Hemos querido presentarle a continuación la “metodología”“metodología” con los pasos que sugerimos seguir para
realizar la prueba y en los que se podrán apreciar vínculos que nos mostraran, a través de un ejemplo
concreto, que debe hacerse en cada uno de ellos, así como su contenido. Regresar Continuar
I. Identificar la distribución Ji-cuadrado en el problema la distribución Ji-cuadrado en el problema biomédico.biomédico.
II.II. Buscar el valor tabulado de Xel valor tabulado de X22 según según y los grados de y los grados de libertad.libertad.
IIIIII.. Planteamiento de las hipótesis nula y alternativa, el nivel de de las hipótesis nula y alternativa, el nivel de
significación significación y los grados de libertad. y los grados de libertad.
IV.IV. Calculo del estadígrafo X del estadígrafo X22 con el procesador estadístico. con el procesador estadístico.
V.V. Análisis e interpretación de los resultados. e interpretación de los resultados.
VI.VI. Toma de decisión. de decisión. Regresar
VolverVolver
Paso 1Paso 1
Supongamos que deseamos probar si existe independencia entre el tipo de dieta ingerida por los
adolescentes en cierta región durante determinado período y la cantidad de caries y se toma una
muestra de 95 adolescentes.
Los resultados se plantean a continuación( o sea, frecuencia absoluta O ij ).
Tipos de dietas
Cantidad de caries
Después de leer el problema varias veces debemos identificar identificar el tipo de prueba de hipótesis, para ello
debemos darnos cuenta que en el problema clasifican dos variables cualitativas y ordinalescualitativas y ordinales(tipos de
dietas y cantidad de caries), pero además se quiere saber la dependenciala dependencia entre ambas en una
muestra que es lo suficiente grande( n 30 ), de manera que estos elementos son suficientes para
saber que estamos en presencia de una prueba no paramétrica o Ji-cuadrado.
A B Total
1-2 12 32 44
22 14 36
6 ó más 9 6 15
Total 43 52 95
3-5 3-5
Regresar
Paso 2Paso 2
Tabla 2Tabla 2
En la tabla se puede observar que para un gl = 2 el valor de xt
2 es 9.21
gl .05 .01
1 3.84 6.63
2 5.99 9.21
3 7.81 11.34
4 9.49 13.28
5 11.07
15.09
6 12.59
16.81
RegresarRegresar
Paso 3Paso 3
La hipótesis de nulidad supone que el tipo de dieta es un factor independiente del número de caries,
por tanto, la hipótesis de nulidad y la hipótesis alternativa se expresan:
Ho : Existen independientes.
H1: No existen independientes.
Tomaremos un nivel de significación = 0.01
El criterio de decisión será:
Rechazar HRechazar Hoo si el valor de 22 obtenido mediante la fórmula es mayores mayor que el tabulado tt22 ( 2 t
2 ).
Este punto crítico t2
se obtiene en la tabla 2 para gl = (3-1)(2-1) = 2 ,el cual constituye el paso 2.
Aceptar HAceptar Hoo si 2 t2
En nuestro caso t2 = 9,21
RegresarRegresar
Seleccionamos...Describe...Categorical Data..Contingency Tables.. del menú y hacemos clic.
Paso 1: Selección de la escala de medición de la variable
Paso 4Paso 4
ProcesadorProcesador
Regresar Continuar
DATA.- nombre de las variables que contienen los datos que se quieren analizar. Hacemos clic en OK
Paso 2: Seleccionar las variables en la base de datos
Regresar Continuar
Seleccionamos el botón Tabular options de la barra de herramientas y hacemos clic.
Paso 3: Seleccionar la opción para realizar la tabulación de la variable
Regresar Continuar
Seleccionamos...Chi-Square Tests de la caja de diálogo y hacemos clic en el botón OK
Paso 4: Selección de la prueba
Regresar Continuar
Paso 5: Extraer los resultados obtenidos para efectuar el análisis e interpretación que se plantea en el punto V de la metodología
Como se observa en los resultados para un gl = 2 el valor del estadígrafo x2 es 10.71 y el P-valor = 0.0047
Regresar
Paso 5Paso 5
Este es el paso más importante de la prueba, pues utilizando los resultados obtenidos con el procesador y Este es el paso más importante de la prueba, pues utilizando los resultados obtenidos con el procesador y teniendo en cuenta los diferentes aspectos del paso 2 es que se hacen los análisis e interpretaciones teniendo en cuenta los diferentes aspectos del paso 2 es que se hacen los análisis e interpretaciones finales del problema.finales del problema.
De acuerdo a lo planteado en el problema hacemos los razonamientos siguientes:De acuerdo a lo planteado en el problema hacemos los razonamientos siguientes:
Utilizando el nivel de significación Utilizando el nivel de significación = 0.01 y los grados de libertad dados por el número de filas y = 0.01 y los grados de libertad dados por el número de filas y columnas de la tabla de frecuencias observadas se obtuvo que el valor tabulado de columnas de la tabla de frecuencias observadas se obtuvo que el valor tabulado de tt
22 es de 9.21 y a es de 9.21 y a
partir del procesador el valor partir del procesador el valor 22 que corresponde a la fórmula (1), resultando ser 10.71, de manera que si que corresponde a la fórmula (1), resultando ser 10.71, de manera que si hacemos las comparaciones pertinentes de acuerdo al criterio de decisión podemos ver que hacemos las comparaciones pertinentes de acuerdo al criterio de decisión podemos ver que 10.71 10.71 9.21 9.21 y y tendremos que rechazar la hipótesis nula tendremos que rechazar la hipótesis nula HHoo, es decir, que “rechazamos” que exista independencia entre la dieta , es decir, que “rechazamos” que exista independencia entre la dieta
administrada y la cantidad de caries en esos pacientesadministrada y la cantidad de caries en esos pacientes
Si no hubiéramos utilizado el procesador tendríamos que haber calculado las frecuencias esperadas Si no hubiéramos utilizado el procesador tendríamos que haber calculado las frecuencias esperadas dadas por la tabla: dadas por la tabla:
Tipos de dietasTipos de dietas
Cantidad de caries.Cantidad de caries.
y haber calculado por la fórmula (1) a y haber calculado por la fórmula (1) a 22 que por los datos de la tabla es el siguiente: que por los datos de la tabla es el siguiente:
22 = (12-19.9) = (12-19.9)22 / 19.9 + (32-24.1) / 19.9 + (32-24.1)22 / 24.1 + .........+ (6-8.2) / 24.1 + .........+ (6-8.2)22 / 8.2 / 8.2
= 3.14 +2.59 +.........+ 0.59= 3.14 +2.59 +.........+ 0.59
22 = 10.67 = 10.67
10.67 10.67 que el punto crítico 9.21 que aparece en la tabla, que el punto crítico 9.21 que aparece en la tabla, podemos rechazarpodemos rechazar la hipótesis de nulidad a un la hipótesis de nulidad a un nivel de significación de 0.01, es decir, que rechazamos que exista independencia entre la dieta nivel de significación de 0.01, es decir, que rechazamos que exista independencia entre la dieta administrada y la cantidad de caries en esos pacientes.administrada y la cantidad de caries en esos pacientes.
A B Total0-2 19.
924.1
44
3-53-5 16.3
19.7
36
6.8 8.2 15
Total 43 52 95
6 ó 6 ó másmás
Regresar
Paso 6Paso 6
Es en este paso donde usted debe decidir si a los resultados de la
prueba de hipótesis los toma, los deja o se abstiene de ellos, en fin
todo lo que hicimos antes fue para “DECIDIR”.
RegresarRegresar
LimitacionesLimitaciones
La muestra de tamaño n debe ser La muestra de tamaño n debe ser suficientemente grandesuficientemente grande, de modo que ninguna de las , de modo que ninguna de las
frecuencias esperadas Efrecuencias esperadas Eijij sea menor que 1 y no más del 20 % de los mismos sea menor que sea menor que 1 y no más del 20 % de los mismos sea menor que
5.5.
Corrección de Yates ( si gl = 1 )Corrección de Yates ( si gl = 1 )
Cuando los resultados para una distribución Cuando los resultados para una distribución continuacontinua se aplican a datos se aplican a datos discretosdiscretos, se deben , se deben
hacer correcciones para la continuidad. La corrección consiste en rescribir a la ecuación (1):hacer correcciones para la continuidad. La corrección consiste en rescribir a la ecuación (1):
r k r k
(1) (1) 22 = = ( O ( Oijij – E – Eijij))22 / E / Eij ij
i = 1 j = 1 i = 1 j = 1
2 2 (corregida) = ( Q(corregida) = ( Q11-E-E11-0.5)-0.5)22/E/E11 + (Q + (Q22-E-E22-0.5)-0.5)22/E/E22 + ........+(Q + ........+(Qnn-E-Enn-0.5)-0.5)22/E/Enn
Esta corrección se debe hacer cuando gl = 1 ( un solo grado de libertad). En muestras Esta corrección se debe hacer cuando gl = 1 ( un solo grado de libertad). En muestras
grandes la corrección conduce a los mismos resultados que sin efectuar la corrección.grandes la corrección conduce a los mismos resultados que sin efectuar la corrección.
RegresarRegresar
1. Cursos de Maestrías. Metodología de la Investigación, Promoción y Educación para la salud.
[en CD-
ROM User Guide]. ENSAP. Versión 1,0 La Habana, 2004.
2. Freund E. John. Estadística Elemental Moderna. Edición Revolucionaria. La Habana. 1987.
3. Colectivo de autores. Laboratorio de Estadística Matemática II. Editorial Félix Varela, la
Habana,2004.
4. Guerra Bustillo W. Caridad y otros. Estadística. Editorial Félix Varela, la Habana,2004.
5. Oliva G. Leonardo, O´Farril M. Esperanza. Bioestadística y Computación, quía de estudio.
Edit. Pueblo y
Educación. La Habana. 1988.
6. Oliva G. Leonardo y otros. Bioestadística. Cuaderno de ejercicios. Edit. Pueblo y
Educación. La
Habana. 1988.
7. Colectivo de autores. Bioestadística y Computación. Editorial Pueblo y Educación. La
Habana,1987.
RegresarRegresar
Lic. Profesor Asistente Lorenzo Pérez Milanés
Facultad de Ciencias Médicas “Zoilo E. Marinello Vidaurreta”
Las Tunas Cuba
E-mail: [email protected]
RegresarRegresar