EXPERIMENTOS DE CASO ÚNICO€¦ · Web viewMETODOLOGÍA CUANTITATIVA O EXPERIMENTAL Y...
Transcript of EXPERIMENTOS DE CASO ÚNICO€¦ · Web viewMETODOLOGÍA CUANTITATIVA O EXPERIMENTAL Y...
UNIDAD II
METODOLOGÍA CUANTITATIVA O EXPERIMENTAL Y CORRELACIONAL O CUASIEXPERIMENTAL
INTRODUCCIÓN.Las dos concepciones básicas de la realidad social se basan en el subjetivismo o en el objetivismo.
En la concepción cuantitativa de la ciencia el objetivo de la investigación consiste en
establecer relaciones causales que supongan una explicación del fenómeno. Mientras
que a los militantes del enfoque cualitativo lo que les interesa es la interpretación.Las dos concepciones conducen a dos metodologías distintas: cuantitativa y cualitativa.
La primera se mueve dentro de una ciencia nomotética cuyo objetivo es llegar a formular
leyes generales. La segunda se mueve en una ciencia ideográfica cuyo énfasis está en
lo particular e individual.
Intentos integradores de ambas perspectivas:
Weber ya proponía una explicación comprensiva y una comprensión explicativa, en
definitiva una sociología comprensiva.
Campbell, después de haber militado en la más estricta corriente cuantitativa,
revaloriza la perspectiva cualitativa como complemento indispensable e insustituible
de la cuantitativa.
Los intentos de aproximación entre metodologías contrapuestas es una característica de
la investigación actual.
2.1. CONCEPTUALIZACIÓN, CARACTERÍSTICAS, VENTAJAS E INCONVENIENTES DE CADA METODOLOGÍA. METODOLOGÍA CUANTITATIVA. La Investigación Cuantitativa es aquella en la que se recogen y analizan datos
cuantitativos sobre variables.
Los fundamentos de la metodología cuantitativa podemos encontrarlos en el positivismo
que surge en el primer tercio del siglo XIX como una reacción ante el empirismo que se
1
dedicaba a recoger datos sin introducir los conocimientos más allá del campo de la
observación.
A principios del siglo XX, surge el neopositivismo o positivismo lógico siendo una de las
aportaciones más importantes la inducción probabilística. La clave del positivismo lógico
consiste en contrastar hipótesis probabilísticamente y en caso de ser aceptadas y
demostradas en circunstancias distintas, a partir de ellas elaborar teorías generales.
La estadística dispone de instrumentos cuantitativos para contrastar estas hipótesis y
poder aceptarlas o rechazarlas con una seguridad determinada. Por tanto el método científico, tras una observación, genera una hipótesis que contrasta y emite
posteriormente unas conclusiones derivadas de dicho contraste de hipótesis.
El contrastar una hipótesis repetidamente verificada no da absoluta garantía de su
generalización ya que, como señala Karl Popper, no se dispone de ningún método capaz
de garantizar que la generación de una hipótesis sea válida. Con el ejemplo de los
cisnes, K. Popper rebatía las tesis neopositivistas sobre la generalización de las
hipótesis,...”todos los cisnes de Austria eran blancos...no se dispone de datos sobre el
color de los cisnes fuera de Austria..., todos los cisnes son blancos...” En el momento
actual no hay ningún método que garantice que la generalización de una hipótesis sea
válida, pero sí se puede rebatir una hipótesis con una sola evidencia en contra de ella.
Es por ello que la ciencia, como señala K. Popper “busca explicaciones cada vez
mejores”.
Las características de la Metodología Cuantitativa son la aplicación del Método
Hipotético-Deductivo, la utilización de muestras representativas de sujetos, la medición
objetiva de variables, la utilización de técnicas de recogida de datos cuantitativos como
las encuestas y los tests, la aplicación de la estadística en el análisis de datos, etc. Se
trata de una investigación nomotética que pretende llegar a la generalización de
resultados. Son ejemplos de metodología cuantitativa los estudios correlacionales, los
diseños experimentales, etc
METODOLOGÍA CUALITATIVA.
2
Corriente metodológica que se encuentra en el extremo opuesto a la metodología
cuantitativa y que ha recibido alternativamente distintas denominaciones: Paradigma
cualitativo, metodología cualitativa, interpretativa, etnográfica, ecológica, etnogenética,
naturalista, fenomenológica, etnometodología, constructivismo, observación participante,
estudio de casos, etc.
Es una investigación “desde dentro”, que supone una preponderancia de lo individual y
subjetivo. Su concepción de la realidad social entra en la perspectiva humanística. Es
una investigación interpretativa, referida al individuo, a lo particular. Por lo tanto de
carácter ideográfico.
Señalamos una cierta pluralidad terminológica tal vez debido a que estos enfoques son
relativamente nuevos en el campo de la investigación educativa.
ORÍGENES Y DESARROLLO DE LA INVESTIGACIÓN CUALITATIVA. La observación descriptiva, las entrevistas y otros métodos cualitativos son tan antiguos
como la misma historia. Los orígenes del trabajo de campo: van desde Herodoto a Marco
Polo. Es a partir del siglo XIX cuando se empiezan a utilizar conscientemente en la
investigación social.
Hasta el siglo XVIII no se había prestado atención en describir y analizar la vida de los
grupos sociales “sin voz” considerándolos a un nivel inferior.
Obras de Rousseau (1712-1778) preconizan una revolución social que empezará a
tener sus efectos a partir de 1789 con la Revolución Francesa. En 1775 “El barbero de
Sevilla” de Beaumarchais: una de las primeras caracterizaciones simpáticas del sirviente.
A partir de los inicios del S. XIX: el interés por el mundo rural creció progresivamente.
Obras de los hermanos Grimm en Alemania. Charles Dickens en Inglaterra y la misma
obra pedagógica de Pestalozzi (1746 – 1827) en Suiza.
Durante todo el S. XIX proliferaron los informes y narraciones de viajes : vida de los
habitantes de las colonias en ultramar; en este contexto emerge la antropología, con
lo cual se presta atención científica al estudio de estos grupos sociales y tribus
desconocidas hasta entonces.
Se empieza a denominar etnografía a una descripción monográfica de gente ethno (del
griego “otros”). En esta época aparecieron una serie de “biografías de bebés” siendo el
autor más destacado Charles Datwin (1884-1942).
En 1914 Bronislaw Malinouwski (1884-1942) visitó por primera vez Nueva Guinea.
Permaneció varios años, especialmente en las Islas Trobriand . Durante su estancia tuvo
contacto directo con las sociedades primitivas.
3
La obra de Malinowuski (1922) revolucionó el campo de la antropología social. Sus
descripciones incluyen el comportamiento explícito e inferencias sobre el conocimiento
cultural implícito (creencias), que los mismos indígenas eran incapaces de expresar. El método de investigación era la observación participante y la entrevista en profundidad.En la concepción de Freud (1856-1939), igual que en en Malinowski, las personas saben
mucho más de lo que son capaces de expresar. El psicoanálisis es una forma de
entrevista en profundidad para llegar al inconsciente, el cual constituye una fuente de
conocimiento para interpretar aspectos no manifiestos de la mente.
La teoría social alemana distinguía entre ciencias naturales y ciencias humanas. Dilthev
(1833-1911) argumenta que los métodos de las ciencias humanas deben ser
hermenéuticos o interpretativos.
La ciencia social alemana pone el énfasis en el “punto de vista del actor”. La
introspección se considera válida como método científico.
En una dirección contraria se movía la teoría social francesa, con Comte (1795-1857) y
Durkheim (1858-1917), mucho más próxima a las ciencias naturales. Lo que interesa son
los “hechos sociales”.
En síntesis, LA INVESTIGACIÓN CUALITATIVA TIENE SUS ORÍGENES EN LA ANTROPOLOGÍA, pretende una comprensión holística, no traducible a términos
matemáticos, y pone el énfasis en la profundidad. Mientras que la investigación
cuantitativa tiene sus orígenes en la sociología y en las ciencias físico-naturales,
parcializa la realidad para facilitar el análisis, y pretende estudios extensivos sobre
muestras representativas de sujetos.
Los principales creadores de la ciencia antropológica: Lévy-Bruhl (1857-1939), seguidor
de Durkheim, que contribuyó al esclarecimiento de las formas primitivas de la vida mental
del hombre. Radcliffe-Brown (1881-1955), con importantes aportaciones a la etnología en
la corriente del funcionalismo. Lévi-Strauus (1908- ), con el estructuralismo, que aglutina
la lingüística de Jakobson, el inconsciente de Freud y la etología de Radcliffe.Brown.
Margaret Mead (1901-1978) durante los años veinte realizó unos estudios
antropológicos en Samoa (Mead,1972), que pueden considerarse como la primera
aplicación de la etnografía al campo educativo. Al mismo tiempo es uno de los primeros
estudios que tratan de la educación fuera del contexto escolar.
El empleo de métodos cualitativos se divulgó gracias a la “Escuela de Chicago”, entre
1910 y 1940. Destacan la sociología urbana de Park, Burgess y otros; historias de vidas
criminales y delincuentes juveniles por Shaw, Sutherland y otros; estudios etnográficos
4
sobre inmigrantes a los Estados Unidos por Warner, Whyte, Thomas y otros. En estos
estudios se utilizó la observación participante y la entrevista informal.
Después de la II GUERRA MUNDIAL HUBO UN PREDOMINIO DE LA METODOLOGÍA CUANTITATIVA. LOS ESTUDIOS CUALITATIVOS QUEDARON EN EL OLVIDO EN MUCHAS UNIVERSIDADES. Precisamente en esta época Spindler y
Kimball inician estudios etnográficos aplicados a la educación.
Durante los años 60 empiezan a realizarse numerosas investigaciones de carácter
cualitativo, principalmente en Estados Unidos y Gran Bretaña. En este último país
citamos el liderazgo de STENHOUSE (1926-1982) y las aportaciones de ELLIOT en la
línea de investigación-acción.
Durante los años 80 se observa un creciente interés por la metodología cualitativa
aplicada a la investigación educativa.
CARACTERÍSTICAS DE LA INVESTIGACIÓN EDUCATIVA. Como características generales comunes que se engloban en la metodología cualitativa
podemos señalar las siguientes:1- El investigador como instrumento de medida : En la Investigación Cualitativa el
investigador es el instrumento de medida. Todos los datos son filtrados por el criterio del
investigador.
Por consiguiente los resultados pueden ser subjetivos. Para evitar este peligro, el
investigador debe adiestrarse en una disciplina personal, adoptando una “subjetividad
disciplinada”, que requiere auto-conciencia, examen riguroso, reflexión continua y
“análisis recursivo”. La “comprensión intersubjetiva” es otro procedimiento que se suele
utilizar: el investigador explicita los aspectos subjetivos a los participantes en el estudio;
esto produce una búsqueda de profundización en la comprensión de las experiencias de
los sujetos. También puede emprender el uso sistemático del criticismo externo y la
ayuda de críticos. El criticismo externo consiste en un cambio constante de rol interno-
externo. La “triangulación” es una de las estrategias más utilizadas.
2.- Estudios intensivos en pequeña escala: Se trata de estudios en pequeña escala
que sólo se representan a sí mismos. Se basa en la exploración intensiva de unos pocos
casos. En investigación educativa, suelen estudiarse las situaciones normales de clase
en un ambiente natural.
3.- Teorías e hipótesis: No suele probar teorías o hipótesis. Es, más bien, un método de
generar teorías e hipótesis.
5
4.- No tiene reglas de procedimiento: El método de recogida de datos no se especifica
previamente. Las variables no quedan definidas operativamente, ni suelen ser
susceptibles de medición. La base está en la intuición y en los aspectos artísticos del
producto. La investigación es de naturaleza flexible, evolucionaria y recursiva.
5.- Holística: Abarca el fenómeno en su conjunto. No se detiene en dividirlo en variables
o en discernir entre ellas.
6.- Recursiva.: El diseño de investigación es emergente: se va elaborando a medida que
avanza la investigación. El problema inicial se va reformulando constantemente para
confirmar que los datos recogidos contribuyen a la interpretación del fenómeno. Cuando
se encuentran desajustes importantes, se puede replantear el problema adoptando las
modificaciones que se consideren oportunas.
7.- Categorización: Para categorizar suelen preguntar frecuentemente “¿Qué es un
ejemplo....?. Van clasificando datos preguntándose “¿A qué grupo pertenece esta
categoría?
8.- Análisis estadístico: En general no permite un análisis estadístico. A veces, pueden
hacer recuentos de frecuencias y categorizaciones; pero solamente cuando se está muy
seguro de lo que se cuenta.
9.- Serendipity: Se pueden incorporar hallazgos que no se habían previsto (serendipity).
10.- Emocionalmente satisfactoria: Es importante asegurarse de que están hablando
la voz de “su gente”. Es democrática o incluso populista.
INVESTIGACIÓN CUALITATIVA VERSUS INVESTIGACIÓN CUANTITATIVA.La investigación cuantitativa se basa sobre muestras grandes y representativas de
sujetos. Son estudios extensivos que utilizan la estadística en el análisis de datos. Hasta
los años cincuenta predomina el método cuantitativo en investigación educativa. A partir
de entonces empiezan a surgir críticas y alternativas, aunque con un predominio claro de
la metodología cuantitativa. No es hasta la década de los ochenta cuando irrumpe
vigorosamente la metodología cualitativa.
La investigación cualitativa se basa sobre una muestra reducida de sujetos,
seleccionados por algún método generalmente no probabilístico. Son estudios extensivos
y en profundidad.
Recientemente ha surgido una polémica entre partidarios de ambos enfoques, que, por
otra parte, ya había surgido en ocasiones anteriores. Tenemos las dicotomías siguientes:
positivismo contra fenomenología, el método hipotético-deductivo contra el inductivo,
metodología cuantitativa contra metodología cualitativa, paradigma racionalista contra
6
paradigma naturalista, investigación nomotética contra investigación ideográfica,
comprensión contra interpretación, cuantificadores contra descriptores, científicos contra
críticos, rigor contra intuición, evaluación dura contra evaluación blanda, etc.
El debate cualitativo versus cuantitativo se ha convertido, para muchos, en debate sobre
la concepción de la realidad social. A este nivel, los puntos de vista pueden llegar a ser
irreconciliables.
PARADIGMA CUALITATIVO PARADIGMA CUANTITATIVO
Aboga por el empleo de los métodos
cualitativos.
Fenomenologismo “interesado en
comprender la conducta humana desde
el propio marco de referencia de quien
actúa”.
Observación naturalista y sin control.
Subjetivo.
Próximo a los datos: perspectiva desde
“dentro”.
Fundamentado en la realidad, orientado
a los descubrimientos, exploratorio,
expansionista, descriptivo e inductivo.
Orientado al proceso.
Válido: datos “reales”, “ricos” y
“profundos”.
No generalizable: estudios de casos
aislados.
Holista.
Asume una realidad dinámica.
Aboga por el empleo de los métodos
cuantitativos.
Positivismo lógico: “busca los hechos o
causas de los fenómenos sociales,
prestando escasa atención a los estados
subjetivos de los individuos”.
Medición penetrante y controlada.
Objetivo.
Al margen de los datos: perspectiva
“desde fuera”.
No fundamentado en la realidad,
orientado a la comprobación,
confirmatorio, reduccionista, inferencial e
hipotético-deductivo.
Orientado al resultado.
Fiable: datos “sólidos” y repetibles.
Generalizable: estudios de casos
múltiples.
Particularista.
Asume una realidad estable.
7
Sin embargo, si nos limitamos al aspecto metodológico, ambos enfoques pueden ser
complementarios. Si bien esta posibilidad no está exenta de dificultades. Muchas de ellas
debidas a distintos enfoques y puntos de vista que adoptan los teóricos que se ocupan
del tema. Es decir, la inconmensurabilidad (Feyerabend, 1981: 118-133), según la cual
las interpretaciones científicas dependen del marco teórico. Así, por ejemplo, Gage
(1978), entre otros defiende un orden de estudios en el cual la descripción general
cualitativa de un reducido número de casos es el primer estadio de investigación.
Después se identifican las variables importantes y los constructos subyacentes, se
realizan estudios correlaciones proceso-producto en gran escala. El último estadio
consiste en investigaciones experimentales controladas para establecer el
encadenamiento causal entre las variables. Estos estadios suponen una colaboración
entre la investigación cualitativa y la cuantitativa.
En la dirección opuesta, Erikson (1986) reclama que toda generalización basada en
estudios correlacionales o experimentales, debe ir seguida de estudios etnográficos
particulares y concretos. Esto ejemplifica como en este punto no hay acuerdo en la
concepción teórica de la investigación educativa.
Deutscher (cit. por Taylor y Bogdan, 1986:134) señala que uno sólo puede entrenarse en
algo que ya existe. Mientras que ser educado consiste en aprender a crear de un modo
nuevo. Debemos crear constantemente nuevos métodos y enfoques. C. Wright Mills (cit.
por Taylor y Bogdan, 1986. 134) recomienda: que el investigador sea un buen artesano.
Evite un conjunto rígido de procedimientos. Sobretodo trate de desarrollar y aplicar la
imaginación. Eluda el fetichismo del método y la técnica. Que cada uno sea su propio
metodólogo.
Podemos insistir en que el método es importante como guía, teniendo también presente
la creatividad.
Cook y Reichardt (1986) aportan argumentos para demostrar que la investigación
cualitativa y la cuantitativa son compatibles, o incluso complementarias. Si interesa más
el proceso se recomienda utilizar métodos cualitativos. Si interesa más el producto se
recomienda utilizar métodos cuantitativos. Con Cook y Reichardt (1986) y De
Lansdsheere (1982: 23-43) coincidimos en apuntar que ambos enfoques tienen su
campo de aplicación , sus objetivos y funciones. Los métodos cuantitativos y cualitativos
deben complementarse.
2.1.2. Tipos de diseños: pre-experimental, experimental y cuasi-experimental
8
DISEÑO DE INVESTIGACIÓN EXPERIMENTAL Es uno de los diseños que más se utiliza en investigación educativa y psicopedagógica.
El término diseño alude al Plan de investigación y a los aspectos metodológicos.
El diseño es la estructura en la que las variables y los sujetos han sido organizados para
recoger datos y responder a las preguntas de investigación.
La investigación responde a:
1. QUIEN: participantes (están implicados)
2. POR QUÉ: causa
3. CÓMO: efecto (cómo ha ocurrido)
4. DÓNDE: contexto (dónde se hace la investigación)
5. QUÉ: observaciones (que ha ocurrido)
6. CUANDO: procedimiento (cuando ha ocurrido)
El diseño requiere tomas decisiones que garanticen las relaciones entre la causa y el
efecto, eliminando explicaciones alternativas poco relevantes.
La decisión sobre el tipo de investigación es cuestión del equilibrio entre la validez
interna (establece relaciones causales) y la externa (capaz de generalizar). Las
investigaciones en ambientes naturales ganan en validez interna y es propia de los
laboratorios.
Un diseño debería maximizar la validez interna y la externa. Aunque un investigador
debe ser realista y ajustar la planificación a los objetivos e hipótesis planteadas, es decir,
un diseño apropiado a la investigación.
Las investigaciones que se realicen deben acercarse lo más posible a la realidad del
aula, aunque ha de tenerse en cuenta que no existe el diseño ideal.
Tipos: Pre-experimentales, experimentales, Cuasi-experimentales y de caso único.
NOMENCLATURA: O: medida de la variable dependienteO1: antes de aplicar el tratamientoO2: después del tratamientoX: variable independiente
9
Z: indica que los sujetos no han sido elegidos al azar a los grupos experimentales y de controlR: los sujetos han sido elegidos al azar y asignados al azar a los grupos experimentales y de controlVI: variable independienteVD: variable dependiente
DISEÑOS PREEXPERIMENTALES: Tienen bajo nivel de control y baja validez interna y externa. El investigador no puede
saber con certeza que los efectos que se producen en la variable dependiente se deben
a la variable independiente.
A) DISEÑO DE UN SOLO GRUPO CON POSTEST. X OLa variable independiente sólo se aplica a un grupo de sujetos. Luego se somete al
grupo a un postest para ver los efectos en la variable dependiente. La ausencia de un
grupo control y de la información sobre el grupo viola los principios de la validez interna.
Este tratamiento no garantiza que X sea causa de O.
B) DISEÑO DE UN SOLO GRUPO CON PRETEST Y POSTEST. O1 X O2El efecto se comprueba comparando el postest con el pretest. La limitación del diseño
está en la no utilización del grupo control que impide saber si el tratamiento u otros
factores son los que han producido las diferencias entre los dos momentos evaluados. Ej:
factores cómo la historia, maduración, aplicación de pruebas,…
Este diseño sirve para estudiar las variaciones en determinadas variables que sólo
cambiarían si se interviniese sobre ellas. La secuencia de aplicación O1XO2 debe ser
cercana para evitar variables extrañas.
C) DISEÑO DE DOS GRUPOS CON POSTEST AL GRUPO EXPERIMENTAL Y AL GRUPO DE CONTROL. X O1 ---------- O2Los grupos no son equivalentes. Los sujetos de uno y otro grupo podrían no ser
comparables en las características más relevantes. Algunos autores consideran este
diseño cuasiexperimental.
El grupo experimental recibe tratamiento y postest y el grupo control sólo postest. La
incorporación del segundo grupo permite controlar factores de invalidez. La línea
10
discontinua indica que los sujetos no han sido elegidos al azar. La ausencia de pretest no
garantiza que los grupos sean equivalentes.
DISEÑOS EXPERIMENTALES Este tipo de experimentos realiza un control de todos los factores que afectan:
Validez interna: garantizan la interpretalidad del experimento
Validez externa: garantiza su generalización.
A) DISEÑO POSTEST CON GRUPO DE CONTROLR X O1R PLACEBO O2Los sujetos son elegidos al azar de la población y asignados también al azar a los grupos
experimental y de control. No se aplica pretest a ninguno de los dos grupos. Hay
situaciones en investigación educativa dónde no es conveniente la aplicación del pretest,
por eso este diseño en apropiado.
B) DISEÑO PRETEST-POSTEST CON GRUPO DE CONTROLR O1 X O2R O3 O4
Este diseño es de los más completos en investigación experimental. Incluye la medida de
la variable dependiente en un pretest, la aplicación del tratamiento al grupo experimental
y la medida de la variable dependiente en un postest. La medida de la variable
dependiente en el pretest y en el postest se hace al mismo tiempo a los dos grupos
(experimental y de control). La asignación de los sujetos a los grupos de hace al azar.
Este es uno de los diseños que tienen mayor control sobre los factores que afectan a la
validez interna. Lo peor controlado de este diseño es que la aplicación del pretest
sensibiliza a los sujetos, y esto afectará a los resultados del postest.
C) DISEÑO SOLOMON CON CUATRO GRUPOSR O1 X O2R O3 O4R X O5R O6
11
Es una combinación de los dos diseños anteriores. Este diseño permitirá que los
resultados puedan generalizarse también a los sujetos que no han recibido pretest.
Este diseño consta de 4 grupos. 2 grupos reciben pretest y 2 que no lo reciben.
Igualmente 2 grupos reciben tratamiento y otros 2 no lo reciben. El mayor problema es
que exige un importante número de sujetos para formar los 4 grupos.
DISEÑOS CUASI EXPERIMENTALES
La característica de este diseño es que el investigador no puede hacer la asignación al
azar de sujetos a los grupos experimental y de control. Sin embargo, puede controlar:
Cuándo llevar a cabo las observaciones
Cuándo aplicar el tratamiento o variable independiente
Cuál de los grupos recibirá el tratamiento.
Los diseños experimentales controlan las amenazas que afectan a la validez interna
(causa – efecto), los cuasiexperimentales controlan la validez externa (generalización)
A) DISEÑO CON GRUPO CONTROL NO EQUIVALENTE Y PRETESTO1 X O2 ----------------- O3 O4
Es de los diseños más utilizados en educación por las facilidades de no depender de la
elección de los sujetos al azar para la muestra. Para minimizar las diferencias que
pueden existir entre el grupo experimental y el grupo de control se pueden asignar los
participantes a uno u otro grupo al azar, con lo que se logra la equivalencia entre ambos
grupos. En el caso de que esto no fuese posible, al investigador aún le queda la
posibilidad de asignar al azar el grupo que recibirá el tratamiento y el grupo que hará de
control.
Este diseño incluye dos grupos, uno de control y otro experimental, a los que se les ha
aplicado pretest y postest al mismo tiempo.
La no asignación al azar de los sujetos a los grupos experimental y de control viene
indicada por la línea discontinua. El grupo experimental recibe el tratamiento o variable
12
independiente. El grupo de control puede recibir no tratamiento, un placebo o un
tratamiento alternativo.
Con este diseño si el investigador sospecha o comprueba que existen diferencias
iniciales en la medida de la variable dependiente, puede hallar la media de cada uno de
los grupos y determinar realmente cuánto de debe a las diferencias iniciales y cuanto al
tratamiento.
B) DISEÑO DE SERIES TEMPORALESO O O X O O O
Este diseño sólo incluye un grupo. La variable dependiente es medida antes y después
del tratamiento varias veces.
Este diseño es similar al de diseño de un solo grupo con pretest y postest, pero éste es
más potente gracias a las múltiples medidas que se efectúan antes y después del
tratamiento.
Este tipo de diseño es especialmente útil en aquellas investigaciones dónde, al no sep
posible la inclusión de un grupo de control, se quieren ver los efecto de un tratamiento de
forma inmediata, a medio y a largo plazo. Por ejemplo, en los programas de intervención
para la mejora o cambio de conducta.
Aunque este diseño controla más factores que amenazan la validez interna, aún quedan
otros factores que pueden afectarla, por ejemplo la historia o la mortalidad.
C) DISEÑO COMPENSADOA X1 O X2 O X3 OB X2 O X3 O X1 OC X3 O X1 O X2 O
En este diseño se aplican todos los tratamientos a todos los grupos que intervienen en la
investigación. Este tipo de diseños se utiliza cuando hay varios tipos de tratamientos para
analizar. La novedad está en que cada grupo es expuesto al tratamiento en momentos
diferentes.
13
En caso de que los sujetos pudiesen asignarse al azar a los grupos, estaríamos ante un
diseño de corte experimental. El uso de este tipo de diseño es apropiado en los casos en
los que la aplicación de un tratamiento no afecta a la aplicación del siguiente tratamiento.
Ejemplo: Estudio de los efectos de la cafeína sobre la capacidad de concentración, en la
realización de tareas como el tachado de letras. El tratamiento podría aplicarse a los
mismos grupos suministrando cantidades diferentes de cafeína, o incluso un placebo.
La secuencia a seguir sería: aplicación de todos los tratamientos a todos los grupos en
orden diferente dejando un espacio de tiempo y medida de la variable dependiente
después de cada tratamiento.
2.2 Pasos para conducir la investigación experimental
INTRODUCCIÓN Existen diferentes tipos de investigación, como la histórica o la descriptiva, pero en la que
nos vamos a centrar es la Investigación Experimental.
En este tipo de Investigación, el investigador controla y manipula las condiciones que
determina la aparición de un fenómeno. Es decir, un experimento supone un cambio en
la llamada variable independiente y la observación de los efectos que este cambio
produce en las variables dependientes.
Los pasos a seguir para llevar a cabo una Investigación Experimental:
2.2.1 PLANTEAR EL PROBLEMA. Este problema además de ser relevante, ha de cumplir una serie de condiciones:
expresar la relación entre dos o más variables; tener un planteamiento claro y formulado,
a ser posible, en forma de pregunta; permitir una verificación científica; incluso es
necesario que esté bien delimitado para no extenderse innecesariamente.
2.2.2 BÚSQUEDA DE INFORMACIÓN.Una vez identificado el problema es necesario proceder a una búsqueda de información.
En este sentido podemos recurrir a:
- Revisión de los índices de las revistas especializadas.
- Consulta de los índices bibliográficos como el ERIC (Educational Research
Information Center), RIE (Resources in Education), Education Index….
14
- Consultar tesis doctorales.
Este es un paso importante para conseguir un marco de referencia conceptual, además
de ayudarnos a entender en que punto se encuentra la cuestión que pretendemos
investigar.
2.2.3 FORMULACIÓN DE HIPÓTESIS.
Una hipótesis, es una conjetura sobre la posible relación entre variables. Esta ha de
cumplir una serie de requisitos:
- Comprobable empíricamente.
- Estar en relación con el marco teórico y con el marco de investigación.
- Cumplir el principio de parsimonia.
- Ser precisa, específica y expresarse con simplicidad lógica.
- Ser descriptiva debe intentar explicar el fenómeno.
- Ser susceptible de cuantificación.
- Ser generalizable.
- Tener consecuencias.
Elementos que componen una hipótesis.- Unidad de análisis: objeto cuyo comportamiento se desea estudiar.
- Variables: características cuantitativas o cualitativas de las unidades de análisis.
- Elementos lógicos.: nexos que relacionan las unidades de análisis con las variables y
las variables entre sí.
Existen diferentes tipos de hipótesis que podemos clasificar en dos subgrupos: Según la forma de su enunciado pueden clasificarse en:A) hipótesis nulas: hipótesis según la cual las diferencias encontradas entre dos
sucesos que se deben al azar.
B) hipótesis alternativas. Es la afirmación que el investigador espera apoyar. Según
esta hipótesis, es improbable que las diferencias se deban al azar, luego los efectos
encontrados se atribuyen a la variable independiente.
Según el número de variables y las relaciones que se hacen en ella:A) Hipótesis descriptivas que involucran una sola variable: describen la presencia o
ausencia de ciertos hechos en la población.
15
B) Hipótesis descriptivas que relacionan dos o más variables. La investigación
correlacional valora el grado de relación.
C) Hipótesis que relacionan más o dos hipótesis en términos de dependencia. D) Hipótesis de la diferencia o de la intervención. E) Hipótesis de la diferencia en la investigación ex post facto. Se observan las
diferencias en base a una variable que ya posee el sujeto.
2.2.4 METODOLOGÍA DE RECOGIDA DE DATOS.Lo primero que tenemos que hacer es definir las variables, en este sentido podemos
diferenciar entre constructos y variables:
Constructo: conceptos formales que se utilizan en las investigaciones científicas.
Variable: característica o cualidad de la realidad que es susceptible de asumir
diferentes valores.
Ambos conceptos están íntimamente relacionados: los constructos son variables no
observables directamente por el observador. Para estudiarlos se analizan variables como
indicadores de ese fenómeno no observable.
Clasificación de las variables:
Tipos de variables según su función :◦ Variable Independiente : aquella que se supone ser la causa del fenómeno
estudiado. Es la que el investigador manipula.
◦ Variable Dependiente : es la que se trata de cambiar mediante la manipulación de la
variable independiente.
Según su manipulación:◦ Variable Interviniente : características que afectan al resultado que se espera.
◦ Variable Moderadora : variable independiente, secundaria. Se utiliza para saber si
afecta la relación entre la variable independiente primaria y las variables
dependientes.
16
◦ Variables de Control : es la variable que el investigador controla para eliminar sus
efectos en la variable dependiente.
Según su Naturaleza:◦ Variables Cualitativas : cualidad no medible de un fenómeno.
◦ Variable Cuantitativa : características asociadas a un valor numérico, además se
pueden presentar en grados de intensidad, es decir, admiten una escala numérica de
medición.
Según su nivel de medición:◦ Nominal: sus valores no obedecen a una ordenación intrínseca. Hace referencia a
categorías excluyentes.
◦ Ordinal: sus valores obedecen a una ordenación intrínseca. Hace referencia a un
continuo con grados de menos a más.
◦ Escala: encontramos dos tipos:
◦ Discreta: expresada sin decimales.
◦ Continua: expresada con decimales.
Cuando se identifican las variables, el siguiente paso es su operacionalización, es
decir, hay que hacer operativa una variable. Para ello, se da un nombre a la variable y
definen los indicadores (elementos más concretos de una variable, pueden ser uno o
varios).
A continuación se establece el tamaño de la muestra. Es fundamental asegurar su
representatividad para poder llegar a conclusiones que sean generalizables.
Ante esto, nos encontramos dos tipos de muestreo:
Muestreo probabilístico: basado en el principio probabilístico de
equiprobabilidad (azar). Existen cuatro tipos:
17
o Aleatorio simple : consiste en asignar a cada individuo un número y seleccionarlo
a través de algún sistema mecánico.
o Aleatorio sistemático : Se ordenan los individuos de la población y se calcula un
coeficiente en función del tamaño. Eligiendo posteriormente el número al azar,
tomando dicho número como referencia de una serie.
o Aleatorio estratificado : divide la población en estratos y dentro de cada estrato
se realiza un muestreo. El número de individuos se decide por: afijación simple (en
partes iguales), afijación proporcional, y afijación óptima (según la dispersión).
o Muestreo por conglomerados : los individuos constituyen una agrupación natural.
Muestreo no probabilístico: basado en criterios de selección de la muestra
dependiendo de la intencionalidad que se tenga.
o Por cuotas: número de individuos que cumplen una serie de condiciones.
o Intencional: selección realizada por expertos siguiendo unos criterios
establecidos.
o Casual: Se utiliza como muestra a gente voluntaria y/o de fácil acceso.
o Bola de nieve: se localizan los individuos y estos conducen a otros.
o Por etapas: combina diferentes tipos de muestra.
Una vez vistos los diferentes tipos de muestreo, se decide el tamaño de la muestra a
estudiar. Para ello, se tienen en cuenta que la elección del tipo de diseño sea una
cuestión de equilibrio entre la validez interna del diseño y la validez externa, así como el
control de ambas.
Factores que afectan la validez interna: Historia. Al aplicar un tratamiento en el experimento, puede haber algunos factores
ajenos al experimento que afecten a la variable dependiente y por consecuencia el
efecto del tratamiento se mitiga.
Maduración o cambios psicológicos o biológicos que los participantes sufren
mientras se está llevando a cabo la investigación.
Aplicación de instrumentos similares en otros experimentos.
18
Selección no azarosa de los participantes.
Mortalidad experimental.
Expectativas que posea el investigador.
Factores que afectan a la validez externa: Validez de la población.
Validez de los constructos o capacidad de generalizar desde conductas
manifiestas a conductas de orden superior.
Validez ecológica:
◦ Problemas de generalización desde unas condiciones ambientales a otras
completamente distintas.
◦ Interferencias entre los tratamientos utilizados.
◦ Efectos debido a la novedad del tratamiento o a cambios de conducta en el
sujeto por sentirse observados.
◦ Efecto del experimentador en función de su experiencia o manera de
ejecutar su trabajo.
En función del grado de control y validez encontramos distintas clasificaciones:
Diseños pre-experimentales.
Cuasi experimentales.
Experimentales.
Factoriales.
Caso único.
– Diseños preexperimentales (Menos control)
o Diseño de un solo grupo con postest
o Diseño de un solo grupo con pretest y postest
o Diseño de dos grupos con postest al grupo experimental y al grupo de control.
– Diseños cuasiexperimentales (sin control muestral pero con control en otras
variables).
o Diseño con grupo de control no equivalente y pretest
o Diseño de series temporales
o Diseños factoriales
19
o Diseño correlacionales
- Diseños experimentales (Ver 2.1)o Diseño postest con grupo de control.
o Diseño de Pretest-Postest con grupo de control.
o Diseño Solomon con cuatro grupos
.
2.2.5 VALIDAR EL PROCEDIMIENTO EXPERIMENTALEsta validación se realiza a través de una serie de instrumentos tanto para la recogida de
los diferentes datos como para la medición en sentido estricto.
Dentro de los instrumentos de recogida de datos:– Para la observación se utilizan diferentes instrumentos de registro: anecdotarios,
listas de control, escalas de estimación, análisis de trabajo y escalas de producción.
Todos estos se manipularán a través de observación directa e indirecta por parte del
examinador.
– Para las encuestas se utilizarán: cuestionarios e inventarios, entrevistas y
técnicas sociométricas. Entre ellas se complementan para la mejor obtención de los
datos, ya que unas sin las otras no tendrían mucha fiabilidad.
Dentro de los instrumentos de medición en sentido estricto (test):– Para medir las aptitudes, nos encontramos con pruebas de inteligencia general tanto
verbal como no verbal o mixta. Para medir aptitudes diferenciadas podemos medirlas
gracias a diversas baterías: razonamiento, creatividad, percepción, memoria, destreza
manual, aptitudes profesionales, espaciales, numéricas, verbales y artísticas.
– Para medir la personalidad, intereses y actitudes de adaptación, nos encontramos
con: cuestionarios e inventarios de personalidad, escalas de actitudes, test
proyectivos, intereses vocacionales de estilos cognitivos.
20
– Para medir el rendimiento pedagógico tanto externo como interno, tenemos
baterías de pruebas de capacidades, baterías de lectoescritura, baterías de hábitos
de estudio y otras pruebas más objetivas de rendimiento que uno mismo puede crear.
2.2.6 ANÁLISIS ESTADÍSTICO DE LOS DATOS
El siguiente paso dentro de la investigación experimental, es el análisis estadístico de los
datos obtenidos. Dentro de este, comenzamos con la estadística descriptiva de los datos
recogidos en el cuestionario.
Estos datos pueden ser cuantitativos o cualitativos. Si son datos cuantitativos podemos
realizar descripciones gráficas de las variables más representativas (polígonos de
frecuencia, curva normal) y descripciones numéricas (media, moda y mediana). Si son
datos cualitativos se realizan descripciones gráficas (histograma) y descripciones
numéricas (tablas de frecuencia y contingencia).
Seguidamente, y si procede, se realizaría una estadística inferencial para generalizar los
resultados de nuestra muestra a la población.
Un último paso se refiere a las técnicas estadísticas avanzadas o meta-análisis, es decir,
se evalúa el rigor técnico de todas las investigaciones que se han realizado sobre un
área en concreto (analizar lo analizado).
2.2.7 CONCLUSIONES. EL INFORME DE INVESTIGACIÓN El último paso para finalizar la investigación experimental, es la redacción de un informe
escrito, en el que se recoge todo lo realizado a lo largo del proceso del experimento.
Gracias a este documento, se podrá informar a la comunidad científica de lo que se ha
hecho y como se ha llevado a cabo el trabajo.
Se deben recoger los siguientes puntos:
1. RESUMEN (debe ser entre 10-15 líneas y que recoja objetivos, técnicas e
instrumentos y resultados)
2. INTRODUCCIÓN1. Revisión de las fuentes (escalas utilizadas además de la existencia de
otras)
2. Propósito, Objetivos
3. METODOLOGÍA1. Población, muestra
21
2. Diseño llevado a cabo
3. Materiales utilizados
4. Procedimiento seguido
4. RESULTADOS OBTENIDOS (numéricos y objetivos)
5. DISCUSIÓN Y CONCLUSIONES6. REFERENCIAS BIBLIOGRÁFICAS (las que creemos que pueden ser útiles
además de las utilizadas)
7. ANEXOS Y APÉNDICES
Una vez realizado este informe, podemos dar por terminada nuestra investigación
experimental para posteriormente sacar conclusiones que nos lleven a otros futuros
estudios.
2.3. EXPERIMENTOS DE CASO ÚNICO 2.3.1. Características de los experimentos de caso único:
¿Un experimento de verdad con un solo sujeto?
Siguiendo los criterios de los métodos experimentales tenemos que comprobar que se
cumplen los tres requisitos para determinar que se trata de un experimento:
a.- Se produce covariación entre la V.D y la V.I.
b.- La aplicación y medida de las condiciones de la V.I anteceden a la medida de la VD.
c.- Otras variables, distintas a la V.I, son descartadas como posibles explicaciones de los
cambios observados en la variable dependiente.
¿Cuándo utilizar los diseños de caso único?- Cuando es difícil encontrar grupos de sujetos con el mismo diagnóstico.
- En muchas circunstancias clínicas es muy difícil encontrar sujetos para formar un
grupo de control, y aunque lo tuviéramos a veces aparecen problemas de carácter ético
(¿cómo hacer un grupo control con enfermos de SIDA, dejando a un grupo sin
tratamiento mientras la enfermedad avanza?)
- Cuando el sujeto establece un compromiso con el terapeuta, desea que el
tratamiento sea efectivo con él, independientemente de cómo pueda decir la literatura
22
que ha funcionado en la 95% de los casos informados. Comprobar la eficacia de una
intervención en un cliente es un patrón común a la aplicación de diseños de caso único.
- Establecida la relación causal con el sujeto, se podría generalizar.
Cuando la investigación es sobre procesos muy básicos con clara base biológica, el usar
diseños con un solo sujeto es adecuado.
Fases en la experimentación de caso único.Existen tres fases comunes a todo diseño de caso único:
1º. Establecer la línea base.El conjunto de observaciones dentro de una condición (consumo de alcohol sin
tratamiento registrado durante varios días/, consumo con el tratamiento registrado
durante varios días); esto se denomina serie, y la serie, antes de la intervención, se
denomina línea base.
Se recomienda tomar una serie lo suficientemente grande para poder asegurar su
estabilidad.
2º. Aplicar la intervención.Esta fase supone de hecho dos acciones; la primera, intervenir en el sentido literal, y la
segunda registrar la serie correspondiente a la propia fase de intervención.
Ejemplo; si hemos iniciado el tratamiento con medicación, registrar el consumo de
alcohol en esta nueva fase.
3º. Interpretar los resultados.La interpretación de los resultados es uno de los puntos más discutidos en este tipo de
métodos. Dos puntos en los que se plantea el debate:
a.- En el primer punto se mezclan dos objetivos: El científico que busca descubrir
relaciones causales generales, y el terapéutico, cuya conducta es cambiar la conducta
del sujeto. Hay ocasiones en las que coinciden y otras en las que difieren. El terapeuta
interesado en el cambio de conducta independientemente de que en el proceso se haya
preocupado por la validez. Si el paciente deja de beber ambos estarán satisfechos,
terapeuta y paciente, independientemente del factor que haya intervenido (AA,
medicación), pero el investigador por el contrario está interesado en mostrar que una
intervención novedosa reduce de forma estadísticamente significativa una determinada
tasa de conducta.
23
b.- El segundo punto de debate se produce al determinar el nivel al que hay que
analizar los datos. Frente al criterio de significación estadística se defienden otros
criterios, basados en la inspección visual de los datos;
- La significación clínica; es el terapeuta en función de su experiencia el que decide
cuándo el cambio es relevante.
- La significación social; el patrón para evaluar el cambio se establece con arreglo a lo
que se admite que es el comportamiento de los sujetos normales.
Desde el punto de vista que defiende el análisis matemático (estadístico),
argumentan que la inspección visual puede ser clara cuando los resultados son
perfectos, pero que existen situaciones intermedias donde es más arriesgada la
interpretación.
2.3.2. Tipos de diseño de caso únicoCon un solo sujeto también hay varias posibilidades de organizar la administración de
condiciones experimentales. Posibilidades que dan lugar a varios diseños:
Diseño AB. ( A= fase sin tratamiento// B= fase con tratamiento)Es un plan en el que primero se establece la línea base – sin tratamiento- y una vez
establecida se produce la intervención y la medida de la nueva serie.
Es el análisis más simple y el más débil, y sólo se usará cuando sea imposible hacer una
retirada del tratamiento.
Ejm: Un niños con dislexia ¿ es posible que el niño se desaprenda con la finalización del
tratamiento y así probar la relación causal?. Éste y muchos casos parecidos sólo admiten
el esquema AB.
Diseño BABEste diseño se puede dar en las situaciones en las que es necesario una intervención
inmediata sin poder esperar a establecer una línea base.
24
Diseño ABAEste diseño menos frecuente en la clínica porque termina en una fase sin tratamiento,
aunque se puede utilizar en investigación básica. Por ejemplo, queremos comprobar la
asociación de la aparición de nauseas y vómitos con la medicación.
Estos diseños se denominan de vuelta atrás, retirada o inversión. La ventaja de este
diseño es que podemos poner de manifiesto la influencia de otras variables que han
actuado simultáneamente. Ejm; El propio cliente puede cambiar por el hecho de haber
decidido cambiar, esta reacción del cliente pude contaminar el experimento, y si el deseo
del experimentador es contrastar la eficacia del tratamiento, debería usar un diseño de
vuelta atrás.
Diseño ABAB.Es el más completo y el que más se suele utilizar en el diseño de caso único, alternando
fases sin tratamiento y con tratamiento sucesivas.
25
0
5
10
15
20
25
30
35
1
L
3 5 7
D
9 11
13
15L
17
19
21D
23
25
27
Con trat.
Sin trat.
Con trat.
0
5
10
15
20
25
30
35
1
L
3 5 7
D
9 11 13
15L
17
19
21D
23
25
27
Sin trat.
Con trat.
Sin trat.
Diseños de línea base múltiple.Una de las extensiones de los diseños anteriores y que tiene más uso en la psicología
clínica es el caso de los diseños de línea de base múltiple. No se mide la conducta a
extinguir, sino conductas que inciden en ésta. No se trata el alcoholismo con
condicionamientos químicos, sino con conductas incompatibles con la bebida
(indirectamente se producirá un descenso de la bebida).
Este diseño permite que al mismo tiempo que se establece la línea base de las
frecuencias de conductas asertivas del paciente, podamos establecer otras líneas base
de aquellas conductas que queramos sean.
Las características que permiten utilizar este tipo de diseño son:
1. Independencia de las conductas seleccionadas: la dependencia de una
conducta (2), respecto a otra (1) que esta siendo tratada, hará que produzcan cambios
en (2) antes que se aplique el tratamiento. Al producirse la modificación sin presencia de
la V.I, no podremos establecer la relación causal.
2. Similar sensibilidad de las conductas seleccionadas: las conductas en
estudio se deben poder afectar por las mismas variables: deben ser receptivas de igual
forma, si hubiera una variable enmascarada con la V.I, se pondría de manifiesto en las
conductas no tratadas.
Por lo tanto, y según lo anterior, se pueden dar tres tipos de diseño:
a) Varios registros del mismo individuo en diferentes condiciones: Un posible
ejemplo sería probar escalonadamente la eficacia del refuerzo, mediante fichas, de la
conducta asertiva de un individuo en casa, en el trabajo, y con sus amigos.
26
b) Diferentes variables del mismo individuo en una sola condición: Ej de ese tipo
son el caso del alcohólico al que se le refuerza la conducta asertiva y relajación antes de
la bebida.
c) Varios individuos observados en la misma variable y condición: Este tipo se
utiliza en instituciones cuando se le quiere cambiar la conducta a todos los pacientes de
similares características. La intervención se hace de sujeto a sujeto de forma
escalonada, comprobando que un sujeto mejora en comparación a la línea base del
resto.
2.3.3. Validez y limitaciones de los diseños de caso único.La validez interna de estos diseños depende, como en el caso de grupos, de la correcta
aplicación del método, del correcto control que permita asignar los cambios de la variable
dependiente a la independiente.
El diseño AB presenta incertidumbre sobre su validez interna, ya que no es posible
desechar explicaciones alternativas de variables enmascaradas con la variable
independiente. Una forma de escapar a esta limitación, es acumular evidencias con más
sujetos equiparados.
Respecto a la interacción sujeto/tratamiento, uno sujeto, por sus características
personales, puede reaccionar de una forma especial al tipo de tratamiento que le están
aplicando y hacer que sus respuestas sean mucho mejores o mucho peores que la de la
mayoría de los individuos, por lo tanto contaminará las conclusiones sobre el tratamiento
y por tanto sobre la generalización a otras personas. Esto conecta con la validez externa.
Las críticas a la validez externa: ¿ Cómo puede una sola persona representar al resto de
los mortales?.
- Estos diseños se utilizan mayoritariamente en poblaciones clínicas, el sujeto del
experimento suele representar bastante bien a los sujetos con el mismo síndrome.(Ejm:
respecto de la conducta fóbica en un sujeto, similar al de otro con la misma fobia)
- El que se hagan experimentos con un solo sujeto, no quiere decir que se renuncia
a utilizar grupos cuando se pueden agrupar resultados de casos individuales e informar
de ellos en grupo, diciendo por ejemplo cuál fue el % de casos que modificaron su
conducta.
¿Cuándo es inadecuado aplicar diseños de caso único?a.- Cuando es perfectamente posible aplicar diseños de grupos.
27
b.- Cuando la variabilidad de la conducta en la línea base es muy grande. Antes de la
experimentación hay que reducir la variabilidad, localizando las variables que producen
esa variabilidad. Este análisis previo puede hacer que se reenfoque el experimento. Ejm:
Si la frecuencia irregular de la bebida se explica por las diferencias diario/fin de semana;
esta observación fundamental para orientar el tratamiento y poder proceder al
experimento, centrándose en los registros del fin de semana.
b.- Cuando se necesita un informe de la eficacia de un tratamiento con objeto de utilizarlo
de forma generalizada en instituciones.
c.- Cuando hay que hacer estudios comparativos de la eficacia de varios tratamientos
alternativos. No podemos deducir la superioridad de un tratamiento porque el sujeto X
haya mejorado más que el Y.
2.4. EL ANÁLISIS EN LA INVESTIGACIÓN EDUCATIVA.
INTRODUCCIÓN.Sabemos que el conocimiento científico es un conjunto organizado de conocimientos
acerca de la realidad observable obtenidos por el método científico y susceptibles de ser
transmitidos y verificados. Es sistemático, empírico (parte de la realidad observable para
elaborar sus hipótesis y teorías), verificable, objetivo, comunicable y replicable,
provisional (Bunge, 1973), no es absolutamente exacto y se prefiere la explicación más
sencilla (parsimonia).
La investigación es el procedimiento por el cual se llega a obtener conocimiento
científico, pero no existe un método absolutamente seguro para eliminar el error en la
elaboración y validación de las teorías científicas, sino que tal procedimiento es relativo
según cada momento histórico e incluso según la naturaleza del conocimiento que se
trata de lograr (Sarramona, 1991).
Como indica Del Rincón et altri, 1995: 26. “En Ciencias Sociales la diversidad
metodológica posibilita el estudio de la realidad social desde diversas ópticas, ya que
ninguna perspectiva metodológica por sí sola responde totalmente a las preguntas que
pueden formularse en el contexto social.
Existe una gran variabilidad de los procesos investigativos en Ciencias Sociales referente
a:
- a sus opciones de ejecución.
28
- a la misma naturaleza del proceso.
Esos resultados pueden utilizarse como herramientas conceptuales para un análisis
general básico de las investigaciones educativas.
2.4.1. Algunos problemas centrales de la actual investigación educativa.El tema de la Investigación Educativa, con las recientes polémicas epistemológicas y
metodológicas se ha llegado a hacer difícil de tratar, se han multiplicado los puntos de
vista divergentes y han proliferado las nuevas propuestas.La Investigación Educativa se debate ahora entre dos extremos de riesgo:1) LA INTRANSIGENCIA.Que sólo considera válidas las investigaciones empírico-deductivas de base
probabilística.
2) LA ANARQUÍALigada a una concepción ambigua y excesivamente indefinida (que no distingue entre
investigación y literatura)
LA INVESTIGACIÓN QUE DESEAMOS NO ESTÁ EN NINGUNO DE AMBOS EXTREMOS.- Por una parte, la noción de investigar parece haber sido una degeneración del
empirismo lógico (no compartida por los más ortodoxos positivistas*)
* Los positivistas se esforzaron por elaborar mecanismos de ascenso desde el plano de
lo evidente hacia el plano de las teorías.
- Por otro lado la idea de investigación como verborrea incontrolada que parece
una degeneración a partir de ciertas propuestas de sustituir la tradicional metodología
por una ciencia “más anárquica y más subjetiva” (Feeyerabend, 1970:76)
No estamos de acuerdo sobre dónde debe ubicarse la investigación dentro de esos
límites extremos.
LOS DOS PROBLEMAS CENTRALES QUE SE DERIVAN, TANTO EN UNA PROYECCIÓN TEÓRICA COMO EN UNA PROYECCIÓN HACIA LA PRAXIS SON :
29
A) ¿Qué son los procesos de investigación? ¿Qué los distingue de otros procesos
que no lo son?
B) ¿Qué elementos definen la validez de las operaciones en una investigación ?
¿Cuáles son los criterios de aceptabilidad de unos resultados en relación con una
diversidad de opciones metodológicas?
En la práctica, este problema se traduce en una grave dificultad para la formación de
investigadores, no sólo a la hora de preparar los diseños instruccionales de los cursos de
investigación, sino también cuando se trata de orientar al estudiante acerca de qué
elección operativa es más adecuada en un determinado caso.
2.4.2. Conceptos esenciales para una descripción de los procesos de investigación: conocimiento-acción, socialización-sistematización . LA RELACIÓN CONOCIMIENTO-ACCIÓN.La producción de conocimientos, en cuanto producción de mapas representacionales del
mundo circundante, ha tenido la función elemental de apoyar el éxito en las acciones.
Estas a su vez, permitían someter a prueba los conocimientos asociados.
Del valor conceptual de la relación acción-conocimiento en la evolución humana se
derivan estos planteamientos importantes:
- El éxito de las acciones humanas depende estrictamente de la confiabilidad de los
conocimientos que las fundamentan.
- A través de la historia humana, la producción de conocimientos se va delimitando
y definiendo cada vez más como un proceso especializado orientado a apoyar el éxito o
la calidad de las acciones.
- El valor de la producción de conocimientos se mide, históricamente, en función de
su capacidad para generar acciones exitosas. El crecimiento de la técnica y la tecnología
se va asociando cada vez más, con el tiempo, a la confiabilidad de la investigación,
entendida como producción de conocimientos.
- Sabemos que los rudimentarios mapas representacionales producidos en las
remotas épocas de la historia humana difieren muy significativamente de los más
recientes, aquellos que hoy en día sintetizamos en la palabra “ciencia”. ¿Dónde radica
esa abismal diferencia?
Dos propiedades o características parecen suficientes para explicar la distancia entre el
conocimiento primitivo y la ciencia actual: sistematización y socialización.
30
ACCIONES Y CONOCIMIENTOS SISTEMÁTICOS-SOCIALIZADOS.La relación conocimiento-acción resulta sustancialmente modificado a través de esas dos
funciones o propiedades:
- Por un lado, tanto la acción como el conocimiento pueden ir creciendo en
“sistematización”.- Por otro lado, tanto la acción como el conocimiento, en conjunto o por separado,
pueden ir creciendo en socialización llegando a “institucionalizarse” o a formar
“instituciones”.
- Tendremos entonces acciones y conocimientos sistemático-socializados (como
la industria y la ciencia, por ejemplo).
Ejemplo de bajo nivel de sistematización: Los mecanismos de dominación entre los
hombres primitivos, así como los consecuentes mecanismos de defensa, comenzaron
siendo muy improvisados y desorganizados.
Eran problemas de cada individuo o, a lo sumo, de pequeños grupos de individuos (bajo
nivel de socialización).
Ejemplo de alta sistematización : la guerra de hoy en día que es un aparato
procedimental especializado y es también una estructura conformada con Ministerios de
Defensa y otros (alta socialización).
Este crecimiento de grados de sistematización y socialización en el plano de la acción
corre paralelamente al plano de los conocimientos y se explica por una interrelación entre ambos planos. El paso de lo que hacia el curandero a lo que hace el médico no se
explica sin la interdependencia con el paso de los conocimientos sobre magia e hierbas
a los conocimientos sobre anatomía, fisiología, etc. Y tanto la acción como el
conocimiento, se fueron transformando sobre la base de un notable incremento en los
niveles de sistematización y socialización.
2.4.3. La producción de conocimientos como estructura de “pregunta-respuesta”.Todo conocimiento es el producto de un acto en el que las cosas particulares del mundo,
visibles o constatables, se traducen en mapas o esquemas mentales generalizadores.
Mientras más abarcantes, universalizantes y abstractos sean tales esquemas, más
eficiente es el conocimiento en relación con la calidad de las acciones. Un niño que al
quemarse con la llama de una vela elabora un esquema generalizador, no volverá a
31
quemarse con la llama de una cocina, lo cual si le ocurriría si sólo elaborara un esquema
particular del hecho anterior.
Esto significa que el conocimiento más eficiente es aquél que correlaciona un hecho
concreto con la respectiva clase de hechos Así el conocimiento abstracto resulta potente
con respecto a lo nunca antes visto, es decir encierra un cierto carácter predictivo.
La necesidad de conocer o saber se expresa en términos de incógnitas las cuales, a su
vez, se expresan en términos de preguntas, de modo que la producción de
conocimientos puede entenderse:
1º) Como un acto de formulación de preguntas.
2º) Como un acto de formulación de respuestas.
La estructura “pregunta-respuesta” tipifica la clase de procesos de producción de
conocimientos, pero no como un binomio cerrado, sino más bien como un ciclo o espiral
que tiende a la expansión. Las preguntas parecen no generarse exclusivamente en el
campo de los hechos, sino más propiamente en el campo de las respuestas previamente
elaboradas, una vez que revelan contradicciones con ciertos hechos. De ahí que el progreso del conocimiento sistemático-socializado, más que una acumulación cada
vez más abultada de representaciones o esquemas, parece un trabajo de ajuste, corrección o refinamiento de respuestas. Más que a una conquista de verdades, se asemeja, como lo advirtió Popper (1982), a una búsqueda de errores
2.4.4. La producción de conocimientos en el individuo.El desarrollo del ser humano en términos de la relación conocimiento-acción, expuesta
en sentido filogenético, ocurre también a nivel individual u ontogenético.Investigar es algo que el hombre hace desde que nace, igual que comer y dormir. El ser
humano comienza organizando el mundo que lo rodea, tal como es captado
primariamente por sus sentidos, en lo que podría ser una 1ª Fase descriptiva (“¿qué es
esto? “), es una de las preguntas típicas del niño en edad temprana. Esta organización
del mundo circundante tiene la función de garantizar el éxito de sus acciones
individuales, en beneficio de su propia supervivencia ante un mundo que, en principio, le
es totalmente extraño.
En una segunda fase, el niño, progresivamente, va elaborando representaciones o
mapas cada vez más abstractos y universales.
Posteriormente, en la fase 3ª, establece relaciones entre clases de hechos, en lo que
podría ser una fase explicativa (“¿por qué?” es una pregunta típica de cierta edad).
32
Podríamos suponer que hay una especie de tipología de las personas según el método
cognitivo que privilegien o según su estilo de pensamiento. Esto acentúa el paralelismo
entre conocimiento común y conocimiento científico. La preponderancia que tuvieron en
la historia algunos “enfoques epistemológicos “tuvo algo que ver con la imposición del
estilo de pensamiento de los científicos prestigiados para ese momento. Esto se refuerza
si consideramos la aceptación que tuvo, incluso dentro de la filosofía analítica, la idea de
una Historia Externa en la dinámica de las teorías científicas (Lakatos, 1978; Carnap,
1992; Kuhn, 1970 y 1982; Stegmüller, 1983).
En esta evolución del ser humano se hace evidente la relación conocimiento-acción. Lo
que más en el fondo parece diferenciar el conocimiento científico del ordinario es el par
de relaciones: sistematización y socialización.
Desde una perspectiva teórica se derivan dos conclusiones:1.- Existe una fuerte correspondencia estructural, descriptivo-explicativa, entre el
aprendizaje o adquisición de conocimientos, a nivel individual, y los procesos de
investigación a nivel sistemático-socializado.
2- Como consecuencia, las variaciones psicológicas individuales de “estilo de
conocimiento” (o “estilo de pensamiento” o “estilo cognitivo) muy probablemente se
corresponden con los llamados “enfoques epistemológicos” en el ámbito de la
investigación y de la filosofía de la ciencia. Esto marcaría una decisiva conexión entre
ciencias cognitivas y epistemología, tal como planteó Piaget (1975), con las
implicaciones teóricas del caso.
2.4.5. E structura de los procesos de investigación .
Podemos concebir los procesos de Investigación desde dos perspectivas. En una se
hace abstracción de la línea de tiempo en la que ocurren los procesos de investigación
(análisis sincrónico) y en la otra se considera su dinámica (análisis diacrónico).
ESTRUCTURA SINCRÓNICA.Los procesos de investigación son analizables en dos grandes componentes: lo
“Extraestructural”, el plano de las relaciones sociocontextuales del proceso, y lo
“Lógico-estructural”, el plano de las relaciones internas.
EL COMPONENTE “EXTRA-ESTRUCTURAL” o sociocontextual se genera a partir de
los grandes macrocontextos sociales, nacionales e internacionales. En él aparecen, por
un lado, las influencias de tipo “Organizacional” (clima, estructuración, cultura,
33
liderazgos, tipo de aprendizaje organizacional, etc.) y , por otro lado, las influencias de
tipo “Personal” (estilo de pensamiento, prestigio, rol, posición social, actitudes, etc).
EL COMPONENTE “LÓGICO-ESTRUCTURAL” Se conforma sobre los datos del
anterior componente sociocontextual. Todo proceso de investigación se puede definir
como una proyección de cosas del mundo en esquemas representacionales abstractos y
universalizantes, por vía de una cierta rutina estratégico-operativa. Pues bien, esta
estructura remite a tres subcomponentes lógico-estructurales esenciales:
a) El subcomponente “Empírico”: es el espacio observacional o sector del
mundo que se intenta representar y que es objeto de estudio.
b) El subcomponente “Teórico”. Es la red de conocimientos o conjunto de
representaciones abstractas en que se proyecta el tema o espacio observacional de la
investigación.
c) El subcomponente “Metodológico”: Relaciona los dos subcomponentes anteriores.
Es la secuencia estratégico-operativa en virtud de la cual los elementos del
subcomponente “Empírico” se proyectan sobre los elementos del subcomponente
“Teórico”. Por esta razón, lo “Metodológico” actúa al estilo de una función matemática
que transforma valores de “E” (lo empírico) en valores de “T” (lo teórico). Así todo este
gran componente “Lógico-estructural” podría sintetizarse en una estructura del tipo:
M : E T.
En la lógica interna de los procesos de investigación opera un cuarto subcomponente, el
cual envuelve a los tres anteriores: es el componente “Textual”, donde tiene lugar la
acción de los lenguajes de investigación, no sólo en términos de comunicación de
resultados, sino también de modelación semiótica.
La conclusión más importante que se deriva de aquí para el plano de la praxis es que ,
ante quien pregunte cuáles son los pasos de una investigación, la respuesta lógica no es
una lista de operaciones sino que, primero, hay que caracterizar al menos estos tres
Modelos Epistémicos y, luego, por cada uno de ellos, se podría entonces sugerir una
secuencia probable de pasos:
Las modalidades de ejecución investigativa varían lógicamente en dependencia de cada
uno de esos modelos y jamás podría hablarse de “pasos de investigación” sino única y
exclusivamente por referencia a uno de aquellos. Los modelos epistémicos subyacen,
condicionan y son anteriores a cualquier esquema metodológico e, incluso, a cualquier
configuración institucional orientada a la investigación.
34
ESTRUCTURA DIACRÓNICA O DINÁMICA DE LA INVESTIGACIÓN.Los posibles “tipos” de investigación no sólo se obtienen de una visión sincrónica del
constructo anterior. Se obtienen también de una visión diacrónica.
La investigación trasciende a los individuos investigadores, a veces en términos
generacionales, ya que ella evoluciona en una trayectoria de tiempo, donde se comienza
por descripciones empíricas, se sigue con explicaciones o construcciones teóricas,
se pasa a validaciones o contrastaciones de las teorías construidas y se termina en
aplicaciones, tecnologías o instrumentaciones para la acción educativa práctica.
La estructura diacrónica es constatable no sólo en la evolución histórica de la producción
de conocimientos de la especie humana sino también en el desarrollo cognitivo de cada
individuo, es aproximadamente la siguiente:
Fase Descriptiva Fase Explicativa o Constructiva Fase Constrastiva Fase
Aplicativa.
Resumiendo: La Investigación no es cuestión de individuos aislados sino de grupos
organizados y de plazos temporales de gestión. Todo esto puede sintetizarse en lo
siguiente:
- Los procesos de producción de conocimientos no se estructuran sobre problemas
aislados sino sobre “redes” problemáticas crecientes y jerarquizadas, lo cual remite a la
idea de “Programas” de investigación (aproximadamente en el sentido de LAKATOS,
1978), mucho más que a la idea de trabajos particulares desvinculados entre sí.
- La noción de “Programas” remite a la noción de “Gerencia de Investigaciones”,
íntimamente asociada, a su vez, a las nociones de “Necesidades de conocimiento”,
“Mercado de conocimientos”, “Estrategias de Oferta y Difusión de conocimientos”, etc
- Ningún trabajo de investigación particular puede evaluarse integralmente sino por
referencia a algún “Programa”. Un simple estudio medicional, estrictamente descriptivo y
singularizado, por ejemplo, pierde todo sentido mientras no se ubique en una línea de
gestiones progresivas; pero resulta pertinente si, en cambio, se proyecta hacia metas
constructivas, contrastivas o aplicativas dentro de un programa investigativo previsto, es
decir, dentro de una estructura diacrónica coherente.
2.5. CONCEPTO DE VALIDEZ Y AMENAZAS CONTRA LA VALIDEZ2.5.1 Concepto de Validez:Validez: Es el grado en que la puntuación verdadera lo es realmente de lo observado.
35
Validez: La validez tiene que ver con la exactitud, qué el test mida lo que tiene que medir.
El requisito indispensable de toda medición es la fiabilidad (estabilidad, constancia y
precisión) de las medidas, de forma que la falta de la misma limita el resultado de la
investigación.
La fiabilidad no es una condición suficiente de medición. Puede ser que estemos
midiendo con gran precisión un rasgo o característica, pero que no sea el rasgo o
característica que deseamos medir.
Si una prueba no es válida, por muy fiable que sea, no sirve de nada.Hay toda una serie de rasgos o características cuya medición utiliza aparatos o
instrumentos que son de la misma naturales que aquellos o, en su defecto, que se valen
de alguna transformación cuya relación es patente.
En la mayoría de las mediciones psicopedagógicas, la distancia entre el objeto a medir y
el instrumento con que se mide es lo suficientemente grande como para que no sea
evidente, ni siquiera fácilmente demostrable, la relación entre ambos.
La validez se expresa como un índice que puede tomar valores de 0 a 1.
Éstos son los cuatro objetivos de la validez:- Determinar el grado en que cada una de las personas que realizan una prueba
poseen el rasgo definido por la misma.
- Avanzar un pronóstico sobre el comportamiento futuro de cada uno de los sujetos en
un área de conducta determinada en función de su reacción al instrumento de
medición.
- Situar a cada uno de los sujetos en una determinada posición en un rasgo exterior a
la prueba en función de su reacción a la misma.
- Determinar el grado en que la prueba construida mide un determinado rasgo,
característica o constructo.
La validez es la característica más importante de un test, ya que, como hemos
mencionado anteriormente una medida externa o test será válido si mide aquel aspecto
para el cual ha sido diseñado o construido. En general, la validez de un método es la
exactitud con que pueden hacerse medidas significativas y adecuadas con él, en el
sentido de que midan realmente los rasgos o variables que pretenden medir. Es
evidente, pues, que cuando queremos estimar la validez de un instrumento de medida,
necesitamos saber qué rasgo deseamos que mida. A este rasgo suele denominársele
variable de criterio. Nos interesa saber en qué grado se corresponden las posiciones de
36
los individuos en la distribución de las puntuaciones obtenidas en el test a validar y los
datos que usamos, con un grado conocido de certeza, como índices para las
puntuaciones de los individuos en la variable criterio.
El tema de la validez de un test es complejo. Son muchas las dificultades que suelen
encontrarse cuando queremos estudiar cualquier rasgo o variable. Algunos de estos
problemas son; un primer problema es el que se deriva del carácter indirecto de la
medición, ya que nunca medimos un rasgo, sino algunas de sus manifestaciones
conductuales, las cuales, suponemos, nos permiten estimar el grado en que un individuo
“posee” un rasgo o variable. En este sentido nunca podrá decirse que un test es válido o
no, sino en qué grado es válido para medir lo que pretende medir. Una restricción más,
cuando pretendemos asignar un grado de validez a un instrumento, es la población en
que dicha validez es estimada, dado que un instrumento podrá ser válido (en el mismo
grado) para otra población de sujetos distinta.
De lo anterior se deduce que la validez no es un concepto único, si no que adopta muy
variadas formas e interpretaciones dependiendo del tipo de rasgo a medir, de los sujetos
a que se destina, del uso que se hará las puntuaciones de test, etc. de hecho, existen
distintos tipos de validez, según la terminología usada por los autores que la definen; las
más comúnmente aceptadas son: validez aparente, validez de contenido, validez
predictiva, validez concurrente, validez de constructo y validez de utilidad.
En todo caso, las principales cuestiones a que pretende responder el estudio de la
validez, y que ya hemos introducido anteriormente, podrían sintetizarse de la forma en
que lo hacen Martínez Arias (1981) y Cronbach (1971):
- Adecuación con lo que mide la conducta de una persona.
- Capacidad de diagnosticar la conducta de una persona.
- Sensibilidad para detectar un objetivo.
- Seguridad en las decisiones.
- Utilidad
En esta línea, algunas conclusiones que pueden extraerse de todo lo dicho son (Garcia
Ramos, 1986):
1. La validez no es un concepto único; adopta diversas y variadas formas e
interpretaciones según sea la variable de validar, los objetivos del test, la población a
que se aplique dicho instrumento, etc.
2. que se valida no es estrictamente el instrumento, sino la interpretación de los datos
obtenidos por un procedimiento específico (Cronbach, 1971).
37
3. La validez no debe entenderse como el cálculo de un simple índice que indique la
relación entre test criterio, sino más bien como un proceso continuo que requiere la
acumulación de datos procedentes de distintas investigaciones empíricas y de
procesos lógicos.
4. La validez no puede determinarse en términos absolutos respecto de ninguna
variable de nuestro campo de estudio, y no que es una cuestión de grado.
5. La elección de uno u otro tipo de validez o de varios tipos a la vez, dependerá de las
funciones típicas u objetivo que cumplirá el instrumento de medición participar que
sea estudiando.
Dentro de la validez, hay varios tipos aunque las más importantes son cuatro tipos; la
validez de contenido, la validez predictiva, la validez concurrente y la validez de
constructo. De esta última hablaremos con más detenimiento posteriormente y a
continuación vamos a mencionar las otras tres restantes.
La validez de contenido: este tipo de validez, implica la adecuación con que los
elementos de un test miden un contenido claramente especificado. Se determina
revisando sistemática y lógicamente los elementos que forman parte del test, intentando
comprobar si efectivamente dichos elementos permiten describir el área de contenidos-
objetivos que definen la conducta a medir.
La validez predictiva: este concepto hace referencia a la relación existente entre las
puntuaciones obtenidas en el test construido y alguna variable evaluada o evaluable
posteriormente. Esto alude a las posibilidades que el test ofrece para predecir, estimar,
avanzar juicios de cara al futuro.
La validez concurrente: es un concepto similar al anterior. También se estima
correlacionando test y criterio establecido. La diferencia entre estos dos tipos de validez
está en que en el caso de la validez concurrente el criterio ha de ser una variable
contemporánea a la medida al test a validar. En ocasiones, por ejemplo, se utilizan test
ya validados (con garantías de validez, fiabilidad, etc.) como criterios para estimar la
validez concurrente de otros tests construidos para medir la misma variable o rasgo.
2.5.2 Concepto de validez interna y sus amenazas:
1. Concepto de Validez interna:Para que el test tenga validez de contenido, el conjunto de ítems que lo forman tiene que
constituir una muestra suficiente y representativa del dominio que reflejan.
38
La contribución fundamental de un experimento es que ayuda a excluir las diferentes
variables que podrían explicar un fenómeno. Pero un experimento determinado no
excluye necesariamente todas las explicaciones alternativas posibles. Desde un punto de
vista metodológico, el mejor experimento es aquél cuyo diseño excluye las explicaciones
alternativas de los resultados.
Idealmente, los resultados de un experimento tendrán sólo una interpretación, que sería
que la variable independiente es la responsable de los cambios en la dependiente.
Las variables extrañas que puedan afectar los valores obtenidos en la V.D. suponen una
amenaza para la validez experimental. Un experimento resulta válido en la medida que
los resultados pueden ser atribuidos a la V.I., y en el grado que se generalizan fuera del
experimento.
Si los resultados de un experimento pueden ser atribuidos inequívocamente a la V.I., se
dice que el experimento es internamente válido. El grado en que permite la
generalización se refiere a los aspectos relativos a la validez externa.
Se refiere al grado en que un experimento excluye las explicaciones alternativas de los
resultados, es decir, al grado en que ciertamente la manipulación de la V.I. es
responsable de los cambios en la V.D.
Cualquier factor o fuente que no sea la V.I. y que pudiera explicar los resultados es una
amenaza para la validez interna. De esta forma, la validez interna es un mínimo básico
sin el cual un experimento está abierto a múltiples explicaciones alternativas.
2. Amenazas a la Validez interna: Son ocho las variables o factores que han de estudiarse por su incidencia en la validez
interna de un diseño, pudiendo suponer una amenaza para ésta. Un experimento que
controle las siguientes amenazas reduce la ambigüedad de las conclusiones o
explicaciones alternativas. Las amenazas pueden ser:
A. Historia : acontecimientos ocurridos durante las diferentes mediciones.
B. Maduración : evolución de los procesos internos de los participantes por el mero
paso del tiempo (edad, hambre, cansancio…).
C. Administración de test : (en términos generales, presentación de estímulos) cuya
mera aplicación puede modificar los resultados de aplicaciones posteriores.
D. Instrumentación : los cambios en los instrumentos de medición o en los
observadores o calificadores participantes pueden producir variaciones en las
mediciones.
39
E. Regresión estadística : opera allí donde se han seleccionado los grupos sobre la
base de puntajes extremos.
F. Sesgos : resultantes de una selección diferencial de participantes para los grupos
de comparación.
G. Mortalidad experimental : pérdida de participantes en los grupos de comparación.
H. Interacción entre la selección y la maduración.
A continuación se analizarán detenidamente la incidencia de cada una de estas ocho
variables en la validez interna del diseño.
1) El efecto historia: Existen dos posibles momentos de influencia del efecto historia en el proceso de
experimentación:
a) En el desarrollo de la experimentación.
b) En el proceso final de medición de los resultados obtenidos en el experimento.
Sin embargo, cuanto mayor sea el intervalo de tiempo experimental y el tiempo dedicado
a la medición final, más difícil resultará controlar el efecto de la historia.
Las soluciones de tipo estadístico para el control del efecto historia, tales como la
aleatorización de las sesiones experimentales o la aleatorización de las circunstancias
que rodean el experimento, si bien contribuyen a reducir los efectos perturbadores no
parece que solucionen definitivamente el problema. Además del control estadístico es
conveniente plantearse un control prolongado y crítico.
2) El efecto maduración: El efecto de maduración abarca todos aquellos procesos biológicos o psicológicos que
varían de manera sistemática con el correr del tiempo e independientemente de
determinados acontecimientos externos.
La maduración es con frecuencia el punto más crítico de los estudios experimentales en
educación, debido a que entre las diferentes mediciones del esquema experimental
clásico (pre-test/ tratamiento/ post-test) transcurre un determinado tiempo que puede dar
lugar a diferencias entre las dos mediciones realizadas, bien por el mismo paso del
tiempo o bien por los cambios habidos en los sujetos experimentales durante ese tiempo.
El problema de la enorme dificultad de control de la maduración de sujetos se traduce en
un criterio importante para definir la calidad de un experimento, hasta el punto que
determina la categorización del diseño como experimental, preexperimental, etc.
40
La solución a este problema en el contexto metodológico experimental se fundamenta en
la incorporación al experimento del “grupo control” existiendo diferentes alternativas para
su utilización, lo que determina diseños diferenciados.
La solución metodológica que conlleva la utilización del grupo control es que el efecto de
maduración entre el pre-test y el post-test será similar en ambos grupos – experimental
(GE) y control (GC) – pudiendo atribuirse entonces las diferencias encontradas entre los
grupos en la evaluación post- test al efecto del tratamiento seguido, exclusivamente, por
el grupo experimental.
3) El efecto administración de test (“efecto reactivo”): Este efecto surge en aquellos experimentos que requieren la realización de pre-test o
algún tipo de entrenamiento previo a la medición experimental (experiencia de
aprendizaje). Estas experiencias de aprendizaje previas pueden modificar las respuestas
experimentales posteriores, se siga o no un tratamiento experimental. Este efecto se
produce con mayor reiteración cuando el proceso de medición supone en sí mismo un
estímulo al cambio y no un mero registro de comportamiento. [*Ejemplos de este tipo de
efecto serían la preocupación surgida en un sujeto ante un control de peso que, por sí
mismo, puede significar un estímulo para adelgazar; la presencia de un observador
extraño que puede condicionar las respuestas de los miembros del grupo…]. En general,
cuanto más nuevo y motivador sea el estímulo, mayor será el efecto reactivo.
Resulta necesario aclarar que este efecto no se produce si no existen pruebas de
entrenamiento o si dichas pruebas no adquieren un carácter distinto al de un registro
normal de comportamiento. Por tanto, sería deseable conseguir que el sujeto no se
sintiera protagonista de experimentación y la realización de mediciones no tuviera
efectos especialmente reactivos.
En los grupos experimentales clásicos se controla este efecto con el establecimiento de
grupos de control, ya que este efecto puede considerarse como una manifestación
específica del efecto maduración.
4) El efecto de instrumentación: Dentro de este grupo se incluyen todos aquellos efectos perturbadores producidos por
los cambios habidos en los Instrumentos de medición, en las personas encargadas de
realizar las evaluaciones, en los entrevistadores…
Este efecto se controla con facilidad cuando el experimento posibilita su realización en
una única sesión, con un único experimentador y con un único instrumento de medida el
cual no admita dudas en la interpretación de respuestas.
5) El efecto de la regresión estadística:
41
Este efecto se produce cuando se incluyen en el experimento grupos de sujetos con
puntuaciones extremas en el pre-test. Por el efecto de la regresión los grupos con
puntuaciones muy bajas o muy altas en una variable obtendrán puntuaciones no tan
bajas o no tan altas en otra variable, sin que esas diferencias puedan atribuirse al efecto
de los tratamientos ni a los efectos de historia, maduración, etc. sino simplemente al
efecto de la correlación imperfecta entre las variables: cuanto menor sea esta correlación
mayor será la regresión hacia la media. La falta de correlación perfecta puede deberse a
error de medición y/o a fuentes sistemáticas de varianza específicas de una u otra
medición.
6) El efecto de la selección de sujetos: Este efecto refleja el sesgo resultante de una selección diferencial de participantes para
los grupos de comparación.
Este efecto se puede controlar a través de la asignación aleatoria de los sujetos a los
grupos de experimentación. Este proceso de aleatorización se puede complementar con
un proceso de equiparación de sujetos.
La influencia de este efecto se reduce a medida que aumenta el tamaño de los grupos de
experimentación.
7) El efecto de la mortalidad experimental: Esta amenaza a la validez interna también se puede nombrar como agotamiento
experimental o pérdida de sujetos.
La perdida de sujetos no se refiere sólo al fallecimiento real de algún individuo, sino al
abandono en la participación del experimento por ciertos sujetos. Supone una amenaza
para la validez interna si hay una pérdida diferencial de sujetos a través de los grupos o
si el número de sujetos perdidos es similar pero hay alguna razón para creer que el tipo
de sujetos, o la posición de los sujetos en una medida dada difieren a través de los
grupos. Es probable en investigaciones en las que las condiciones experimentales son
diferencialmente atrayentes o eficaces. Es más probable que los sujetos permanezcan
disponibles o cooperativos durante y después del tratamiento si están recibiendo una
intervención que es atractiva o eficaz, que si se están en un grupo menos atrayente o sin
tratamiento.
El control de este efecto perturbador será efectivo a medida que se evite el abandono de
los sujetos sometidos a experimentación o se disponga de sujetos reservas que hayan
seguido todo el proceso experimental y que previamente hayan sido asignados al azar a
los diferentes grupos de experimentación.
8) El efecto de Interacción entre maduración y selección:
42
Es posible la actuación conjunta, interactiva, de dos o más efectos. A la hora de analizar
los efectos de las interacciones debemos considerar otras posibilidades como
maduración-historia, selección-test, etc. hasta agotar todas las combinaciones de primer
orden (entre dos factores) y de órdenes sucesivos.
2.5.3. Concepto de validez externa y sus amenazas: 1. Concepto de la Validez externa:La validez externa se refiere a la extensión y forma en que los resultados de un
experimento pueden ser generalizados a diferentes sujetos, poblaciones, situaciones,
variables de tratamiento y variables de medición.
Como se ha dicho, el objetivo de un experimento es demostrar las relaciones funcionales
entre las variables independiente y dependiente. Un objeto aún más amplio de la
investigación es establecer relaciones generales valiosas. La validez interna dirige la
pregunta inicial referente a si un experimento determinado ha demostrado una relación
inequívoca. La validez externa dirige una pregunta más amplia, referente al grado con
que pueden generalizarse los resultados de un experimento.
2. Amenazas a la Validez externa:Los factores que representan una amenaza a la validez externa o representatividad de
un diseño son:
1. Efecto reactivo o de interacción de las pruebas : Cuando la prueba modifica la
calidad de la reacción del participante a la variable experimental, por lo que no sería
legítimo generalizar a poblaciones que no han recibido el estímulo-prueba.
2. Interacción de los rasgos de selección y la variable experimental: 3. Efectos reactivos de los dispositivos experimentales : impedirán hacer extensivo
el efecto de la variable experimental a las personas expuestas a ella en una situación
no experimental.
4. Interferencia de los tratamientos múltiples: suelen persistir efectos de los
tratamientos anteriores.
A continuación se analizarán detenidamente la incidencia de cada una de estas cuatro variables en la validez externa del experimento.
1) El efecto reactivo o de interacción de las pruebas: Este efecto también toma el nombre de pretesting. La validez externa puede estar
también limitada por la sensibilización al pretest, o la interacción de las medidas del
pretest con los efectos de la variable independiente. Los resultados de estudios con
43
pretest no se pueden generalizar necesariamente a situaciones sin pretest, porque los
sujetos pueden haber respondido diferentemente a la manipulación si no hubieran estado
sensibilizados al pretest.
Es decir, este efecto ocurre cuando el pre-test aumenta o disminuye la sensibilidad o
calidad de la reacción del participante a la variable experimental, haciendo que los
resultados obtenidos para una muestra con pretest no sean representativos de los
efectos de la variable experimental para poblaciones sin pre-test.
Por tanto, se potenciará la validez externa de un diseño en lo referente a este efecto a
medida que el proceso de experimentación no suponga una ruptura importante respecto
a la conducta normal del sujeto; es decir, a medida que no implique estímulos capaces
de provocar conductas reactivas.
2) Efecto de la interacción entre la selección y la variable experimental: Este efecto hace referencia a los problemas de la selección de los sujetos participantes
en un determinado experimento; es decir, a la representatividad de la muestra utilizada.
Ciertamente no es fácil lograr una muestra perfectamente representativa de la sociedad
a la que se pretende representar, pero debe aspirarse a ello como un presupuesto básico
de investigación. Lo que no es aceptable es despreocuparse del problema en la
planificación del experimento y pretender posteriormente generalizar los resultados
obtenidos: “no generalizar en las conclusiones más allá de lo que los datos permitan”.
3) Efectos reactivos de los dispositivos experimentales: Este efecto tiene que ver con los factores situacionales. La validez externa de un
estudio está limitada por los efectos reactivos de la situación o ambiente de
investigación. En un estudio los sujetos tienden a reaccionar al ambiente y a responder
de modo diferente cuando están siendo observados y medidos que cuando se
encuentran en condiciones normales. El efecto reactivo del ambiente o situación de
investigación es conocido con el nombre de efecto Hawthorne.
En otras clases de ambientes o situaciones de investigación el sujeto puede ser
consciente del modo en que el investigador ve su ejecución. A veces los sujetos intentan
responder de acuerdo a su percepción de deseabilidad social, o intentando ayudar al
experimentador. Cualquiera de estos factores puede afectar la validez externa de un
estudio.
Es importante tener conciencia de que la obvia artificialidad de la situación experimental
y la conciencia del sujeto de que está participando en un experimento son, a menudo,
44
causas más que suficientes de carencia de representatividad y por tanto impedimentos
para el proceso de generalización.
En la medida que no sea posible evitar situaciones experimentales novedosas
(reactivas), habrá que restringir los límites de generalización de conclusiones.
La solución óptima estaría en la línea de una “investigación en la acción” dirigida por los
propios psicólogos y educadores, aconsejados en la planificación del experimento por
expertos en metodología de la investigación.
4) Efectos de la interferencia de tratamientos múltiples: Este efecto se produce cuando se aplican diferentes tratamientos a un mismo grupo de
sujetos, ya que suelen persistir los efectos de los tratamientos anteriores.
Es decir, esta variable condiciona la validez interna porque el experimentador no puede
determinar si la respuesta del sujeto es debida al tratamiento que está siendo
administrado, a los efectos de tratamientos previos, o a la interacción de ambos. Estos
efectos también limitan la validez externa porque el investigador no puede generalizar los
resultados a situaciones que no incluyan la serie de tratamientos actualmente usada en
el estudio.
La solución metodológica consiste en evitar la aplicación de tratamientos múltiples a los
mismos grupos de experimentación. Puede lograrse diseñando el experimento en etapas
sucesivas (una etapa por tratamiento) con grupos de estudio diferenciados
anteriormente.
3- Validez de constructo y sus amenazas:1. Concepto de Validez de constructo:Trata de garantizar la existencia de un constructo psicológico que dé sentido y
significado a las puntuaciones del test.
Un constructo es una variable medida y que tiene lugar dentro de una teoría o esquema
teórico.
La validez de constructo es probablemente la más importante sobre todo desde una
perspectiva científica y se refiere al grado en que una medición se relaciona consis-
tentemente con otras mediciones de acuerdo con hipótesis derivadas teóricamente y que
conciernen a los conceptos (o constructos) que están siendo medidos. Se intenta no sólo
validar el test, sino también el rasgo o constructo que bajo él subyace.
45
La validez de constructo permite acercarse a la medida de variables derivadas de una
teoría concreta. Las variables de constructo son las que determinarán que conductas han
de ser seleccionadas para su observación y la situación en que será aplicada.
El instrumento de medida estará ligado al sistema de constructos dentro del que fue
construido y este grado de validez es el que nos indicará el grado en el que el
instrumento de evaluación es una medida adecuada al constructo y en qué medida las
hipótesis derivadas del mismo pueden confirmarse mediante la utilización del
instrumento.
La validez de constructo incluye tres etapas:1. Se establece y especifica la relación teórica entre los conceptos (sobre la base del
marco teórico).
2. Se correlacionan ambos conceptos y se analiza cuidadosamente la correlación.
3. Se interpreta la evidencia empírica de acuerdo a qué tanto clarifica la validez de
constructo de una medición en particular.
El proceso de validación de un constructo está vinculado con la teoría. No es posible
llevar a cabo la validación de constructo, a menos que exista un marco teórico que
soporte a la variable en relación con otras variables. No es necesaria una teoría
sumamente desarrollada, pero si investigaciones que hayan demostrado que los
conceptos están relacionados. Cuanto más elaborado y comprobado se encuentre el
marco teórico que apoya la hipótesis, la validación de constructo puede arrojar mayor luz
sobre la validez de un instrumento de medición. Y mayor confianza tenemos en la validez
de constructo de una medición, cuando sus resultados se correlacionan
significativamente con un mayor número de mediciones de variables que teóricamente y
de acuerdo con estudios antecedentes están relacionadas.
2. Amenazas a la validez de constructo: Falta de definición de los constructos teóricos: Las variables no están preparadas para
ser medidas. Ausencia de examen empírico de las interrelaciones existentes entre
diversas operacionalizaciones del constructo.
4- Validez de conclusión estadística :1. Concepto de Validez de conclusión estadística:En la mayoría de los experimentos de grupo, el establecimiento de relaciones entre el
programa y los resultados se basa en las covariaciones entre ambas variables. Las
decisiones basadas en procedimientos estadísticos tienen en cuenta esas covariaciones,
al valorar la magnitud de las diferencias entre grupos por encima de las variaciones entre
46
sujetos. El uso de pruebas estadísticas no está exento de posibles sesgos, que habría
que tener en cuenta para asegurar la validez de las conclusiones.
2. Amenazas a la Validez de conclusión estadística:- La violación de las asunciones de las pruebas estadísticas
- Problemas relacionados con el tipo de error y comparaciones múltiples
- Poca potencia estadística de las pruebas
- La fiabilidad de las mediciones
- La fiabilidad de la aplicación del tratamiento
- Factores aleatorios, no relevantes en la situación experimental
- Heterogeneidad, aleatoria, en las respuestas.
47