Ficha Tema 4 Parte 1 b

download Ficha Tema 4 Parte 1 b

of 5

Transcript of Ficha Tema 4 Parte 1 b

  • 1

    Evaluacin Psicolgica I

    Ficha de Ctedra -Uso Interno.

    Tema 4 PARTE 1 b)

    Normas tcnicas: VALIDEZ

    Prof. Acua, M. I.

    CONCEPTO DE VALIDEZ La validez se basa en la seguridad con que pueda apoyarse cualquier inferencia que se haga a

    partir de los resultados de un test o tcnica psicolgica.

    En las normas sobre el uso de los tests, se define a la validez como el grado en que las pruebas

    acumuladas apoyan que la interpretacin propuesta a partir de las puntuaciones del test es adecuada

    para la finalidad pretendida (AERA, APA, NCME, 1999, p. 11).

    Oliden (2003) define a la validez como el aspecto esencial de la medicin en psicologa, relacionado

    con la investigacin del significado terico de las puntuaciones obtenidas.

    Nunally (1991) por su parte, expresa que las puntuaciones evidencian validez cuando se verifica que

    el test realmente mide el constructo que pretende medir, justificando adecuadamente las inferencias

    realizadas en funcin a sus resultados.

    Messick (1989) seala que: la validez es un juicio evaluativo integrado de la medida en que la

    comprobacin emprica y el fundamento terico sustentan la adecuacin y propiedad de las

    inferencias y acciones basadas en las puntuaciones de los tests u otras formas de evaluacin (p.13)

    La validez, al igual que la fiabilidad, no es una cualidad que caracteriza a los tests en abstracto, ni a

    un test especifico ni a ciertos datos de un test, sino que es un problema de los juicios que pueden

    hacerse sobre las puntuaciones del test en la medida en que stas se empleen para un determinado

    propsito y en un determinado contexto (Urbina, 2007).

    Momentos histricos del concepto

    En la historia del concepto de validez, pueden identificarse tres etapas principales (Tornimbeni, Prez

    & Olz, 2008; Urbina, 2007). En la primera, llamada operacional, se destaca una perspectiva

    pragmtica de las aplicaciones de los tests, donde se considera a la nocin de validez como sinnimo

    de correlaciones entre las puntuaciones de un test con un criterio que el test intenta predecir. Una

    segunda etapa, surge con la publicacin del artculo de Cronbach y Meehl (1955) quienes presentan

    el concepto de validez de constructo y se caracteriz al mismo como el aspecto fundamental e

    inclusivo de las restantes dimensiones de validez: de contenido y de criterio. Finalmente, el perodo

    actual se caracteriza por una extensin de la concepcin anterior, a la que se agrega la importancia

  • 2 otorgada al uso propuesto para el test. Esto significa que, en realidad, nunca se valida un test en s

    mismo sino que su validez se verifica para determinados propsitos (Tornimbeni et al., 2008, p. 103).

    En esta etapa la validez esta vinculada al proceso de recoleccin de diferentes tipos de evidencia

    para un concepto unitario.

    El producto final del proceso de validacin es la medicin de un constructo que a) est bien definido

    en trminos de una variedad de observaciones y, eventualmente b) se correlacione con otros

    constructos de inters.

    Fuentes de evidencia de validez

    Oliden (2003) diferenci las fuentes de evidencia interna y de evidencia externa.

    Fuentes internas de evidencia

    Se relacionan con el test y sus componentes (tems) en s mismos. La lgica implcita de las

    evidencias incluidas en esa categora se relaciona con el primer objetivo del proceso de validacin

    de las puntuaciones del test, es decir, medir un constructo con un significado univoco, estrictamente

    definido.

    1) Evidencia basada en el contenido del test

    Este tipo de evidencia se obtiene demostrando que el contenido del test es una muestra

    representativa del dominio o constructo sobre el cual se desea realizar una inferencia (Murat, 1985).

    Esta evidencia es ms factible de ser obtenida en pruebas de rendimiento donde se necesita verificar

    la representatividad y relevancia del contenido con respecto a los objetivos, actividades, etc. En

    cambio en los tests que evalan rasgos latentes la representatividad es menor en relacin con el

    dominio de comportamiento que intentan medir, porque no se basan en un dominio de conocimiento

    especfico como el caso de los tests de rendimiento.

    Aunque en las fases iniciales de elaboracin de los tests de rasgos latentes, tambin se evala la

    adecuacin y congruencia del contenido, la validacin final de los tests que miden constructos se

    relaciona ms con los otros tipos de evidencia (Anastasi & Urbina, 1998, citados por Tornimbeni et

    al., 2008). Sin embargo, en la construccin de todo tipo de test, se incluyen especificaciones

    adecuadas del dominio de contenido que el test intenta representar.

    Segn la APA para reunir evidencia de contenido, los mtodos pueden ser:

    juicio de expertos que permite confirmar la relacin entre los tems del test y el dominio o

    constructo a medir.

    Procedimientos lgicos y empricos facilitados por la tecnologa computacional, que permite

    generar tems que difieran sistemticamente en varias pautas del dominio.

    De acuerdo a Martnez Arias (1995) las operaciones para realizar la validacin relacionada con el

    contenido son:

    a. Definicin del dominio de conocimiento o comportamiento a medir

    b. Identificacin de expertos en ese dominio

  • 3

    c. Juicio de los expertos acerca del grado en que el contenido del test es relevante y

    representativo. Tambin pueden juzgar la calidad formal de los tems utilizando escalas

    numricas, y se les solicita observaciones complementarias.

    d. Procedimiento estadstico para resumir los datos de la fase precedente.

    No debe confiarse exclusivamente en el juicio de expertos para evaluar la calidad y pertinencia

    de los tems, siempre es recomendable un estudio piloto con una muestra pequea de

    caractersticas semejantes a la poblacin meta del test (Tornimbeni et al., 2008).

    2) Evidencia basada en las estructura interna del test

    Siguiendo a Tornimbeni et al. (2008), este tipo de evidencias indican si las relaciones entre los

    tems y las dimensiones (factores, escalas) permiten confirmar la existencia de los constructos que

    el test pretende medir. Es necesario verificar si los tems se agrupan estadsticamente del modo en

    que se predice tericamente, y para ello el anlisis factorial es el procedimiento adecuado.

    El anlisis factorial es un mtodo para agrupar las variables (tems, por ejemplo) que se

    correlacionan fuertemente entre s y cuyas correlaciones con las variables de otros agrupamientos

    (factores) es menor (Aiken, 2003).

    3) Evidencia basada en el proceso de respuesta

    El anlisis emprico y terico del proceso de respuesta del test puede suministrar evidencia

    relacionada con la congruencia entre el constructo medido y la naturaleza del rendimiento o

    respuesta emitida por los examinados (APA, 1999, citado por Tornimbeni et al., 2008). Por

    ejemplo, en un test de razonamiento numrico es importante determinar si los examinados estn

    realmente razonando para emitir sus respuestas, en lugar de seguir algn algoritmo estndar

    (p.108), o verse influidos por la tendencia a la conformidad social (p. 109).

    Se obtiene este tipo de evidencia, mediante entrevistas con los examinados, protocolos de

    respuestas o cualquier procedimiento que permita realizar un anlisis cualitativo de las

    respuestas individuales a los tems del test (p.e. anlisis de contenido).

    Fuentes externas de evidencia

    El anlisis de las relaciones de las puntuaciones del test con variables externas al mismo test es otra

    fuente de evidencia. Las variables externas pueden ser las medidas de algn criterio que el test

    pretende predecir, as como las puntuaciones de otros tests que miden constructos semejantes o

    diferentes.

    4) Evidencia convergente-discriminante

    Tornimbeni et al. (2008) lo explican del siguiente modo: Al construir un test (p.e. una escala para

    medir inestabilidad emocional) se deben comparar los puntajes obtenidos, tanto con otros tests

    elaborados para medir el mismo atributo, como con los diseados para medir otros atributos. La

  • 4

    lgica de ambos procedimientos complementarios es evidenciar que el test en cuestin mide el

    constructo al correlacionarse con otros tests reconocidos que miden el mismo constructo y no

    correlacionarse con tests que miden constructos diferentes, pero relacionados.

    La estimacin sistemtica de esta evidencia de validez puede realizarse mediante la matriz

    multirrasgo-multimetodo con la que se obtiene una matriz de las correlaciones entre dos o ms

    instrumentos construidos para medir constructos semejantes. La finalidad de este procedimientos

    es demostrar que las correlaciones entre los test que miden un mismo rasgo (p.e. escalas de

    ansiedad de dos tests diferentes) son ms elevadas que las correlaciones entre constructos

    diferentes medidos por un mismo test (p.e. entre ansiedad y depresin del MMPI), y ms elevadas

    aun que las correlaciones entre constructos diferentes medidos por tests diferentes (p.e entre la

    ansiedad medida por un inventario y la depresin medida por otro). Otro mtodo para recoger

    evidencia convergente-discriminante es el anlisis factorial confirmatorio.

    5) Evidencia de las relaciones entre las puntuaciones del test y criterios externos.

    Tornimbeni et al. (2008) destacan que este tipo de evidencia es importante en los contextos

    aplicados de la psicologa en los que se busca predecir de manera precisa un determinado

    comportamiento o desempeo a partir de las puntuaciones de un test. De acuerdo al nmero y

    tipo de variables (nivel de medicin) predictoras y dependientes (criterios) pueden utilizarse

    diferentes anlisis estadsticos dentro del modelo lineal general.

    Veremos los procedimientos ms utilizados cuando se trata de una variables predictora y un

    criterio (correlacin bivariada) y cuando se utilizan diversas variables para la prediccin de un

    criterio (correlacin mltiple). Los diseos de investigacin para verificar la utilidad predictiva de

    un test incluyen mtodos multivariados como el anlisis de regresin mltiple o el anlisis de

    senderos (path analysis).

    Entre los factores que pueden afectar las relaciones entre los puntajes de un test y las medidas

    de criterio, los tres ms importantes son: las diferencias de grupo (sexo, edad, nivel

    socioeconmico, etc.), variabilidad de las respuestas al test y al criterio y confiabilidad del test y

    del criterio.

    Actividad obligatoria: Realice la lectura del artculo: Estudios Psicomtricos del Self-Directed

    Search (Forma E) en una muestra de estudiantes Argentinos (Cupani & Saurina, 2012). Disponible en PEDCO y en Evaluar http://revistas.unc.edu.ar/index.php/revaluar/index

    IMPORTANTE. Reflexione sobre el objetivo, la metodologa y los resultados de la investigacin,

    establezca relaciones con los conceptos trabajados en el tema 4.

    6) Evidencia de las consecuencias de la aplicacin de test.

  • 5

    Es importante diferenciar la evidencia que es relevante para la validez, de aquellas que solo tiene

    significacin para las decisiones en polticas sociales. En tal sentido, existe inters por conocer

    las causas de las diferencias grupales observadas en los puntajes de tests en mbitos tales como

    la seleccin laboral. Aunque la informacin acerca de las consecuencias de la aplicacin de tests

    puede influir sobre las decisiones a propsito del empleo de tests, tales consecuencias no afectan

    directamente la validez de las interpretaciones de las pruebas. Los juicios de validez o invalidez

    de los tests en relacin con las consecuencias de su administracin dependen de una mayor

    investigacin sobre las fuentes de dichas consecuencias (APA, 1999, citado por Tornimbeni et

    al., 2008). Es decir, esta evidencia es relevantes cuando se relaciona con alguna fuente de

    invalidez tales como la pobre representacin del constructo o la existencia de componentes no

    relevantes para el constructo.

    Generalizacin de la validez: el meta-anlisis

    El meta-anlisis transforma los resultados estadsticos de investigaciones empricas

    independientes a una mtrica comn, provee una estimacin simple de la fortaleza de la relacin

    entre determinadas variables y permite comprobar estadsticamente si una serie de estudios

    apoyan o refutan las hiptesis de investigacin.

    Este mtodo comienza con la reunin, clasificacin y codificacin de las investigaciones

    existentes sobre un tema. El propsito de la codificacin de los estudios particulares es verificar

    si los resultados difieren en funcin de las caractersticas de los mismos.

    Los resultados de las investigaciones podran ser difciles de comparar directamente por eso se

    los debe transformar en una medida comn. Las dos medidas ms utilizadas son los niveles de

    significacin (informa si los resultados han ocurrido por azar) y las medidas de tamao del efecto

    (indica la intensidad de la relacin o del efecto de inters).

    Una vez transformadas las unidades de anlisis de un meta-anlisis a una escala comn, se

    aplican tcnicas estadsticas que permiten resumir los resultados particulares de las diferentes

    investigaciones en un ndice global. El meta-anlisis se utiliza para generalizar la evidencia

    predictiva de un test en relacin con un criterio, y puede emplearse para obtener evidencia de las

    relaciones hipotetizadas entre constructos y criterios evaluados por diferentes instrumentos.

    Como actividad optativa proponemos para aquellos que puedan leer el texto en ingls:

    http://www.people.vcu.edu/~mamcdani/Publications/McDaniel%20et%20al%201994%20JAP%2

    0Validity%20of%20interviews.pdf un interesante estudio sobre la entrevista laboral desde el

    meta anlisis.