felixrodriguezisidro.files.wordpress.com · Web viewDefinición y función de las pruebas: (tests):...

Facultad de Ciencias de la SaludEscuela Académico Profesional de Psicología Humana

Félix Rodríguez Isidro Página 1

Asignatura : PSICOMETRIA

Docente : Félix Rodríguez Isidro

SEMESTRE : I

Ciclo : V

HUANCAYO, 2011


CAPACIDADES

1. Explica y describe los aspectos fundamentales de la psicometría.2. Elabora, selecciona y diseña los diferentes ítems en los tests

psicométricos.3. Distingue y reconoce las cualidades de los tests psicométricos.4. Aplica la teoría psicométrica a los diversos campos de la psicología.5. Maneja los análisis estadísticos de mayor uso en psicometría.



ACTIVIDAD nº 01

PSICOMETRIA

FUNDAMENTOS DE LA TEORÍA Y LA PRÁCTICA DE LA PSICOMETRÍA¿Es importante la psicometría?

La psicometría cada día nos confirma que todavía el hombre es único y que en nuestra mismidad, como seres biológicos y sociales, cada uno es diferente psicológicamente del otro; que las diferencias individuales existen de manera evidente y mensurable. El tipo de análisis de la personalidad que se hace desde el modelo psicométrico pretende ser objetivo y molecular. La objetividad la va a basar en la psicología matemática, enfatizando los aspectos cuantitativos de la evaluación. Realmente, los desarrollos realizados en metodología de la evaluación por este enfoque han sido significativos, y definidores de la tarea diagnóstica. Los conceptos de fiabilidad y validez han sido y son criterios clave para juzgar las pruebas psicológicas.Modelo psicométrico, psicología matemática.¿Qué área ha contribuido más para hacer de la psicología una ciencia? Se pregunta Nuria Cortada (1999, 2000, 2001), a quien seguimos en lo fundamental en los avances de la investigación psicométrica, su respuesta considera que ha sido la psicometría la que empezó tratando de medir los constructos psicológicos y sigue en la lucha por la matematización de nuestra ciencia para estar a tono con los avances de las demás ciencias y con la complicada tecnología del tercer milenio. En efecto cuando una ciencia tiene por objeto el estudio de procesos dinámicos necesita un aparato formal para analizarlos. La psicología estudia muchos procesos como el aprendizaje, la percepción, la memoria, la atención, los fenómenos cognitivos y emocionales que son procesos que se refieren al cambio o modificación de una variable en función de otras, como por ejemplo la evolución del aprendizaje en función de la práctica, el declive de las huellas de la memoria en función del tiempo, el cambio de niveles de percepción en función de los estímulos, el aumento de las funciones cognitivas en relación al crecimiento, etc

Antecedentes históricos de la psicometría:

Las raíces de la aplicación de pruebas, se encuentran en la antigüedad partiendo de los exámenes que se hacían en China para el servicio civil, hasta la aplicación de exámenes en Grecia para evaluar las habilidades físicas e intelectuales.De gran importancia fueron las aportaciones hechas en el siglo XIX por los médicos franceses, Esquirol y Seguin. Aporte fundamental para el establecimiento de la psicometría lo hicieron los investigadores Charles Darwin, Francis Galton, James McKeen Cattell, Krapelin, Charles Spearman, T.L. Kelly, L.L. Thurstone, E.B. Titchener y otros.

Concepto de psicometría: La Psicometría es la ciencia cuyo objeto es medir los aspectos psicológicos de una persona, como son: el conocimiento, las habilidades, las capacidades, las actitudes o la personalidad. La Psicometría se encarga de los procesos para la medida de los aspectos "psicológicos" de una persona, tales como conocimiento, habilidades, capacidades, o personalidad. Las primeras pruebas psicometrías fueron construidas para medir la inteligencia. Las bases teóricas de la psicometría parten de la teoría de los tests y los métodos de elaboración de escalas.

Importancia de la medición en psicología: La importancia de la medición psicológica radica en su afán por establecer científicamente la diferencia entre los rasgos y estados psicológicos entre individuos para ello se utilizan diferentes escalas que apoyan la medición objetiva de los atributos conductuales.

Medición y estadística: En 1816 Bessel Astrónomo de Greenwich, con base en sus investigaciones descubre variaciones considerables entre individuos con respecto de la



rapidez con que reaccionaban ante un estímulo visual (lo llamo ecuación personal), este suceso tuvo gran relevancia para la psicología ya que sentó las bases para la medición de al menos una característica mental (Tyler, 1978)En la actualidad, la construcción de escalas y el análisis de datos obtenidos, perderían su carácter de objetividad sin el uso de los métodos estadísticos (medidas de tendencia central). La estadística permite determinar aproximaciones correlaciónales entre variables. En la determinación de correlaciones entre dos variables, el análisis estadístico es muy útil para condensar y analizar los datos.La estadística es la disciplina que proporciona una metodología para recoger, organizar, resumir, analizar datos y hacer inferencias a partir de ellas. La Estadística se divide en: estadística descriptiva y estadística Inferencia. En la estadística descriptiva, se analizan indicadores como: los porcentajes, la media, la moda, la mediana, la desviación típica, los percentiles, etc. En el caso de la estadística inferencial, que es en la que se apoya la psicología para hacer inferencias, los tópicos a analizar son las leyes del azar y el concepto de probabilidad, los tipos de muestreo, diferencia de medias y análisis de varianza.

La medición y las teorías psicológicas: Existen diversas teorías que tratan sobre la razón por la cual las personas se comportan como lo hacer. Algunos teóricos centran el énfasis en la herencia y el ambiente como modeladores del comportamiento humano. Las teorías de los tipos, de los rasgos, psicoanalíticas, fenomenológicas, son útiles como guía hacia la medición y comprensión de la personalidad.

Principios éticos y deontológico en la medición psicológica: “La deontología refiere a los deberes relativos a una práctica determinada, los cuales, en su forma de enunciados normativos se plasman en los llamados "códigos de ética". La deontología se aboca al estudio de los deberes y obligaciones de los psicólogos, lo cual incluye el tratamiento de ciertas problemáticas propias del campo deontológico, tales como, competencia, idoneidad, integridad, capacitación, respeto por los derechos y dignidad de las personas, responsabilidad profesional y científica, ámbitos de incumbencia. También se ocupa de los deberes y obligaciones de los psicólogos en lo referido a declaraciones públicas, publicaciones, actividades de investigación, supervisión, docencia, etc.”

Las escalas de medición en psicología: Medir es utilizar los procedimientos matemáticos para asignar números e identificar atributos físicos y psicológicos que permitan poner en claro las diferencias individuales. Una escala de medida permite al investigador determinar el tipo de análisis estadísticos que deberá utilizar para examinar una prueba y así poder considera a la prueba como buena.

Tipos de escalas: Son cuatro las escalas utilizadas para medir variables físicas y psicológicas. Si se utilizan números para describir o nombrar algo la escala debe ser nominal. En una escala ordinal los números se refieren a la clasificación ordenada de objetos o eventos en función del rasgo que se mide. En las escalas de intervalo la distancia entre intervalos tendrá que establecer valores iguales. Este tipo de escalas son las más usadas para medir variables psicológicas y comparar diferencias interindividuales o intraindividuales.

Las escalas de razón son las que poseen un cero real que significa ausencia total de lo que se quiere medir (Coolican, 1997).

Métodos de elaboración de escalas: Cohen (2001) define “elaboración de escalas como el proceso de establecimiento de reglas para la asignación numérica en la medición. Es el proceso por el que se diseña y calibra un dispositivo de medición, y la forma en que se asignan números (u otros índices), valores de escala a diferentes cantidades del rasgo, atributo o característica que se este midiendo” (Cohen, 2001, pág. 288)



Por lo regular existen diferentes métodos de medición escalar, los cuales pueden estar abocados a medir personas, estímulos y tipos de respuesta. La medición escalar de estímulos se puede realizar con base a estimaciones subjetivas, ya que se requiere la tarea evaluativo del sujeto. Los modelos discriminativos son otra opción, estos modelos ponen énfasis en la variabilidad de la respuesta a cada estímulo.

En la medición escalar de sujetos, los estímulos se constituyen en reactivos los cuales se le presentan al sujeto para que proporcione un tipo de respuesta.Son 3 los métodos para medir tipos de respuesta, los más importantes son: juicios y sentimientos, respuestas comparativas y absolutas, escala de respuesta.

Escalas multidimensionales: Las técnicas de elaboración de escalas multidimensionales se usan en caso de que el reactivo englobe más de una dimensión. “El objetivo primario de los análisis multivariados es resumir grandes cantidades de datos en relativamente pocos parámetros” (Nuria Cortada de Kohan)

Definición y función de las pruebas: (tests): Una prueba psicológica es una medida objetiva y tipificada de una muestra de conducta. “Una prueba psicológica sirve de estímulo para extraer un segmento de la conducta. Es rigurosamente estandarizada, o sea se construye, se administra y se califica según reglas preestablecidas. Permite comparar estadísticamente la conducta de un sujeto con un grupo de sujetos de una población definida y clasificarla cuantitativamente, cualitativamente y/o tipológicamente” (Costa, 1996; pág. 17)

Uso de las pruebas (tests) psicológicas: Las pruebas o tests se usan con motivo de evaluar aspectos educativos, clasificación por ejemplo la inteligencia, en el área del trabajo, para la selección de personal, las pruebas también son utilizadas para diagnosticar la existencia o ausencia de problemas en el comportamiento, son un recurso importante para comprobar hipótesis de investigación, en la clínica es un método para diagnosticar comportamiento normal o patológico, o establecer un tratamiento terapéutico.

Clasificación de las pruebas (tests): Las pruebas pueden clasificarse porsu objetivo (potencia, ejecución máxima, ejecución de rasgos, o proyectivas). Por la forma o tipo de respuesta que exigen (pruebas objetivas, subjetivas). Por la forma de administración (aplicación individual o colectiva). Por la forma de dar las instrucciones.(Morales, 2002; págs. 24-30).

Teoría de la Generalizabilidad. Fue desarrollada por Cronbach y sus colegas, esta teoría parte de la idea que las puntuaciones de prueba de una persona varían de una prueba a otra, debido a variables en la situación de prueba (Cohen, 2000; pág. 175).

La escuela americana (Thurstone): Thurstone no concordaba con la existencia de un factor general y afirmaba que factores independientes o factores de grupo integraban la inteligencia. Desarrolló un procedimiento matemático, denominado “análisis factorial múltiple”, este método permite identificar un sin número de aptitudes que constituyen la inteligencia y correlacionarlos entre sí.

La estructura del intelecto de Guilford: El realizó un estudio muy completo de las aptitudes cognoscitivas, él y su colaboradores encontraron un sinnúmero de factores que podrían ser relacionados unos con otros (Tyler, 1978)Elaboro un modelo estructural de la inteligencia al que llamó estructura del intelecto. Este constaba de tres dimensiones: operaciones (modos de pensar), contenidos (aplicaciones del pensamiento) y productos (resultado de la aplicación de una operación a un contenido.



Teoría de la respuesta al ítem: Este es un modelo probabilística y permite conocer la información proporcionada por cada ítem o reactivo y así crear tests individualizados. Son escalas unidimensionales, ya que parten del supuesto de que cada ítem (reactivo) de la prueba o test debe medir una sola aptitud o rasgo.

Teorías cognitivas y psicometría: La información almacenada en la memoria, consta de huellas de actos constructivos anteriores, organizados de modo que corresponda a la estructura de estos actos, sin embargo estos se relacionan en forma dinámica con la nueva información, provocando transformaciones cognoscitivas en la memoria y el pensamiento. (Neisser, 1979) “Sus dominios son la percepción, el aprendizaje, la memoria, la resolución de problemas y la toma de decisiones y aunque los psicólogos cognitivos tienden a subrayar la importancia de la variación de los estímulos y los psicólogos diferenciales ponen el acento en laimportancia de la variación individual en ambos casos se están estudiando comportamientos similares” (Nuria Cortada de Kohan)

Teoría triarquica de Stenberg: En esta teoría Stenberg combina la cognición y el contexto para comprender la inteligencia humana y su desarrollo. La denominación de triárquica se debe a que está formada por tres subteorías:

La componencial, (inteligencia académica). La experiencial, (inteligencia creativa), y La contextual, (inteligencia práctica).



ACTIVIDAD nº 02

MEDICION - REQUISITOS- PROCEDIMIENTO PARA CONSTRUIR UN INSTRUMENTO DE MEDICION

¿QUE IMPLICA LA ETAPA DE RECOLECCION DE DATOS?

Una vez seleccionado el tipo y el diseño de investigación apropiado y la muestra adecuada de acuerdo a nuestro problema de estudio, la siguiente etapa consiste en recolectar los datos pertinentes sobre las variables involucradas en la investigación.

Recolectar los datos implica tres actividades estrechamente vinculadas entre sí:

1.Seleccionar un instrumento de medición de los disponibles en el estudio del comportamiento o desarrollare uno que sea válido y confiable, de lo contrario, no podremos basarnos en sus resultados para realizar conclusiones.

2.Aplicar ese instrumento de medición, es decir, obtener las observaciones y mediciones de las variables que son de interés para nuestro estudio.

3.Codificar, analizar e interpretar estas mediciones.

¿QUÉ SIGNIFICA MEDIR?

De acuerdo a definiciones clásicas como la de Stevens (1951), significa “asignar números o valores a objetos y eventos de acuerdo a reglas”. Sin embargo, como lo señala Carmines y Zeller (1979), esta definición es más apropiada para las ciencias físicas que para las ciencias sociales, las cuales trabajan con una serie de conceptos más abstractos que no pueden verse directamente o tratarse como productos o resultados.

Este razonamiento nos hace sugerir que es más adecuado definir medición como el “proceso de vincular conceptos abstractos con indicadores empíricos”, proceso que se realiza mediante un plan explícito y organizado para clasificar y frecuentemente cuantificar los datos que me puedan suministrar conductas observables relacionadas con las variables en estudio. El centro de atención es por lo tanto la respuesta observable (bien sea una respuesta marcada en un cuestionario, una conducta grabada o una respuesta dada en una entrevista). Un instrumento de medición adecuado va a ser aquél que me registra datos observables que verdaderamente representan los conceptos o variables (más abstractas) que el investigador tiene en mente.

¿QUÉ REQUISITOS DEBE CUBRIR UN INTRUMENTO DE MEDICION?

Toda medición o instrumento de recolección de datos debe reunir dos requisitos esenciales; confiabilidad y validez.

LA CONFIABILIDAD de un instrumento de medición se refiere al grado de precisión o exactitud de la medida, en el sentido de que si aplicamos repetidamente el instrumento al mismo sujeto u objeto produce iguales resultados. Es el caso de un balanza o de un termómetro, los cuales serán confiables si al pesarnos o medirnos la temperatura en dos ocasiones seguidas, obtenemos los mismos datos.

LA VALIDEZ se refiere al grado en que un instrumento mide la variable que pretende medir. Por ejemplo, un test de inteligencia no será válido, si lo que mide es realmente memoria y no inteligencia. Ciertas variables como el sexo, la nacionalidad, son muy fáciles de observar o de preguntar y obtener una respuesta válida. Pero cuando se trata de diversas variables que se trabajan en ciencias sociales como motivaciones, actitudes,



sentimientos, emociones, etc, la validez de un instrumento que pretenda medirlas se torna más compleja, y por lo tanto, cabe preguntarse si ¿realmente el instrumento estará midiendo lo que pretende medir?

LA VALIDEZ ES UN CONCEPTO DEL CUAL PUEDEN TENERSE DIFERENTES TIPOS DE EVIDENCIA:

Evidencia relacionada con el contenido LA VALIDEZ DE CONTENIDO se refiere al grado en que un instrumento refleja un dominio específico de contenido de lo que se mide. Por ejemplo, una prueba de operaciones aritméticas no tendrá validez de contenido si explora suma y división y excluye problemas de resta y multiplicación. Un instrumento de medición debe contener representados a todos los items del dominio de contenido de las variables a medir.

Evidencia relacionada con el criterio. LA VALIDEZ DE CRITERIO implica que la medición del instrumento se ajusta o sirve a un criterio externo. Si el criterio se ajusta al futuro se habla de validez predictiva. Por ejemplo una prueba de admisión en las universidades puede comparar sus resultados con el rendimiento futuro de los estudiantes en la carrera. Si el criterio se fija en el presente se habla de validez concurrente; es cuando los resultados del instrumento correlacionan con el criterio en el mismo momento o punto de tiempo. Por ej. una encuesta administrada un día antes de las votaciones para detectar preferencias del electorado, correlaciona con los resultados finales de la elección.

Evidencia relacionada con el constructo. LA VALIDEZ DE CONSTRUCTO es probablemente la más importante, sobretodo desde la perspectiva científica, ya que se refiere al grado en que una medición aportada por un instrumento relaciona consistentemente con otras mediciones que han surgido de hipótesis y construcción de teorías antecedentes. VALIDEZ TOTAL = Validez de contenido + validez de criterio + validez de constructo

Cabe agregar que un instrumento de medición puede ser confiable pero no válido, puede medir consistentemente un aspecto más no medir lo que pretende medir el investigador. Por ello es requisito que un instrumento de medición que demuestre ser confiable y válido.

FACTORES QUE PUEDEN AFECTAR LA CONFIABILIDAD Y LA VALIDEZ

a)La improvisación. Algunas personas creen que elegir un instrumento de medición o desarrollar uno es algo fácil y que no requiere de supervisión alguna. Para poder construir un instrumento se requiere conocer muy bien la variable que se pretende medir y la teoría que la sustenta.

b)El no estar validados en el contexto donde se aplican. Traducir un instrumento, aún cuando adaptemos los términos a nuestro lenguaje no es ni remotamente validarlo. Es simplemente un primer paso ya que validar un instrumento implica realizar una investigación extensa y compleja. Los grupos, las personas cambian y tienen valores diferentes de acuerdo a la cultura. Por lo tanto, se deben aplicar instrumentos ya validados en el contexto.

c)El instrumento e inadecuado o no es empático. Hay instrumentos que tienen un lenguaje muy elevado para el entrevistado o no toma en cuenta diferencias de sexo, edad nivel ocupacional y educativo; todo esto puede resultar en errores de validez y confiabilidad del instrumento de medición

d)El cuarto factor lo constituyen las condiciones en que se aplica el instrumento. El ruido, presionar para que una persona conteste un instrumento largo en un período de tiempo



corto, el hambre o falta de motivación para responder influirá negativamente en la validez y confiabilidad de la medida.

e)El quinto factor se refiere a los aspectos mecánicos. Que el instrumento tenga instrucciones precisas, que se lea bien (si se trata de un cuestionario escrito), que no le falten páginas, que haya un espacio adecuado para contestar.

¿CÓMO SE SABE SI UN INSTRUMENTO ES CONFIABLE Y VALIDO? PROCEDIMIENTOS:

En la práctica es casi imposible que una medición sea perfecta, generalmente se tiene un grado de error. Desde luego, se trata que este error sea el mínimo posible y para ello hay formas de calcular la confiabilidad y la validez.

Para la confiabilidad, generalmente todos los procedimientos utilizan fórmulas que producen “coeficientes de confiabilidad”, los cuales pueden oscilar entre 0 y 1, donde 0 significa confiabilidad nula y 1 representa el máximo de confiabilidad. Entre más se acerque el coeficiente a 0 habrá mayor error en la medición. Los procedimientos más utilizados son:

Medida de estabilidad (confiabilidad por test-retest). Un mismo instrumento es aplicado dos o más veces a un mismo grupo de personas. Si la correlación entre los resultados de las diferentes aplicaciones es altamente positiva, el instrumento se considera confiable.. Desde luego, el período de tiempo entre las mediciones es un factor a considerar. Si es muy largo, otros factores como maduración o cambio de condiciones pueden afectar la segunda medida. Si es muy corto, las personas pueden recordar cómo contestaron la primera vez y aparecer como más consistentes la segunda vez.

Medidas paralelas o formas equivalentes de medir. En este procedimiento no se aplica el mismo instrumento de medición sino dos o más versiones equivalentes de éste. Las versiones deben ser similares en contenido, instrucciones, duración, etc. Por ej. cuando un profesor administra 2 o más modalidades de examen en su grupo de alumnos. El instrumento es confiable si la correlación entre los resultados de las dos o más pruebas administradas es significativamente positiva.

Método de mitades divididas. Aquí se administra un solo instrumento, una sola vez, pero se dividen las preguntas o los items (Por ejemplo los items pares con respecto a los impares, o la primera mitad con respecto a la segunda mitad). Si correlacionan los resultados de las dos partes, se considera el instrumento confiable. Ahora bien, la confiabilidad varía de acuerdo al número de items de la prueba. Cuantos más items mayor es la confiabilidad.

Cotejo entre observadores. Se utiliza fundamentalmente cuando se aplican instrumentos de observación y registro. Dos o más observadores aplican el mismo instrumento al mismo tiempo. Luego se calcula la correlación de aspectos coincidentes observados. Se considera confiable el instrumento si hay un porcentaje de coincidencias superior al 80%. Por supuesto que este método implica que los observadores tengan el mismo nivel de preparación o de entrenamiento para observar.

Para calcular la validez, la validez que más interesa obtener en una investigación es la validez de contenido. Para obtener validez de contenido primero que nada hace falta revisar como ha sido tratada esta variable por otros investigadores anteriormente. Segundo, elaborar un universo de items tan amplio como sea posible, para medir la variable en todas sus dimensiones. Posteriormente, se consulta con investigadores familiarizados con el tema y la variable a medir para ver si el contenido es exhaustivo. Esto se conoce con el nombre de validación por expertos.



PROCEDIMIENTO PARA CONSTRUIR UN INSTRUMENTO DE MEDICION

1.El primer paso consiste en listar las variables que se pretenden medir u observar. Recordemos que las variables son propiedades de los objetos o de los sujetos que adquieren distintos valores y que son razón de nuestro estudio o fenómeno a investigar.

2.Revisar su definición conceptual y comprender su significado. Por ejemplo, comprender qué es “integración escolar” y qué dimensiones o grandes aspectos envuelve.La definición conceptual se refiere a la descripción de la esencia o de las características propias, reconocidas por consenso de un fenómeno u objeto, a la cual se le llama cotidianamente “definición real”; se reconoce la importancia de una conceptualización teórica, dada por autores reconocidos.

3. Revisar cómo han sido definidas operacionalmente las variables. La operacionalización de las variables se refiere a un conjunto de procedimientos que narran o describen las actividades que el investigador realiza para medir las variables en estudio. Cuando el investigador dispone de varias opciones debe utilizar el procedimiento que le reporte mayor información sobre la esencia del objeto o fenómeno de estudio.

3.Elegir el instrumento o los instrumentos (ya desarrollados) que han sido favorecidos por la comparación y adaptación al contexto de la investigación. Deben seleccionarse los instrumentos que reporten mayor validez y confiabilidad. Si se selecciona un instrumento desarrollado en otro país deben hacerse pruebas piloto más extensas. Tampoco debe olvidarse que traducir no es validar un instrumento, por muy buena que sea la traducción.

4.En caso de no encontrar un instrumento desarrollado adecuado, válido y confiable y se quiera construir o desarrollar uno propio, debe pensarse en cada variable, sus categorías, los indicadores más precisos y los items para cada uno de ellos. Un ejemplo de ello podría ser el siguiente:

VariableDefinición operacionalCategoríasIndicadoresItemsIntegración escolarGrado de aceptación de la comunidad escolar regular para aprender y convivir con niños especiales Por parte de los DirectivosInterés y voluntad por aceptar niños especiales en su Institución1.¿Desde hace cuanto tiempo se realiza integración escolar en este Centro?2.¿De qién fue la iniciativa?3.¿Cuáles fueron las estrategias para llevar adelante este proceso?

Por parte de los DocentesSensibilización y preparación para trabajar con niños especiales dentro de un aula regular1.¿Cómo es su perfil de formación para trabajar con estos niños?2.¿Qué adiestramiento ha recibido?3.¿Cómo planifica y evalúa las actividades con estos niños?4.¿Qué estrategias de integración practica?

Por parte de los PadresInformación y opinión sobre el proceso de integrar niños especiales en aulas regulares1.¿En qué medida ha sido informado sobre el proceso de integración escolar que adelanta la escuela?2.¿Cuáles son a su juicio los aspectos favorables de la integración?



3.¿Cuáles son los obstáculos o dificultades de este proceso?

En este caso, debemos asegurarnos de tener un número suficiente de items para medir todas las variables en todas sus dimensiones.

El nivel de medición nominal indica que hay dos o más categorías de respuesta las cuales no tienen orden o jerarquía. Por ej. cuando preguntamos el estado civil, la religión, etc. Las variables nominales pueden ser dicotómicas (admiten solo dos valores, como el sexo, tipo de escuela a la que asiste : privada u oficial, etc.) y politómicas (cuando admiten tres valores de medición o más).

El nivel de medición ordinal, indica que hay varias categorías, pero además estas mantienen un orden jerárquico, de mayor a menor. Por ejemplo el Grado o Nivel de Instrucción de las personas, el cargo que una persona ocupa dentro de una empresa o Institución, etc. En los dos niveles mencionados no se pueden utilizar las operaciones matemáticas básicas, porque sería absurdo y no tiene sentido, darle numeración en escala a las respuestas.

El nivel de medición por intervalo, implica crear escalas de medición donde las distancias entre las diferentes categorías de respuestas son iguales. El cero o punto de partida, es arbitrario, es decir no es real, como el caso de la temperatura, donde el cero no significa que no haya temperatura. Algunas escalas de observación y de medición de opinión de actitudes suelen tratarse como si fueran mediciones de intervalo. Aquí se permite utilizar las operaciones matemáticas básicas y algunas estadísticas. Ej. las escalas de evaluación que los estudiantes llenan sobre sus profesores. ¿Cómo considera el sistema de evaluación de la materia? 1 --- 2 --- 3 --- 4 --- 5 (1 = deficiente, 5 = excelente)

El nivel de medición de razón, además de tener todas las características del nivel de intervalo (distancias iguales entre las categorías de respuesta y aplicación de operaciones matemáticas básicas), implica que parte de un cero real y absoluto donde no existe la propiedad a medir. Por ej. ¿Cuántos hijos tiene usted?O --- 1 --- 2 --- 3 --- 4 --- 5 --- 6 --- 7 --- 8 --- 9 --- 10 ó más

Indicar cómo se han de codificar los datos . La codificación es necesaria para analizar cuantitativamente los datos (aplicar análisis estadísticos). La mayoría de las veces se usan números o cantidades, aunque también se pueden utilizar letras o símbolos.

Aplicar una prueba piloto del instrumento de medición. Es decir, aplicar el instrumento a personas con características semejantes a las de la muestra o población objetivo de nuestra investigación En esta prueba se analiza si las instrucciones se comprenden y si los items funcionan adecuadamente. Los resultados se utilizan para calcular la confiabilidad y de ser posible, la validez del instrumento de medición. La prueba piloto se realiza con una pequeña muestra; los investigadores aconsejan un 10% de personas semejantes a las que integrarán la muestra definitiva.

Sobre la base de la prueba piloto, el instrumento de medición preliminar, se modifica, se ajusta y se mejora, para lograr mayor nivel de confiabilidad y validez. En un trabajo de investigación habrá que narrar el procedimiento, el pilotaje y la reestructuración del instrumento posterior al pilotaje.



ACTIVIDAD nº 03

LOS TESTS PSICOMÉTRICOS

Desde que la psicología, separada del corpus filosófico que le dio origen, empieza a desarrollarse como disciplina científica, ha sido atravesada por distintos paradigmas y por variadas concepciones y epistemologías, que tienen su anclaje en diferentes momentos socio-históricos. El psicodiagnóstico, o, más específicamente el uso de las técnicas diagnósticas, probablemente una de las prácticas más vinculadas identitariamente a la psicología, no escapa a esos cambios, antes bien es causa y a la vez consecuencia de los mismos.

La creación de los tests psicológicos, tiene su origen en la necesidad de medir y cuantificar para de esta forma poder categorizar a los individuos. Este desarrollo, que pauta un momento histórico para la disciplina psicológica, no está por supuesto carente de ideologías y concepciones acerca del hombre. En tanto inaugura algo, ha dejado una marca que en cierta medida sigue hasta nuestros días.

Plantearnos hoy que el par psicodiagnóstico-evaluación no sólo da cuenta de esa marca sino que pone en evidencia al mismo tiempo el origen y la historia, en una suerte de convivencia compleja de distintas concepciones que nos atraviesan en la actualidad.Realizar una lectura crítica de los diferentes momentos de esa historia nos permitirá pensar sobre las prácticas vigentes de modo que las mismas no queden naturalizadas per se como científicas o no científicas.

Si bien a Francis Galton se le reconoce como precursor del empleo de tests para la evaluación psicológica (1883), James Mckeen Cattell, fue el primero que los aplicó para medir la inteligencia (1890), y Münsterberg inició los tests de aptitud profesional, no es menos cierto que ya en 1575 el pregrafólogo español Juan Huarte de San Juan reclamaba la necesidad de pruebas específicas (psicotécnicos) para los funcionarios de la administración pública como un medio para conocer las aptitudes psicológicas individuales y su correcta adecuación profesional.

El propio Alfred Binet junto a Víctor Henri (1895) recurrió el estímulo perceptivo de las manchas en lo que sería un antecedente de técnica proyectiva formulado más tarde por H. Rorschach. Será en 1904, cuando Jung elabore la primera prueba proyectiva: el test de asociación de palabras. Éste se utilizó en criminología, intercalando vocablos vinculados a los hechos inculpatorios, para estudiar la reacción del sujeto ante esas palabras con fuerte carga emocional, y sus variaciones fisiológicas en las respuestas verbales; Jung le llamaba "indicios de complejo". En contraposición Freud no consideraba válida la práctica de la asociación libre para detectar a sujetos que han cometido un delito, puesto que él que ha cometido realmente la acción fraudulenta, en la asociación libre, no deja plenamente libertad, hace esfuerzos por controlar la situación; mientras que por el contrario el neurótico, por sentimientos de culpa, va a delatarse, por el miedo a que se den cuenta, precisamente de su miedo a que le crean culpable, es el llamado delincuente por sentimiento de culpa. (Dr. Jorge Ulnik. Psiquiatra Psicoanalista de la Facultad de Medicina de la Universidad de Buenos Aires).

En 1920, M. Klein, las emplea en el psicoanálisis de los niños, obteniendo excelentes resultados, pues éstos se expresaban mejor ante el juego y el dibujo, y en 1920, aparece la técnica del Rorschah, donde la personalidad de cada uno determina la percepción de las manchas.

.- Fiabilidad o constancia de los resultados,



ésta se verifica mediante varios sistemas (de la partición (Split-test-method), de la repetición (test-re-test), de las formas paralelas...) más aptos para los psicotécnicos que para las técnicas proyectivas, puesto que el material de estas últimas, al no ser un cuestionario de preguntas, difícilmente puede dividirse a la mitad (Split-test-method) de manera homogénea “ el total es mayor que la suma de sus partes” o el estímulo visual o creativo en su repetición (test-re-test) pierde la fuerza y espontaneidad primera, siendo sustituida por la “memoria y el deseo de variación”.

Comencemos con una pregunta inicial: ¿Que es un Test?: Una definición sencilla es considerar a un Test como un instrumento de medición que tiene como finalidad “medir”, evaluar algún aspecto puntual de la personalidad humana en particular , o el conjunto de ella.Rápidamente vendrán a nuestra mente la idea muy cierta por cierto, vale la redundancia, de la enorme variedad de áreas, aspectos que podremos evaluar de la personalidad tan rica, multifacético y llena de incógnitas.Etimologicamente la palabra “Test” nos hemos encontrado que tiene una raíz latina, que es “Testa” - “Testis” cuya acepción y uso nos remite a la Edad Media, estas se refería a la vasija de barro que utilizaban los alquimistas para realizar sus experiencias, recordemos que buscaban transmutar metales comunes en oro. Recordemos que la Alquimia fue la precursora de la Ciencia conocida luego como Química. Hay mas allá del experimento con los metales toda una construcción filosófico- espiritual en torno a los alquimistas que eran considerados en esa época como grandes magos. Muchas simbologías surgen de allí y en realidad se dice que lo que en el fondo buscaban como trasmutación real era la de la individualidad humana.. Así transformar en oro los metales equivale a transformar al hombre en puro espíritu .Cada Test que los psicólogos e investigadores han construido responden a esta búsqueda que ha perseguido (positivamente por supuesto) el hombre a lo largo de su historia , la búsqueda del conocimiento de si mismo, recordemos la famosa y celebre frase del Oráculo de Delfos que le decía al hombre “conocete a ti mismo” y es esta necesidad de conocerse la que ha alimentado miles de formas y caminos de acceso a ese conocimiento en parte posible de conocer y en parte vedado aún. Y aún mas trascendiendo ya, la búsqueda individual se amplio al conocimiento de otras personas, esto en la actualidad se lo llama investigaciones transculturales y muchas de ellas entre ellas el T.A.T (Test de Apercepción Temática de Murray) , se ha aplicado a distintas poblaciones con distintas culturas con el fin de encontrar semejanzas, y diferencias.Podríamos decir que cuando aplicamos un Test o una serie de ellos, lo que buscamos es no solo lograr un conocimiento profundo de una persona, aquellas características que hacen a su naturaleza básica y aquellas otras que denotan la presencia se áreas disfuncionales, sino también que ese conocimiento se convierta en información útil no solo pro-curación de una determinada sintomatología cuyo núcleo o fuente intentábamos identificar con las técnicas , sino también una información que a través de la devolución que le otorgamos al paciente o a veces al profesional derivante, ponga de manifiesto áreas potenciales de salud o recursos que a lo mejor esa persona no tiene a nivel conciente registro de que los tiene. Conocer áreas desconocidas pero presentes de la personalidad de uno provoca , a veces una transformación de la personalidad hacia un nivel superior de funcionamiento que mejore la calidad de vida en un sentido amplio del paciente o consultante, o un punta pie inicial hacia ella. Esto implica que el uso de los Test no siempre esta al servicio de la Psicopatología y solo mente recurrimos a ellos cuando hay alguna disfunción psicológica, sino también podemos recurrir a ellos para conocerlo mas. Por supuesto los Test deben ser aplicados por profesionales idóneos en la materia. Los Test se agrupan en 2 grandes categorías: 1) Test o técnicas Proyectivas 2) Técnicas Psicometrías



Las Técnicas Proyectivas a diferencia de las Psicométricas apuntan a la exploración y diagnostico de la Personalidad Total o integral de un individuo. Las Técnicas Psicométricas buscan explorar algún aspecto puntual de la personalidad , por ej. si una persona posee un nivel de ansiedad importante, y de que tipo, así tenemos las Escalas IDARE y STAIC que sirven para ello; las Escalas de Autoestima, Las Escalas para evaluar presencia de Depresión como por ej. la de Beck, la de Alexitimia (incapacidad para poner en palabras –²€alizar- lo que se siente), etc. Estas entonces no apuntan y no permiten explorar la dinámica de la Personalidad como un todo, sino alguna de sus partes y áreas.Las técnicas Proyectivas pueden ser de 3 tipos: a) Gráficas b) Verbales c) Lúdicas.La diferencia entre ellas gira en torno al estimulo con el que se genera la proyección en el sujeto. Valido es decir que en términos sencillos, Proyectar es poder poner en el afuera algo que corresponde al adentro, así en cada Test que le proponemos a nuestro evaluado algo del mundo interior del sujeto como en una pantalla se proyecta así.Así cada Test mueve en el evaluado distintas cosas cada una diferente pero en un mismo sentido, la personalidad , su dinámica, sus disfunciones, sus patologías, su manera de percibir al mundo y así mismo, sus miedos, sus vacilaciones, sus seguridades, sus potencialidades, su inteligencia, su inteligencia emocional ....la lista es muy extensa por cierto.Ampliando un poquito mas podemos decir:Que en las técnicas graficas el estimulo que se le propone al sujeto una hoja en blanco , se le da un lápiz a veces una goma de borrar, y se le da alguna consigna, tal como “dibuje un árbol”, “su familia”, “una casa” “una persona” “lo que usted quiera”, así es que estamos frente a una consigna verbal y gráfica posteriormente.En las técnicas proyectivas Verbales tales como: El test de las relaciones objetales de Phillipson también llamado TRO, el T. A.T de Murray, el CAT-A de Bellack, el Rorschach, el Test para adolescentes de Simon, el Test de Frustración de Rosenwaig el estimulo es visual y verbal, ya que en todos ellos le pedimos al sujeto que nos construya una historia con lo que ve en la lamina, que invente una historia, o que nos diga que ve en la lamina y donde –Rorschach- .En las Técnicas proyectivas lúdicas el estimulo es de acción, por ejemplo la terapia de l juego en donde se le da al niño o a adolescentes distintos elementos con los cuales tiene que interactuar.Otra técnica es el Psicodrama, en donde la consigna es que el sujeto asuma determinados tipos de roles



ACTIVIDAD nº 04 y 05

ITEMS DEL TESTAntes tendremos que analizar los items de cualquier instrumento de medición que utilizaremos con fines diagnósticos, se exige que ellos satisfagan ciertos requisitos, entre los principales están las condiciones siguientes: Ser objetivos, confiables y válidos.Por esto la consecuencia práctica es el aspecto más importante del análisis de los ítems, cuando al eliminar los inadecuados o revisar los que necesitan mejorarse se garantiza la confiabilidad y validez futura de la prueba, asegurando además las mejores condiciones para su normalización.En el análisis de los ítems se consideran tres criterios fundamentales:

POR DIFICULTAD: se entiende el por ciento de sujetos que responden correctamente al ítem. Este índice garantizará la dificultad baja, promedio o alta del test según sea el objetivo del investigador.

LA DISCRIMINACIÓN: es la segunda y más complicada parte del análisis de los ítems, está caracterizada por el coeficiente de discriminación, que no es más que la correlación entre la respuesta al ítem y la puntuación total de la prueba. Entonces la discriminación se analiza a través de un criterio interno, por eso el problema ahora, es averiguar la contribución del ítem a la puntuación total del test.

LA VALIDEZ: del ítem se define mediante la correlación entre la respuesta correcta de los sujetos al ítem y el grado en que él expresa la característica medida con un criterio externo.

La importancia de estos criterios y los requisitos que se le imponen al ítem con respecto a ellos, dependen del Test de que se trate y de los que persiga el investigador. Después de analizar los ítems de un test, es posible también indagar sobre el pronóstico de la validez y la confiabilidad de la prueba total. El análisis de la validez solo es posible hacerlo cuando en la base de datos del análisis de los ítems, se tiene información sobre los coeficientes de validez además de los de discriminación, mientras que la posibilidad de pronosticar la confiabilidad siempre está garantizada.ELABORACIÓN Y SELECCIÓN DE LOS ÍTEMS: Según como seleccionamos los ítems el test tendrá un contenido. Las preguntas y alternativas de respuesta son el protocolo del test. Los ítems son verbales, gráficos o manipulativos. El tipo de ítems tiene que ver con sí el sujeto responde de forma libre, estructurada o de forma mixta

Ítems de respuesta libre: El sujeto debe responder con sus propias palabras, no hay una única respuesta. Es la más completa. El sujeto desarrolla de forma abierta y libre una respuesta ante una pregunta que se plantea, desde una perspectiva personal y su propio lenguaje. Puede ser verbal, manipulativo o gráfico.Ventajas: se recoge la creatividad/originalidad de la respuesta del sujeto, se permiten varias respuestas verdaderas y se puede valorar no solo lo que dice sino también cómo lo expone y lo construye (información adicional).Desventajas: la subjetividad a la hora de construir y, fundamentalmente, a la hora de valorar estos ítems (diferentes evaluadores no llegan al mismo acuerdo, es diferente según el juez, evaluación sesgada, a no ser que evalué un solo juez).

Sobre los demás tiene la ventaja de tener la mejor manera de valorar la creatividad y originalidad del sujeto.

Ítems de respuesta restringida. En los que se le pide una respuesta breve, tiene menor libertad pero se puede ampliar el número de ítems (hacer más preguntas).Ventajas: corrección rápida y se llega a un acuerdo entre jueces.Desventajas: perdemos mucho la valoración de la creatividad del sujeto y sigue siendo subjetiva. Ítems de respuesta estructurada: Se pierde totalmente la posibilidad de valorar respuestas creativas (p.e. exámenes tipo test), se le dan las respuestas al sujeto y se le pide que elija una alternativa. La muestra es mucho mayor, se hacen más



preguntas. Se responde a cada ítem por separado, son independientes entre sí y se suelen puntuar uno a uno.Ventajas: permiten la comparación de grupo por presentar las mismas respuesta a cada sujeto. Más fáciles de cuantificar, mayor precisión, hay una clave de corrección clara y por ende, más acuerdo entre los jueces.Desventaja: menor libertad a la hora de responder, no se valora la originalidad y creatividad. Perdemos cualidades, son muy atomistas (analiza una pequeña parte del comportamiento del sujeto). Existen diferentes tipos: Ítems de respuesta alterna. Verdadero-falso, sí-no:

-Utilización de términos que no sean generales o universales, pues son erróneos (nunca, siempre, todas, ninguna...)-Evitar el empleo de términos ambiguos o indefinidos para asignar cantidad (p.e. hace ejercicio frecuentemente?, la interpretación de este puede variar de una persona a otra). Es necesario poner cantidad (3, 4 o más veces por semana).-Procurar no utilizar negaciones (enunciados negativos) y muchísimo menos la doble negación (pues esto afirma).-Limitar los enunciados de verdadero-falso a una sola idea (una idea para cada enunciado)-Que los enunciados tengan aproximadamente la misma extensión (p.e. generalmente, un enunciado verdadero es más extenso que uno falso).

Ventajas: se pueden construir muchos, recoger más muestras de conducta, son fáciles de corregir y rápidos.Desventajas: difíciles de construir, pierde la capacidad de creatividad. Ítems de elección de respuesta múltiple:

-Poseen más de dos alternativas, generalmente de 3 a 5. Son más flexibles, representan mejor lo que quieren evaluar, hay más opciones para el sujeto. -Es necesario delimitar bien el enunciado de las alternativas de respuesta. El enunciado debe contener toda la pregunta (saber que estamos preguntando y poner las alternativas pertinentes). El enunciado puede ser amplio pero las alternativas de respuesta deben ser breves.-El enunciado debe ser claro y específico, claramente expuesto (cuál es nuestra pregunta) y que sea positivo, no utilizar la doble negación (pues esta evalúa lo peor de una persona no lo mejor). -Asegurarse de que haya solo una respuesta válida o que expresa mejor lo que se pregunta (p.e. en los test de personalidad, la respuesta que manifiesta mejor ese rasgo). Que haya una única respuesta óptima, evidente sobre las demás y asegurarse de que las otras también sean plausibles.-No proporcionar indicadores involuntarios para las respuesta (todas tienen que acercarse a lo que quieren medir).

Ventajas: suele ser más objetiva la corrección, existe un mayor acuerdo y se puede corregir mediante el uso del ordenador (p.e. en la selección de personal). Se corrige rápidamente y de forma objetiva se puede comparar y el número de ítems es amplio para tener una muestra representativa de la conducta del sujeto. Recogen mucha información en poco tiempo.Desventajas: para redactarlos bien lleva mucho tiempo (su construcción), no permiten analizar la creatividad del sujeto. A veces es difícil determinar cuándo una respuesta óptima es correcta sobre las demás. Su utilización depende del ámbito de trabajo, por ello puede ser mejor o peor en una determinada situación (p.e. para aplicaciones grupales son buenas pero en el ámbito clínico no, serían mejores las de ensayo). Ítems de completamiento: son semiobjetivos o mixtos: mezclan los ítems de respuesta libre y los estructurados. Hay mayor flexibilidad y hay varias respuestas correctas.

CARACTERISTICAS Si cada ámbito va ser valorado igual habrá un mismo número de ítems para cada

área (p.e. la asertividad en la familia, el trabajo, con los amigos), si le damos más relevancia mayor número de ítems y obtener más muestras de conducta.



¿Cómo elegimos los ítems? - La elección de los ítems la hace el autor de los test, tomando en cuenta:

Que sean representativos del atributo que quiero medir, ¿cómo se manifiesta ese atributo? observación directa, definir cuál es la manifestación, tomar datos de campo.

Hasta que punto necesito una precisión de los datos, cuanto más estructurado es un ítem más preciso es pero menos creativo. Qué quiero evaluar y qué precisión quiero; me interesan los datos cualitativos o cuantitativos, describir (cualidad, ensayo) o predecir (cantidad, respuesta alternativa).

Las personas, a quien voy a evaluar, considerar edad, nivel sociocultural, académico, contexto, ambiente. Variables del sujeto.

Forma de administración: individual o colectiva. Tiempo disponible (las pruebas verbales son más rápidas de aplicar y corregir que

una manipulativa o gráfica) Longitud (cuántos ítems tendrá la prueba): Ver la característica que quiero evaluar y

lo amplia que es (p.e. una característica de personalidad es más amplia que el clima familiar, más concreto), y ver si tengo de esa característica tengo más áreas de evaluación, si es así necesitaré más ítems. Cada uno de los ítems es una muestra de conducta, cuántas más tengamos mejor podremos entender al sujeto pero sin perder el equilibrio (no preguntas en exceso).

Tipo de ítems elegidos (la prueba es más larga o corta según los ítems, las pruebas verbales tienen más ítems, los manipulativos son menos). Demarcar la longitud del test.

Finalidad del instrumento, según ella la longitud puede cambiar. Forma de aplicación. Los test individuales suelen tener menor número de ítems, en

los colectivos se pierden la relación de tú a tú y otra información, hay que tener más preguntas, son más amplios que los individuales (p.e. tiempo de reacción WAIS, dificultad de los ítems y cuánto tiempo necesita para pensar y responder).

Características del sujeto. Tiempo de aplicación, si tenemos menos tiempo utilizamos test cortos. No hay normas fijas, depende de estos apartados y del autor.

dificultad de los ítems: Tomar en cuenta el tipo de prueba, en las de personalidad tendrá que ser una dificultad media y media-alta, en los test de manipulativos y de inteligencia existirán diferentes niveles. Por ende, hay que valorar lo que mide la prueba y el tipo de sujetos a evaluar (tipo de ítems, presentación, áreas de contenido y características del sujeto marcarán la dificultad). Es importante que el nivel de lectura o lenguaje de los sujetos evaluados no sea un obstáculo para responder a las tareas, debe estar adecuado a su nivel de lenguaje. La única excepción sería si se trata de una prueba en que se evalué el rendimiento en el lenguaje, pero en ellas poco a poco se va aumentado el grado de dificultad para que el sujeto encuentre ítems que pueda resolver. (p.e. para un niño son más difíciles los ítems verbales que los gráficos).

APLICACIÓN, CORRECIÓN Y PROCEDIMIENTOS ESTADÍSTICOS DE LOS ITEMS: Hay que aplicar el test y para ello tenemos que tener en cuenta:

Delimitar unas normas claras de aplicación. Tener elegida de forma clara la muestra representativa. Aplicar el test: Recoger datos significativos.

Ahora hay que hacer un análisis de los ítems a dos niveles: Cualitativo: análisis lógico- racional. Cuantitativo: análisis empírico de las propiedades estadísticas de cada uno de

los ítems.A. ESTADÍSTICA DE ÍTEMS: es tan económica como la anterior. Una sola medida.

Valora la consistencia interna con criterios internos. Comparamos las puntuaciones de cada ítem con la puntuación obtenida en el test completo.

Se considera a cada ítem como un test individual. Comparación de cada ítem con la puntuación total del test.

Se supone que todos los ítems tienen la misma varianza y la misma media utilizamos la formula de Kuder- Richardson.

Si las varianzas y medias son distintas:



Los distintos métodos nos dan diferentes medidas de confiabilidad, varían en cuanto al grado y en cuanto al contenido

INSTRUMENTOS PSICOMETRICOSA.- DE INTELIGENCIA B.- DE PERSONALIDAD CONSEJOS PARA REALIZAR ESTAS PRUEBAS TIPOS DE PRUEBAS No evalúan ni lo que sabes ni lo que sabes hacer, sino lo que podrías llegar a saber y a hacer, es decir, tu potencial. Lo importante aquí es no considerar que si no pasas una prueba psicotécnica, es porque eres medio tonto. En realidad, cada empresa decide qué busca al pasar un psicotécnico (por ejemplo, para un puesto de trabajo determinado, puede que la empresa no seleccione a personas con una inteligencia superior a la media -según el test, claro- porque no desempeñaría bien el trabajo). Los test que suelen pasar en una selección de personal, suelen depender del puesto de trabajo, es decir, si te presentas para administrativo, seguramente pasarán un test numérico (si lo tuyo no son los números, tendrás que destacar más en otras habilidades que se requieran, o pensar en otros puestos de trabajo, en los que los números no sean tan importantes).B.- DE INTELIGENCIA TEST DE AMPLITUD: Miden el conocimiento y/o el rendimiento. Pueden valorar la memoria, precisión, destreza, atención, sentido de la organización, agilidad manual y mental. -MATRICES DE RAVEN: Orientados a la valoración de la inteligencia concreta, nivel de observación y organización lógica. Consiste en descubrir qué figura corresponde al cuadro en blanco de los otros que aparecen en la parte inferior. Las figuras pueden ser abstractas u objetos que mantienen un orden lógico. Interesan la identificación y la diferenciación de formas. Son ejercicios en orden de dificultad creciente. El tiempo está limitado, con lo cual hay que evitar estancarse en un ejercicio. -FICHAS DE DOMINÓ: Miden la abstracción lógica. -TEST DE RAZONAMIENTO: Miden las facultades de adaptación: agilidad mental, resolución de problemas, etc. -TEST DE COMPRENSIÓN VERBAL: Miden la comprensión de ideas, facultad de análisis y síntesis. C.-DE PERSONALIDAD • -TEST DE RORSCHACH: Analiza las dimensiones intelectual, afectiva y de comportamiento. -TEST DE APERCEPCIÓN TEMÁTICA: Evalúa los factores y necesidades de la conducta y de las motivaciones, valorando las emociones y estados internos. -TEST DE ÁRBOL: Revela a la persona en la vida interior y el desarrollo afectivo. En definitiva en un prueba psicotécnica nos podemos encontrar los siguientes puntos: • Test de información: Evalúan cuestiones relacionadas con el vocabulario, fluidez verbal y significado de las palabras. • Problemas aritméticos: Intentan medir la capacidad para resolver problemas aritméticos y matemáticos mediante ejercicios relacionados con números. • Series numéricas: Estos ejercicios prueban la capacidad para resolver problemas aritméticos y matemáticos, convirtiéndose en una buena forma de medir el razonamiento inductivo o razonamiento abstracto. Las series numéricas pueden presentarse de forma que el individuo complete los números que faltan o bien se les da a elegir el número siguiente entre varias alternativas posibles. • Series alfabéticas: Del mismo modo que con las series numéricas, se pretende medir también el razonamiento abstracto. • Problemas de razonamiento no verbal: Son test que se han creado con figuras o símbolos para medir la inteligencia general o el razonamiento abstracto. • Ejercicios de visualización: Evalúan la capacidad para captar relaciones espaciales. Es importante para aquellas personas que deben manejar objetos, máquinas, planos, etc. • Test de capacidad mecánica: Tienen como finalidad identificar a aquellos individuos con aptitudes para trabajos de carácter mecánico y trabajos de mantenimiento. • Test de personalidad: Tratan de buscar rasgos de carácter, acordes con el perfil del puesto: introvertido o extrovertido, dinámico o pasivo, optimista o pesimista, con iniciativa o sumiso, impulsivo o moderado, etc. • Test de aptitudes administrativas: Sirven para medir la capacidad de percepción, rapidez de lectura, de precisión en actividades específicas, cálculo aritmético, comprobación de datos, ortografía, archivo, comprobación de errores, etc.



AVTIVIDAD 06

INSTRUMENTOS PSICOMÉTRICOSEl Mini Mental StateExamination (MMSE) de Folstein.

DESCRIPCION:

Diseñado por Folstein y McHung en 1975, con la idea de proporcionar un análisis breve y estandarizado del estado mental que sirviera para diferenciar, en pacientes psiquiátricos, los trastornos funcionales orgánicos. Hoy en día, se utiliza sobre todo para detectar y evaluar la progresión del Trastorno Cognitivo asociado a Enfermedades Neurodegenerativas como la de tipo Alzheimer. El MEC fue la primera versión en castellano del MMSE, adaptada por Lobo y col. La versión de 35 puntos, fue la primera y es la más utilizada actualmente. Se trata de una sencilla escala estructurada, que no requiere más de 5 – 10 minutos para su administración.

Sus ítems exploran 5 áreas cognitivas:Orientación, Fijación, Concentración y Cálculo, Memoria y LenguajeINSTRUCCIONES GENERALES: Invitar al entrevistado a colaborar. No corregir nunca al paciente, aunque se equivoque. Contabilizar los puntos correctos de cada uno de los 5 ítems del test.

1. Orientación: No se permite la Comunidad Autónoma como respuesta correcta para la provincia ni para nación o país(excepto en las comunidades históricas).

2. Fijación. Repetir claramente cada palabra en un segundo. Le damos tantos puntos como palabras repita correctamente al primer intento. Hacer hincapié en que las recuerde, ya que más tarde se le volverán a preguntar. Asegurarse de que el paciente repita las tres palabras correctamente hasta que las aprenda. Están permitidos seis intentos para que las repita correctamente.

3. Concentración y Cálculo: Sustracción de 3 en 3. Si no le entiende se puede reformular la pregunta. Si tiene 30 pesetas y me da tres ¿cuántas le quedan?, y seguir pero sin repetir cifra que dé el paciente. Se dará un punto por cada sustracción correcta. Repetir los dígitos 5 – 9 – 2 lentamente: 1 segundo cada uno, hasta que los aprenda, se le da 1 punto por cada dígito que coloque en posición inversa correcta.

4. Memoria: Dar un amplio margen de tiempo para que pueda recordar sin ayudarlo. 1 punto por cada palabra recordada sin tener en cuenta el orden.

5. Lenguaje y construcción: El entrevistador ha de leer la frase poco a poco y correctamente articulada, un error en la letra, es 0 puntos en el ítem:Semejanzas: En las semejanzas perro-gato las respuestas correctas son animales de “x” características. Órdenes verbales, si el paciente coge el papel con la mano izquierda, se valorará como error, si lo dobla más de dos veces es otro error.Lectura, escritura y dibujo: Si utiliza gafas se solicita que se las ponga.

Frase: Advertir que no se considerará correcta si escribe su nombre. Si es necesario se le puede poner un ejemplo, pero insistiendo en que ha de escribir algo diferente. Debe construir una frase con sujeto, verbo y complemento para valorarla con un punto.Figura. Cada pentágono ha de tener exactamente 5 lados y 5 ángulos y debe entrelazarse en dos puntos de contacto.

PUNTUACIÓN:

La puntuación total máxima es de 35 puntos.



Excluimos las preguntas que hayan sido eliminadas, básicamente por analfabetismo o por imposibilidad física de cumplir un ítem (ej.: ceguera). Entonces calculamos la puntuación total corregida: la obtenida por regla de tres después de corregir la puntuación total. Ejemplo, si el paciente es ciego y no puede acceder a 4 de los 35 puntos posibles, la puntuación final se calculará sobre 31 puntos posibles. Imaginemos que la puntuación total ha sido 20, aplicando la corrección obtenemos una puntuación (20x35/21) = 22,5 (redondearemos al núm. entero + próximo, el 23).INTERPRETACIÓN:

Instrumento sencillo y breve de aplicación, no requiere de especiales habilidades para su administración. La edad y la escolarización influyen en la puntuación total.Existen limitaciones a su uso en pacientes con bajo nivel cultural, analfabetos o con déficit sensoriales. No explora todas las áreas cognitivas. Posibilidad de que pasen inadvertidos los casos incipientes de deterioro cognitivo.RANGO de PUNTUACION 0 – 35. Lobo y col, proponen:Pacientes GERIATRICOS:(> de 65 años), punto de corte 23/24; es decir, 23 ó menos igual a “caso” y 24 ó más a “no caso”.Pacientes NO GERIATRICOS punto de corte 27/28 (es decir, 27 0 menos igual a “caso”, y 28 ó más igual a “no caso”.Cuestionario de Estado Mental Portatil de Pfeiffer

DESCRIPCION

Fue diseñado por Pfeiffer en 1975 como test de screening de deterioro cognitivo.Se encuentra validado en nuestro país por García-Moltalvo.

Se trata de un cuestionario heteroaplicado de 10 ítems, sobre cuestiones muy generales y personales. Se puede pasar en 4 –5 minutos. Se van anotando las respuestas erróneas. Se permite un fallo de más si el paciente no ha recibido educación primaria y uno de menos si tiene estudios superiores.

Explora la: Memoria a corto plazo.Orientación. Información sobre hechos cotidianos, y la Capacidad de cálculo.

INTERPRETACIÓN.

Detecta tanto la presencia de deterioro cognitivo como el grado del mismo. Las cuestiones con varias respuestas sólo se aceptan como correctas si todos los elementos de la misma lo son.

Para población de raza blanca y nivel cultural medio se considera: - NORMAL de 0 a 2 errores.- Deterioro cognitivo Leve de 3 a 4 errores.- Deterioro cognitivo MODERADO (Patológico) de 5 a 7 errores,- Deterioro cognitivo Importante de 8 a 10 errores.

Sus valores psicométricos arrojan valores bajos de sensibilidad en estudios realizados en la comunidad (S 34 – 48% y E 94- 95 %) y mejorando éstos en casos diagnosticados de grados moderados o severos de demencia.



Enfatiza mucho el lenguaje y la memoria y tiene una intensa orientación verbal. Por lo que en algunos tipos de déficit sensoriales o trastornos psiquiátricos (depresión) podría dar falsos positivos. A pesar de haber sido diseñado para screening, no detecta deterioros leves ni cambios pequeños en la evolución del deterioro cognitivo.

Es un test muy rápido de administrar que no requiere especial entrenamiento, lo que lo hace muy indicado en los CRC... Se ha mostrado especialmente útil en invidentes, personas de edad avanzada y analfabetos. Especialmente útil para screening en población general.

PROPIEDADES PSICOMETRICAS- Fiabilidad:La fiabilidad test-retest oscila entre 0,82 y 0,85.- Validez: Los índices de correlación con otros instrumentos similares: son 0,76 al 0,88 con el Mental Status Questionnaire.- Sensiblidad: Según varios estudios recogidos por Del Ser la sensibilidad, varía del 68 al 82 % y la Especificidad del 92 al 96%.

Trastornos orgánicos: Ansiedad DepresionTrastornos del ESTADO DEL ÁNIMODepresión

Actualmente se conocen más de 100 escalas, lo que nos da una idea de las limitaciones de estas herramientas y del hecho de que no existe ningún instrumento "ideal".En las escalas todos los síntomas son igual de importantes y se suman ítems vegetativos o cognitivos de forma intercambiables. Por eso, estas escalas no permiten realizar el diagnóstico de dapresión y mucho menos especificar de qué tipo de depresión se trata... Su función es evaluar la intensidad de los síntomas una vez que se ha realizado el diagnóstico.OBJETIVO DE LA ESCALA:Son 3 los objetivos principales de las escalas para evaluar la depresión:- Cuantifica la intensidad de la depresión en sujetos ya diagnosticados.- Evalúa la efectividad del tratamiento.- Cribaje en población general o en población clínica.CARACTERISTICAS ESPECÍFICAS: La primera de las escala desarrolladas para evaluar la depresión fue la de HAMILTON, y con ella nacía la moderna psicometría.

1. La Escala de HAMILTON. Es la más utilizada y sirve de referencia para todas las demás. Que deben demostrar una buena validez convergente con ésta....... Su mayor limitación es que requiere cierto entrenamiento por parte del entrevistador por lo que encarece su uso.

2. La Escala de BECK. Es la más empleada de las escalas autoadministradas en depresión.

3. Escala Ansiedad Depresión de GOLDBERG. Es una de los tests utilizado como instrumento de cribaje en depresión y ansiedad. Es breve, fácil de administrar y sirve como guía clínica.

4. Escala Ansiedad Depresión Hospitalaria. Especialmente indicada en pacientes hospitalizados con co-morbilidad orgánica.

Estas dos últimas escalas no evalúan específicamente depresión ya que también incluyen ansiedad. El problema de a ellas es que no discriminan bien ambas entidades. El solapamiento entre las escalas de ansiedad y depresión no debe atribuirse necesariamente a una mala construcción del instrumento, sino a la mala delimitación de ambos síndromes clínicos. Por eso se tienden a emplearse como medidas de malestar general, en la línea del General HeatthQuestionnaire (GHQ).



Trastornos del ESTADO DEL ÁNIMOAnsiedad.

A la hora de seleccionar una escala para medir la ansiedad es conveniente considerar el diagnóstico. La Ansiedad como síntoma es ubicua y puede presentarse en casi todas las enfermedades psiquiátricas, no solo en los trastornos de ansiedad.

Las escalas que nosotros vamos a utilizar miden fundamentalmente trastornos de ansiedad y suelen emplearse las escalas AUTO – EVALUADA.

CARACTERISTICAS ESPECIFICAS DE CADA INSTRUMENTO. Escala de HAMILTON:

Es la primera de las escalas desarrolladas para evaluar la ansiedad en sentido general. Es la más utilizada, después del Cuestionario de ansiedad Estado Rango (STAI) para evaluar la intensidad de los síntomas en los trastornos de ansiedad. De hecho, sirve de referencia o "patrón oro" para todas las demás escalas de ansiedad, que deben demostrar una buena validez convergente. Por tanto, puede emplearse como primera elección en cualquier situación. Sus mayores limitaciones son:- Requiere cierto entrenamiento por parte de los entrevistadores.- Es una escala general, poco útil si queremos evaluar Trastornos de ansiedad específicos como la Fobia,- Trastornos de angustia y mucho menos Trastornos obsesivo-compulsivos.

Escala de ZUNG.Es posterior a la de Hamilton y mide la ansiedad general. Se desarrollaron dos versiones: Una HETEROEVALUADA por un clínico (ASI), y Otra AUTOEVALUADA, la SAS.A diferencia de la escala de Zung de depresión, su validez no ha sido tan cuestionada.

Su principal ventaja es que no incluye ningún ítem que evalúe la depresión, limitación que si se observa en la de Hamilton, por lo que el poder discriminativo ansiedad / depresión es mayor en la escala de Zung.

Escala de BECK.La escala auto - administrada se utiliza para detectar pacientes con ansiedad en cualquier población, para medir la intensidad de la ansiedad en pacientes diagnosticados y para monitorizar tratamientos farmacológicos o psicológicos.

Inventario de DEPRESION de BECK

BeckdepressionInventory (BDI) y col, 1961

DESCRIPCION.

El inventario de Depresión de Beck (BAI) fue desarrollado inicialmente como una escala heteroaplicada de 21 ítems para evaluar la gravedad (intensidad sintomática) de la depresión, conteniendo cada ítem varias fases autoevaluativas que el entrevistador leía al paciente para que éste seleccionase la que mejor se adaptase a su situación; sin embargo, con posterioridad su uso se ha generalizado como escala autoaplicada.. Beck y cols.(1979) da a conocer una nueva versión revisada de su inventario, adaptada y traducida al castellano por Vázquez y Sanz (1991), siendo ésta la más utilizada en la actualidad.

Es un cuestionario autoaplicado de 21 ítems que evalúa un amplio espectro de síntomas depresivos. Se sistematizan 4 alternativas de respuesta para cada ítem, que evalúan la gravedad / intensidad del síntoma y que se presentan igualmente ordenadas de menor a mayor gravedad. El marco temporal hace referencia al momento actual y a la semana



previa. Ni la numeración de las alternativas de respuesta, ni los enunciados de los distintos ítems deben aparecer en el formato de lectura del cuestionario, ya que al dar una connotación clínica objetiva a las frases pueden inflluir en la opción de respuesta del paciente.

Su contenido enfatiza más en el componente cognitivo de la depresión, ya que los síntomas de esta esfera representan en torno al 50% de la puntuación total del cuestionario, siendo los síntomas de tipo somático/vegetativo el segundo bloque de mayor peso; de los 21 ítems, 15 hacen referencia a síntomas psicológicos-cognitivos, y los 6 restantes a síntomas somáticos vegetativos.

INTERPRETACION

El paciente tiene que seleccionar, para cada ítem, la alternativa de respuesta que mejor refleje su situación durante el momento actual y la última semana. La puntuación total se obtiene sumando los valores de las frases seleccionadas, que van de 0 a 3.

El rango de la puntuación obtenida es de 0-63 puntos. Como otros instrumentos de evaluación de síntomas, su objetivo es cuantificar la sintomatología, no proporcionar un diagnóstico.

Los puntos de corte usualmente aceptados para graduar la intensidad/ severidad son los siguientes:

No depresión: 0-9 puntos Depresión leve: 10-18 puntos Depresión moderada: 19-29 puntos Depresión grave: > 30 puntos

A efectos de cribado o detección de casos en población general el punto de corte ha sido establecido por Lasa L. y cols en > 13 puntos. En pacientes médicos la validez predictiva de la escala está peor establecida, por cuento los ítems somáticos tienden a aumentar el número de falsos positivos si se utiliza un punto de corte bajo y se han utilizado puntos de corte más altos ( por ej.: > 16 en pacientes diabéticos, > 21en pacientes con dolor crónico).

A efectos de selección de sujetos para investigación, el punto de corte usualmente aceptado es > 21 puntos.

Cuestionario de Screning de ANSIEDAD de Wittchen.

DESCRIPCION:Este cuestionario fue desarrollado por Wittchen y cols con el objeto de detectar trastornos de ansiedad generalizada y otros trastornos de ansiedad. Está basado en el Composite International Diagnostic Interview (CIDI). Su versión 1.2 se desarrolló para cubrir criterios diagnósticos DSM-IV y ICD-10. Ha sido diseñado para su uso en atención primaria.El cuestionario consta de varias secciones:

1. Motivo de acudir a la consulta: es el ítem 1 y recoge una información útil para el clínico (dolor, estrés emocional o psicológico, enfermedad física o somática...)



2. Diagnósticos: ítems 2 a 7. Cada uno de ellos evalúa un diagnóstico distinto mediante las llamadas cuestiones llave, que poseen una elevada sensibilidad operativa para el diagnóstico de una patología.

3. La contestación negativa a estas cuestiones hacen casi imposible el diagnóstico del cuadro explorado... Los diagnósticos evaluados son: trastorno depresivo mayor, trastorno y síndrome de pánico, trastorno de ansiedad social, agorafobia, trastorno de estrés postraumático y estrés agudo y trastorno de ansiedad generalizada. Si la respuesta a estos seis ítems es negativa se finaliza la cumplimentación del cuestionario.

4. Trastorno de ansiedad generalizada: evalúa tanto los criterios de ansiedad generalizada como cuadros subclínicos de ansiedad, según los criterios DSM-IV, completados con algunas cuestiones recogidas en CIE -10.

Valoran los siguientes aspectos. contenidos de las preocupaciones y ansiedad (ítems 8-10), dificultad para controlar las preocupaciones (ítems 11 y 12), síntomas físicos de ansiedad (ítem 13, que tiene 11 sub - ítem; los 6 primeros son

específicos de trastorno de ansiedad generalizada y los 5 siguientes corresponden a los incluidos en CIE-10),

impacto sobre la vida del paciente (ítem 14) y criterio temporal de duración de los síntomas (ítem 15).

El marco temporal explorado es distinto para cada ítem. El cuestionario es auto administrado. No se encuentra validado en nuestro medio y la versión que presentamos es la de Bobes y cols.INTERPRETACION:Es un instrumento fácil y rápido de utilizar (en el estudio original de tiempo de cumplimentación fue de 3.5 minutos), que no requiere entrenamiento especial.La Sensibilidad y especificidad de las distintas cuestiones llave es la siguiente: Trastornos de pánico (S 95% E 62%). Agorafobia (S 88% E58%),Fobia Social (S 89% E 51%, Trastornos por estrés postraumático (S 82% E 49%),Trastorno Depresivo Mayor (S 87% E 68%),Trastornos de Ansiedad generalizada (cuestión llave más criterio, S 92% E 74%).Respecto a los criterios de trastorno de ansiedad generalizada, los autores no proponen ningún punto de corte. Cuantos más criterios se cumplan mayor posibilidades de presencia del cuadro.El cuestionario resulta útil tanto en cuadros de ansiedad establecidos como en situaciones subclínicas.PROPIEDADES PSICOMETRICAS:Fiabilidad:La fiabilidad tetst-retest para cuadros de ansiedad generalizada establecidos fue de Kappa 0.72 y para ansiedad generalizada subclínica de 0.70.Validez:La validez concurrente se estableció con el CIDI, presentando valores de Kappa de 0.88 % , con Sensibilidad global de 88 y Especificidad de 96.3%. Cuando se analizan los resultados con los criterios DSM-IV la sensibilidad es alta, pero la especificidad alcanza solo valores moderados.Instrumentos psicométricos de Personalidad

1. Para comprender el estudio de la personalidad nos vamos a apoyar en los métodos destinados a apreciar “los rasgos del comportamiento” o las reacciones individuales.

2. Son los denominados TEST de PERSONALIDAD, y que clasificamos en:1. - LOS MÉTODOS o TEST PROYECTIVOS.

El test de Rorschach es el más representaativo de estos test. Pero por su extensión y por estar fuera del objetivo de este Manual, descartamos



desarrollarlo.

2. - LOS TEST OBJETIVOS de Personalidad.Estos test intentan determinar los diferentes factores de la personalidad. Son necesariamente validados según criterios exteriores a ellos mismos. Por consiguiente corresponderán o bien a una sistematización nosológica de la psiquiatria, o bien a una concepción estructuralista o incluso factorialista de personalidad.

CLASIFICAMOS los test Objetivos en:

(A) los Test clásicos que miden los factores de personalidad como:

Inventario de personalidad de Minessotta (MMPI)Factores de Personalidad (16 PF)Cuestionario de Análisis Clínicos (CAQ).Inventario de Personalidad de Pinillos (CEP)Inventario de Personalidad de EYSENCK (EPI).Todos ellos (el MMPI o el 16Pf, el CAQ, el EPI, o el CEP), nos permiten diagnosticar trastornos de personalidad según criterios de las clasificaciones psiquiátricas vigentes como el DSM o CIE.Estos test (de los que comentaremos sus características, a groso modo) al estar protegidos por copyright y comercializados por empresas especializadas, no se incluirán en su totalidad.(B) Test Específicos.Hemos incluido, entre otros, los que miden aspectos específicos de personalidad y que pueden ser útiles, en los CRC, son:

1) La Escala de Búsqueda de SENSACIONES, que mide este rasgo, se define como “la necesidad de sensaciones y experiencias nuevas, variadas y complejas, y el deseo de arriesgarse con el fin de obtenerlas”. Se ha empleado en: Individuos con conductas inmaduras. En trastornos de personalidadad, e incluso en individuos normales que realizan deportes de riesgo.

2) El Test de Hostilidad de BUSS-DURKEE, que es uno de los cuestionarios autoaplicados más empleados para medir la agresión, de especial utilidad para evaluar impulsividad, intencionalidad suicida y agresión en general.

3) La Escala de Impulsividad de BARRAT. Es autoaplicado y uno delos más utilizados en investigación. Está indicado en trastornos de personalidad (especialmente límites), trastornos bipolares y todo trastorno psiquiátrico en que la conducta impulsiva o suicida constituye un problema.

3. Test Específicos de PersonalidadHemos incluido, entre otros, los que miden aspectos específicos de personalidad y que pueden ser útiles, en los CRC, son:

1) La Escala de Búsqueda de SENSACIONES.

Esta escala mide este rasgo, se define como “la necesidad de sensaciones y experiencias nuevas, variadas y complejas, y el deseo de arriesgarse con el fin de obtenerlas”. Se ha empleado en: Individuos con conductas inmaduras. En trastornos de personalidadad, e incluso en individuos normales que realizan deportes de riesgo.



2) El Test de Hostilidad de BUSS-DURKEE. Este, es uno de los cuestionarios autoaplicados más empleados para medir la agresión, de especial utilidad para evaluar impulsividad, intencionalidad suicida y agresión en general.

3) La Escala de Impulsividad de BARRAT.Es una escala autoaplicado y uno de las más utilizadas en investigación. Está indicado en trastornos de personalidad (especialmente límites), trastornos bipolares y todo trastorno psiquiátrico en que la conducta impulsiva o suicida constituye un problema.

4. ESCALA de BUSQUEDA de SENSACIONES.

DESCRIPCIÓN

La escala de búsqueda de sensaciones (Forma V), fue diseñada por Zuckerman y col., siendo la versión más reciente la de 1978. Su objetivo es valorar la búsqueda de sensaciones”. Este rasgo fue definido por Zúckerman como “la necesidad de sensaciones y experiencias nuevas, variadas y complejas y el deseo de arriesgarse con el fin de obtenerlas”.Es un cuestionario autoadministrado, formado por 40 preguntas con respuestas dicotómicas (Si – No). Cada respuesta afirmativa puntúa 1 y cada negativa 0.

CONSTA de 4 Escalas:

Búsqueda de Emociones (BEM): ítems 1.5.9.13.17.21.25.29.33.37Búsqueda Excitación (BEX): ítems 2,6,10,14,18,22,26,30,34, 38Desinhibición: ítems 3,7,11,15,19,23,27,31,35,39.Susceptibilidad al aburrimiento (SAB):4,8,12,15,20,24,28,32,36,40

Proporciona por tanto 4 puntuaciones distintas (una por escala) y además una total. En nuestro medio ha sido validada por Pérez y col., en base a trabajos previos de este mismo autor.

INTERPRETACION.Se trata de un instrumento adecuado para la investigación del rasgo “búsqueda de sensaciones” en nuestro medio. No existen puntos de corte propuestos por los autores y debe interpretarse que puntuaciones + elevadas representan mayor presencia del rasgo.Al igual que numerosos estudios, en la validación española se observan puntuaciones más elevadas en todas las subescalas y la puntuación total en varones respecto a las mujeres. En varones las puntuaciones más altas se obtienen en la escala BEM y las menores en la SAB. En mujeres las más altas en la BEM y las menores en la DES. Existe una relación inversa entre la edad y la puntuación de la escala.

La subescala SAB es la menos homogénea, la que presenta menor correlación con las otras y es la que menos fiabilidad alfa demuestra. La menor fiabilidad se obtiene mediante la utilización de la puntuación total. En lugar de la de las subescalas. A modo orientativo, presentamos los datos normativos en población española

BEM BEX DES SAB TOTAL Varones 6.8 (2,6) 5,7 (2,1) 5,1 (2,5) 3, ) ,3 (6,4) Mujeres 6,1 (2,4) 5,4 (1,9) 3,0 (1,9) 3,0 (1,9) 17,7 ,3)



PROPIEDADES PSICOMETRICAS.

Fiabilidad

La fiabilidad test- retest en la población española con un intervalo de 5 días es en valores del 0,9 para la puntuación total y oscila entre 0,68 y 0,94 para las subescalas. En las mujeres para la puntuación total es de 0,92 y entre 0,72 y 0,95 para las subescalas. El mismo caso anterior. Pero con un intervalo de 5 semanas arroja valores similares en varones (0,88 para la puntuación total y 0,71 – 0,86 para las subescalas) y mujeres (0,78 para el total y 0,70 – 0,87 para las subescalas).

Validez La validez concurrente observada con las diferentes escalas selEysencjPersonalityQuestionnaire son: Las Escalas E (Extraversión) y P (Psicoticismo) presentan correlaciones superiores con la escala de Busqueda de Sensaciones que la escala de N (Neuroticismo).

Instrumentos Psicométricos que nos permiten evaluar la Esquizofrenia y los Trastornos Psicóticos

INTRODUCCION:Desde la descripción de Demencia precoz por Kraepelin, que se considera el punto de partida de la psiquiatría moderna, se han intentado identificar grupo de síntomas que diagnostiquen de forma fiable este trastorno. De hecho, las clasificaciones psiquiátricas DSM y CIE han intentado, en cada una de sus ediciones, afinar los criterios diagnósticos en este sentido, sin conseguir acuerdos definitivos.En 1980 Crow y en 1982 Andreasen defienden la existencia de 2 tipos de síntomas en la esquizofrenia: Positivos y Negativos, con sus correlatos biológicos y de neuroimagen. En 1987, Liddle revisa este modelo y sugiere uno tridimensional con las categorías de Positivo-paranoide, Negativo-Deficitario y desorganizado y hefebrénico. En 1990, Kay y Sevy proponen un modelo de 4 factores:: Positivo, Negativo, Agitación y Depresión.Por último, Linstrom y Von Knorring entre otros autores, proponen un sistema pentadimensional con las siguientes dimensiones: negativo, Positivo, Disfunción cognitiva, Ansiedad / Depresión y Excitación. Todas estas propuestas cuentan con estudios que poyan y con otras que los invalidan, y cualquier otra alternativa nosológica resulta igualmente endeble.En este momento se acepta que la esquizofrenia es un grupo hetereogéneo de enfermedades cuya clasificación se encuentra en contínua revisión. La consecuencia es que no hay un “patrón oro”, por lo que las escalas de evaluación , basadas en alguno de los modelos descritos, se emplean para validar o rechazar dichos modelos, produciéndose un error autológico metodológicamente inaceptable. Este problema casi específico de la esquizofrenia, no parece que vaya a subsanarse en los próximos años, por lo que va a implicar limitaciones importantes desde el punto de vista de la Psicometría.TIPOS DE ESCALAS:Los principales aspectos que pueden evaluarse en la esquizofrenia son los siguientes:1)Instrumentos para evaluar la PSICOSIS en general. Por las características

específicas de la Psicosis (la falta de conciencia de enfermedad en la mayoría de estos enfermos), las escalas tienen que ser heteroevaluadas ya que el paciente frecuentemente no va a colaborar. Dentro de este grupo, la BPRS (ESCALA BREVE DE EVALUACION PSIQUIATRICA) es no solamente la escala más utilizada con esta función, sino el test psiquiátrico más empleado a nivel internacional junto a la escala de Hamilton de Depresión. Inicialmente se empleó para monitorizar el tratamiento farmacológico en



pacientes con Psicosis, utilidad en la que se considera de elección, pero poco después empezó a emplearse en la evolución del síndrome Psicótico.

2) Instrumentos para la evaluación síntomas Positivos y Negativos. En este grupo, la escala más empleada internacionalmente con diferencia es la PANSS, (ESCALA SINDROME POSITIVO Y NEGATIVO EN ESQUIZOFRENIA), También es heteroaplicada, basada en la BPRS y fundamentalmente en el modelo Crow. La utilidad de esta escala ha motivado que se incluya en la Entrevista Clínica Estructurada (CSID) que recomienda la Asociación Psiquiátrica Americana para realizar los diagnósticos del DSM – III – R.

3) Instrumentos para la evaluación de otros aspectos relacionados con la enfermedad.En este grupo, la escala más importante es la AIMS: (ESCALAS DE MOVIMIENTOS INVOLUNTARIOS ANORMALES), que evalúa los efectos extrapiramidales secundarios al tratamiento neuroléptico. Éstos efectos, constituyen una de las principales limitaciones a la calidad de vida de estos enfermos y el principal motivo de abandono del tratamiento.La AIMS es la escala más empleada internacionalmente para medir este aspecto, aunque no se encuentra validada en español.

Test de inteligencia:Los Test de Inteligencia más que medir la inteligencia en sí (posibilidad muy discutible), valoran los conocimientos, aptitudes y capacidades del individuo, por lo que se tiende hoy a llamarlos test de aptitudes, de eficiencia o de rendimiento.

CONCEPTOS:

Conjunto de capacidades – razonamiento, memoria, asimilación, percepción, habilidades numéricas, visualización espacial, rapidez mental, etc. – que pueden estar en un sujeto en grados muy distintos. No es algo unitario sino una serie de cualidades que se miden con pruebas diversas.

TIPOS DE TETS:1. Individuales. (más fiables que los grupales).2. Grupales. Autoadministrados, y de Realización.3. Verbales:

OTIS, varias formas equivalentes destinadas a personas de distintos niveles mentales. Permite formarse un juicio bastante aproximado sobre el nivel mental y el desarrollo intelectual de los candidatos.

WECHSLER – BELLEVUE, para adultos. Consta de 11 pruebas.

WAIS, aprecia a través de las pruebas verbales, la inteligencia teórica y, a través de las pruebas de ejecución, la inteligencia

4. Tests No Verbales:

Test D - 48, series de dominó

Matrices progresivas de RAVEN

PM – 38Desarrollamos los que más nos puedan ayudar a la hora de valorar el Nivel o Coeficiente de Inteligencia.



ACTIVIDAD 07 y 08

Cualidades que debe tener un test psicométricoConfiabilidadLa confiabilidad (o consistencia) de un test es la precisión con que el test mide lo que mide, en una población determinada y en las condiciones normales de aplicación. (Anastasi, 1982; Aiken, 1995). (Las condiciones normales de aplicación se refieren a las condiciones especificadas en el manual del test).La falta de confiabilidad de un test psicométrico esta en relación con la intervención del error. Se considera que el error es cualquier efecto irrelevante para los fines o resultados de la medición que influye sobre la falta de confiabilidad de tal medición. El error es de dos tipos: a) Error constante (sistemático), que se produce cuando las mediciones que se obtienen con una escala son sistemáticamente mayores o menores que lo que realmente deben ser. b) Error causal (al azar o no sistemático), que se produce cuando las medidas son alternativamente mayores o menores de lo que realmente deben ser.Este último tipo de error interviene cuando se afecta la confiabilidad de un test psicométrico. Este error tiene que ver con la salud, fatiga, motivación, tensión emocional, fluctuaciones de la memoria, condiciones externas de luz, humedad, ventilación, calor, distracción por problemas del momento, familiaridad con la prueba, que presenta el examinado al momento de dar el test (Rey, 1972; Brown, 1982).

¿Cómo se presenta la confiabilidad de un test psicométrico? La confiabilidad se presenta por medio del coeficiente de confiabilidad (rxx) y del error estándar de medida (EEM). Jaime Aliaga 93

A) Coeficiente de confiabilidadEs un coeficiente de correlación entre dos grupos de puntajes e indica el grado en que los individuos mantienen sus posiciones dentro de un grupo. Abarca valores desde 0 a 1. Cuanto más se acerque el coeficiente a 1, más confiable será la prueba. El coeficiente de confiabilidad señala la cuantía en que las medidas del test están libres de errores casuales o no sistemáticos.Por ejemplo, un coeficiente de 0.95 quiere decir que en la muestra y condiciones fijadas de aplicación del test el 95% de la varianza de los puntajes directos se debe a la auténtica medida, y sólo el 5%, a errores aleatorios.Existen cuatro métodos básicos para obtener el coeficiente de confiabilidad (rxx): Método de las formas equivalentes; método del test-retest; método de la división por mitades emparejadas o "Split half method"; y método de la equivalencia racional o de Kuder- Richardson.a) Método de las formas equivalentes: Se aplican dos formas equivalentes o paralelas del test al mismo grupo de individuos, y las dos series de puntajes resultantes se correlacionan con el coeficiente producto de los momentos de Pearson (r).b) Método del test-retest: Se aplica dos veces el mismo test (el lapso entre las aplicaciones se determina previamente), a una misma muestra de individuos. Las dos series de puntajes resultantes se correlacionan con el coeficiente de correlación "r" de Pearson.c) Método de la división por mitades emparejadas o "split half method": Se aplica el test una sola vez a una muestra. Luego, se califica por separado los ítemes pares (2, 4, 6, ..., n) y los ítemes impares (1, 3, 5, ..., n). A continuación, las dos series de puntajes resultantes se correlacionan con el coeficiente "r" de Pearson, pero por haberse dividido el test en dos partes (ítemes pares e ítemesimpares), el "r" resultante debe ser "corregido" para arrojar el "r" para todo el test. Esta corrección se efectúa con la fórmula de profecía de Spearman-Brown:d) Método de la equivalencia racional: En este método se considera que si un test esta formado por un conjunto de ítemes estos pueden ser considerados como un conjunto de



tests paralelos (tantos como ítemes tenga el test). Luego se deriva una ecuación para computar el coeficiente de confiabilidad. Kuder y Richardsonderivaron varias fórmulas para el cálculo del coeficiente de 94 Psicometríaconfiabilidad, son las más conocidas la KR20 y la KR21. Actualmente, un coeficiente más utilizado es el coeficiente alfa de Cronbach(1972; Anastasi, 1982; Aiken, 1995).

B) Error estándar de medidaPor medio de este error estándar de medida se estima el intervalo probable de puntajes en el cual se encontrará el puntaje verdadero de un sujeto examinado con un test psicométrico. El error estándar de medida (EEM) se obtiene a través de la siguiente fórmula:EEM = s 1- rxxDonde:s = Desviación estándar de los puntajes de la distribución.rxx = Coeficiente de confiabilidad del test.1 = Constante.Obtenido el EEM, debemos escoger el nivel de confianza:- Nivel de confianza del 68% = PD ± 1 EEM.- Nivel de confianza del 95% = PD ± 2 EEM.Para el nivel de confianza del 68% la interpretación es la siguiente: "Podemos concluir, con un 68% de confianza, que el puntaje verdadero de un sujeto está en la zona o intervalo comprendido entre su puntaje directo u obtenido (PD) y ± 1 EEM".El nivel de confianza más usado en psicometría es el del 95%: "el puntaje verdadero de un sujeto se encontrara en el intervalo comprendido entre su puntaje obtenido o directo (PD) y ± 2 EEM".

ValidezSi tenemos una prueba “X” nos equivocaríamos al creer que su titulo nos dice lo que la prueba mide, pues cualquier persona puede reunir un conjunto de reactivos y esperar a obtener una medida, por ejemplo, de razonamiento numérico o de las estrategias de aprendizaje. La averiguación de lo que la prueba mide no responde a la pregunta ¿cómo llama el autor a la prueba?, sino más bien ¿a qué hacen referencia los puntajes obtenidos en esta?, ¿es válido el uso o la interpretación de las puntuaciones de este test?, ¿qué generalizaciones se pueden hacer apropiadamente a partir de la puntuación en esta prueba? (Thorndike, 1989). En esencia, el trasfondo de estas preguntas es determinar cuáles son los procesos mentales que pone en juego el test. Ahora bien, el responder a las Jaime Aliaga 95 citadas interrogantes necesita de una indagación larga y compleja que en psicometría se denomina proceso de validación.

a) Distinción entre la validez y la confiabilidad según el error. La distinción entre confiabilidad y validez se basa en lo que consideramos como error. En la validez interesan los errores constantes o sistemáticos y en la confiabilidad los errores aleatorios o no sistemáticos. El siguiente ejemplo nos permitirá precisar la diferencia entre ambos tipos de error: Supongamos que un reloj es adelantado 20 minutos. Si se trata de un buen cronometro el tiempoque marca será confiable (es decir consecuente), pero no será valido en comparación con el tiempo estándar (hora GMT).b) Definición de validez. En términos estadísticos la validez se define como la proporción de la varianza verdadera que es relevante para los fines del examen. Con el término relevante nos referimos a lo que es atribuible a la variable, características o dimensión que mide la prueba. En este sentido, generalmente la validez de un test se define ya sea por medio de (1) la relación entre sus puntuaciones con alguna medida de criterio externo, o bien (2) la extensión con la que la prueba mide un rasgo subyacente específico hipotético o “constructo”.



En términos psicométricos, la validez es un concepto que ha pasado por un largo proceso evolutivo, desde aquella posición que sostenía que “un test es válido para aquello con lo que correlaciona” (Guilford, 1946, citado en Muñiz, 1996, p. 52), hasta la más reciente que la entiende como un juicio evaluativo global en que la evidencia empírica y los supuestos teóricos respaldan la suficiencia y lo apropiado de las interpretaciones y acciones en base a los puntajes de las pruebas, que son función no sólo de los ítemes sino también de la forma de responder de las personas así como del contexto de la evaluación. Es decir, lo que se valida no es la prueba sino las inferencias hechas a partir de la misma, lo que tiene dos importantes consecuencias: a) el responsable de la validez de una prueba ya no es solo su constructor sino también el usuario, y b) la validez de una prueba no se establece de una vez por todas sino que es resultado del acopio de evidencias y supuestos teóricos que se dan en un proceso evolutivo y continuo que comprende todas las cuestiones 96 Psicometría experimentales, estadísticas y filosóficas por medio de las cuales se evalúan las hipótesis y teorías científicas (Messick, 1995). En este contexto, el concepto validez refiere a la adecuación, significado y utilidad de las inferencias específicas hechas con las puntuaciones del los tests. La validación de un test es el proceso de acumular evidencia para apoyar tales inferencias. Una variedad de evidencias pueden obtenerse de las puntuaciones producidas por un test dado, y hay muchas formas de acumular evidencia para apoyar una inferencia específica. La validez, sin embargo, es un proceso unitario. Aunque la evidencia puede ser acumulada de muchas formas, la validez se refiere siempre al grado en que esa evidencia apoya las inferencias que se hacen a partir de las puntuaciones” (APA, AERA, NCME, 1985, citado en Gómez e Hidalgo, 2002). La validez no se puede resumir en un solo indicador o índice numérico, al igual que ocurre con la confiabilidad (p.e., el coeficiente de confiabilidad), sino que la validez de las puntuaciones de un test se asegura mediante la acumulación de evidencia teórica, estadística, empírica y conceptual del uso de las puntuaciones.

c) Tipos de evidencia. En 1954 un comité presidido por L. J. Cronbach estableció por encargo de la Asociación de Psicología Americana (APA), que la validez era de cuatro tipos: validez de contenido, validez predictiva, validez concurrente y validez de constructo. Actualmente se coincide, desde el punto de vista científico, que la única validez admisible es la validez de constructo(Messick, 1995). Validación que ha de hacerse en un marco teórico, pues se trata en última instancia de confirmar o explicar las inferencias que se hagan de los puntajes. La validez de constructo esta referida al grado en que cada prueba refleja el constructo que dice medir, elaborándose operativamente cuando el usuario desea hacer inferencias acerca de conductas o atributos que pueden agruparse bajo la etiqueta de un constructo particular. Su lógica en muchos aspectos así como en sus métodos, es esencialmente la del método científico, pudiendo verse como la elaboración de una “miniteoría” acerca de una prueba (Kline, 1985) cuyas hipótesis deben someterse a contraste con evidencias que provengan de diferentes fuentes como la de los tipos de validez propuestos por Cronbach, entendidas como estrategias de validación, en vista que cada tipo de inferencia requerirá una Jaime Aliaga 97 estrategia distinta para la obtención de las evidencias (Vidal, 1996, en Muñiz, 1996).En el estudio de la validez de constructo estas evidencias están relacionadas a cinco aspectos: a) Contenido (relevancia y representatividad del test);b) Sustantivo (razones teóricas de la consistencia observada de las respuestas);c) Estructural(configuración interna del test y dimensionalidad);d) Generalización (grado en que las inferencias hechas a partir del test se pueden generalizar a otras poblaciones, situaciones o tareas); e) Externo (relaciones del test con otros tests y constructos); f) Consecuencia (consecuencias éticas y sociales del test) (Messick, 1995).

d) Categorías de la validez. La validez empieza a considerarse como el grado en que cada test refleja el constructo que dice medir y que las relaciones entre tests que miden distintos constructos reflejan las relaciones hipotetizadas entre ellos. En este sentido, al



estimarse que la validez de un test es la validez de constructo la que ha de hacerse en un marco teórico, ya no se tiende a hablar de tipos de validez sino de categorías o estrategias de validación comprendiendo éstas a los tipos tradicionales de validez: validez de contenido, validez empírica y validez de constructo. Si tenemos en cuenta que lo que se valida no es el test sino las inferencias hechas a partir del mismo, cada tipo de inferencia requerirá una estrategia distinta. (Vidal, 1996, en Muñiz, 1996).

(1) Validez de Contenido (evidencia del contenido).- ¿Los ítems que constituyen el test son realmente una muestra representativa del dominio de contenido o dominio conductual que nos interesa?Es conveniente precisar que un dominio o campo conductual es una agrupación hipotética de todos los reactivos posibles que cubren un área psicológica particular. Al hablar de este conjunto de reactivos posibles, se emplean los términos de dominio, universo o población conductual como sinónimos. Por ejemplo: Un test de vocabulario debe ser una muestra adecuada del dominio o universo de ítems posibles en esta área. La validez de contenido consiste en determinar lo adecuado del muestreo de reactivos del universo de reactivos posibles; en este sentido, es una “medida” de lo adecuado del muestreo. Ponemos “medida” entre comillas debido a que este tipo de validez consiste en 98 Psicometría una serie de estimaciones u opiniones, que no proporcionan un índice cuantitativo de validez (para su obtención no se utiliza procedimientos estadísticos). Este tipo de validez se asocia fundamentalmente a los tests de aprovechamiento o rendimiento (testde matemática, historia, etcétera); aunque no existen razones para que no pueda aplicarse a los otros tipos de pruebas psicológicas (pruebas de aptitudes, habilidades, etcétera). Para su determinación se compara sistemáticamente los reactivos del test con el dominio conductual del contenido postulado. Por ejemplo: si tenemos una lista de 500 palabras que esperamos que los estudiantes de un curso sean capaces de escribirlas correctamente al final de este, su performance o rendimiento respecto a estas palabras será importante solamente en tanto que proporciona una prueba de su habilidad para escribir correctamente las 500 palabras. El test que construyamos tendrá una muestra de las 500 palabras, pero sólo tendrá validez de contenido en la medida en que proporcione una muestra adecuada de las 500 palabras que represente. Si seleccionamos solamente palabras fáciles o difíciles, o palabras que representen únicamente ciertos tipos de faltas comunes de ortografía, estaríamos propensos a obtener una validez de contenido muy baja. En consecuencia, el aspecto clave en la validez de contenido es el muestreo de los reactivos. En otras palabras, la validez de contenido es cuestión de determinar si la muestra de sus reactivos es representativa del universo o dominio conductual de ítems al que supuestamente representa. Para hacer esta determinación se recurre a “jueces” (o expertos, generalmente en número impar). El proceso es básicamente lógico y racional, los distintos jueces pueden no estar de acuerdo en la validez de contenido de un test; por ejemplo, la falta de claridad en la especificidad del dominio conductual, hará que resulten difíciles los juicios de validez de contenido. Existen algunos índices estadísticos para valorar el grado de acuerdo de los jueces en torno a los reactivos, por ejemplo el coeficiente V de Aiken. Un procedimiento para que el proceso de “enjuiciamiento” de los reactivos sea lo más objetivo posible, es el siguiente:- El constructor de la prueba:* Define específicamente el dominio del contenido por medio de una descripción que lo debe delimitar claramente. Jaime Aliaga 99* Define, si fuera necesario, subcategorías importantes del dominio, especificando esta importancia en términos porcentuales.- Los jueces:* Determinan si los reactivos sometidos a su consideración pertenecen o no al dominio definido así como también si, tomados en conjunto, tienen una proporción adecuada.* También enjuician la bondad de la redacción de loselementos. Es usual considerar en los tests de aprovechamiento escolar a este tipo de validez como un concepto similar al de validez curricular. Por otro lado, es necesario diferenciar la validez de contenido de la llamada validez de facie. Esta última se da



cuando se revisa superficialmente los reactivos y se consideran que los ítems “parece” que miden lo que se supone tienen que medir. Esta validez puede ser una consideración importante a tener en cuenta, si la “apariencia” de los ítems influye en la motivación del sujeto. Por ejemplo, si en un test para adultos se incluyen reactivos en lenguaje y contenido infantil, se dirá que este test no tiene validez de facie; el sujeto puede no sentirse motivado a obtener buenos resultados al sentir que la prueba es poco importante para la decisión que se va a tomar.

(2) Validez Predictiva (evidencia externa) - ¿Predicen las puntuaciones del test un rendimiento o conducta futura? (Junto con la validez concurrente se le denomina también validez empírica del test).Un uso común de los tests es predecir la conducta futura; utilizamos el test para ayudarnos a tomar alguna decisión práctica (selección, clasificación, etc.). En cada una de estas situaciones, cuanto mayor es la exactitud de predicción del resultado (es decir del criterio externo), tanto más útil será la prueba. Por ejemplo, el test será un componente aceptable de un proceso de selección depersonal, si sus calificaciones o puntuaciones predicen la ejecución de algún componente importante del trabajo (criterio externo); en otras palabras, para que el test se pueda utilizar como parte de un proceso de selección es preciso demostrar la validez de la prueba relacionándola con los criterios pertinentes. En este sentido, el contenido de la prueba pasa a tener un lugar secundario, siendo el interés fundamental del psicólogo el averiguar si el test predice un criterio determinado. 100 Psicometría Para este logro es necesario que los criterios externos con los cuales se relacionará las puntuaciones del test sean criterios validos y confiables.Un criterio es cualquier desempeño que los sujetos tienen en la vida real, por ejemplo, las medidas de rendimiento académico, medidas de rendimiento laboral, clasificaciones psiquiátricas, etcétera. En muchos casos resulta imposible hallar un criterio no ambiguo de un rasgo mental. Por ejemplo, dos psicólogos, Carla y Abel, que investigan el rasgo de aptitud numérica pueden emplear diferentes criterios externos para correlacionar los puntajes del test que han creado. Así, Carla puede considerar que el criterio externo más adecuado son las calificaciones que reciben los sujetos en un curso de mecánica en taller; mientras que Abel puede considerar como criterio el periodo de tiempo que gastan los estudiantes en aprender una tarea mecánica y sencilla durante el entrenamiento en un fabrica. ¿Qué sucede si las pruebas que emplean ambos psicólogos correlacionan 0.006 con uno de los criterios, y 0.70 con el otro?, ¿cómo podemos afirmar que la prueba es valida cuando arrojan resultados de cierta clase?, ¿se trata en verdad de una prueba de aptitud mecánica? En razón a situaciones como esta se llego a la conclusión de que la validación de un test es un proceso largo y no un hecho aislado. Solamente a través de estudios de correlación con una amplia variedad de criterios podremos comprender que mide la prueba. Así, una serie de investigaciones sobre la “prueba de actitud mecánica” nos puede demostrar que en realidad esta midiendo la habilidad para realizar movimientos fino y cuidadosamente controlados, siendo completamente independiente para comprender las reacciones complejas de la piezas mecánicas. De esta manera el test puede tener una alta correlación con las calificaciones obtenidas en el taller y ninguna con los trabajos e maquinarias. En el proceso de validación, la validez predictiva de un test (y también la concurrente) se expresa generalmente por medio de un coeficiente de correlación entre los puntajes y los denominados criterios. Este coeficiente se denomina coeficiente de validación. La interpretación de este coeficiente requiere un dominio excelente del análisis estadístico utilizado para obtenerlo. Después del criterio, los procedimientos estadísticos adquieren vital importancia para obtener esta categoría de validez. Incluso para un mejor análisis es conveniente contar con el dispersigrama o scatergrama o “nube de Jaime Aliaga 101 puntos” (gráfica del coeficiente de correlación entre las puntuaciones del test “X” y las del criterio “Y”).

(3) Validez Concurrente.- ¿Permiten las puntuaciones del test la valoración de ciertos hechos presentes? Para estimarla se administra el test y se le correlaciona con el criterio. La diferencia con la validez predictiva se da en dos aspectos: a) las medidas del test y del



criterio son obtenidas contemporáneamente, y b) en su uso principal. Respecto a esto último, se la utiliza principalmente para obtener tests como sustitutos de otros procedimientos menos convenientes por diversas razones. Ejemplos: un test de inteligencia colectiva se compara con uno de inteligencia individual. Los diagnósticos de lesiones cerebrales basados en el test de diseños de bloques (cubos de Kohs) se comparan con síntomas neurológicos. El problema principal de este tipo de validez es encontrar tests que sirvan como criterios válidos y confiables. Análogamente a la validez predictiva requiere un amplio domino de las técnicas de correlación y de los procedimientos estadísticos que se utilizan en su obtención. Junto con la validez predictiva es importante en ciertos problemas de psicología aplicada como en psicología clínica, psicología educacional, psicología industrial y en general, en la toma de decisiones que debe hacer el psicólogo en situaciones de selección, clasificación, hospitalización, etc.

(4) Validez de Constructo.- El constructo viene a ser un concepto hipotético que forma parte de las teorías que intentan explicar la conducta humana: inteligencia, creatividad, dependencia de campo, etc. La validez de constructo es la obtención de evidencias que apoyan que las conductas observadas en un test son (algunos) indicadores del constructo. Este tipo de validez responde a lapregunta "¿cómo se puede explicar psicológicamente la puntuación del test?". La respuesta a esta pregunta puede verse como la elaboración de una “miniteoría” acerca de una prueba psicológica. La lógica de la validez de constructo en muchos aspectos así como en sus métodos, es esencialmente la del método científico. El proceso de validación de constructo implica a partir delestablecimiento de deducciones de la teoría:a) Formular hipótesis y relaciones entre elementos del constructo, de éste con otros constructos de la teoría y con otros constructos externos. 102 Psicometríab) Seleccionar ítemes o tests (indicadores) que representen manifestaciones concretas del constructo.c) Recogida de datos.d)Establecer consistencia entre datos e hipótesis, y examinar el grado en que los datos podrían explicarse mediante hipótesis alternativas.Hay diversos procedimientos para establecer la validez de constructo. Si elaboramos una “miniteoría” esta tendrá tres pasos: (1) en base a la teoría sostenida en ese momento respecto del test, el psicólogo deduce ciertas hipótesis sobre la conducta esperada de las personas que obtienen puntajes diferentes en el test, (2) se reúne datos que confirman o no esas hipótesis, (3) en base a los datos acumulados, se toma la decisión relativa a si la teoría explica adecuadamente los datos. Si no es así se tiene que revisar la teoría yrepetir el proceso hasta lograr una explicación más adecuada. El proceso de validación, en ese sentido, es de continua reformulación y refinamiento.Al determinar la validez de construcción, el propósito es identificar todos los factores que influyen en la ejecución del test y determinar el grado que influyen cada uno de ellos.Ejemplo: Un psicólogo construye un test de ansiedad y elabora una “microteoría” cuya contrastación le dirá si el test tiene validez de constructo. Las hipótesis a verificar son las siguientes:1. Los que obtienen puntuaciones elevadas acabarán probablemente en clínicas psiquiátricas en comparación con aquellos de puntuaciones más bajas.2. Será más fácil que les receten drogas psicotrópicas a los que tienen altas puntuaciones que a los de bajos puntajes.3. Los hijos de los de puntuaciones altas tendrán mayores probabilidades de tener una puntuación alta en el test que los hijos de quienes tuvieron puntuaciones bajas.4. El test de ansiedad se correlacionará alta y significativamente (más allá de 0.60) con otros test de ansiedad.5. El test de ansiedad no se correlacionará con variables que no resulten conexas con la misma.6. Los grupos psiquiátricos caracterizados como ansiosos alcanzarán en el test unas puntuaciones más altas que los del grupo control. Jaime Aliaga 103



7. En el test de ansiedad, los sujetos evaluados por supervisores y colegas como ansiosos, lograrán mayores puntuaciones que quienes están considerados como no ansiosos (Kline, 1985).Los resultados de los estudios que hagamos realmente no “validan” o “prueban” la teoría completa, puesto que nunca se puede demostrar una “construcción” en forma absoluta; solamente se puede aceptar como la mejor definición de trabajo. Si los resultados son negativos, hay por lo menos tres interpretaciones posibles: a) la prueba puede no medir el “constructo”, b) el marco teórico puede ser erróneo, permitiendo que se hicieran inferencias incorrectas, o bienc) quizá, el diseño del experimento no permitía una prueba apropiada de la hipótesis. La falla del diseño suele ser la falla más fácil de detectar, pero no siempre se puede hallar con facilidad el lugar exacto de la falla. La interpretación ambigua de los resultados negativos es un inconveniente evidente del procedimiento de validación de los “constructos” (Crombach, 1972; Kline, 1985).e) Implicaciones prácticas en la validación de un test. El psicólogo que utiliza un test debe tener en cuenta lo siguiente: a) antes de tomar de decisiones sobre individuos o grupos, debe acumular toda la información disponible acerca del test; b) para la predicción o selección, el test debe estar validado en la situación específica donde se va utilizar; c) en cualquier situación, el psicólogo debe tener presente que nuestras ideas sobre la naturaleza de los rasgos y sobre todo lo que miden se modifica constantemente con nueva información hacer

MÉTODOS EMPLEADOS PARA ESTIMAR LA VALIDEZDE CONSTRUCCIÓNa) Métodos intrapruebas, cuyas fuentes de evidencia más usadas son: la validez de contenido de la prueba, el análisis de los procesos psicológicos empleados al responderla (p. e., pidiendo que los sujetos “razonen” en voz alta sus respuestas). Otras técnicas estudian la estructura interna de la prueba, mediante el análisis de los ítemes y las correlaciones entre los diferentes subtests; asimismo, también mediante el establecimiento de la homogeneidad a través del coeficiente alfa de Cronbach o los coeficientes de Kuder-Richardson (que contribuyen a evaluar la unidimensionalidad del test).b) Métodos interpruebas: Utilizan las técnicas del análisis factorial (para evaluar los factores que subyacen en las intercorrelaciones de las 104 Psicometría pruebas estudiadas), la validez congruente (en tanto correlaciona los puntajes de la prueba con los puntajes obtenidos en otra prueba de validez ya establecida), los estudios de validez convergente y divergentediscriminante(propuestos por Campbell).c) El método de los estudios relacionados con los criterios: Que implican la diferenciación de grupos (evaluando la capacidad de la prueba para poder diferenciar dos o más grupos naturalmente separados o diseñados experimentalmente) y los coeficientes de validez (cuando la prueba es aplicada a un grupo de sujetos en los que se estudian criterios relacionados con el constructo teórico estudiado).d) El método de la manipulación experimental: Se manipula experimentalmente una variable y se observa sus efectos sobre los puntajes de una prueba psicológica o la relación de estos puntajes con algún criterio.e) El método de los estudios de la capacidad de generalización: Estos estudios analizan sistemáticamente la prueba psicológica en una amplia gama de dimensiones o en condiciones diferentes de administración (p. e., la matriz multirasgo-multimétodo propuesta por Campbell y Fiske).Teoría de respuesta al ítem (TRI)Llamada también Teoría del Rasgo Latente, es un modelo probabilístico que permite conocer la información proporcionada por cada ítem, y así crear tests individualizados, es decir, a medida. Es un modelo complejo que se ha popularizado como modelo de Rasch (1980) (aunque específicamente el modelo de Rasch es un parámetro de la dificultad del ítem), pero existe también el modelo de dos parámetros, que tiene en cuenta también la discriminación o pendiente de la curva, y el de tres parámetros que tiene en cuenta el



factor azar en la respuesta a ítemes de alternativas múltiples (Cortada de Kohan, 1999). La diferencia principal entre el modelo de la Teoría Clásica de los Test y este modelo es que la relación entre el puntaje observado y el rasgo o la aptitud en la teoría clásica es de tipo lineal (PD = PV + e: puntaje directo del sujeto es igual a su puntaje verdadero más el error); mientras que en los diversos modelos de la TRI las relaciones son funciones de tipo exponencial, principalmente logísticos. Los postulados básicos de la TRI son:1) El resultado de un examinado en un ítem puede ser explicado por un conjunto de factores llamados rasgos o aptitudes simbolizados por q.Jaime Aliaga 1052) La relación entre la respuesta a un ítem y el rasgo latente se describe como una función monotónica creciente que es la curva característica del ítem.3) En la TRI los parámetros de aptitud y de los ítemes soninvariantes.Los supuestos de la TRI son:1) La unidimensionalidad del rasgo latente, es decir, que los ítemes de un test deben medir una sola aptitud o rasgo; y2) La independencia, es decir, que las respuestas de un examinado a cualquier par de ítemes son independientes. Para estimar los parámetros de la TRI se usa el método de máxima verosimilitud, que es un proceso complejo que se logra con los softwares apropiados como BILOG, BICAL, y otros. (Cortada deKohan, 1998).

CONCLUSIONES1) La psicometría es una disciplina de la psicología cuya finalidad intrínseca es la de aportar soluciones al problema de la medida en cualquier proceso de investigación psicológica; constituye, por ello, un campo metodológico que incluye teorías, métodos y usos de la medición psicológica, tanto a nivel teórico como a nivel práctico.2) En psicología, medir es dar la magnitud de cierta propiedad o atributo, por ejemplo, la inteligencia, la extraversión, el razonamiento verbal, de una o más personas, con ayuda del sistema numérico.3) El test psicométrico es un procedimiento estandarizado compuesto por ítemes seleccionados y organizados, concebidos para provocar en el individuo ciertas reacciones registrables; reacciones de toda naturaleza en cuanto a su complejidad, duración, forma, expresión y significado.4) Los requisitos de un test psicométrico son: Construcción del test; la situación de aplicación del test; el registro del comportamiento provocado en el sujeto examinado, que debe ser preciso y objetivo; el comportamiento registrado evaluado estadísticamente con respecto a un grupo de individuos denominadogrupo de referencia o grupo normativo; clasificación de los sujetos examinados en función de normas resultantes del examen previo del grupo de referencia o normativo (baremo), lo que permite situar cada 106 Psicometría una de las respuestas, en una distribución estadística (contraste);.las respuestas a las cuestiones planteadas deben dar una medida correcta del comportamiento al que el test apunta (validez); y por último, la repetición del examen debe conducir siempre al mismo resultado (fiabilidad).5) La estandarización es el proceso mediante el cual se establecen procedimientos unívocos para la aplicación, calificación e interpretación de un test psicométrico.6) La interpretación de los puntajes de un test psicométrico estandarizado se refiere al significado que se les da a los puntajes obtenidos por un grupo de sujetos, al compararlos con una tabla de normas o baremo, estableciendo una clasificación de acuerdo a la conversión de sus puntajes directos en puntajes percentiles, eneatipos o decatipos.7) Los tests psicométricos se clasifican por lo siguiente: Por su forma de dar las instrucciones; por su forma de administración; por la forma o tipo de respuesta que exigen; por el material de la prueba; por su forma de calificación; por sus edades límites de aplicación; y por su libertad de ejecución. En los test psicométricos utilizados en educación existe actualmente un tipo de tests denominado test relacionado con el criterio.8) El test psicométrico es empleado como instrumento auxiliar para una mejor toma de decisiones: En la selección, clasificación, diagnóstico, investigación, y evaluación de un determinado grupo de personas.



9) Entre las limitaciones en el uso de un test psicométrico tenemos: Una prueba o test sólo puede medir aquellos aspectos para los que ha sido construido; las normas (baremo) de una prueba no tienen validez universal; si las condiciones que influyen sobre el individuo se modifican, existe la posibilidad de que tales cambios durante la aplicación de la prueba influyan en los puntajes resultantesdel test; los resultados de un test no deben emplearse para diagnosticar per se estados patológicos;.y, finalmente, las categorías descriptivas (inteligencia muy superior, superior, etc.) sólo deben utilizarse para los tests cuyos puntajes le dieron origen.10) Un test psicométrico tiene generalmente las siguientes secciones o partes: El test propiamente dicho, y el manual del test.11) Entre las cualidades que debe tener un test psicométrico, hay que tener en cuenta: la confiabilidad, que puede estimarse a Jaime Aliaga 107través de dos procedimientos: el coeficiente de confiabilidad y el error estándar de medida (EEM); y la validez, que es el grado en que una prueba mide lo que intenta medir.12) La validez científica de un test la da la validez de constructo. La tendencia ya no es hablar de tipo de validez, sino de categorías de validez en la que la validez de contenido, validez predictiva, validez concurrente y validez de constructo reconstituyen en estrategias de validación.13) La teoría de respuesta al ítem (TRI), denominada también Teoría del Rasgo Latente, es un modelo probabilístico que permite conocer la información proporcionada por cada ítem, y así crear tests individualizados, es decir, a medida. Los supuestos de la TRI son: la unidimensionalidad del rasgo latente; y la independencia, es decir, que las respuestas de un examinado a cualquier par de ítemes son independientes.



Actividad 10 y 11

MEDICION Y EVALUACIONMedición: medida interpretada que es implícita a la medición de un test. Objetiva: método y procedimiento en la administración de un instrumento sin influencia de factor externo; que al ser repetida en igualdad de circunstancias los resultados deben ser iguales. Tipificada: debe ser aplicable a una población diferenciada por ciertas características. Muestra de conducta : es muestra ya que ningún tipo de comportamiento es posible de medir completamente, lo que hacemos es aproximarnos a su medición a través de una muestra. MEDICIÓN: Consiste en reglas para asignar símbolos a objetos de manera que: 1. Representen numéricamente cantidades de atributos (escalas de medida). 2. Definan si los objetos caen en las mismas categorías o en diferentes con respecto a un atributo determinado (clasificación). Tanto las escalas de medición como la clasificación implican la formulación y evaluación de reglas. Estas reglas son usadas para medir atributos de los objetos, por lo general, pero no de manera exclusiva, sino también de personas. Es importante recordar que podemos medir sólo atributos de los objetos, no a los objetos mismos. Entre las características de las buenas reglas están la receptibilidad (confiabilidad) y de modo más importante, la validez en los sentidos que se describan. La estandarización es un objetivo importante de la medición debido a que facilita la objetividad, cuantificación, comunicación, economía y generalización científica. La medición usa matemáticas, pero las dos sirven a papeles separados. La medición necesita relacionarse con el mundo físico, pero las matemáticas puras sólo se ocupan de la consistencia lógica. Un aspecto tradicionalmente importante, pero controvertido de las escales de medición, es que estas por lo general caen en uno de cuatro niveles (han sido sugeridos otros); nominal, ordinal, de intervalos y de razón. Estos cuatro niveles representan de manera progresiva reglas mejor articuladas, por ejemplo, las escalas nominales tan sólo definen si dos (2) objetos son equivalentes o no, entre sí, con respecto a un atributo crítico, pero las escalas ordinales determinan si un objeto que no es equivalente a otro es mayor o menor que el otro; son posibles resultados más consistentes con niveles superiores de medición. El concepto de invarianza es básico para estos niveles de medición, el cual tiene que ver con lo que permanece igual cuando se realizan cambios permisibles en la escala. Las escalas de niveles superiores están más restringidas en cuanto a la manera en que pueden ser transformadas y aún conservar invarianzas claves. ESCALAS DE MEDICIÓN. Stevens propuso que las mediciones entran en cuatro (4) clases principales de escala de medición (nominal, ordinal, de intervalo y de razón), las cuales permitieron que se ejecutaran en las medidas, procedimientos cuantitativos cada vez más complicados, pero a su vez demandaron cada vez más de las operaciones de medición. Escalas de Medición: * Nominal: contiene reglas para decidir si dos (2) objetos son equivalentes o no para una categorización. El resultado de una escala nominal, es una serie de clases, a las cuales podría darse una designación numérica. Es importante distinguir entre usar categorías "Nombres" lo cual es impropio y la categoría "Frecuencias" la cual es bastante apropiada. * Ordinal: contiene reglas para decidir si un objeto es diferente a otro es mayor o menor con respecto a un atributo determinado. * De Intervalo: relfejan operaciones que definen una unidad de medición; así como mayor, igual o menor. * De Razón: es una escala de intervalo con un cero (0) racional (verdadero), en lugar de un cero (0) arbitrario. Un cero (0) racional significa la ausencia del atributo y no simplemente razonable.



AREAS DE APLICACIÓN DE LOS TEST PSICOMÉTRICOS:Dentro de las áreas aplicadas de la psicología el uso de test es fundamental en las siguientes: PSICOLOGÍA CLÍNICA: quizás la más popularmente relacionada con el uso de tests, ya

sea para la práctica privada o institucional, los tests le permiten al clínico tener una mayor cantidad de información del individuo en un menor tiempo así como acceder a elementos dificilmente alcanzables por otros métodos, así como también proporcionan un paneo con respecto a la forma de funcionamiento predominante en el paciente en determinadas áreas lo que cotribuye tanto al proceso de diagnóstico y despistaje, como al momento de planificar determinada intervención, remisión a otros profesionales o incluso al inicio de un proceso de psicoterapia.

PSICOLOGÍA EDUCATIVA Y ORIENTACIÓN VOCACIONAL: en esta área permite evaluar de una forma estandarizada, relativamente sencilla y muy enriquecedora, los procesos de niños, adolescentes o adultos relacionados con el aprendizaje y las posibles dificultades que se puedan presentar en éste, también es fundamental en las asesorías de elección vocacional, pues permiten visualizar las capacidades, aptitudes y preferencias que la persona posee pero que realmente no es capaz aún de identificar y de eleborar por sí mismo.

PSICOLOGÍA ORGANIZACIONAL Y LABORAL: al igual que en las áreas anteriores, permite acceder a una gran cantidad de información en un tiempo mínimo, permite despistar trastornos mentales mayores, identificar actitudes, potencialidades y debilidades y aplicar este perfil en el proceso de selección de personal para un cargo determinado.

COMPONENTES DE LOS TESTMANUAL TÉCNICO DE DESCRIPTORES DEL TEST Descripción del test (¿para qué sirve?, autor, año de publicación, cómo se

comercializa). Desarrollo de las escalas (qué pasos siguió para elaborar los ítems, tareas, qué

modificaciones se han dado, criterios seguidos paras las modificaciones) Proceso de adaptación española del test.. Justificación estadística (tratamiento de los datos, fiabilidad, validez, estudios

comparativos, grupos normativos especiales, estudios transculturales). Normas de interpretación (parámetros de cómo valorar cada una de las

puntuaciones que se han obtenido). Otros (bibliografía). Tablas de los normativos (estudios de estandarización).A. Estimación de las capacidades intelectuales de una persona.B. Adaptación de un test en otra lengua a la española (cómo se han superado los sesgos

culturales p.e. en los subtest de información)C. Datos estadísticos de las características de la muestra con la que se ha hecho la

estandarización (p.e. edad, sexo, nivel educativo) en el WAIS p.e. hay datos de varias edades.

MANUAL DE APLICACIÓN Y CORRECCIÓN (cómo se administran cada una de las tareas): Ámbito de aplicación (lugar) Cualificación del examinador (condiciones psicológica en individuales, si tiene

dificultad para comprender o algún problema sensorial). Procedimiento normalizado (reglas, instrucciones, etc.) Tiempo de aplicación (para cada subtest, tiempo mínimo esperado en el WAIS

hora y media). Condiciones ambientales. Tablas y baremos de corrección y ajustes estadísticos (inicialmente aparecen

diferenciados para cada subgrupo de edad) Obtención de puntuaciones típicas, escalares y CI/índices.Cuadernillo/hoja de respuestas, pueden estar o no, Materiales de administración para cada test, Plantilla de corrección: manual o informatizada.


http://es.wikipedia.org/wiki/Psicolog%C3%ADa_cl%C3%ADnica

http://es.wikipedia.org/wiki/Psicolog%C3%ADa_laboral

http://es.wikipedia.org/wiki/Psicolog%C3%ADa_organizacional

http://es.wikipedia.org/w/index.php?title=Orientaci%C3%B3n_vocacional&action=edit&redlink=1

http://es.wikipedia.org/wiki/Psicolog%C3%ADa_educativa


TIPOS DE PRUEBAS

A.- DE INTELIGENCIA

TEST DE AMPLITUD: Miden el conocimiento y/o el rendimiento. Pueden valorar la memoria, precisión, destreza, atención, sentido de la organización, agilidad manual y mental.

-MATRICES DE RAVEN:

Orientados a la valoración de la inteligencia concreta, nivel de observación y organización lógica.

Consiste en descubrir qué figura corresponde al cuadro en blanco de los otros que aparecen en la parte inferior. Las figuras pueden ser abstractas u objetos que mantienen un orden lógico. Interesan la identificación y la diferenciación de formas.

Son ejercicios en orden de dificultad creciente. El tiempo está limitado, con lo cual hay que evitar estancarse en un ejercicio.

-FICHAS DE DOMINÓ: Miden la abstracción lógica.

-TEST DE RAZONAMIENTO: Miden las facultades de adaptación: agilidad mental, resolución de problemas, etc...

-TEST DE COMPRENSIÓN VERBAL: Miden la comprensión de ideas, facultad de análisis y síntesis.

B.- DE PERSONALIDAD

-TEST DE RORSCHACH: Analiza las dimensiones intelectual, afectiva y de comportamiento.

-TEST DE APERCEPCIÓN TEMÁTICA: Evalúa los factores y necesidades de la conducta y de las motivaciones, valorando las emociones y estados internos.

-TEST DE ÁRBOL: Revela a la persona en la vida interior y el desarrollo afectivo.

En definitiva en un prueba psicotécnica nos podemos encontrar los siguientes puntos:

Test de información: Evalúan cuestiones relacionadas con el vocabulario, fluidez verbal y significado de las palabras. Problemas aritméticos: Intentan medir la capacidad para resolver problemas aritméticos y matemáticos mediante ejercicios relacionados con números. Series numéricas: Estos ejercicios prueban la capacidad para resolver problemas aritméticos y matemáticos, convirtiéndose en una buena forma de medir el razonamiento inductivo o razonamiento abstracto. Las series numéricas pueden presentarse de forma que el individuo complete los números que faltan o bien se les da a elegir el número siguiente entre varias alternativas posibles. Series alfabéticas: Del mismo modo que con las series numéricas, se pretende medir también el razonamiento abstracto. Problemas de razonamiento no verbal: Son test que se han creado con figuras o símbolos para medir la inteligencia general o el razonamiento abstracto. Ejercicios de visualización: Evalúan la capacidad para captar relaciones espaciales. Es importante para aquellas personas que deben manejar objetos, máquinas, planos, etc. Test de capacidad mecánica: Tienen como finalidad identificar a aquellos individuos con aptitudes para trabajos de carácter mecánico y trabajos de mantenimiento.



Test de personalidad: Tratan de buscar rasgos de carácter, acordes con el perfil del puesto: introvertido o extrovertido, dinámico o pasivo, optimista o pesimista, con iniciativa o sumiso, impulsivo o moderado, etc. Test de aptitudes administrativas: Sirven para medir la capacidad de percepción, rapidez de lectura, de precisión en actividades específicas, cálculo aritmético, comprobación de datos, ortografía, archivo, comprobación de errores, etc. Pruebas psicométricas y proyectivas:

CLEAVER Prueba que describe el perfil laboral de cada candidato. Describe el comportamiento y habilidades del personal en la organización, apoyando los programas de Planeación de Recursos Humanos, mejorando la comunicación y el desempeño en el trabajo

AUTODESCRIPCION DEL CANDIDATO Describe en términos de comportamiento, la percepción que el individuo tiene de sí mismo, con relación al puesto que desempeña, clarificando las diferencias existentes entre el puesto y el ocupante del mismo.

RASGOS A MEDIR EN CADA CANDIDATO:

* COMPORTAMIENTO DIARIO

COMPORTAMIENTO BAJO PRESIÓN

INDICADORES DE MOTIVACIÓN

TERMAN MERRIL Prueba para la medición del Coeficiente Intelectual I.Q., conocimientos generales, comprensión, análisis y síntesis, razonamiento, aritmética, juicio práctico, sentido común y capacidad de deducción. Proporciona una medida de la inteligencia para examinados adultos, esta orientado para personas de nivel escolar bachillerato o superior.

INVENTARIO MULTIFASICO DE LA PERSONALIDAD MMPI- ESPAÑOL Prueba de personalidad conocida también como MINESOTA, consta de 566 preguntas y está enfocada a la selección de personal, sin embargo la gráfica que se obtiene, se puede usar para un análisis más profundo o clínico.

Describe de manera textual las siguientes características: Hipocondriasis, Depresión, Histeria, Personalidad psicopática, Masculinidad-Feminidad, Paranoia, Obsesivo-Compulsivo, Esquizofrenia, Manía, Introversión Social, Capacidad de Autocrítica, Capacidad de Liderazgo, Actitud de Servicio, Capacidad para trabajar bajo presión, Capacidad para trabajar en equipo, Sentido de la realidad, Metas y logros, Meticulosidad y Detallismo.

BARSIT Determina rápidamente el nivel de inteligencia o aptitud para aprender. - Compara la composición de grupos, selecciona previamente casos excepcionales. - Adaptabilidad del sujeto.

HTP: (sigla que proviene de House, Three, person) El test de la casa/árbol/persona es un test proyectivo basado en la técnica gráfica del dibujo, a través del cual podemos realizar una evaluación global de la personalidad de la persona, su estado de ánimo, emocional, etc. La realización de dibujos es una forma de lenguaje simbólico que ayuda a expresar de manera bastante inconsciente los rasgos más íntimos de nuestra personalidad.



IPV (Inventario de la Personalidad del Vendedor ) Proporciona la medida de la Disposición General para la Venta (DGV) del candidato en dos dimensiones amplias las cuales son Receptividad y Agresividad.

KOSTICK: El Inventario de Preferencias y Percepciones de Kostick es un instrumento diseñado para ayudar a comprender los estilos administrativos de las personas, que permite evaluar a los candidatos a un puesto y a descubrir gente de éxito en las organizaciones.

MACHOVER: Prueba proyectiva mediante la cual se evalúa maduración, organicidad y cuadros patológicos. La personalidad se desarrolla a través del movimiento, sentimiento y pensamiento de un cuerpo específico. Los métodos proyectivos han puesto repetidamente determinantes profundos y quizás inconscientes, de expresión propia, los cuales no podrían manifestarse en comunicación directa. Toda actividad creadora lleva el sello específico de conflicto y necesidades que presionan sobre el individuo que está creando. La actividad despertada como respuesta a "Dibuje una persona", es en verdad una experiencia creadora. El dibujo de la figura humana indica una unión entre la figura y la personalidad del individuo que la realiza.

ZAVIC Prueba para evaluar los valores e intereses de los individuos: Consta de 20 preguntas con cuatro opciones cada una, se divide en dos áreas : Valores : Moral, Legalidad, Indiferencia y Corrupción Intereses : Economico, Politico, Social y Religioso. Otras....

1.Actividades Instrumentales De La Vida Diaria 2.Audit(alcohol Use Disorders Identification) 3. Barber - Encuesta Deteccion De Ancianos Con Riesgo 4. Barnes Para Evaluacion De Acatisia 5. Bender Koppitz Escala De Maduracion Neuro Motriz 6. Bprs - Escala Breve De Evaluacion Psiquiatrica 7. Cage 8. Clasificacion Rorschach 9. Componentes Obsesivo - Compulsivos De La Bebida 10 Coopersmith 11 Criterios De Ingreso Por Riesgo De Suicidio 12 Cuestionario Apgar Familiar 13 Cuestionario Apoyo Social Funcional 14 Cuestionario De 90 Sintomas - Scl - 90 - R - 15 Cuestionario De Actitudes Ante La Alimentación , Eat - 40 - 16 Cuestionario De Actitudes Ante La Allimentación , Eat - 26 - 17 Cuestionario De Actividad Funcional De Pfeffer 18 Cuestionario De Afrontamiento Del Dolor 19 Cuestionario De Apoyo Social De Sarans 20 Cuestionario De Cambios Vitales Recientes 21 Cuestionario De Dolor De Mcgill 22 Cuestionario De Estado Mental Portatil 23 Cuestionario De Estres Percibido De Leve 24 Cuestionario De Experiencia Traumatica 25 Cuestionario De Miedos 26 Cuestionario De Salud General De Gold



Actividad 12 AL 15

ESTADISTICAS QUE SE UTILIZAN PARA LAS MEDICIONES PSICOLOGICAS

TRATAMIENTO ESTADISTICO

DISTRIBUCION DE FRECUENCIAS LA DISPERSION

LA MEDIANA ( Me ) Dada una distribución de frecuencias con los valores ordenados de menor a mayor, llamamos mediana y la representamos por Me, al valor de la variable, que deja a su izquierda el mismo número de frecuencias que a su derecha.LA MEDIA ARITMÉTICA ( X ) La media aritmética o simplemente media, que denotaremos por X , es el número obtenido al dividir la suma de todos los valores de la variable entre el número total de observaciones.LA DESVIACIÓN ESTÁNDAR:En rigor, esta medida de dispersión es utilizada con más frecuencia por los estadísticos. Supongamos las observaciones x1, .., xi, .., xn, entonces la desviación estándar S se define como

Observemos como antes que esta desviación estándar tiene la misma unidad que las observaciones. En rigor es un promedio de las diferencias cuadráticas de las observaciones respecto de la media. El cuadrado permite eliminar los signos negativos, de modo que no se anulen diferencias simétricas en torno de la media.

PERCENTILES (PI) Son los valores que dividen a la distribución en 100 partes iguales, cada una de las cuales engloba el 1 % de las observaciones. En total habrá 99 Percentiles. (Q2 = D5 = Me = P50)

COEFICIENTE DE CORRELACIÓNUn coeficiente de correlación se dice que es significativo si se puede afirmar, con una cierta probabilidad, que es diferente de cero. Más estrictamente, en términos estadísticos, preguntarse por la significación de un cierto coeficiente de correlación no es otra cosa que preguntarse por la probabilidad de que tal coeficiente proceda de una población cuyo valor sea de cero. A este respecto, como siempre, tendremos dos hipótesis posibles.

TRANSFORMACION DE PUNTAJES DIRECTOS A PUNTUACIONES ESTANDAREsta técnica es la más conocida y utilizada en el marco de la TCT, al punto que muchos usuarios asumen que es la única existente para estimar la Puntuación Verdadera. Se trata de un procedimiento ampliamente recomendado por muchos autores (e.g. Allen & Yen, 1979; Anastasi & Urbina, 1998; Felt & Brennan, 1989; Gulliksen, 1950) que consiste en utilizar el EEM para construir un intervalo de confianza en torno a la Puntuación Observada. Teóricamente, el procedimiento se fundamenta en asumir que los errores de medida se distribuyen normalmente. Bajo este supuesto es posible utilizar el EEM para construir un intervalo de confianza para la Puntuación Verdadera, en torno a la Puntuación Observada. Sin profundizar en la derivación de la fórmula (para tal efecto ver, por ejemplo, Muñiz, 2001), las ecuaciones para el límite inferior y superior del intervalo de confianza corresponden a:



En ambas ecuaciones, x es la Puntuación Observada de un sujeto y Z representa el valor de la distribución normal asociado a la magnitud del intervalo de confianza que se desea construir. La práctica convencional es construir un intervalo no direccional de un 95% de confianza, al que corresponde un valor Z = 1.96. Para ilustrar la aplicación del método, supongamos que una persona obtiene 55 puntos en el test de autoestima, cuyo error estándar de medida calculamos en el apartado anterior (EEM = 4.47). ¿Cuál será su Puntuación Verdadera en el test? Aplicando las ecuaciones (6a) y (6b) para determinar los límites inferior y superior del intervalo de confianza al 95% (Z = 1.96), concluimos que Z (EEM) = 8.76 y, por tanto, que la Puntuación Verdadera se encontrará entre 46.2 y 63.8 puntos en el test. Puede observarse que, aun cuando las puntuaciones arrojadas por el test parecen fiables, el intervalo de confianza que contiene a la Puntuación Verdadera, con un 95% de confianza, es bastante amplio (17.6 puntos de magnitud).La interpretación del intervalo de confianza construido con la metodología tradicional no es fácil. Allen & Yen (1979) lo explican de la siguiente manera. Si una persona, que obtuvo un Puntaje Observado X en el test, fuera evaluada infinitas veces con la misma medida y construyéramos un intervalo de confianza de un 95% después de cada ocasión, en el 95% de las veces el intervalo incluiría la Puntuación Verdadera de la persona. Cuando existe sólo un intervalo, hay un 95% de confianza de que éste incluya la Puntuación Verdadera. En forma alternativa, se puede imaginar que un gran número de personas fueron evaluadas y se obtuvo un intervalo de confianza para cada una, centrado en la Puntación Observada para cada examinado. El 95% de esos intervalos debería incluir la Puntuación Verdadera del sujeto.Cociente Intelectual (CI). Indicador del nivel de inteligencia utilizado en las primeras pruebas psicométricas y que se calculaba mediante la división de Edad Mental (calculada por el test) y Edad Cronológica (edad real del Sujeto) multiplicada por 100. Un valor de 100 (igual edad mental y edad cronológica) indica normalidad, mientras que por debajo indica “retardo” y por encima “aceleración”. Cociente Intelectual de Desviación (CI Desviación). Sustituto del Cociente Intelectual original se desarrolló por las diferencias existentes en la varianza de las puntuaciones del Cociente Intelectual en los diferentes niveles de edad, que dificultaban la interpretación de los resultados. Es en realidad una transformación que tiene una media de 100 y una desviación típica de 15. Coeficiente de Correlación. Medida del grado de asociación que existe entre dos conjuntos de medidas realizadas en el mismo grupo de individuos. El más conocido y utilizado con Pruebas Psicométricas es Producto Momento de Pearson, aunque existen otros como correlación por rangos, biserial, tetracórico, etc. Tiene un recorrido entre +1.00 y –1.00 (asociación perfecta positiva o negativa), pasando por 0.00 (ausencia de relación entre ambas medidas). La correlación indica solamente asociación entre variables, no relaciones causales. Competencias. Características de las personas directamente relacionadas con el desempeño exitoso de un trabajo o una actividad. Incluyen conocimientos, habilidades, disposiciones afectivas, rasgos físicos y conductas de carácter relativamente estables que se pueden aplicar a diferentes situaciones y tipos de trabajo o tareas. Confiabilidad. El grado en que un test es consistente al medir la variable que mide. Algunas palabras asociadas con la Confiabilidad son estabilidad, exactitud, consistencia y precisión, así como el Error Estándar de Medida. La Confiabilidad se expresa usualmente mediante coeficientes de correlación, obtenidos a partir de los puntajes en dos aplicaciones de la misma prueba al mismo grupo de Sujetos o haciendo uso de pruebas paralelas aplicadas al mismo grupo de sujetos. También se define como Consistencia Interna, que se obtiene mediante la determinación de las intercorrelaciones o Covarianzas de los ítems.Construcción de pruebas, fases de la. Las pruebas psicométricas se construyen mediante un cuidadoso proceso, que garantiza la calidad de las mismas. Tavella identifica varias fases: 1) Preparatoria, en la que se define (teórica y operacionalmente) la variable a explorar, se establecen las especificaciones del instrumento, se elaboran los ítems, se depuran cualitativamente mediante el juicio de expertos, se elaboran



instrucciones y se estructura el instrumento. 2) Exploratoria, en la cual se aplica a una muestra informal de sujetos de la misma población a la cual va dirigida, se realiza análisis de ítems para determinar su calidad y se depura el instrumento. 3) Experimental, en la cual se aplica el instrumento ya depurado en la fase anterior a muestras formales de sujetos, hasta conocer mejor el instrumento, elaborar estudios de validez y confiabilidad y normas. 4) Definitiva, en la cual ya se considera que el instrumento está listo para su uso en grupos extensos de la población, así como para la realización de estudios normativos a gran escala. Constructo. Las variables psicológicas no son observables directamente, por lo que se infieren a través de la observación de la conducta de las personas, y se plantean en términos teóricos. Son inventados y adoptados en forma deliberada y consciente por la comunidad científica, es decir, “construidos” por los investigadores y teóricos de la psicología. Corrección (puntuación) de Pruebas. Es la asignación de puntajes a las respuestas dadas por un sujeto a las preguntas de una prueba. La mayoría de las veces se realiza mediante la asignación de un punto por cada respuesta correcta (ítems binarios), es decir, que coincida con la clave de respuestas (ver Clave de Corrección), aunque también son posibles otras formas de corrección, como restar a las respuestas correctas una proporción de las incorrectas. Consulte también Puntaje Directo o Puntaje Bruto. Corrección de Puntajes por Azar. Los ítems de opciones múltiples permiten responder al azar y alcanzar un cierto número de aciertos, es decir, permiten la adivinación de las respuestas. Por ejemplo, en una prueba de 40 ítems de cuatro opciones, la probabilidad de marcar la respuesta correcta por azar es de 25%, lo que permite establecer una media de puntajes por azar de 10 puntos y una desviación típica de 2,73 (en una distribución binomial, la media es 0,25x40= 8 puntos y la desviación típica raíz de 0,25X0,75x40= 2,73). Por ello se han propuesto formas de corrección por puntajes por azar. La más común es la siguiente, en donde Xc es puntaje corregido, C es el número de respuestas correctas, I es el número de incorrectas y k es el número de opciones. Estas fórmulas asumen que toda respuesta incorrecta es una respuesta al azar; lo usual es que se le recomiende al Sujeto, que se abstenga de dar respuestas en las que no esté completamente seguro y se le advierta sobre el uso de la fórmula de corrección. Correlación Múltiple. La correlación que se establece entre una variable predicha y varias variables predictoras en contraste con la Correlación simple. Por ejemplo, el rendimiento universitario (Criterio) que se predice haciendo uso de los resultados en varios tests (variables predictoras). La Correlación Múltiple tiene especial aplicación en las Ecuaciones de Regresión Múltiple, que permiten establecer una recta de regresión que incluye varias variables predictoras de la forma siguiente (en donde K es una constante, βnXn es la ponderación que se le da a cada una de las variables predictoras): Correlación simple. Relación que se establece entre una variable predictora (o independiente) y una variable predicha (o Criterio). Es el modelo más sencillo de correlación. Véase Correlación Producto Momento de Pearson. Correlación producto momento de Pearson. Coeficiente de correlación que permite establecer el grado de asociación entre dos variables continuas. Dado que se fundamenta en los mínimos cuadrados, exige que las variables guarden una relación lineal entre ambas y que presenten homocedasticidad. Criterio de Validación. Es un estándar mediante el cual se evalúa la validez de un test. Se requiere que sean también una medida de algún tipo, es decir, que se expresen en una Escala Cuantitativa. Pueden ser el rendimiento en otra variable como otro test, la apreciación de un supervisor en el trabajo, los juicios de un profesor, notas en un curso, etc. Usualmente se establece una correlación entre el rendimiento en el test y la puntuación en el criterio para decidir cuál es el grado de asociación entre el test y el criterio, lo que permite predecir el rendimiento a futuro o determinar el nivel actual en el criterio. Desviación Típica. Es una medida de la variabilidad o dispersión de una distribución de puntajes. Mientras menos dispersos están las puntuaciones alrededor de la Media menor es la desviación típica, mientras más se dispersan, mayor es la Desviación Típica. Cuando se trata de una Distribución Normal, existen algunas relaciones importantes. Por



ejemplo, a una desviación típica por encima y por debajo de la Media se encuentra el 68,26% de la distribución. El cálculo de la Desviación Típica se realiza mediante el cálculo de la raíz cuadrada de la sumatoria de los desvíos de los puntajes con respecto a la media elevados al cuadrado. Es también la raíz cuadrada de la Varianza. Dificultad de los ítems. El grado de dificultad de un ítem se determina mediante la proporción de respuestas correctas (cociente entre respuestas correctas divididas entre el número de respuestas totales). La proporción que se obtiene se denomina a la media del ítem, o “la p del ítem” y es un indicador directo de su facilidad, o inverso de la dificultad, ya que su valor, comprendido entre 0 y 1, indica que mientras más se acerca a 0 es más difícil el ítem (puesto que fue respondido por un menor número de personas) y mientras más se acerca a 1 es más fácil (respondido por un mayor número de personas). Error Estándar de Medida Sem. Es un estadístico que estima la posible magnitud del error presente en un puntaje individual. El Error Estándar de Medida indica la diferencia que puede existir entre el Puntaje Obtenido y el Puntaje Real o Verdadero (T), que se supone que refleja la verdadera posición del individuo en un continuo subyacente; esa diferencia se debe a errores de medida. Mientras mayor es el Error Estándar de Medida, menos confiable es la puntuación obtenida. El Error Estándar de Medida es una magnitud tal, que en aproximadamente dos terceras partes de los casos, el puntaje obtenido no diferirá más de un Error Estándar por encima o por debajo del Puntaje Real. En teoría se puede decir, que en 2 de cada 3 casos, el puntaje obtenido se encuentra en una banda que se extiende del Puntaje Real más o menos un Error Estándar de Medida; pero debido a que el Puntaje Real nunca se puede conocer, la práctica establece que, para la interpretación, se puede revertir la relación Puntaje Verdadero – Puntaje Obtenido. Escala. La sucesión de números en función de los cuales se realiza la medición. Clásicamente se distinguen cuatro niveles: Nominal, Ordinal, Intervalo, Razón. También se entiende por escalas, las transformaciones de puntajes que se realizan a escalas de propiedades conocidas, tales como Estaninas Percentiles, puntaje Z, Puntaje H, etc. Estadística Descriptiva e Inferencial. La E. Descriptiva es una rama de la estadística aplicada que permite describir las características de las distribuciones en función de los datos obtenidos. La E. Inferencial es una rama de la estadística que permite realizar inferencias sobre el comportamiento de los estadísticos en la población o un segmento de ella. Ambas son absolutamente necesarias en el trabajo estadístico de los datos psicométricos. Frecuencia. Es el número de observaciones que corresponde a un determinado puntaje en una escala. Usualmente las observaciones son los sujetos que obtuvieron ese puntaje. Frecuencia Acumulada. Es el número de observaciones acumuladas hasta el límite superior de un determinado puntaje en una escala. Se acumula siempre desde las puntuaciones más bajas en la Escala hacia los más altos.Inventario de Personalidad. Es un tipo de Prueba Psicométrica que consiste en un cuestionario o lista de chequeo, usualmente autoadministrada, diseñada para obtener información de variables no intelectuales de un individuo. Los inventarios usualmente evalúan rasgos tales como intereses, actitudes, motivación, etc. (véase Pruebas de Personalidad). Ítems. Son los estímulos o reactivos que se presentan a los sujetos para que respondan y pongan de manifiesto conductas asociadas con un atributo determinado. Dependiendo del tipo de prueba, los ítems varían sustancialmente. Un tipo común de ítem son los de opciones múltiples, que presentan un problema en el “pie” y varias opciones de respuesta de las cuales sólo una es la correcta (la clave) y las otras son Distractores, que sirven para atraer la respuesta de quienes no conocen realmente la respuesta correcta.Media o Media Aritmética. Es el promedio de las puntuaciones obtenidas por un grupo en un test. Se obtiene mediante la suma de las puntuaciones y la división entre el número de ellas. Medición. Consiste en la asignación de numerales a las propiedades de los objetos o eventos de acuerdo a ciertas reglas (Stevens). En medición psicológica, los objetos son las manifestaciones de los atributos psicológicos o constructos. Se fundamenta en varios supuestos: a) la asunción de la existencia de un continuo subyacente con direccionalidad, b) la existencia de un solo puntaje verdadero para cada sujeto, c) la variabilidad entre



sujetos con relación al puntaje verdadero y d) la posibilidad de obtener manifestaciones asociadas con la posición que la persona ocupa en el continuo subyacente. De esta manera, se asignan puntuaciones, de acuerdo a ciertas reglas, a las manifestaciones de conducta asociadas al atributo psicológico que se desea medir. Las puntuaciones se interpretan en función de la teoría psicométrica y psicológica, para inferir acerca de la conducta actual, de la futura o de las potencialidades de la persona. La medición usualmente implica la existencia de un propósito y una decisión que debe tomarse con relación a los Sujetos de la medición o de los atributos medidos. Mediana. Es la puntuación en una distribución de puntajes por encima de la cual se encuentra el cincuenta por ciento de las observaciones. Medidas de Dispersión. Estadísticos que permiten establecer la variabilidad de un conjunto de datos. Por ejemplo: la Varianza, y la Desviación Típica. Medidas de Tendencia Central. Estadísticos que permiten conocer la ubicación de la distribución en un continuo, por ejemplo: Media, Mediana y Moda, Moda. Es la puntuación que tiene la frecuencia más alta en una distribución. Algunas distribuciones pueden ser bimodales o multimodales. Muestra. Una parte de una Población o universo; un subconjunto de observaciones de una población. Si la población está compuesta de individuos, la Muestra constituye un grupo de individuos provenientes de esa población. Se desea que las Muestras sean representativas de la población para poder inferir los parámetros de la población a partir de los estadísticos de la Muestra. La representatividad se logra asegurando que todos los individuos de la población tienen la misma probabilidad de ser seleccionados para la Muestra, se habla así de muestreo probabilístico. Esto se logra mediante esquemas de muestreos entre los que se incluyen como sus elementos básicos: Muestreo por Azar Simple, Muestreo por Azar Sistemático, Muestreo Estratificado, Muestreo por Conglomerado. Estos esquemas exigen

BIBLIOGRAFÍA

Arnau, J. (1989). Metodología de la investigación y diseño. En J. Arnau y H. Carpintero (Eds.). Historia, teoria y método. Madrid: Alhambra Universidad.Canpintero, H. (1996). Historia de las ideas psicológicas. Madnd: Pirámide.Martínez-Arias, R (1995). Psicometría: Teoría de los tests psicológicos y educativos. Madrid: Síntesis.Meliá, J.L. (1990). La construcción de la Psicometría coma ciencia teórica y aplicada. Valencia: Cristóbal Serrano.Muñiz, J. (1991). Introducción a los métodos psicofísicos. Barcelona: PPU.Muñiz, J. (1998). La teoría clásica de los tests. Madrid: Pirámide.Nunnally, J. C. (1973). Introducción a la medición psicológica. Buenos Aires: Paidós.

REFERENCIAS DE LA WEB: http://www.gestiopolis.com/canales8/rrhh/psicometria-como-ciencia-del-

compotamiento-y-los-recursos-humanos.htm http://www.uam.es/docencia/ace/ http://www.uaim.edu.mx/web-carreras/carreras/Etnopsicologia/07%20TRIMESTRE/

PSICOMETRIA.pdf http://html.rincondelvago.com/psicometria_5.html http://es.wikipedia.org/wiki/Teoría_de_respuesta_al_ítem

http://es.wikipedia.org/wiki/Test_psicológico


http://es.wikipedia.org/wiki/Test_psicol%C3%B3gico

http://es.wikipedia.org/wiki/Teor%C3%ADa_de_respuesta_al_%C3%ADtem

http://html.rincondelvago.com/psicometria_5.html

http://www.uaim.edu.mx/web-carreras/carreras/Etnopsicologia/07%20TRIMESTRE/PSICOMETRIA.pdf

http://www.uaim.edu.mx/web-carreras/carreras/Etnopsicologia/07%20TRIMESTRE/PSICOMETRIA.pdf

http://www.uam.es/docencia/ace/

http://www.gestiopolis.com/canales8/rrhh/psicometria-como-ciencia-del-compotamiento-y-los-recursos-humanos.htm

http://www.gestiopolis.com/canales8/rrhh/psicometria-como-ciencia-del-compotamiento-y-los-recursos-humanos.htm

felixrodriguezisidro.files.wordpress.com · Web viewDefinición y función de las pruebas: (tests):...

Documents

Transcript of felixrodriguezisidro.files.wordpress.com · Web viewDefinición y función de las pruebas: (tests):...