Antecedentes (Anastasi)

Antecedentes histricos de las pruebas actuales a

na breve revisin de los antecedentes histricos y los orgenes de las pruebas psicolgicas nos brindar un panorama til para comprender las pruebas actuales.' La direccin en que estas han avanzado, as como sus limitaciones y entajas especiales, podrn entenderse mejor al considerarlas a la luz de sus pre-

cursoz . ~ i s t e captulo nos concretaremos a la revisin de los antecedentes y el desarrollo inicial del movimiento psicomtrico como un todo. En los captulos poste- riores analizaremos los desarrollos ms recientes relacionados con algunos instrumentos especficos, como los tests de habilidad (capti~los 8 a 12) o los de inters (captulo 14), as como con las reas (educativa, industrial, clnica y de consejera) en las que se utilizan tales instrumentos (captulo 17).

Las races de la aylicacih de prurbas se pierden en la Antigedad. Existen rela- tos del sistema de exmenes del servicio civil que prevaleci en el imperio chino durante 2 000 aos (Bowman, 1989). Entre los antiguosgriegos, la aplicacin de exmenes formabaparte de! poceso ~.. educativo; . . . - - las pruebas servan para . evaluar ..~ .

-

el domit?ia de habilid~dgsfsicasq~ri~el~~~~l~s(Doyle, 1974). Desde sus inicios en la Edad Media, las universidades europeas basaron los grados y honores en exmenes farmales. Cori todo, no tenemos que ir ms all del siglo XIX para identificar los

' Se encuentra una descripci6n mAs detallada d i Icn orgenes de las pniebas psicol6gicas en E L. Gouiienough (1949) y en J. Peterxm (1926). Vease tambin br ing (1950) y G. Murphy y Kovach (1972) para antecedentes ms generales, DuBois (1970) y McReynolds (1975. 1986) para recuentos ms recientes de la hiscoria de las pniebas psicol6gicas, y Anastasi (1965) para los antecedentes hist6ricos del estudio de las diferencias individiia- les. En Acascasi (1993) hzv un repaso de las cendericias actuales de la psicometra.

ZhapKielText BoxAnastasi, A. y Urbina, S. (1998) Test Psicolgicos. (7ma Edicin). Mxico: Prentice Hall

Antecedentes histricos de las pruebas actuales " 3 3

principales acontecimientos que formada base de las pruebas contemporneas, y a ellos dirigimos ahora nuestra atencin.

lbas ac-

5 Y .>re- y el aste- tru - ers d a )

ela- lino 1 de ir el n 1; mes

. los

ough entes le las idua-

INTERS INICIAL EN LA CLASIF ICACI~N Y LA CAPACITACIN DE LAS PERSONAS

CON RETARDO MENTAL El siglo XIX atestigu el surgimiento del inters por el tratamiento humano de las personas "insanas" y las que sufran de retardo mental. Hasta ese momento, el desti-

.-. . . - -- - -

no comn de tales individuos era el descuido, el ridculo e inclmo latorfuo. Con la nueva pieocupacin por el cuidado adecuado de la gente con d roble mas mentales, se hizo evidente la necesidad de contar con criterios uniformes para su identiticacin y clas~ficacin, necesidad que se volvi verdaderamente urgente con la prolifera- cin de instituciones sociales dedicadas a estas perscnas en todo el mundo. Primero era necesari~distinguir entre los individuos insanos y los que sufran de retardo mental. Los primeros manifestabari trastornos emocionales que podran o no estar acom- paados por un deterioro intelectual a partir de un nivel normal; los segundos se caracterizaban principalmente por una deficiencia intelectual que estaba presente desde el nacimiento o la primera infancia. El primer informe explcito de esta distincin se encuentra quiz en un trabajo publicado en por el medico frances Esquirql. Se trata de dos volmenes en los que dedica ms de 100 p g m q u e ahora se conoce como "retardo mental". Esquirol tambien seala que existen muchos grados de retardo, que varIan desde la normalidad hasta la "idiotez profunda". En su esfuerzo por elaborar un sistema para clasificar los diversos grados y variedades de retardo, Esquirol prob varios procedimientos y lleg a la conclusin de q u e 4 habla proporciona . - - el criterio ms-confiable del nivel intelectual del individuo.%

P

importante decir que los criterios actuales para d x r m i n a r el retardo mental tambin son principalmente lingsticos y que los tests actuales de inteligencia tienen una fuerte carga de contenido verbal. En los captulos siguientes mostraremos la importante funcin que cumple la habilidad verbal en nuestro concepto de inteligencia.

De espcciai significado son las contribuciones de otro mdico francs, S=& quien fue pionero en la capacitacin de los rctardados. Luego de rechazar la idea do- minante de que el retardo mental era incurable, Seguin (186611907) experiment durante muchos aos con lo que llam el 3 d o fisiolgio-de capacitacin, y en 1817 estableci kprimera escuela dedicada a la educacin de los nios retardados. En 1848 emigr a los Estados Unidos, eQ donde sus ideas obtuvieron un amplio reconoci- -

miento. Seg1si.n fue el creador de muchas de las tmicas.de-eritrenmienta sensorial-1- muscular que despus fueron adoptadas &; las instituciones de asistencia a los retra- sados. Con esos mtodos, los nios con retardo profundo reciben ejercicio intensivo en discriminacin sensorial y para el desarrollo del control motor. Algunos de los procedimientos que estableci Segin con este propsito fueron luego incorpora-dos a los tests de inteligencia no verbal o de ejecucin. U n ejemplo de lo anterior es el

i Tablero de Formas* de Seguin (Seguin Form Board), en el que el individuo debe in- sertar bloques de distinta apariencia en los huecos correspondientes tan rpidamente [como pueda3

Ms de medio siglo despues del trabajo de Esquirol y Seguin, el psiclogo francs Alfred Binet recomendaba que los nios que no lograran responder a la educacin normal herzn evaluados antes de expulsalos y que, de ser considerados educables, fueran asignados a cursos de educacin especial (T. H. Wolf, 1973). Con sus compa- eros de la Sociedad Fara el Estudio Psicolgico del Nio, Binet exhort al ministro de Instruccin Pblica a emprender acciones para mejorar las condiciones de los nios retardados. Un resultado especial fue el establecimiento de una comisin ministe- rial a cargo de Binet para el estudio de estos infantes. Tal designacin fue un acontecimiento trascendental en la historia de las pruebas psicolcgicas.

En general, los primeros psiclogos experimentales del siglo xIX no estaban interesa- dos en la medicin de las diferencias individuales. Su objetivo la formulacin de descripciones generalizadas de la conducta humana, lo que supone que su atencin se concentraba en las uniformidades ms que en las diferencias conductua- les, y que, por lo tanto, las diferencias individuales eran ignoradas o aceptadas como un mal necesario que limitaba la aplicabilidad de las generali&iones. As, el hecho de que un' individuo reaccionara de manera diferente a otro en las mismas condiciones era considerado como un error, o variabilidad individual, que disminua la exactitud de las generalizaciones. sta era la actitud hacia las diferncias individuales que

I :I prevaleca en laboratorios como el fundado por Wundt en Leipzig en 1879, donde se i ! 1 formaron muchos de los primeros psiclogos experimentales. h ! i l ; Al elegir sus reas de estudio, como en muchas otras fases de su trabajo, los funda-

! %

dores de la psicologa experimental evidenciaban la influencia de sus antecedentes en la fisiologa y la fsica. Los problemas que estudiaban en sus laboratorios tenan que ver principalmente con el tiempo de reaccin y con la sensibilidad a estmulos sensoriales como los visuales y los auditivos. Como veremos en otros captulos, este acento en los fenmenos sensoriales refleja tambin la naturaleza de las primeras pruebas psicolgicas.

Otra influencia que la psicologa experimental del siglo XIX ejerci en el curso del movimiento psicomtrico se manifiesta en sutnsistencia por ejercer un control riguro- so de-las condiciones en las que se realizan las observacionej; por ejemplo, la forma de dar las instrucciones en un experimento de tiempo de reaccin puede aumentar o dis- minuir de modo notable la velocidad de la respuesta, y el brillo o el color del fondo pueden alterar marcadamente la apariencia de un estmulo visual, lo que demuestra la importancia de que todos los participantes del experimento sean observados en condiciones estandarizadas. Esta estandarizacin del procedimiento lleg a convertirse en una de las seales distintivas de las pruebas psicolgicas.

*Tarnbi&n conocido corno T&ho de encajamienros. (N. del T.)

ie in- ; lente

mces acin &les, mpa- iistro >S ni- niste- ie un

eresa- >mu- :ue su ictua- como iecho ficio- iacti- -S que d e se

imda- t e - en n que ienso- cento as psi-

so del , iguro- ma de o dis-

;: fondo ima la : zondi-

rse en

: ' Antecedentes histricos de las pruebas actuales ,35

C O N T R I B U C I O N E S D E F R A N C I S GALTON El bilogo ingls ~ r a n c i s e a l t o n ~ e e l ~ s p o n s a b l e del inicio del movimien- to psicommco. Un factor comn en las numerosas y variadas actividades de investi-

Para una descripcian fascinanre de los primeros avances de los principales conceptos esradsricos y de las peno- nas responsables, vase Cowles (1989).

gacin de Galton fue su inters por la herencia humana. En el curso de sus investigaciones sobre esta materia, Galtor, se dio cuenta de Ir necesidad de medir las caractersticas de personas que estaban y no emparentadas, ya que slo de esta manera poda descubrir, por ejemplo, el grado exacto de parecido entre padres e hijoslherma- nos y hermanas, primos o gemelos. Con este propsito, Galton convenci a diversas instituciones educativas de que llevaran registros antropointricos sistemticos de sus estudiantes. Tambin estableci un laboratorio antropomtrico en la Exposicin Inter- nacional de 1884 donde, mediante el pago de tres peniques, se medan ciertos rasgos f- sicos de los visitantes y se los someta a pruebas de agudeza visual y auditiva, fuerza muscular, tiempo de reaccin y otras funciones sensoriomotors simples. Cuando la exposicin cerr, Galton transfiri el laboratorio al Museo de South Kensington, en Londres, donde trabaj durante seis aos. Con estos mtodos se acumul gradualmente el primer cuerpo sistemtico de datos sobre diferencias indi~~iduales en los procesos psicolgicos simples.

El propio Galton elabor varias de las pruebas aplicadas en su laboratorio, muchas de las cuales siguen siendo conocidas, sea en su forma original o modificada. Entre los ejemplos se encuentran la barra de Galton para la discriminacin visual de la longi- tud, el silbato que lleva tambin su nombre para determinar el mayor tono audible y una serie graduada de pesos para medir la discriminacin cinestsica. Galton crez que las pruebas de discriminacin sensorial podan servir para estimar el intelecto. A este respecto, haba sido tambin la influencia de las teoras de Locke. As, Galton escri- bi: "La nica informacin concerniente a los acontecimientos externos que nos al- cama parece pasar por la avenida de los sentidos, y entre ms perceptivos sean los sentidos de Ias diferencias, mayor ser el campo sobre el que pueden actuar nuestro juicio y nuestra inteligencia" (Galton, 1883, p. 27). Galton tambin se percat de que las personas con retardo mental extremo tienden a mostrar defectos en su capacidad para discriminar entre calor, fro y dolor, una observacin que posteriormente fortaleci su conviccin de que la capacidad de discriminacin sensorial, "en conjunto, sera ms elevada entre los intelectualmente aptos" (Galton, 1883, p. 29).

Galton tambin fue pionero en la aplicacin de escalas de calificacin y cuestionarios, as como en el usa de la tcnica de asociacin libre que posteriormente fue utili- .zada con diversos propsitos. Otra de sus muchas contribuciones se encuentra en la formulacin de mtodos estadsticos para el anlisis de datos sobre las diferencias individuales. Galton tom y adapt algunas tcnicas matemticas de forma que pudieran ser utilizadas por investigadores sin conocimientos en la nateria que desear- tratar en forma cuzntitativa los resultados de sus pruebas. De esta manera extendi conside- rablemente la aplicaci6n de los proce'dimientos estadsticos al an!isis de datos de !as pruebas. Esta fase del trabajo de Galton fue llevada adelante por muchos de sus estudiantes, de los cuales Karl Pearson2 fue el ms eminente.

i

36 ~unhones y orgenes de pruebas, tests o instrumentos de medicin psicolgicos

CATTELL Y LOS P R I M E R O S TESTS MENTALES El psiclogo estadounidense James McKeen Cattell ocupa una posicin prominente en el adelanto de las pruebas psicolgicas. En su trabajo se combinan la recin establecida ciencia de la psicologa experimental y el todava ms reciente movimiento psicomtrico. Para obtener su doctorado en Leipzig redact una tesis sobre el tiempo de reaccin bajo la direccin de Wundt; y en 1888, mientras enseaba en Cambrid- ge, su trato con Galton fortaleci su inters por la medicin de las diferencias individuales. A su regreso a los Estados Unidos, Cattell particip activamente en el establecimiento de laboratorios de psicologa experimental y en la difusin del movimiento psicomtrico.

El trmino "test mental" apareci por primera vez en la bibliografa psicolgica en un artculo escrito por Cattell en 1890, que describe un serie de pruebas que cada ao se aplicaban a los estudiantes universitarios para de b rminar su nivel intelectual. Las pruebas, cuya aplicacin era individual, incluan mediciones de la fuerza muscular, velocidad de movimiento, sensibilidad al dolor, agudeza visual y auditiva, discriminacin de pesos, tiempo de reaccin, memoria y cosas similares. En su eleccin de las pruebas, Cattell comparta la opinin de Galton respecto a la posibilidad de obtener una medida de las funciones intelectuales con el uso de instrumentos de discriminacin sensorial y de tiempo de reaccin. La preferencia de Cattell por di- chas herramientas tambin se sustent en el hecho de que le permitan medir con precisin y exactitud las funciones simples, mientras que la obtencin de mediciones objetiva? de funciones ms complejas en ese tiempo pareca una tarea inalcan- zable. 1 ,,/ '

Las piebas de Cattell son caractersticas de los instrumentos desarrollados en la ltima dcada del siglo XiX, que se aplicaban a escolares, universitarios y adultos. En la Exposicin de Columbia realizada en Chicago durante 1893, Jastrow mont una exhibicin en la que a los visitantes se los invitaba a realizar pruebas de procesos perceptuales, sensoriales y motores simples y a comparar su habilidad con las normas (J. Peterson, 1926, Philippe, 1894). Los pocos intentos por evaluar estas primeras pruebas arrojaron resultados desalentadores. El desempeo de cada individuo mostraba poca correspondencia de una prueba a otra (Sharp, 1898-1899; Wissler, 1901) y su relacin con estimaciones independientes del nivel intelectual basadas en las calificaciones de los maestros (T. L. Bolton, 1891-1892;). A. Gilbert, 1894) o con las calificaciones acadmicas (Wissler, 1901 ) era poca o nula. . Algunas pruebas elaboradas por psiclogos europeos de la poca tendan a cubrir

funciones algo ms complejas. Kraepelin (1895), que estaba interesado sobre todo en la evaluacin clnica de pacientes psiquitricos, prepar una larga serie de pruebas para medir lo que consideraba factores bsicos en la caracterizacin del individuo. Las pruebas, que empleaban principalmente operaciones aritmticas simples, estaban des- tinadas a medir lcs efectos de la prSctica, la memoria y la susceptibilidad a la fatiga y la distraccin. Otro psiclogo alemn, Ebbinghaus (1897), aplic a escolares pruebas de clculo aritmtico, memoria y completacin de oraciones; esta !tims, que era la ms compleja, fue la nica que mostr una clara correspondencia con el desempeo escolar.

ente esta- ento :mpo brid- .divi- m el novi-

gica le ca- telec- fuerza litiva, ; elec- didad tos de mr di- .ir con :dicio- ,alcan-

SS en la tos. En ,t una ;os per- mas (J. 1s prue- ostraba ) l ) y su S califi- ? 1% ca-

a cubrir todo en ebas pa- luo. Las 3an des- fatiga y pruebas

le era la .empeo

I

.Antecedentes hi&ricos de las pruebas actuales 37

En un artculo publicado en Francia en 1895, Biriet y Henri criticaron el hecho de que casi todas las pmebas disponibles eran sensoriales y se concentraban indebida- mente en habilidades especializadas simples. Adems, argumentaban que en la medicin de las funciones ms complejas no se req~liere de gran precisin, ya que, en tales funciones, las diferencias individuales son mayores. Propusieron una amplia y variada lista de tests que cubran funciones como la memoria, la imaginacin, la atencin, la comprensin, la susceptibilidad a la sugestin, la apreciacin esttica y muchoj-otros, en los que podemos reconocer las tendencias que a la postre condujeron al desarrollo de las famosas escalas de inteligencia de Binet.

BINET Y EL SURGIMIENTO DE LOS TESTS DE INTELIGENCIA

Binet y sus colaboradores dedicaron muchos aos a la investigacin activa e ingenio- sa de las formas de medir la inteligencia. Probaron muchos metodos, incluyendo la medicin de la forma del crneo, la cara y la mano, as como el anlisis de la escritura; sin embargo, los resultados los llevaron a la conviccin de que la medicin directa, aunque tosca, de las funciones intelectuales complejas era la ms promisoria. Entonces una situacin en particular hizo fructificar los esfuerzos de Binet. En 1904, el Ministe- rio de Educacin lo comision para que estudiara procedimientos para la educacin de nios retardados. Fue en relacin con los objetivos de esta comisin que Binet prepar, en colaboracin con Simon, la primera escala de Binet-Simon (Binet y Simon, 1905).

Fsta escala, conocida como la escala de 1905, constaba de 30 problemas o tests arreglados en orden de dificultad creciente. El nivel de dificultad se estableci empri- camente aplicndolos a 50 nios normales de tres a 11 aos y a algunos nios y adui- tos rerardacios. Las pmebas fueron diseadas para cubrir una amplia variedad de funciones, con nfasis especial en el juicio, la comprensin y el razonamiento, que Bi- net consideraba los componentes principales de la inteligencia. Aunque incluyeron pruebas sensoriales y perceptuales, en esta escala se encuentra una proporcin de contenido verbal mayor que en la generalidad de las pruebas de la poca. Como la escala de 1905 fue presentada como un instmmento preliminar y tentativo, no se formul un mtdo objetivo preciso para obtener una puntuacin total.

Eii la segunda escala, la de 1908, aument el nmero de tests, se eliminaron algunos de la primera que resultaron insatisfactorios y todos fueron agrupados en niveles de edad sobre la base del desempeo de alrededor de 300 nios normales de entre tres y 13 aos. De este modo, en el nivel de tres aos se ubicaron todos los tests que pasaban del 80 al 90 por ciento de los nios normales de tres aos; en el ivel de cuatro aos, los que aprob el mismo porcentaje de nios normales de esa edad; y as1 sucesivamente hasta los 13. La calificacin del nio en toda la p e b a pode la entonces expresarse como el nivel mental correspondiente a la edad de los nios normales cuya ejecucin haba igualado. En las diversas traducciones y adaptaciones de las escalas de Binet el trmino de "nivel mental" fue sustituido por el de "edad mental", cuya fcil comprensin indudablemente contribuy a popularizar los tests de

1 38 Funciones y orgenes de pruebas, tests o instrumentos de medicin psicogicos

inteligencia;3 sin embargo, el propio Binet evitaba el uso del termino por sus implicaciones no verificadas de desarrollo y prefera el ms neutral de "nivelomental" (T. H. Wolf, 1973).

En 191 1, ao en que Binet muri intempestivamente, aparecij la tercera revisin de la &cala de Binet-Simon, que no presenta mayore modificaciones, salvo revisiones menores, cambios en la localizacin de algunos tests, la adicin de otros en varios niveles de edad y la extensin de la escala al nivel adulto.

Incluso antes de la revisin de 1908, los tests de Binct-Simon atrajeron la atencin de los psiclogos de todo el mundo. En muchos pases, aparecieron traducciones y adaptaciones, pero la primera fue la de H. H. Goddard, en ese entonces psiclogo in- vestigador en la Escuela de capacitacin de Vineland para nios con retardo mental. La revisin de Goddard result clave para que la profesin m ca aceptara los tests 4 de inteligencia (Zenderland, 1987). Apareci en un momento propicio para satisfacer la urgente necesidad de un instrumento estandarizado para diagnosticar y clasificar a las personas con retardo mental. No obstante, como herramienta de evaluacin pron- to h e dejada atrs por el Stanford-Binet, un instrumento ms extenso y psicomtrica- mente refinado, elaborado por L. M. Teman y sus colaboradores en la Universidad de Stanford (Teman, 1916). Este instrumento utiliz por primera vez el cociente de inteligencia (CI) o razbn entre la edad mental y la cronolgica. ia ltima revisin se emplea extensamente y la estudiaremos de manera ms completa en el captulo 8. Tambin resulta de especial interbs la primera revisin Kuhlmann-Binet, que ampii6 la escala hasta la edad de tres meses (Kuhlmann, 1912) y representa uno de los primeros esfuerzos por elaborar tests de inteligencia para preescolares e infantes.

PRUEBAS COLECTIVAS h s tests de Binet, as como todas sus revisiones, son escalar individuaks en el sentido de que s61o pueden aplicarse a una persona y luego a otra. Muchos de los tests de esas escalas requieren respuestas orales del examinado o la inanipulacin de materiales. Algunos exigen tomar el tiempo de las respuestas de cada individuo. Por stas y otras razones, las pruebas no pueden adaptarse a la aplicacin colectiva. Otra caractersti- ca de los tests de Binet es que requieren de un examinador muy capacitado, pues se trata de instrumentos esencialmente clnicos adecuados para el estudio intensivo de casos individuales.

L a i *bus de grupo similares a la primera escala de Binet fueron elaboradas para satisfacer una necesidad prctica. Cuando los Estados Unidos ingresaron en 1917 en la Primera Guerra Mundial, la Asociacin Estadounidense de Psicologa form una comisin para considerar cmo poda contribuir la psicologa a la conduccin de la

' F. L. Gdenough (1949. pp. 50-51) observque en 1887.21 aos antes de la aparicin de ia Escala Binet-SI- rnon de 1908. S. E. Chaille public en el New Orkans Medid and Surgical Jounuil una serie~dc pruehas para infantes, arregladas de acuerdo con la edad en que solan ser pasadas. Debido en pane a la limitada circulaci6n de la revista y quiz tambin a que la comunidad cientifica no estaba preparada. en esa e p c a pas inadvertido el significado del concepto de escala de edad. La propia escala de Biner recibi la influencia del trabajo de algunos de sus conremprAnevs. principalmente Blin y Damaye. que prepararon un conjunto de pregunta: orales de las que ohreiian uiia sola calificaci61i global para cad.1 nio (T. H. Wnlf. 1973).

npli- !" (T. isin visio- rarios

icin nes y :o in- mtal. . tests sfacer icar a pron- Strica- lad de de in- in se u10 8. impli 3rime-

.entido de esas eriales. y otras tersti- pues se jivo de

as para 917 en n una n de la

Binet-SI- 8s para in- ilacin de venido el ie algunos des de las

..

;Antecedentes histricos de las pruebas actuales ,39

guerra. La comisin, dirigida por Robert M. Yerkes, reconoci la necesidad de la rpi- da clasificacin del nivel intelectual general del milln y medio de reclutas. Esta informacin era importante para tomar muchas decisiones administrativas, incluyendo el rechazo o la dispensa del servicio militar, la asignacin a diferentes servicios o la admisin zi campos de enxenamienco de oficiales. En este ambiente se formul el primer test colectivo de inteligencia. Para realizar la tarea, los psiclogos acudieran a todos los materiales disponibles, especialmente a un test colectivo de inteligencia nojubli- cado, preparado por Arthur S. Otis, que cedi al ejrcito. Una contribucin importante de este instrumento, elaborado por Otis cuando era estudiante en uno de los cursos de grado de Teman, fue la introduccin de preguntas de opcin mltiple y otros reactivos "objetivos".

Las pruebas que finalmente desarrollaron los psiclogos del ejrcito podan aplicarse a grupos grandes y llegaron a conocerse como Army Alpha y Army Beta (pruebas Alfa y Beta). La primera se ocupaba de las pruebas generales de rutina, mientras que la segunda era una escala no lingstica utilizada con reclutas iletrados o procedentes de pases cuyo idioma no era el ingis.

Poco despuQ de terminar la Primera Guerra Mundial, las pruebas del ejrcito fueron liberadas para que se aplicaran a civiles; adems de pasar por muchas revisiones, las pruebas Alfa y Beta sirvieron como modelo para la mayor parte de los tests colectivos de inteligencia, lo que contribuy al notable crecimiento del movimiento psicomtrico. Muy pronto-se prepararon tests colectivos de inteligencia para todas las edades y personas, desde preescolares hasta universitarios. Los programas de evaluacin a gran escala, otrora imposibles, se emprendieron con gran entusiasmo. Como las pruebas colectivas fueron diseadas como instrumentos de evaluacin masiva, no s61o penni- tieron la medicin simultnea de grandes grupos, sino que tambikn simplificaron las instrucciones y los procedimientos de aplicacin, con lo que disminuy la capacitacin requerida del aplicador. Los maestros empezaron a aplicar en sus grupos los tests de inteligencia y los estudiantes universitarios eran evaluados de rutina antes de su ingreso; se iniciaron amplios estudios de grupos especiales de adultos, como los prisione- ros, y muy pronto el pblico general cobr conciencia del C1.

La aplicacin de esos tests colectivos excedi a su mejoramiento tcnico. En la pri- sa por obtener puntuaciones y sacar conclusiones prcticas de los resultados, a menudo se olvidaba que las pruebas an eran tknicamente imperfectas, de modo que cuando no lograban cumplir las injustificadas expectativas, se generaba escepticismo y hostilidad hacia todas las pruebas. De este m d o , ei auge psicomtrico de los aos veinte, basado en el uso indiscriminado de los instrumentos, puede haber demorado el progreso de las pruebas psicolgicas.

TESTS 'DE APTITU D Aunque al principio los tests de inteligencia fueron diseados para cubrir una amplia variedad de funciones que permitieran estimar el nivel general de inteligencia del individuo, pronto se hizo evidente que su alcance era muy limitado. No todas las funciones importantes estaban representadas. De hecho, la mayor parte de los tests de inteligencia eran principalmente mediciones de la habilidad verbal y, en menor grado. de la

:: 1 40 Funciones y orgenes de pruebas, tests o instrumentos de medicin psicolgicos habilidad para manejar relaciones numricas y otras relaciones abstractas y simbli- cas. Gradualmente, los psiclogos .reconocieron que el termino "test de inteligencia" era un nombre inadecuado, ya que slo medan ciertos aspectos de sta.

Fara que resultaran seguros, los instrumentos tocaban habilidades que son de gran importancia en la cultura para la qiie fueron disefados, perc pronto se reconoci la conveniencia de contar con designaciones ms precbas en trminos de la informacin que podan ofrecer; por ejemplo, ahora se conoce como tests de aptitud escolar a algu- - nos instmmentos que en los veinte habran sido llamados de inteligencia. Este cambio en la terminologa procede del hecho de que muchos de los llamados tests de inteligencia miden la combinacin de habilidades requeridas y fomentadas por el trabajo universitario.

Incluso antes de la Primera Guerra Mundial, los psiclogos efnpezaban a admitir la necesidad de contar con tests de aptitudes especiales que complgnentaran los de inteligencia global. En especial, se prepararon pruebas de aptitudes especiales para uso en la orientacin vocacional y en la seleccin y clasificacin de personal industrial y militar. Entre las ms empleadas estn los tests de aptitud mecnicz, profesiona!, musical y artstica.

La evaluacin crtica de las pruebas de inteligencia que sigui al uso indiscriminado durante los veinte tambin revel el hecho notable de que el desempeo del individuo a menudo mostraba una marcada variacin en diferentes partes de la prueba. Esto result6 en especial evidente en las pruebas colectivas, en las que los reactivos suelen separarse en subpruebas de contenido reiativamente homogneo; por ejemplo, una persona po& obtener una puntuacin ms bien alta en la subpmeba verbal y un pobre resultado en la numrica o viceversa. Dicha variabilidad interna es hasta cierto grado discemible en un test como el Stanford-Binet en el que, por ejemplo, todos los reactivos que incluyen palabras pueden resultar difciles para cierto individuo, mientras que los que emplean imgenes o diagramas geomtricos pueden resultarle venta- josos.

Los usuarios, y sobre todo los clnicos, a menudo se valan de esas comparaciones internas para obtener un conocimiento ms profundo de la estructura psicolgica del individuo. De este modo, al evaluar un caso individual no slo se examinaba el CI o algn otro resultado global, sino tambin el desempeo en grupos de reactivos o subtests; sin embargo, en general no se recomienda esta prctica, porque los tests de inteligencia no fueron diseados con el propsito de realizar un analisis diferencial de las aptitudes. Con frecuencia, los subtests comparados contienen muy pocos reactivos para prducir ur.a estimacin estable o confiable de determinada habilidad. Entonces, la diferencia de las puntuaciones de los subtests se puede revertir si vuelve a examinarse al individuo otro da o con otra forma del mismo instrumento. Para realizar esas comparaciones en el mismo sujeto, es necesario disear las pruebas con el objeto de que revclen diferencias de ejecucin en diversas funciones.

Al mismo tiempo que la aplicacin prctica demostraba la necesidad de contar con mltiples tests de aptitud, un desarrollo paralelo en el estudio de la organizacin de los rasgos iba proporcionando los medios para elaborarlos. Los estudios estadsticos sobre la naturaleza de la inteligencia haban explorado las re!aciones entre las puntuaciones obtenidas por muchas personas en una gran variedad de pruebas. El p&clogo ingls

1-

2"

m

la in u-

i o li- jo

la :e-

. la ili- J Y

ni- de l ue- VOS

40, un

TtO los

.en-

7ta-

mes r del 21 o sub- nte- e las 5 pa- S, la larse :om-

: que

i con

le los sobre lones ng1i.s

.'

~ntecedentes histricos de las pruebas actuales 41 "

Charles Spearman (1904, 1927) inici estas investigaciones durante la primera dcada del siglo XX. Los desarrollos metodolgicos subsecuentes, basados en el trabajo de estudiosos ingleses y estadounidenses, como T. L. Kelley (1928) y L. L. Thurstone (1938, 1947b), llegaron a conocerse como anlisis factorial.

En el captulo 11 examinaremos de manera exhaustiva las contribuciones de los mtodos del anlisis factorial en la elaboracin de pruebas. Por ahora basta con destacar que los datos ~btenidos con estos procedimientos seaiaron la presencia de diversos factores o rasgos relativamente independientes, algunos representados en diversas proporciones en los tests tradicionales de inteligencia, como, por ejemplo, la comprensin verba! y el razonamiento n~imrico; otros, como la aptitud espacial, perceptual y mecnica, se encuentran ms a menudo en los instrumentos para la medicin de aptitudes especiales que en los de inteligencia.

Uno de los principales resultados prcticos del anlisis factorial fue el desarrollo de las baterzs de aptitudes mltiples, diseadas para proporcionar una medida de la posi- .. - cin del individuo en un& serie de rasgos. En lugar de una puntuacin total, o CI, estos instrumentos obtienen una puntuacin aparte para rasgos como la comprensin verbal, la aptitud numrica, la visualizacin espacial, el razonamiento aritmtico y la rapidez perceptual, lo que permite realizar el anlisis intrasujeto o diagnstico diferencial en el mismo sujeto que los usuarios trataron de obtener por muchos aos con los resultados crudos y a menudo errneos de los tests de inteligencia. Ademh, dado que cubren algunos de los rasgos que generalmente no se incluan en ese tipo de instrumentos tambikn incorporaron en un programa amplio y sistemtico de evaluacin gran parte de la informacin que antes se obtena de las pruebas de aptitud especial.

Las bateras de aptitudes mltiples representan un desarrollo relativamente tardo en el campo de las pruebas, ya que casi todas aparecieron a partir de 1945. A este respecto es de destacar el trabajo de los psiclogos militares durante la Segunda Guerra Mundial. Gran parte de la investigacin conducida en las fuerzas armadas se bas en el anlisis de factores y se orient a la preparacin de bateras de aptitudes mltiples; por ejemplo, en la fuerza area se construyeron bateras especiales para pilotos, bom- barderos, operadores de radio, rastreadores y muchos otros especialistas. El informe de las bateras que elabor la fuerza area ocupa al menos nueve de los 19 voimenes de- dicados al programa psicolgico de la aviacin durante la Segunda Guerra Mundial (Awny Air Fmces, 1947-1948). La investigacin en esas lneas an sigue en progreso con el patrocinio de varias ramas de las fuerzas armadas. Tambin se han realizado bateras para uso civil y se aplican lo mismo en la orientacin vocacional y educativa que en la seleccin y clasificacin de personal. En los captulos 10 y 17 presentaremos algunos ejemplos.

Un adelanto ms reciente, surgido a finales de los ochenta y comienzos de los no- venta, permite la integracin de dos metodos al principio contradictorios de medicin mental representados por los tesri tradiciondles de inteligencia y :zs bateras de aptitudes mltiples (Anastasi, 1994). En la actualidad, se reconoce que la habilidad del ser humano puede ser evaluada de manera adecuada a diferentes niveles de profundidad, desde las aptitudes muy definidas de las pruebas especficas (o incluso de reactivos), pasando por el nivel de los rasgos hasta una puntuacin global como el tradicional CI. Para cada propsito de evaiuacin hay un nivel apropiado de profundidad. Fn

correspondencia, los tests de inteligencia que se han desarrollado recientemente, como las Escalas de Habilidad Diferencial o las revisiones recientes de tests mteriores, como la cuarta edicin del Stanford-Binet (que explicaremos en el capftulo 8), combinan la amplia cobertura de diversas aptitudes con calificaciones flexibles de niveles mltiples para propsitos concretos de evaluacin. Aunque se trata de dos ejemplos de tests de inteligencia de aplicacin individual: el mismo mtodo amplio y flexible de preparacin y uso de los instrumentos ha tenido un impacto en las bateras de aplicacin colectiva, como !as que veremos en el capitulo 10. En el captulo 11 estudiaremos la base terica y las implicaciones prcticas de esta combinacin de tests de habilidad en relacin con los adelantos recientes, relativos a la naturaleza de la inteligencia.

P R U E B A S E S T A N D A R I Z A D A S D E A P R O V E C H A M I E N T O . 1

Mientras los psiclogos se ocupaban de los tests de inteligencia &de aptitud, los exmenes escolares tradicionales experimentaban avances tcnicos (0. W. Caldwell y Courtis, 1923; Ebel y Damrin, 1960). Un paso importante en esta direccin lo dieron las escuelas pblicas de Boston en 1845 cuando los exmenes escritos sustituyeron al interrogatorio oral de los estudiantes por examinadores visitantes. Enne los argumentos ofrecidos en apoyo de esta innovacin estaba que los exmenes escritos ponan a los estudiantes en una situacin uniforme, permitan una cobertura ms amplia del contenido, reducan el elemento azaroso en la eleccin de reactivos y eliminaban la posibilidad de favoritismo por parte del examinador. Todos estos argumentos tienen un sonido familiar: fueron utilizados mucho despus para justificar la sustitucin de los reactivos de ensayo por los reactivos objetivos de opcin mltiple.

A la vuelta del siglo empezaron a aparecer las primeras pmebas estandarizadas para medir los resultados de la instruccin escolar. Encabezadas por el trabajo de E. L. Thomdike, las pruebas empleaban principios de medicin tomados del laboratorio psicolgico. Entre los ejemplos se incluyen escalas para calificar la calidad de la escritura y la redaccin, asi como pruebas de ortografia, aritmtica, dlculo y razonamiento aritmtico. Despuds llegaron las baterias de aprovechamiento, iniciadas con la publi- cacin de la primera edicin de la Prueba de Aprovechamiento de Stanford (Stanford Achievement Test) en 1923. Sus autores fueron tres lderes en la elaboracin de pruebas: Tiuman L. Kelley, Giles M. Ruch y Lewis M. Teman. Presagiando muchas carac- teristicas de la psicometra inodema, esta batera proporcion medidas comparables de ejecucin en diferentes materas escolares, evaluadas en trminos de un solo grupo normativo.

Al mismo tiempo se acumulaban evidencias de la falta de acuerdo entre los niaes- tros al calificar las pruebas de ensayo. Para 1930 era ampliamente reconocido que las pruebas de ensayo no slo requeran ms tiempo para los examinadores y examina- dos, sino que tambin arrojaban resultados menos confiables que el "nuevo tipo" de reactivos objet i~os .~ En la medida en que estos ltimos llevaron al uso creciente de las pruebas estandarizadas de aprovechamiento, hubo un niasis mayor en el diseo

' b investigacidn relacionada con la relativa ehcacia de los reactivos de ensayo y objetivos se trata en el capltulo 17, en la parte que aborda la utilizacin educativa de las pmebas

.. 1

ntecedentes histricos de las pruebas $chales 43'

a- ,a- de ra-

:o- ase

:la- i E. x- !1 y ron

1 al en-

tn a del

n la nen

e los

corio x r i - ento ubli- nfmd prue- arac- abies ,pp

siaes- ue las nina- %O" de ite de liseo

de reactivos para probar ia comprensin y la aplicacin del conocimiento y otros objetivos educativos ms amplios. La dcada de los treinta tambien presenci la introduccin de las mquinas para calificar exmenes a las cuales podan adaptarse fcilmente las nuevas pruebas objetivas.

Otro desarrollo digno de mencin fue el estahlecimientc en los Estados Unidos de programas estatales, regionales y nacionales de evaluacin. Probablemente el ms conocido sea el de la Junta Universitaria de Exmenes de Admisin a la Universidad (Colle- Re Entrame E-nation Board, CEEB). Establecido a principios de siglo para reducir la duplicacin de los exmenes de admisin presentados por los estudiantes de reciente ingreso a la universidad, el programa ha experimentado cambios profundos en sus prcce- dimientos de evaluacin y en el nmero y la naturaleza de las universidades participantes, cambios que reflejan los adelantos tanto en la aplicacin de pruebas como en la educacin. En 1947, las funciones de evaluacin del CEEB se combinaron con las de la Corporacin Camegie y las del Consejo Estadounidense de Educacin para formar el Servicio de Pruebas Educativas (Edtccational Testing Sewice, ETS). En los aos posterio- res, el ETS asumi la responsabilidad de un nmero creciente de programas de evaluacin al servicio de universidades, escuelas profesionales, dependencias gubernamentales y otras instituciones. Debe hacerse mencin del Programa de Evaluacin de Universida- des Estadounidenses (Amerium Coiiege Tesring Program) , establecido en 1959 para selec- cionar a los aspirantes a las universidades no incluidas en el programa CEEB y de varios programas nacionales de evaluacin para premiar a los estudiantes talentosos. Las pruebas de aprovechamiento no s61o se utilizan con propsitos educativos, sino

tambien en la seleccin de solicitantes de empleos en la industria y el gobierno. Ya citamos el uso sistemtico en el servicio civil de exmenes en el imperio chino desde aproximadamente el ao 150 a.c. (Bowman, 1989). En los tiempos modernos, la seleccin de empleados gubernamentales por medio de exmenes fue introducida en los pases europeos a finales del siglo XWII y comienzos del XIX. En 1883, la Comisin del Servicio Civil de los Estados Unidos (U.S. Civil Seruice Commission) estableci el uso de exmenes competitivos como procedimiento regular (Kavruck, 1956). Las tcnicas de elaboracin de pruebas creadas durante y antes de la Primera Guerra Mundial fueron introducidas en el programa de evaluacin del Servicio Civil de los Estados Uni- dos con el nombramiento de L. J. O'Rourke como director de la recin establecida divisin de inllestigacin en 1922. En la actualidad, este trabajo lo realiza un boisti- cado equipo de investigacin de la Oficina de Administracin de Personal de los Es- tados Unidos (U.S. Ofice of Personnel Management) .

En la medida en que creca la participacin de psiclogos con preparacin en psicometra en la formulacin de pruebas estandarizadas de aprovechamiento aumentaba la semejanza de sus aspectos tcnicos con el de los tests de inteligencia y de aptitud. Los procedimientos para la elaboracin y evaluacin de todas esas nuevas pruebas tenan muchc en comn. Los crecientes esfuerzos por preparar de aprovecham: .ento que midieran la consecucin de amplias metas educativas, en contraste con el recuer- do de hechos triviales, tambin hizo que el contenido de las pruebas de aprovechamiento se asemejara al de los tests de inteligencia. En la actualidad, la diferencia entre los dos instrumentos corresponde principalmente al grado de especihcidad del conte, nido y el grado en que el instrumento presupone una iristruccin previa.

44 Funciones y orgenes de pruebas, tests o instrumentos de medicin psicolgicos

Otra rea de inters de las pruebas psicolgicas son los aspectos afectivos o no intelectuales de la conducta, los que revisaremos del captulo 13 al 16. Los instnimentos di- seaclos con este propsito suelen conocerse como tests de personalidad, aunque muchos psiclogos prefieren emp!ear el trmino "fiersonalidad en un sentido ms amplio para referirse al individuo en su totalidad. De acuerdo con esto, tanto los rasgos intelectuales como los no intelectuales deberan agruparse bajo dicho rubro; sin embargo, en la terminologa psicomtrica es ms comn el uso de la expresin "test de personalidad" para referirse a la medicin de caractersticas como los estados emocionales, las relaciones interpersonales, la motivacin, los intereses y las actitudes.

El uso que hizo Kraepelin de la prueba de asociacin libre con pacientes psiquitricos es un antecedente de los tests de personalidad. En esta prueba, se bresentan al examinado palabras estmulo especialmente seleccionadas y se le pide que responda a cada una. con la primera palabra que le venya a la mente. Kraepelin (1892) tambin utiliz esta tcnica para estudiar los efectos psicolgicos de la fatiga, el hambre y las drogas, y con- cluy que todos esos agentes incrementan la frecuencia relativa de asociaciones superfi- ciales. Sommer (1894), que tambin trabaj en la ltima dcada del siglo XIX, sugiri que la prueba de asociacin libre podra utilizarse para diferenciar formas de trastorno mental. Despus, la tcnica ha sido utilizada con distintos prop6sitos de evaluacin y an sigue emplendose. Debe mencionarse el trabajo de Galton, Pearson y Cattell en la preparacin de cuestionarios estandarizados y escalas de calificacin. Aunque original- mente estaban destinados a otros propsitos, estos procedimientos fueron utilizados para elaborar algunos de los tests de personalidad que hoy son ms comunes.

El prototipo dc cuestionario de personalidad, o inuentan'o autodescriptivo (captulo 13), es la Hoja de Datos Personales (Personal Data Sheet) creada por Woodworth durante la Primera Guerra Mundial (DuBois, 1970; Franz, 1919, pp. 171-176; L. R. Goldberg, 1971; Symonds, 1931, captulo 5). El cuestionario fue disenado como una herramienta de seleccin para identificar a los individuos gravemente pertiirhiiclos que deberan ser excluidos del servicio militar. El cuestionario constaha dc tina serie de preguntas que versaban sobre sntomas psicopatolgicos comunes y en las que los individuos respondan sobre s mismos. Se obtena una puntuacin toral, contando el

de sritomas indicados. Este instrumenco no se termin y no pudo emplearse a tiempo, antes de que terminara la guerra, pero inmediatainente despus se prepiiraron formas para uso civil, incluyendo una forma especial para aplicar a nifios. Ms an, la Hoja de Datos Personales de Woodworth sirvi como modelo para la mayor parte de los inventarios de ajuste emocional. En algunos de estos cuestionarios se haca un iii- tento por subdividir el ajuste emocional en formas ms especficas, como el ajuste al hogar, el escolar y el vocacional. Otros instrumentos se concentraban en un rea ms estrecha de conducta o en respuestas ms claramente sociales, ccmo las de dominan- cia-sumisin en cl trato personal. El ltimo avance fue la elaboraci6n de 1nstruinen:os para cuantificar la expresin de actitudes e intereses (captulo 14), qiic tarnhiii se ba- saban principalniente en las tcnicas de cuestionario.

Otro mtodo de medicin de la personalidad se encuentra en la aplicacin de tests situacionales y de ejecucin (captulo 16), en las que el examinado debe rer CI 1 izar una

itelec- tos di- unque o ms OS ras- ro; sin test de nocio-

itricos imina- da unas 7 6 esta y con- uperh- sugiri istorno ci6n y 11 en la iginal- dos pa-

aptulo rth du- ; L. R. no una

los que erie de los in- indo el earse a

,araron

an, la arte de un in-

iuste al ea ms ninan- mentos i se ba-

de tescs :ar una

Antecedentes histricos de los pruebas actuales 45

tarea cuyo propsito a menudo est encubierto. La mayor parte simula con mucho realismo situaciones de la vida cotidiana. La primera aplicacin extensa de las tcnicas est en las pruebas elaboradas por Hartshome, May y colabradores a finales de los veinte y principios de los treinta (1928, 1923, 1930). Esta serie, estandarizada para escolares, se interesaba eF conductas tales como copiar, mentir, robar,-cooperar y persistir. Era posible obtener puntuaciones cuantitativas objetivas en numerosos instrumentos especficos. Orro ejemplo, estepara los adulms, se encuentra en la serie de tests situacionales preparados durante la Segunda Guerra Mundial por el Pro- grama de Evaluacin de la Oficina de Servicios Estratgicos (Offce of Snategic Seruices, OSS, 1948). Esos tests se interesaban en la conducta emocional y social sutil y relativamente compleja y su aplicacin requera de condiciones ms bien elaboradas y de personal capacitado, adems de que la interpretacin de las respuestas era relativamente subjetiva.

Las tcnicas proyectivas (captulo 15) representan el tercer mtodc de estudio de la personalidad que ha mostrado un crecimiento notable, en especie1 entre los clnicos. Estos instrumentos presentan al cliente un estmulo no muy estructurado, lo que permite una considerable libertad en su solucin La suposicin que fundamenta este metodo es que el individuo proyectar mediante el estmulo su estilo caracterstico de respuesta. Como e n los tests situacionales o de ejecucin, el propsito de las tcnicas proyectivas est ms o menos encubierto, lo que reduce la posibilidad de que el individuo cree deliberadamente una impresin deseable. La prueba de asociacin libre, que ya citamos, es una de las primeras tcnicas proyectivas. Los tests de frases incompletas tambin se han utilizado de esta manera. Otras tareas que aparecen en las tcnicas proyectivas incluyen el dibujo, el arreglo de juguetes para crear una escena, la drama- tizacin extempornea y la interpretacih de manchas de tinta.

Todos los tests de personalidad disponibles presentan ciertas dificultades prcticas y tericas: Cada mtodo tiene sus propias ventajas y desventajas. En conjunto, los tests de persona!idad han quedado detrs de los de habilidad encuanto a logros prcticos, pero esa falta de progreso no puede atribuirse a un esfuerzo insuficiente. La investiga- ciGn sobre la niedicin de la personalidad ha alcanzado proporciones impresionantes desde 1950, y muchos instrumentos ingeniosos y mejoras tcnicas estn en investigacin. Lo que explica el lento avance en el 5rea son ms hien las dificultades especficas que se encuentran en la medicin de la personalidad.

A partir de la investigacin actual c m los tests de personalidad estn surgier.do dos tendencias unificadoras importantes (vase Anastasi, 1985b, 1992a, 1993; Digman, 1990; L. R. Goldberg, 1993; Simon, 1994). Primera, cada vez hay ms evidencias de la influencia recproca de los rasgos afectivos (de "personalidad") y cognoscitivos (de "habilidad") tanto en el desempeo.de tareas como en el desarrollo conductual. Se ha llegado a la conclusiii de que la distincin tradicional entre los dos rasgos ha sido im- puesta artificialmente por razones de conveniencia en la descripcin y medicin de diferentes aspectos de la conducta. Segunda, el anlisis terico de la naturaleza y com- posicin de la personalidad apoya la integracin de los rasgos cognoscitivos y afectivos en un modelo aiiiplio de :a actividad humana que incluye todas las formas de conducta. Este modelo relaciona la investigacin bsics de los rasgos intelectuales (capkulo 11) y los afectiv~b (capkulo 13).

Button15:

Antecedentes (Anastasi)

Documents

Transcript of Antecedentes (Anastasi)