1 Brown Cap 10

' 5i.i interpreracron ae ius caiificaciones

contenida en la prueba, como en las situaciones de selecci6n o colocacion. Puesto que este t ip0 de calificaciones incluyen daros de validez directarnente

i

en el proceso de interpretacion de la prueba, la primrra etapa seri slernpre la de reunir 10s datos necesarios de validez. Solo despuis de completar esta etapa podemos ocuparnos de 10s mi todos para presentar las calificaciones. Vunos a analizar dos t i p a de cahficaciones relactonadas con 10s rcsultados globales: uno que indica la probabilidad de diversos resultados globales (cuadros de expectancia) y otro que hace una predicci6n sobre el nivel de ejecucion en el critcrio. En nuestra opinion, la:, calificaciones relacion:~cias con 10s resultados globales, a1 incluir datos de validez en el proceso de interpretacion de la prueba, tienen muchas cosas que 10s hacen recomenda- bles sobre 10s otros tipos de calificaciones, particularmente sobre 10s relacionados con normas.

DrspuCs de analizar varios problemas de interpretacihn de calificaclones (cahficaciones ~mprecisas, la equiparacion de calificaciones de pruebas difercntes y las diferencias de calificaciones), esta parte .del libro concluiri con ~ l g u n a s reco~nendaciones para comunicar las calificaciones de las pruebas a o t r ~ s personas. Evidentemente, no podemos hacer que 10s lectores se conviertan en expertos en la in terpre tacih de pruebas: esto se logra s61o niediante la prictica y el conocimiento del desarrollo humano y las tkcnicas de asesoramiento. Lo que haremos es presentar algunas guias utiles para interprrtar calificaciol~es. Esis indicaciones se pueden resumir brevernente: en primer lugar, asegurarse de que ;a persona sepa lo que significan sus calificaciones y como se utilizarin, y en segundo lugar, permitirle reaccionar ante lo informacion presentada, con el fin d e aclarar su significado y sus imphcaciones.

CALlF lCAClONES R E L A C I O N A D A S C O N L A S N O R M A S

Es probable que la rnayoria de los lectores de este l ibro no deterrninen nunca la confiabilidad ni la validez d c una prueba. Sin embargo, e n algun mornento de sus vidas, tendran probablemente la ocasi6n de interprerar resultados en pruebas psicol6gicas o educativas. Esto puede producirse en su papel profesional de maestro, consejero o gerente d e personal o a1 interpretar las calificaciones de las pruebas que hayan pasado 10s lectores mismos o sus hijos. Asi, en esta seccion, vamos a ocuparnos d e 10s "c6mo" y 10s "porqui" del desarrollo y la interpretacion d e las calificaciones de las pruebas.

Antes de ocuparnos de 10s diversos tipos de calificaciones, sera conveniente tomar en corlsideraci6n quC informacion se deriva de 1;is calificd- ciones de las pruebas. Una calificaci6n individual en cualquier prueba sera siempre una funcion de tres condiciones: su cornposicion genktica, su apren- dizaje y sus experiencias antes de la prueba y las condiciones de la si tuscibn cie prueba propiamente dicha, Los tres aspectos desempefiarin un papel importante en la determinaci6n de su ejecucion. .4un cuando e s dificil separar 10s c o m p o n e n t s geniticos y 10s d e la experiencia, las condicionrs :s!nncis:iznLts de 11n examen ~srFIIrsn q 1 1 ~ ;n e.k.c~ci.'::~ 112 :!::;I ~ : L ~ Z O I : . )

r?fle]e S L ! ~ czipr2cidxkr y ~_l.r2:teri.ti~2~. ;! nc !2 ri:uaci6n p a r ~ i c u l x d;.l esarnen.

Otro modo, quiza mas fructifero, de ver las calificaciones de las pruebas es en funcion de las conclusiones que puedan obtenerse de ellas. Trcs pre- y n r a s son cruciales: 'Donde e s t i ahora la persona? ~ C b m o Ilcgo a ese punto? iCuales son las irnplicaciones para su conducta futura? E n otrrls palabras, nos interesamos por la ejecucion actual del individuo. 10s factores clue h m hecho que funcione a ese nivel y lo q u e se puede esperar q u e h a g en el futuro. Si vernos las calificaciones de las pruebas solo a partir de la primera perspectiva - ;donde es t i 61 ahora?- interpretarzmos las calificaciones de 13s pruebas sclo conlo una medida de la situation actual. No obsran- te, esto es un punto de vista limitado, puesto clue la rnisma calificaci6n de una prueba obtenida por dos personas puede significar cosas d i s ~ i n t a ~ .

ZhapKiel

Text Box

Brown, F. (1980) Medición en Psicología y Educación. México: El Manual Moderno

i16 Calificaciones relacionadas con las nonnas f Capltulo 1 U )

dependiendo de sus experiencias previas. Por ejemplo, una calificacibn eievada en una prueba de vocabulario podria tener implicaciones distintas, si la obtiene un nifio cuyos padres fueron profesores universitarios o un nifio de las profundidades de 10s Montes Apalaches. Por ende, para poder hacer interpretaciones significativas, deberemos tornar en consideration las experiencias del kdividuo previas a la prueba.

La tercera pregunta - jcudles son las implicaciones de las calificaciones?- es, por supuesto, un aspecto de la validez. Aunque puede resultar interesante saber quC caiificaciones obtiene una persona en una prueba en comparaci6n con algun grupo, deseamos saber, casi siempre, quC implica la calificaci6n para su conducta futura. Para hacer esta prediction (interpretacion), deberemos tener datos de validez. En resumen, la interpretaci6n significafiva de las calificaciones de las pruebas requiem tanto medios para expresar esas calificaciones (o sea, una escala) como datos de validez que indiquen lo que mide la prueba.

CALIFICACIONES BRUTAS. ORIGINALES 0 DIRECTAS

Despues de administrar una prueba, las respuestas de un individuo se comparan con una clave para obtener su calificacibn en la prueba. En las pruebas de capacidades y rendimiento, las respuestas que figuran en la clave son las correctas. En 10s inventarios de intereses y personalidad, las respuestas incluidas en la clave suelen ser las opciones predominantes de un grupo particular de criterio. TambiCn se pueden utilizar como calificaciones otras medidas de ejecucion -por ejemplo, el nhmero de errores, la suma de puntos en varios reactivos o problemas, el tiempo necesario para completar la prueba o la clasificacion. Cualquiera de esas calificaciones, obte- nidrs direc:dinente a partir 3e !a prueba, sc dmomina calificaciones hrutas u originales.

Es raro que las calificaciones brutas Sean significativas por si mismos. So10 cuando una prueba cubre un universo definido explicitamente tendri sentido una calificacion bruta. De otro modo, tendra que compararse con las calificaciones obtenidas por individuos cornparables o con algbn estandar definido, o bien, expresarlo en tirminos de alguna consecuencia o criterio. Todos esos mitodos requieren que se transformen las calificaciones brutas a alguna escala diferente. Puesto que la nueva escala se deriva de las calificaciones brutas mediante una transformation estadistica, sr dice que son calificaciones transformadas o derivadas.

CALIFICACIONES DERlVADAS 0 TRANSFORMADAS

Hay diversas formas posibles .is clasificac.6n de las calificaciones dcrivatias (ver, par ~jrii:pir;, k~~gc;Cl', : 9?! s; Lyrtrdrr, i 9;; j. En nup.rt1.a

exposicion, vamos a utilizar las tres clases amplias: calificaciones relacionadas con normas, calificaciones relacionadas con el contenido y calificaciones relacionadas con las consecuencias.

Calificaciones relacionadas con Ias normas Lo mis frecuente es que la ejecucion de un individuo se compare

con las calificaciones obtenidas por otras personas en un grupo de rcferen- cia pertinente, el grupo normativo. Este hltimo se compone de personas que cornparten ciertas caracteristicas con el individuo. Por e~emplo , en un examen en clase, el grupo normativo incluiri a otras personas que se sometan a la misma prueba; en una prueba de inteligcncia, 10s niiips de la misma edad; en las pruebas de admisi6n a la universidad, 10s estudiantes que piensen seguir estudios profesionales. Asi, el desarrollo de las calificaciones relacionadas con las normas implica: ( I ) identificar un grupo pertinente de comparaci6n; (2) obtener las calificaciones en la prueba de 10s miembros de este grupo y (3) convertir las calificaciones brutas a una escala que exprese la ejecucibn como clasificaci6n relativa dentro de ese grupo normativo.

El uso de calificaciones relacionadas con las normas hace hincapii en que las mediciones psicol6gicas son mas bien relativas, que absolutas. Como se menciono antes, en las mediciones educativas y psicol6gicas, es raro que se disponga de normas o escalas absolutas. Asi mismo, en la mayoria de las situaciones, las diferencias entre individuos son mas importantes o al menos mas interesantes que las similitudes. Estos dos factores argu- mentan la expresi6n de la ejecucion en tkrminos comparatives; o sea, en escalas relacionadas con normas.

Calificaciones relacionadas con el contenido Aunqne las mediciones psicolbgicas y educativas suelen estar relaciona-

uaa cull I I V I I I I ~ , , =j fi.~~;.;;:;. ;I;;: ~2:: .?lG:p!j~ n t y p y y r i i ~ n r 1:; i n f n ; - melon acseada. Zonsiaaienos a un padre que habla con el maestro de sl! hijo que cursa el tercer grado de primaria. El profesor seiiala que las habilidades de Juan para la aritmttica lo colocan enrre 10% superior de su grupo escolar. Se trata de una interpretacion relacionada con las normas )I le proporciona a1 padre informacibn valiosa. Sin embargo, el padre pudiera preguntar: "iQu6 habilidades aritrnkticas ha Ilegado a dominar Juan?". En este caso, el padre solicita una descripcion de la ejecucion del niRo en funcibn del contenido que ha llegado a dominar y n o en funcibn de su ejecucion en relacion a sus compafieros de clase.

Este ejemplo ilustra un segundo mktodo de informar sobre 13 ejecucibn en tirminos de destreza. Es obvio que estas calificaciones son valiosss sobre todo en 10s ambientes educativos. Sin embargo, el desarrollo de calificaciones relacionadas cou el contenido se ha llevado a csho con Ienti- tud. Una de las razones para ello es que este rnitodo reqtic-is una especi-

218 Calificaciones relacionadas con las normas (Captrulo 10)

ficacion precisa del universo de contenido (y habilidades). Esta tarea es dificil, except0 en ireas rnuy circunscritas. Por ejernplo, es relativamente facil delinear el dominio de "adicion de nhrneros de dos digitos"; pero rcsulra mas dificil circunscribir el universo de "capacidad para resolver ecuaciones algebriiicas". El segundo problerna es el de definir un nivel aceptable de destreza. A primera vista, puede parecer sencillo el especificar el nivel de destrcza esperado en aritniktica en un alurnno de tercer grado, datla una descripcibn dcl dorninio. No obstanre, una ligera reflcxibn indicar i clue el h i c o rnodo n o arbitrario de hacerlo es en terniinos de las habilidades ejercitadas que tienen tipicaniente 10s alurnnos de tercer grado; por supuesto, se tratara de un metodo normativo.

Cdificaciones relacionadas con las consecuencias Una tercera posibilidad es la de expresar la ejecucion en funcion d e una

conducta o una calificacibn pronosticada. 0 sea que, en lugar de interpretar la calificacicin de un individuo en una prueba de admisicin a la universidad, diciendo que obtuvo calificaciones rnhs altas que 78% de 10s candidatos a1 primer afio profesional, podriarnos decir que puede esperar obtener calificaciones de B. 0 bien, a1 interpretar un inventario de intereses, podrianios decir que 10s intereses de una persona fueron sirnilares a 10s de un rnidico. En arnbos ejeniplos, hemos interpretado las calificaciones de las pruebas, no corno clasificaciones relativas dentro d e un grupo, sin0 en funcibn de alguna conducta de criterio o alpuna consecuencia importante.

Las calificaciones relacionadas con las consecuencias tienen una ventaja importante sobre otros tipos de calificaciones: incluyen datos d e validez en la interpretacion de la prueba. 0 sea que la interpretacion es esencialrnen- te una prediccibn de la conducta futura. Para poder hacer esta prediccion, necesitamos datos d e validez que indiquen que conductas se pueden predecir a partir .!:- ]as caii:icacinv: d e la.. ; ; i i i ~ b ? ~ . ?or supuesto. suelen ser datos de validez relacionados con el criterio. Aunque estc metodo reyulere mas trabajo, puesto que se deben realizar estudios de validez e incluir sus resultados en el procedimiento d r inrerpreracion de las calificaciones, da casi siempre interpretaciones rnLs significatiws.

En resurnen, las calificaciones relacionadas con las norrnas indican la ejecucion en funcion de la clasificacion relativa del individuo de que se trate dentro de un grupo de cornparacion, las calificaciones relacionadas con el contenido reportan la ejecucion en tbrminos del contenido o las Iiabilidades adquiridas y las calificaciones relacionadas con las consecuencias expresan la ejecucion en funcion de una prediccion J e la conducta futura.' Toniando

I Un m i t o d o rn6s coniun es el de rvrnar en consideruci6n dos tipos principales de calificaciones las relacionadas con las normas y las relacionadas c o n 10s criterios (Glaser. 1963). Las caljficacio~ics relacionadas con el criterio correspondicnte o lo que denorninanios calificaciones de contenidc.

en cuenta estas distinciones, varnos a efectuar un anilisis m i s dr ta l lado de cada tipo de calificacion. Puesto que las calificaciones relacionadas con las nornias se utilizan con mayor frecuencia nos ocuparemos primrramenrt: d r ellos. Y puesto que la interpretacicin de las calificaciones relacionadas con nornias se hace sirmpre en relacion a un grupo normativo, vanios a ocuparnos del procrso de elaboraci6n de grupos normativos, antes de present31 10s diversos tipos de calificaciones relacionadas con las normas.

N O R M A S D E G R U P O S

En la rnayoria de las pruebas, se interpretan las czlificacionrs cornpn- rando la ejecuci6n de un individuo con la de 10s otros del grupo norniativo. El grupo norrnativo proporciona una base d e c o m p a r a c i h que muestra las calificaciones de un grlnpo estindar, definido, d e referencia. Potencialn~elite, hay cierto nurnero de posibles grupos normativos para cualquier prueba. Puesto que la clasificaci6n relativa de una persona puede v a r i x mucho, dependiendo del grupo normativo que se utilice para la comparaci611, la cornposici6n del grupo norrnativo es un factor crucial para la inrrrpretacion de las calificaciones relacionadas con las norrnas. Asi pues , 31 desarrollar nornias, la prirnera pregunta que debemos hacernos es: jcudles son 10s diversos grupos normativos posibles?

Desde el punto de vista de quien desarrolla la prueba, la prcgunra es: 'En q u i poblaciones se utilizari la prueba? Los grupos nonnut ivos se Jeben elegir para representar esas poblaciones. Si la prueba e s t i disefiada para evaluar las aptitudes de 10s alurnnos de la preparatoria, para realizar las labores correspondientes en la universidad, el grupo normativo deberri con- -;-*.- :;, G ; i < L i < ~ s 23 p;3p& i&:Gi;i <;; p.-- --- ,.";-*;,. <. 1- ,," ..,.3- - ; A . , A JLJIY L,ou.. ""..,LA* - A- -... -.-.--... si la pr3eb.i se ~iisrfiz par:. neak ias c3 rac~r r i s~ icas de la personalidad de 10s adolescenres, el grupo normativo consistiri en una seccion de cor te trans- versal de adolescentes. Si la prueba se Jiscfia para medir 13 disposicibn para la lectura de 10s alumnos de jardines d e nifios, e l grupo norniativo debt: consistir en alurnnos de kinder que no hayan comenzndo a recibir rodavia instruction c.e lectura. Puesto que la mayor ia d e las pruebas s r disellan para utilizarse con varios grupos, se necesitara p o r lo comhn m i s de un grupo normativo.

Los usuarios de las pruebas observan las normas desde diferrntes puntos de vista, segun las ventajas que ellos consideran. Su pregunta pri- mordial es: iCu i l de 10s grupos normativos disponibles es mris apropiado'.' Una vez mas, pueden ser pertinentes varios grupos normativos. Po r ejernplo, a1 aconsejar a un ulumno de preparatoria q u e piense estudiar injynieri.1 e n la universidad, un asesor academic0 puedc coniparar las calitic;~cionc.s

del estudiante en una prueba de aptitudes escolares con las de otros graduados de preparatoria que piensen asistir a la universidad, con las de quienes ingresan a las universidades a las que piensa asistir el alumno y con 10s de 10s estudiantes de primer afio de ingenieria en esas mismas universidades.

Tanto para quien desarrolla la prueba como para el usuario, la consideracibn principal es la composici6n de 10s grupos normativos. Para las pruebas de aptitudes y rendimiento, el grupo normativo apropiado consiste, generalmente, en 10s competidores existentes y potenciales. Para las pruebas de capacidades generales o caracteristicas de la personalidad, 10s grupos normativos se componen habitualmente de personas de la misma edad o el rnismo nivel educativo. Por supuesto, en cualquier situacion dada, se puede usar una gran variedad de dimensiones para d e f i i r el grupo normativo -tales como el sexo, la edad, el grado o el nivel educativo, la ocupaci6n, la zona geografica, la posici6n socioeconbmica y la raza.

REQUISITOS DE LAS NORMAS DE GRUPO

Quien desarrolla o utiliza una prueba debe tomar en consideracion varios factores a1 construir o evaluar grupos normativos. El primer requisito es el de que la composition de las normas de grupo se defina con claridad. Aunque las especificaciones generales d e 10s grupos normativos seri:n determinadas por las finalidades y 10s usos d e la prueba, dentro de esta gama hay una gran variedad de grupos normativos potenciales. Por esto, es necesaria una descripcion concisa y clara de la naturaleza y las caracteristicas de cada grupo norinativo. Es insuficiente una aseveracibn en el sentido d e que un grupo normativo se compone de "5,000 alumnos de primer ailo de profesional". lncluso la declaracibn que sigue proporciona solo una descripcion minim.a:

-. , - !

cl glupo lwllllarivu CSLO A U I ~ ~ L O U V ~ V L i&yi 165 dii;irii~~ d i 2:i;;l~: afh, , . I IUI~!V!CS y ~iiujcsi~ illx.t;;\jj a iUrSOS dr. artes liberales en universidades fundadas por concesidn de tierras.

4 Algunas de las preguntas que podemos hacer son: ~ Q u C es un "alurrno

B de primer afio"? iQu6 cursos se incluyen en "artes liberales"? iQu t son las universidades "fundadas por concesion de tierras"? C J :

G Z i ; c ,e ,5 Si un grupo normativo se compone de personas de un empleo o una "-, 2 i; ocupacion especifica, se debera dar el t i tu lo del empleo junto con su codigo

1 sc: 5 del (Dictionary of Occupationnl Titles) Diccionario de titulos de ocupa- ', C - d E

s - ; ciones, se deberin especificar 10s deberes del empleo y el tipo de empresa $ 0 industria, su ubicacibn peogrifica, lor ailos de experiencia de 10s trabaja-

3 dores y otras informaciones pertinentes. Para las pruebas de ejecucion, la i 2 information bisica debe incluir el nivel de estudios de 10s alumnos, la posi- I ; r * cion socioecon6mica y otros datos demogif icos y la experiencia de 10s f I alumnos en el area acadimica que se e s t i examinando.

Con frecuencia, varios grupos distintos d e una pob lac io~ i t iene una ejecucion diferente en una prueba. Si 10s subgrupos t ienen diferentes rangos o niveles de ejecucion, se deberan construir normas separadas para cada subgrupo. Por ejemplo, 10s hombres suelen tener e n general una mejor ejecucion que las mujeres en pruebas de aptitudes mecanicas, niientras que, a la inversa, las n~ujeres obtienen calificaciones m i s altas q u e 10s horn- bres en pruebas d e aptitudes secretariales; po r esto, se suelen proporcionar datos normativos separados para hombres y mujeres e n esas pruehas. Las variables que se relacionan con frecuencia con la ejecucion en la prueba y que, por lo tanto, pueden constituir la base para grupos normativos separados incluyen el sexo, la edad, la educacibn, la posicibn socioeconornica, la inteligencia, la ocupacibn, la region geogrifica, la raza y la cantidad dz adiestramiento especial.

En la mayoria de 10s casos, un grupo normativo consiste en una niuzs- tra tomada de la poblacion de interks, y n o de la poblacion total . Asi pues, un segundo requisito es el de que el grupo normat ivo sea una rnuestra representativa d e la poblaci6n designada. Por ejemplo, si se debe utilizar una prueba en estudiantes de secundaria, se deben incluir numeros pro- porcionados de alumnos de cada nivel de graduation, las zonas urbanas y rurales, las diversas razas, las posiciones socioecon6rnicas altas y bajas, las diversas regiones del pais, etc. El no obtener una muestra representativa har i que se desvien 10s datos normativos, lo que compl icar i la interpretacion de las calificaciones. Puesto que 10s datos normativos son nias ficiles de obtener para ciertos grupos (por ejemplo, e s m b facil obtener datos de escuelas suburbanas de aka posicibn socioecon6mica que d e escuelas de barriadas bajas y mucho m i s sencillo el obtener d a t o s d e estudiantes universitarios que de adolescentes de 18 afios d e edad y q u e trabajan), es t i siempre presenta la posibilidad de un muestreo desviado.

En el tercer piriafo va implicito un tercer r e q u i ~ i t o : el p r o e < i n ~ + n t c ? . .. . 2: x:es:;c; i; diLi d ~ ~ c r k i ~ cull ualruau. r"alil vvivcr rc nucbtro, cjcl111rio naieriul, ia i k sc r ipc ic~ aei mdcstreo y , pa r w d z , del grupo normativo. yodria ser:

El grupo normativo consistia en 5,000 alumnos de primer afio a 10s que se sonletib a la prueba durante la primera semana de clases, en septiembre de 1975; 250 estudiantes (125 hombres y 125 mujeres) se ercogieron al azx de 10s alumnos inscritos en 10s cunos de artes liberales en 20 un~versidades seleccionadas en forma aleatoria de entre todas las instituciones fundadas por concesibn de tierras.

A1 igual que en C I caso de la descripcibn de la poblacibn, cuan lo nilis precisa y complcta sea la descripcion, tanto mejor.

Un cuarto requisito es el de que 10s grupos normativos se basen en una nwestra de tamalio adecuado. No obstante, cs muy dificil dcfinir con precision lo que constituye un "tamafio adecuado". De t o d o s niodos, puesro que la cantidad de error de muestreo varia en proportion invcrsa a1 tarnu13

. . 317 I L L Calificaciones relacionadas con las nonnas (Capiruiu iu^;

de la muestra, esta ultima seri mejor cuanto mayor sea su tamaiio. Desde luego, n o es irrazonable esperar que las normas nacionalcs sobre pruebas nornializadas incluyan varios centenares de casos en cada casilla d e muestreo. Sin embargo, la necesidad de muestras grandes, que proporciona estima- ciones mas estables, se debe suavizar mediante el requisito de que las muestras Sean representativas. 0 sea que, en general. es mas conveniente obtener calificaciones d e una muestra mas representativa y d e tamaiio menor, q u e d e una muestra mayor, per0 poco definida (ver una exposicion sobre 10s procedimientos d e obtenci6n d e grupos normativos, en la obra de Angoff, 197 1 a).

Otra considrracion final es la de lo recientes que Sean las normas. Con 10s cambios r ip idos en la educacibn y 10s requisitos para 10s ernpleos, las normas desarrolladas hace cierto nbmero de aRos pueden no ser apropiadas ahora. Puesto que se presentan en la actualidad cirrtos conceptos a ni\lelcs de grsduacion mas bajos, 10s alurilnos actuales sc han expuesto a materjales in is nunierosos y diferentes que sus equivalentes de 10s aiios anteriores. Algunos requisitos d e trabajo han cambiado radicalmente, igual que las capacidades d e 10s trabajadores. Las normas se deben actualizar periodicamente y se deben abordar las normas antiguas con el escepticismo apropiado.

NORM AS LOCALES

Un usuario d e una prueba puede descubrir que ninguno de 10s grupos ~lormativos disponibles se ajusta a sus fines. 0 bien, puede desear utilizar LIII grupo normativo m i s limitado que 10s presentados en el manual d e la prueba, que suele tener un alcance bastante arnplio. Por ejemplo, un maestro de escuela puede desear comparar la ejecucion d e sus a lun~nos con el d e attron rsruiliantes de su clase o del A:eiria ed~lcarivc local. En esta situacibn, 2::. A t las soluciones cs la construction de nornias locales.

El desarrollo de normas locales es sencillo y direct0 (Ricks, 1971). Pursto que 10s cuadros de normas son bisicamente distribuciones d e frecuencias, el procedimiento implica la obtencion de calificaciones para todas las personas del grupo local (o una muesua de este grupo), el compilar una distribucion de frecuencias y calcular las calificaciones derivadas (ver niis adelante). Con los equipos d e procesainiento d e datos que existen en la actualidad, se trata de una tarea sencilla, incluso cuando se incluye gran cantidad de personas; si se hacc a mano, la tarsa n o es tarnpoco abrurnadora.

Por supuesto, la ventaja principal de las norrnas locales es que permiten 13s coniparnciones ent re una persona y sus asociados inrnediatos. Puesto que cada clase, compuiiia o r s c u ~ l a es unica en algunos aspectos, sus nliembros w i n distintos d e 10s grupos normativos incluidos en el manual Ya que la rjccucion en la j m e b a del grLpo local puede ser difersnte de la de 10s grupos i:ormri;:os ::ncionii:rr.. la dc!r:.:.:tlttlsia de 10s bltirnos puede conducir a

Califiraciones relacin~lldns con las nonnas 223

inferencias inadecuadas, a1 interpretar las calificaciones. Por ejemplo, 10s alumnos de cualquier clase o escuela dada n o tendr in las mismas experiencias educativas que 10s estudiantes d e un grupo norniativo nacional. Tam- bien es probable que 10s estudiantes locales difieran del grupo normativo nacional en factores relacionados con el rendimiento en la escusla, tales como el d e las capacidades o el nivel socioeconon~ico. Cuando esss difrren- cias se producen entre grupos normativos locales y nacionales. un grupo ilormativo local puede representar una mejor norma d e cornpar3ci6n. Po r supuesto, el usuario d e una prueba puede utilizar tanto no rmas locales c o m o nacionales y extraer la cantidad mixima d e inforrnacion d e las c:rlificaciones d e las pruebas.

La ventaja d e las normas locales -proporcionar un g u p o d e comparacion mas pr6xirno- es tambien su mayor debilidarl. Aunque las nornlas locales proporcionan informacibn pertinente para ]as decisiones loc:~les directas, no permiten las interpretaciones en un conrexto mas amplio. Por ejrmplo, 10s datos de grupos locales pueden scr niis valiosos para ayudar a 10s alunmos a que tornen decisiones sobre si estudiar Geomrtr ia A o Geomerria B ; tendran poca utilidad para aconsejar a 10s alumnos sobre 13s posibilidades d e que sigan una carrera en matemhticas. En el u l t imo caso, las normas mas amplias proporcionarin una mejor informaci6n.

Nuestra exposicion sobre las normas se puede resumir mejor c i tando varios principios generales forrnulados por Seashore y Kicks ( 1 950) . Sugie- ren que se debe: ( I ) utilizar grupos normativos bien definidos y evitar las normas poco definidas d e 10s individuos en general; ( 2 ) usar normas d e subgrupos separados, cuando las poblaciones Sean diferentes y mezclar grupos so10 cuando su combinaci6n tenga sentido; (3) sefialar todos 10s datos normativos utilss ( o sea, proporcionar normas sobre rarios grupos); (4) desarrollar y emplear grupos normativos locales y especiales; (5) pone r todos 10s datos normativos a disposicion d e o t ros usuarios d e las prucbas y (6) ::i!iz-: L-2 .'-rc~ nr\ymr,!i?rr\y (I-i:p?nih!y? ?.! jntprirrrtar :,.. ,-,~i~ricacjnr,es . . .

L A S C A L I F I C A C I O N E S R E L A ' C I O N A D A S

C O N L A S N O R M A S

En esta seccion debernos analizar cuatro clases d e calificaciones relacionadas con las norrnas: percentiles, calificaciones estandar, escalas d e desarro- 110. indices y cocirn tes. Para cada calificaci6n, debemos tomar en consideracion su fundamento y su calculo, citar sus ventajas y l imitaciones, da r un rjeinplo y describir como se interpreta.

PERCENTILES

Es probable que el metodo rnis utilizado de expresion de las calificaciones de las pruebas sea el de 10s rangos percentiles. Los rangos percentilares de una calificaci6n se definen como el porcentaje de personas del grupo normativo que obtienen las calificaciones m h bajas. Asi, un rango percentilar de 78 indica que 78% de las personas en el grupo normativo obtuvieron calificaciones mas bajas; un rango percentilar de 5 indica que so10 5% del grupo normativo obtuvieron calificaciones rnis bajas. En otras palabras, un rango percentilar indica la clasificaci6n relativa de la persona en porcentajes. Lo importante es que el rango percentilar incluye a porcentajes de personas. Esto ofrece un contraste con las calificaciones de porcentajes, que expresan la ejecucion en terminos del porcentaje, del contenido que se llega a dominar; esto es, que una calificaci6n de 78% significa que el estudiante responde correctamente a 78% de 10s reactivos.

Obtenci6n de 10s rangos percentilares Para desarrollar rangos percentilares se requiere determinar la propor-

cion de personas del grupo normativo con calificaciones inferiores a una calificaci6n especifica. La yrimera etapa consiste cn preparar una distribucion de frecuencias. A continuaci6n, se determina el nhmero de personas que obtuvieron calificaciones inferiores a la calificacih particular en cuestion (la frecuencia acumulativa). La divisibn de este ndmero poi el ndmero total de calificaciones que hay en la muestra da la proporcion de casos que caen por debajo de la calificacion (la proporcion acumulativa). A1 multi- plicar esta proporci6n por 100 las calificaciones se transforman en rangos percentilares.

En realidad, el procedimiento no es tan sencillo. La razon es la de que podemo: uszr la r:oporci6n d- personas con cdificaciones inferiores a , una calitlcacion dada o la proporcion de ios qut: ubtiencli ~ a i i i i c a ~ i u r r ~ ~ i g ~ d i i o inferiores a ella. En otras palabras, la trecuencia acurnuladlr se puede definir en funcibn del limite inferior del inrervalo de calificaciones o el punto medio de dicho interva1o.l Vamos a utilizar el ultimo metodo. En el cuadro 10- 1 se da un ejemplo del cilculo de rmgos percentilares.3

La interpreracion de 10s rangos percentilares es directa. Lo unico que se necesira recordar es que un rango percentilar indica el nhmero de

A veces se utiliza un tercer metodo, en el que se definen 10s percentiles en funcion del porcentaje de personar, que obtienen una calificaci6n dada o una calificacion inferior a ella. Las diferencias entre 10s tres mPtodos serin relativamente pequefias, cuando haya un rango amplio de calificaciones; sin embargo, cuando este rango de calificaciones posibles sea estrecho, habra diferencias relativamente grandes entre 10s rangos percentilares, calculados por m6todos diferentes. ' SI se desean otros m6tsdoi para cdcular 10s percentiles, ver las obras de Ebel(1972) 0 Ansoff ( 197 1 a).

personas de entre 100 que obtienen calificaciones mas bajas que la calificacion en cuestion. Como ilustracih, en nuestro ejemplo (cuadro 10- 1 ), una calificaci6n bruta de 25 era equivalente a1 rango percentilar 31. Asi, un alumno que obtenga una calificacion de 25 en el (American College Testing Program) (ACT) Programa Estadounidense de Pruebas Universitarias tendri calificaciones superiores a 31% de sus compafieros e inferiores a 6 9 8 de ellos.

Los rangos percentilares se pueden obtener tambiCn utilizando procedimientos graficos. Por ejemplo, podriamos trazar las frecuencias acumula- tivas y obtener una curva, llamada ogival. A partir de esa curva, podriamos leer directamente 10s rangos percentilares. En la fig. 10- 1 se, ilusrra el mod0 en que se hace esto, demostrando que una calificaci6n bruta de 25 es equivalente a1 percentil 31. Esta clasificaci6n es la rnisma que se obtuvo por el metodo de tabulaci6n (ver el cuadro 10- 1 ).

Pun tos percentiles A1 determinar 10s rangos percentilares, buscamos la proporcion de

individuos con calificaciones rnis bajas que la calificaci6n dada en la prueba. No obstante, deseamos a veces saber quC calificacion de una prueba divide una distribucion en ciertas proporciones; por ejemplo, podemos desear identificar a 20% superior de 10s estudiantes, para poder situarlos en una seccion aventajada del curso. Para lograr esto, deberemos determinar la calificacion de la prueba que corresponde a un rango percentilar de 60. Esto se puede lograr, encontrando la proporcion acumulada asociada a1 rango percentilar y, a continuaci611, el punto de la escala de calificaciones brutas que corresponde a esa proporcibn acumulada. El punto en la escala de calificaciones que corresponde a una clasificacion deseada en percentiles se denomina percentil.

Como ilustracihn, vamos a deterrninar la calificaci6n bmta en nuestro :j;.;;.~;k, q i x i+i;* ,i 2S;Z aurariul L;G ia disiribu&,r GG 605* isstar~ie. En ei c-sdro :G-1 podemos ver que una calificacion brilta de 30 tiene una proporcion acumulativa (PA) de 0.890 y una calificacion bruta de 29 tiene una PA de 0.780; a1 interpolar, descubrimos que una calificacion bruta de 29.2 es equivalente a un rango percentilar de 80. Asi, 10s alumnos con calificaciones superiores a 29 estarfan entre 20% superior de su clase y podran ser elegibles para la seccion aventajada.

Obstrvese que I~ubiCramos podido lltilizar tanibien el procedimiento grifico para obtener percentiles. 0 bien, si desearamos so10 encontrar una linea de corte, como en nuestro ejemplo, hubieramos podido contar el 20% de las caljficaciones (en el ejemplo, las 35 calificaciones suprriores). Sin embargo, en general, nos interesan varios puntos percentiles. Por ejemplo, si queremos desarrollar un cuadro normativo (ver rnis adelante) que. en lugar de mostrar rangos percentilares para cada calificacion bruta. presen- to las calificaciones brutas cue fueron necesarias para obtener diversos

7'76 --- Calificaciones relacionadas con las normas f Caplrulo 10)

Cuadro 10-1. Obtenci6n d e 10s rangos percentilares

Las etapas que siguen ilustran 10s procedimientos para calcular 10s rangos percentilares. Los datos utilizados son las calificaciones combinadas ACT para una muestra d e 177 alumnas de primer ingreso, a una universidad de Artes Liberales del oeste rnedio. Pasos a seguir para el cornputo: 1. Preparar una distribucibn d e frecuencias d e las calificaciones. 2. Deterrninar la frecuencia acumulada ( F A ) a1 limite inferior de cada

calificacibn. Esto es la suma d e todas las calificaciones que se encuentran por debajo de la calificaclin en cuestion. Por ejemplo, la FA para un resultado de 2 3 es: 1 + 3 + 12 = 16, el nhmero de estudiantes con calificaciones d e 22 6 rnenos.

3. Deterrninar la frecuencia acumulada en el punto rnedio del intewalo de las calificaciones (FA, , ). Esto se obtiene sumando la mitad del numero de calificaciones del intervalo a la FA. Por ejemplo, para una calificacion d e 23:

4. Determinar la proporci6n acumulada (PA) , dividiendo FA,, por N , el numero total d e calificaciones. Para una calificacibn d e 23:

5. Para deter rn ina~ 10s rangos percentilares (RP) , se multiplica PA por 100. Una vez mas, con una calificacion d e 3-3, se tiene:

Un rango pe r r e~ t i l a r de 13 sig!?ifica que 13 d e cada 100 estudlantes (1 3%) ~ u v i c l u l ~ c~iiiibabiullcs lrlclwics quc 23 cn la ACT y E7 de iada iG3 i87X; :u:'lercn calificaciones mis altas.

X f FA FA pm PA RP

Calificaciones relacionadas con las nurmas 22 7

Calificacion bruta u original (combination ACT1

Fig. 10-1. MBtodo grhfico para obtener rangos percentilares (Nota: A l rrazar l ineas perpendiculares a 10s ejes, descubrimos que una calif icacion bru ta de 27 es equivalente a u n rango percentilar de 54).

rangos percentilares -tales como 9 0 , 8 0 , 70 , e tc . En este caso, ca l cu l3~ iamos puntos percentiles.

Deciles Los puntos percentiles dividen una distribucibn d e calificaciones en

100 partes iguales. Sin embargo, en nluchas cii-cunstancias, no sc necesitan esas distinciones tan fillas y puede bastar con la division d e la disrribucion en un nulnero menor de segmrntos o porciones. De ent re 13s divisiones : ,n4 l>l t*~ . l:>c r i A . i n ~ s c cc!., I?! " 3 3 2 am,,,lm-+- ,.,,.. .,..- '- -... r.'-.. - " a . . . ...nyo; 7 - - - .,.-...--

.,crL.c..L,o. L c 7 S , , , , ~ ~ ~ ~ ..- A - ,-*I rlllilLC;I',~~ c.--- . - . . que dividen la distribution en decimas b c ( i c ~ ~ u ~ n i n a n

dzciles. Puesto que 10s deciles dividen la distribucion e n diez srgrnentos iguales (cortindola en 10s puntos percentiles d e 10, 20, . . . , 9 0 ) . el ci lculo de deciles es igual q u e el d e 10s puntos percentiles 10, 20 , . . . . 9 0 . En esencia, 10s deciles proporcionan una escala d e clasificacion en divisionrs t ic dicz, de tal modo que cada etapa contienc 10% d e las calificnciones. Tradicionalmente. la decima mis baja se denonlina primer decil. 13 sipuiente es el segundo decil (clasificaciones en percentiles de I 0 a 70) , y a s i sucesi- vamente.

Evaluation La ventaja principal de 10s percentiles es su facilidad d e intcrpreta-

cion. El conocer la clasificacion relativa d e una persona e n un g rupo per- tinrnte dl? comparacion es, para la nlaporia d e 10s individuos. un indice de elecucibn simple, significativo y facil d e entender. T-mi-ikn. l u r a muchos

propositos la clasificacion dentro de un grupo es suficiente, por lo que no se necesitan transformaciones mas complejas.

Los rangos percentilares tienen dos limitaciones importantes. En primer lugar, siendo una escala ordinal, no se pueden sumar, restar, multi- plicar o dividir. Esto no constituye una limitacibn importante a1 interpretar las calificaciones; per0 constituye una dificultad grave cn 10s andisis estadisticos. Una segunda limitacibn tiene mayor interts para 10s usuarios de las pruebas. Los rangos percentilares tienen una distribucibn rectangular, en la que las distribuciones de las calificaciones de las pruebas se aproximan en general a la curva normal. Como consecuencia de ello, las pequefias diferencias de las calificaciones brutas cerca del centro de la distribuci6n dan como resultado grandes diferencias en percentiles. A la inversa, las grandes diferencias de las calificaciones brutas en 10s extremos de la distribucion producen solo pequefias diferencias en percentiles (ver la fig. 10-2). A menos que se recuerden estas relaciones, 10s rangos percentilares se pueden malinterpretar con facilidad; en particular, las diferencias aparen- temente grandes, alrededor del centro de la distribucibn tienden a inter- pretarse con exageracion.

!,. 1 Percentiles '#

Calificaciones relacionadas con las nomas 22 9

CALIFICACIONES ESTANDAR

Los rangos percentilares se miden en una escala ordinal. Por varias razones, sobre todo cuando se realizan analisis estadisticos con las calificaciones de las pruebas, seria conveniente expresar las calificaciones en una escala de intervalos -0 sea, tener una escala con unidades d e tamafio iguales. Las calificaciones estandar poseen esta propiedad.

Una caIificaci6n estandar ( 2 ) es la desviaci6n que tiene una califimcion bruta de la media, en unidades de desviaciones estindar:

x - x 7 =-

S

Puesto que la unidad basica de la escala es la desviacion estandar, se dice que esas calificaciones son estandar.

Es precis0 indicar varias propiedades de las calificaciones est indar ( z ) : ( I ) Se expresan,en una escala que tiene una media de 0 y una desviacion estandar de 1. (2) El valor absoluto de una calificacibn z indica la distancia a la que se encuentra la calificacibn bruta de la media d e la distribucibn. El signo de las calificaciones z indica si la calificaci6n cae por encima o por debajo de la media; las calificaciones por encima de la media tendrin signos positivos; 10s que se encuentren por debajo de la media, negativos. (3) Puesto que las calificaciones estandar se expresan en una escaIa dr: inrervalos, se pueden someter a las operaciones algebraicas comunes. (4) La transformacibn de las calificaciones brutas a estindar es lineal. Por esto, la forma de la distribucibn de las calificaciones z es similar a la distribucion de las calificaciones brutas. Si la distribuci6n de las calificaciones brutas es normal, lo sera tambiin la distribuci6n de las calificaciones z ; si la distribucion de /as calificaciones brutas es sesgada, lo sera tambiin la distribucibn de las califi- ,?a:iones i. ( 5 ) Ci la distribucibn de las calificaciones brutas es normal. 10s rangos ae ias caiiGcaciones z i r i rie apunilliodo~iitiii~ -2 z I 3.

Para evitar decimales y valores negativos, las calificaciones z ir transforman por lo comun a otra escala. Esta transformaciun es de la forma:

en donde Z es la calificacion estandar transformada y A y B son c o n ~ t a n t e s . ~ Puesto que la suma o la multiplicacion de o por una constante n o destruye las relaciones en la escala, las relaciones entre las calificaciones z seran las mismas que entre las calificaciones brutas.

Fig. 10-2. Relaciones entre distribuciones :k calificaciones brutas y rangos percentilares.

Obsirvese que esla es la ecuacibn para una linea recta, e n d o n d e B es la constante de inclinacibn y A la constante de intercepcibn. Tal y c o m a se aplica a nuestro problems, A rransfonnnri la media y B la desviacibn eslandar.

I

Cuadro 10-2. Obtencio11 de calificaciones estandar -- Las etapas que siguen ilustran la forrna d e obtener calificaciones estindar. Los datos son 10s utilizados en el cuadro 10-1.

Pasos para el computo: 1. C_alcular la media y la desviacion estindar. Para esos datos, obtenemos

.Y = 26.54 y s = 2.76. 2. Para cada calificacion bruta, determinar la calificaci6n de desviacion

individual (x), que es la calificacion bruta menos la mzdia. Por ejemplo, cuando X = 25:

3. Deterniinen z para cada calificacion. Recuerden que z = xis. Para X = 25 :

La calificacion 2 expresa la calificacion bruta en unidades de desviacion estindar d e la media. En nuestro ejemplo se indica que una calificaci6n original de 3 5 estd a 0.56 de desviacion estindar por debajo d e la media.

4 . Para eliminar decimales y nunleros negativos, transfonnanios las calificaciones z a otra escala. La transformacion que se recornienda es a una escala con una media de 50 y una desviacion estandar d e 10. Esto se puede lograr, utilizando la f6rmula Z = 5 0 + 101. A1 aplicarlo a nuestro ejemplo, con X = 25,

Nuestras calificaciones se expresan ahora en una escala de calificaciones estrindar con una media d e 5 0 y una desviacion estandar d e 10 puntos. T a rltrlna rlel c h t n p ~ ~ r n ze t;~l)ula como sip-::

Calificaciones relacionadas con las nonnas 231

Aunque se pueden utilizar constantes d e cualquier t ipo, el procedimien- t o recomendado (APA, 1974) es el d e utilizar la transformaci6n:

En esencia, esta transforrnacion cambia las calificsciones a una escala que tiene una media d e 50 puntos y una desviacibn es t indar d e 1 0 punros. Se pueden liacer otras transforrnaciones, utilizando cualquier ~ n c d i a y cualquier desviacion estandar que sea apropiada y conveniente. En to-ios 10s casos, las calificaciones se redondean a nbmeros enteros.'

En el cuadro 10-2 se dan un ejernplo del ci lculo d e calificacioncs estandar.

Calificaciones estandar norrnalizadas La transforrnacion de calificaciones brutas a es t indar , q u e \limos

antes, era lineal; po r ello, la forrna d e la distribucibn d e las calificaciones 2 y las calificaciones brutas ser i la rnisrna. Si la distribucibn d e las calificaciones estandar es normal, estas se pueden convenir directamenre en rangos percentiles. Esta transformaci6n se puede liacer, uti l izando un cuadro de ireas de la curva normal, como la que se d a e n el Aptndice A. Esta transforrnacion es posible, debido a que cn una distribucibn normal. hay una relacion especificable entre las calificaciones esr indar ( 2 ) y las areas situadas a lo largo d e la curva ( o sea, la proporcibn d e casos q u e caen entrr dos puntos).

lncluso cuando las calificaciones brutas o directas n o e s t i n d i s t r i bu idx normalmente, podrernos realizar una transformacion d e area y forzar las calificaciones a entrar en una distribucion normal. Las calificaciones obteni - das de este rnodo se dice que son calificaciones es t indar normalizadas; la ~ palabra "norrnalizados" indica que se ha obligado a las calificaciones a entrar ?I? !!r?? !~lrlri!~llci+!? .?pm?z!. Par? ! ! ~ . 3 2 ! i 7 n r 1:1c m l ~ f i r ~ ~ i c . ~ . . \ . i ~ h r hnb?: ;:;ni;.n b~.ii. pi;; :;;p;iiii que ]us calificaciones d e la caracterir,:i:- c;.~r. st. mide tienen, d e liecho, una distribucion normal. Si n o se puede suponrr que las calificaciones tienen una distribuci6n nornial. forzarlas a entrar a una distribucion normal solo serviria para distorsionar la disrribucion inisma. Por consiguiente, las calificaciones estindar normalizadas se cal- culan solo cuando una distribucion obtenida se acerca a la normalidad pero, debido a 10s errores de rnuestreo, es ligerarnente diferente. Esta situacion se presenta con frecuencia en la normalization d e pruebas en muestras grandes y heterogkneas. En el cuadro 10-3 se ilustra el procedimiento utilizado para obtener calificaciones estandar norrnalizadas.

j Esas transformaciones tienen tambien la ventaja de eliminar decitnales y valores negativos (por ejemplo, en la escala de 50, 10, el rango esperado de resultados seri de aproximadamente 20-80).

Cuadro 10-3. Obtenci6n de caiificaciones estindar normalizadas

Las etapas que siguen ilustran el cilculo de las calificaciones estindar normalizadas. Los datos son 10s mismos que se utilizaron en 10s ejemplos anteriores (cuadros 10- 1 y 10-2). Pasos para el cornputo:

1 . Para cada calificaci6n original, encuentre la proporcibn acumulada (PA), mediante 10s procedimientos descritos en el cuadro 10-1.

2. En el cuadro de zonas de la curva normal (ver el apCndice A), encuentren la calificacion z comparable a esta PA. Para las calificaciones situadas por encima de la mediana (PA > 0.500) utilicen la columna marcada "Zona de Proportion Mayor"; para las calificaciones por debajo de la mediana (PA > 0.500), usen la columna marcada "Zona de Propor- cion Menor". Esto da la calificacion z que corta la distribucion en las proporciones deseadas. Denominaremos este valor z', para distinguirlo de la calificaci6n z calculadas mediante una transformacibn lineal (corno en el cuadro 10-2). Para obtener valores de z', tendremos que in terpolar.

3. Una vez mas, debemos transformar las calificaciones a otra escala y, otra vez, vamos a utilizar una escala con una media de 50 y una desviacion estindar de 10; o sea, Z' = 50 + 1 0 ~ ' .

La rutina del cornputo se tabula como sigue:

X PA z' Z'

32 .989 2.29 7 3 3 1 .958 1.73 6 7 3 0 .890 1.23 62 29 .780 0.77 5 8

, * - id .oo I 6.4; 54 27 .537 0.03 5 1 2 6 .4 1 5 -0.21 4 8 25 .3 1 1 -0.49 45 24 .209 -0.81 42 23 .I30 -1.13 3 9 2 2 .056 -1.59 3 6 2 1 .014 -2.20 2 8 20 .003 -2.75 22

'-

Nora: Si la distribucibn es normal, las calificaciones estindar normallzadas (z' o 2 ' ) tendrdn el mismo valor, dentro de 10s errores de medicibn, como las calificaciones estandar comparables transformadas de mod0 lineal (z o Z, respectivamente). Si la distribucion no es normal, 10s valores compara- tivos diferirin.

Como sucede con todas las escalas de calificaciones estandar, se puede utilizar cualquier media y cualquier desviacion cstandar arbit raria. Una vez mas, el procedimiento recomendado es el de transforrnar las calificaciones a una escala con una media de 50 y una desviacibn estandar de 10 puntos. Por supuesto, si la situacion lo justifica, se pueden utilizar otras const antes.

Otras caiificaciones estandar Cuando se dan las calificaciones estandar normalizadas en una rscala

con una media de 50 y una desviacion estindar de 10, se denominan calificaciones T. Este uso puede provocar cierta confus ih , puesto que las calificaciones T se definieron originalmente en relacion a un grupo normative dado (McCall, 1922) -no en un sentido genirico. Ademis, algunas personas utilizan la designacion de "calificaciones T" para referirse a cualquier sistrma de calificaciones estindar transformados, normalizados o no. Lo mas frecuente es que a cualquier sistema de calificaciones estandar normalizados con una media de 50 y una desviacion estindar de 10 se le de el nombre d r sistema de calificaciones T (Lyman, 197 1).

Otro tip0 de calificacion estandar es la estanina, que es una abrevia- cion de "nueve estindar". La escala estanina es una escala de calificaciones estandar de nueve intervalos, con una media de 5 y una desviacion estandar de 2 puntos. Cada m a de las nueve categorias de calificacion, con excrp- cion de las dos categorias extremas, tiene una amplitud de media desviacibn estindar (ver la fig. 10-3). La utilizacion de calificaciones de un solo digito tiene ciertas ventajas; por ejemplo, las estaninas se pueden perforar en una sola columna de una tajeta IBM. No obstante, como cualquier otro sistema que reduce el rango mediante un agrupamiento, sacrifica cierta precisibn a favor de la simplicidad.

1 - : . ! ..I.. .. . urr r .p . r rur&u.a u L ~ u . 1 L~AIAAULIV~IU~ G J I P ~ ~ U ~ .

-. un2 calliicaclon z de 1.00, un z (o T ) de 60 y una caiiilcac15n estancisi

normalizado de 60 indican que la calificacibn bruta e s t i a una desviacion estandar por encima de la media de la distribucion.' De mod0 similar, un z de -1.50, un Z de 35 y una calificacion estindar normalizada de 35 repre- sentan una calificacibn de una desviacibn estiindar y media por debajo de la media. Asi pues, las calificaciones estindar indican la posicibn relativa de un individuo, en funcion de desviaciones estindar de la media.

Para una persona no familiarizada con el concept0 de des\.iacion estandar, esa interpretation, en el mejor de 10s casos. scri vaga. No obstante. a1 utilizar calificaciones estandar normalizadas o cuando la dlsrribucion dr. las calificaciones estiindar transformados linealmente se acerqur a la normalidad, las calificaciones estandar se podran convertir en ranpos percentilares con relacion a la CUNa normal. Asi, una calificacion estindar d r 60 es equivalente a un rango perce5tilar de 84 y uno calificacion estindar de

Fig. 10-3. Relaciones entre varias escalas cornunes de calificacibn. Estas relaciones solo son validas cuando las calificaciones tienen una distribucion normal (Adaptada de la obra de H.G. Seashore, Methods of Expressing Test Scores. Nueva York: The Psychological Corporation, Test Service Bulletin No. 48, 19551.

35 rs t.clti:.,- ..-lentt. a tin railgo perieniilar de 7. Estas relacianes entre las cali- ficacionrr ectlnrlar y 10s rangos percentilares son vilidas. sea cual sea la naturaleza y el contenido de la prueba. Asi, las calificaciones estindar normalizadas y las calificaciones Z se pueden convertir a percentiles e inter- pretarse con10 tales. Cuando iriterpretan las pruebas personas no familiari- zadas con las calificaciones estindar, probablemente desearin utilizar una interpretacion basada en percentiles.

Evaluation Puesto que las calificaciones estandar expresan las calificaciones de las

pruebas en una escala de intervalos, son valiosos cuando se necesitan andisis estadisticos posteriores; por ejemplo, cuando se tienen que combinar varias calificaciones en una medida cornpuesta. Ademis, las calificaciones estandar normalizadas permiten referirse a una distribucion estindar (la c u m normal) a una conversi6n directa a percentiles, a mod0 de sirnplificar la interpretacion.

Chlificaciones relacionadas con las nonnas ~ J J

Otra ventaja de 13s calificaciones estindar es la de clue p e r m ~ t e n 13

comparaci6n directa de las calificaciones en dos o m h pruebas o escalas. La transforinacion de las calificaciones en calificaciones estrindar corrigz las diferencias en medias y desviaciones estandar de las diversas distribuciones, de modo que las calificaciones de las diversas pruebas se encuentrzn en la misma escala. En otras palabras, una calificacion z dada represrnra la misma posici6n relativa en las dos distribuciones sean cuales s r a n la media y la desviacion estandar de las distribuciones originalrs. Corno ilustracibn, supongamos que la prueba A tiene una media de 4 0 y una desviacion estandar de 20, la prueba B tiene una media d e 5 0 y una desviacibn es t indar de 10 y que Juan obtuviera 7 0 en la prueba A y 65 e n la B , a1 convertir a calificaciones estindar, descubririamos que su calificaci6n z seria el m i s ~ n o (+ 1 5 0 ) en las dos pruebas:

1.50 65 - 50

Prueba A: -= 20

1.50 Prueba B: - =

Asi pues. aun cuando las calificaciones brutas eron distintas en Ias dos pruebas, sus calificaciones estindar eran iguales y, por es to , ob tuvo la rnisnia posici6n relativa en las dos pruebas.

Los legos en la materia tienen mayores dificultades para entender las calificaciones estindar, puesto que son m i s complejas, desde el pun to de vista estadistico, y menos conocidos que 10s percentiles. TambiCn 10s sistemas de calificaci6n estindar usan diferentes medias y desviaciones estindar y , con frecuencia, se dice sinlplemente que son calificaciones estindar, sin hacer ninguna distinci6n entre las normalizadas y las transformadas en forma lineal. Por consiguiente, el usuario d e una prueba debe asegurarsc sicmpre del tipo de valores escalares usados en la escala dada y si las calificacione!: so11 no;lnalizr;2as o se trilta siinplenienre dc ulia 11.;11l~fzrl:1~:inl1

lineal I IP !2c c ? l i f i ~ a f i n n c ~ hrutas. Finalnlente, i n n o r m a l i z a c i h dz mli- fin. ~ ' l ~ i o n e s ,. estiindar obliga a las calificaciones a entrar a una disrribucihi normal. Este proczdilniento se justifica para suavizar 10s errores dz niucs- trzo; de o t ro niodo, solo distorsionaria la forma de la d i s t r i b u c i h .

En la fig. 10-3 se muestra la relacion d e 10s percentiles y \.arias tipos dc calificacionrs estindar utilizados comunmente. En esta figura se nlucs- tran las relaciones cuando la distribucion de calificacionrs brutas sean normales; naturalmente, las relaciones serian diferentes en las distribucionrs no normales.

ESCALAS DE DESARROLLO

Muchas habilidades, capacidades y caracteris:iias se desarrollan dc motlo s is tc~ndtko 2 travCs del t i cn~po . Por c jc~nplo , 12 xp;lci:!:~! d e leciura

236 Calificociones relacionadas con las nomas (Captrulo 10)

de un niAo aumenta con la edad y 10s aiios adicionales de asistencia a la escuela. Lo mismo sucede con la mayoria d e las d e m h habilidades y capacidades intelectuales. Puesto que esas capacidades aumentan sistemitica- mente, se puedcn desarrollar escalas de calificaciones que cornparan la ejecucion d e un individuo con el de la persona promedio a varios niveles de desarrollo. En estas escalas, una calificaci6n individual indica el nivel d e desarrollo que caracteriza su ejecucicn. Como podia esperarse, las escalas de desarrollo seiialan generalmence la ejecucion como equivalente a la edad cronol~gica o a1 grado escolar.

Escalas d e edad mental Alfred Binet, hacia fines del siglo, concibib la idea d e medir el creci-

miento mental, a1 comparar la ejecuci6n de un nifio con el d e 10s niiios promedio de varios niveles d e edades -0 sea, en reactivos en 10s que la ejecucion variaba sistematicamcnte con la edad. A continuacibn, cada reactivo se situaba a1 nivel d e edad en el que la mayoria d e 10s niilos podian completar con Cxito esa tarea. Por ejemplo, si la mayoria d e 10s niiios de ocho afios de edad deberan responder correctamente a la pregunta: " iCuanto es nueve veces nueve?"; pero so10 pudieran responder bien menos de la mitad d e 10s njfios de siete afios, esa pregunta se incluiria al nivel de ocho aRos de edad. Mediante el desarrollo de cierto nhmero d e reactivos apro- piados para cada nivel de edad, Binet construyo una escala que evaluaba el nivel de desarrollo mental de 10s niAos. La calificaci6n que recibia un niiio era el del nivel d e edad a u e calificaba mejor a su ejecucibn. Esa cali- ficaci6n se denomina edad mental.

Todas las escalas de edad mental se desarrollan utilizando esencial- mente el mismo razonamiento y 10s mismos procedimientos. Estas escalas asipnsn una calificaciin a un individuo, comparando su ejecucion con la ael nino pru~netiiu 6s i i r ~ r a d a d i i c ; . Dzr :;t.:pl~., ..i it!? nil50 p w d e r.=:. ponder conactamente a las preguntas a las que con;c;:;r, co.lunmen?e quienes ticnen diez afios de edad; pero falla en la mayoria de las preguntas de niveles de edades superiores, su cdificacibn d e edad sera d e die^.^

ObsCrvese que una de las prernisas fundamentales de las escalas d e edad mental es la d e que 1as caracteristicas que se miden aumentan sistematicamente con la edad cronolbgica. Asi, 10s elementos esenciales en una escala por edad mental son: (1) un conjunto de reactivos que discriminan a las personas a diferentes edades; (2) un grupo normativo, compuesto de una muestra representativa de personas de distintas edades, que proporciona la base para asignar un reactivo a un grupo particular de edad y (3) una escala para reportar la ejecucion. En la fig. 10-4 se da un ejemplo hipo- tCtico d e como se asignaran 10s reactivos a 10s niveles d e edad.

6 En la practicu, lus cdificaciones por edad mtntal se dan en arfos y meses. Asi, una cdi:?c~cid,i df edaC .jc 13 5 ~igaifica q u ~ P I hdividco o h v o Is misma calfficaci6n que 10s niilos yia~ncdio C: 10 afios y 5 meses

Caiijicaciones reiacionuuaias curt ius rrotttw

I Reactivo I I

4 5 6 7 8 9 1 0 1 1 1 2 1 3

Edad cronolbgica

Reactivo I I I I l l

Nivel de edad mental 6 9 12

Fig. 10-4. Desarrollo de una escala de edad mental.

Cuando las capacidades varian sistematicamente c o n la edad, las calificaciones de las edades son directas y ficiles d e interpretar. N o obstante, cuando el indice de desarrollo varia d e allo en aiio, se dificulta su interpre- taci6n, debido a la cantidad d e lo adquirido en el crecimiento ent re cada uno d e 10s afios. ( 0 sea que el tamaiio de las unidades no e s igual). Po r ejemplo, ia iirayur;o ;r ;ab ca+~;2;ic; i;,t;!::::~!:: 2: " D E ~ T T ~ ~ ~ I ! r c n ; : - J c ~ P ~ :I ur, incicc bastante constacre, durante toda la infancia; pero el' ia.?ic: .I: crecimiento comienza a desacelerarse durante la adolescencia. Por consi- fuiente, el incremento, por ejemplo, en la comprensi6n d e lo leido, sera menor entre 17 y 1 8 afios que entre 7 y 8. Por esto, u n a diferencia d e un afio en las calificaciones por edad mental tendre diferentes aplicaciones a las diversas edades. Ademis, puesto que la ejecucion se v e r i afectada por la educacion o las experiencias de la vida en general. Lo q u e es "normal" para una edad dada, en determinadas circunstancias, puede no ser "normal" en otras condiciones. Por todas estas razones, las escalas d e edad mental se utilizan de mod0 mas adecuado con 10s nillos mas jovenes q u e crecen en ambientes comunes y corrientes; para 10s niiios y 10s adulros d e ambientes atipicos o restringidos, las calificaciones por edad mental seran menos significativas.

C;lIi/icaciones relacionadas con las normas (Cap ftulo 10) Calificaciones relacionadas con las n o r m u 239

Escalas de grados escolares Otro tipo anilogo de calificacion es el d e la escala de grados escolares.

En lugar de cornparar la ejecucion de un individuo con el de personas de diferentes edades, las escalas de grados escolares comparan su ejecucion con la del prornedio de 10s estudiantes en varios grados. Asi, si el equivalente de grado de Jorge en una prue5a de aritmktica es de 3-5 su ejecucion es comparable a1 de un alumno prolnedio en el quinto nits del tercer g a d o (puesto que el crecirniento continlia durante el aAo, las calificaciones de grados se dan como meses dentro de cada grado).' Los procedimientos para elegir reactivos y asignar calificaciones son directamente anilogos a 10s utilizados en escalas por edad mental, con la exception de que se utilizan niveles dc grados escolares, en lugar d e edades.

Al igual que las calificaciones por edad mental, las calificaciones tqui- valentes 3 grados escolares solo son apropiadas cuando la caracteristica medida varia sistematicamente dentro de 10s niveles d e 10s grados de estudios. Adernas, se deben presuponer las experiencias educativas sirnilares. Corno ilustracion, supongarnos que una prueba de matemiticas de nivel de secundaria consiste en 75 preguntas -50 de aritmktica y 25 d e ilgebra- y se aplica en el sexto rnes del curso. Supongarnos tambikn que la calificacion promedio para 10s alumnos d e octavo grado es de 4 0 y para 10s de noveno grado de 50 y que el ilgebra se imparte so10 en el noveno grado. Alberto, un alumno de octavo grado, pasa la prueba y obtiene un resultado bruro de 50-, o sea, la calificacion promedio para 10s alumnos de noveno grado. i Q u i quiere decir esta calificacion? Alberto obtuvo probablernente esa calificaci6n a1 responder con una gran precision a las preguntas de aritrnk- tica, rnientras que 10s niiios prornedio de noveno grado obtuvieron la misma calificacion, a1 responder correctamente a algunas de !as preguntas de arit- rnktica y a!:unas de las preguntas de algebra. En otras palabras, Alberto y - ' ;;;;iiantc p:c;r,-di:, de :I.>\'-::- ;:-<Q nt,:;.m~r~n ;QC rn is rnns r.,~lifica- ..A

ciones; pero respuridiclvn correctamci;te b; difexnt:; Fxpun!:~. Por ende, e! conocimiento de las matemiticas que tiene Alberto no es necssariarnente equivalente a1 de 10s estudiantes prornedio de noveno grado, porque no habia estudiado algebra.

Adernas de depender d e 10s tenlas enseiiados en varios niveles de grados de estudio, las calificaciones de grados escolarzs reflejan tambikn la coniposicion del grupo normativo. Ya rnencionanios el hecho d e que las experiencias educativas de 10s estudiantes tienen qus ser similares a las experiencias de 10s alumnos del grupo normativo. Adzmas, algunas escuelas lienen progranias no graduados o exigen que 10s nifios repitan un grado si su rendimiento no satisface ciertas normas minimas y aceleran 10s cursos de 10s alumnos cu}o rendimiento sobrepasa claramente a1 de sus compaiieros de

Se presupone por lo cornun un d o escolar de 10 nieses. Asi, por ejemplo, en rercer 21 :do , Inr. .,,\ificaciones equiv&nlec :I arados puedaq ir de 3-0 a 3-9.

clase. En esas situaciones, todos 10s grados incluirin a a l ~ unos alurnnos que son rnayores y otros mas jbvenes que 10s niiios q u e han svanzado d s grado en grado, seg6n, las normas comunes d e avance. Para controlar esa diversidad, algunos editores de pruebas utilizan normas rnodales d e edad- grado. Esas nornias se basan en muestras que incluyen s o l o a a lumnos q u e estan en el grado especifico para su nivel de edad. Los estudiantes a w n l a - jados o retrasados un ail0 o mas se elirninan de 10s grupos normativos. para proporcionar una lnejor estimacion de la ejecuci6n es tsndar dc 10s nilios en un grad0 particular. Por esto, a1 interpretar calificaciones q u i v a l s n t e s a grados, es preciso tornar en consideracibn n o solo el material ensefiado, sino tarnbiin las norrnas de prornocion. Hay o t ro problema en las calificaciones eqbivalentes a grados escolares. Se desarrollan calificaciones para una muestra de grados y, por definicion, la mitad de 10s estudiantes del grado mas alto tendran calificaciones por encinia del p romrd io para esr grado. LA quk, grado equivalente se deben asignar? El proccdimiento habitual es el de asignar calificaciones extrapolando a niveles de grados rnis elevados; sin embargo, en este punto nos encontramos con el rnismo problerna que con las calificaciones de edades -0 sea, indices rn is Isntos de desarrollo a1 pasar 10s ailos. Por ello, las calificaciones extrapoladas son con frecuencia bastante irnprecisas.

Evaluaci6n Las ventajas de las Escalas de Desarrollo son : (1) d a n las calificaciones

en unidades que se pueden leer con facilidad -en tkrrninos de equivalentss de grados o edades; ( 2 ) proporcionan una cornparacion directa con la rjecu- ci6n de 10s coetaneos del estudiante y (3) brintlan una base para las corn- paraciones entre individuos y para el estudio del crecirniento a ~ r a v k s del tiernpo. Sus principales desventajas son: ( I ) que solo son apropiadas cuando i~ cara~rcrist ica nied~cia c i ? ~ ~ . t i d sistecnificr,me3!. t.,!!? !r, i..:,G. TIFTT * , , 1 -

r - - - - - I - - ss lirnita prirnordialme~~te a1 ~ r s c rnr! !cr niiios pcq.~c.ilas; ( 2 ) :,- :.;;; ;f,-c:;da, por la coniposicion -0 sea, las experiencias y la education an~er io r - - d r l grupo normativo; (3) las unidades de la escala a diversas edades o di>:irltos grados, no son igualcs y (3) las extrapolaciones de un nivzl d c , <.ratlo o ed:d a o t ro son arriesgadas. En resurnen, las escalas de edad mental 5. grados cscolarrs no se puedcn interpretar en forma tan poco srnbipua corno pudic- ran sugerirlo las consideraciones superficiales.

Debido a este problerna de interpretation d c caljficaciones squivalerltcs a grados, muchas personas prefieren utilizar 10s rangos percentilares ent re grados en lugar de calificaciones por grados. En este mCtodo. 13 c.alificscion d e un individuo se expresa corno su clasificacion relativa ~ r m g o p c r ~ ~ n t i l s r 1. dentro de un nivel particular de grado. Asi. en nuestro ejzrnplo. 13 califica- ciOn d e Alberto puede caer en el percentil 95 para estudiantes d c 0ct3vo

I grado.

I

240 Calificaciones relacionadas con las normas (Capitulo 10)

RAZONES Y COCIENTES

Se han hecho muchos intentos para desarrollar escalas que utilicen la razdn entre dos calificaciones. Quizi el m i s conocido de todos sea el cociente ~ntelectual (CI). En la prueba original d e inteligencia de Binet, las calificaciones se expresaban en una escala de edades. Al utilizar su prueba, algunos psicometras sefialaron q u e una edad mental de 1 0 podria tener signi- ficados e implicaciones diferentes si la obtenia un nilro d e 8, 1 0 6 15 allos de edad. En consecuencia, recomendaron que se midiera el indice de desarrollo mental, a1 igual que el nivel de desarrollo (o sea, la edad mental). El cociente intelectual, definido como la raz6n entre la edad mental del nillo y su edad cronologica, se propuso como indice del r i tmo del desarrollo intelectual:

Edad mental C1 = X 100

Edad cronologica

Como se puede ver en esta formula, un niiio cuyo desarrollo intelectual es promedio para su edad ( 0 sea, un niiio cuya edad mental es igual a su edad cronologica) obtendra un CI de 100, mientras que 10s nifios cuyo desarrollo mental es mas rapid0 que el promedio obtendran indices de m8s de 100 y 10s que tengan u n desarrollo mas bajo que el promedio tendran un CI menor d e 100. Cuanto mas se desvie del promedio el indice d e desarrollo, tanto m i s se alejari el C I d e 100.

Un CI calculado de este mod0 es una raz6n de CI. En la principal revision norteamericana d e la prueba de Binet -]as formas L y M de la prueba de Stanford-Binet-, la distribution de 10s CI mostro una desvia- riOn estandar de aproxim3jsmer?te 16 guntcc. No obstan!:, esas desviaciones estandar variaban aproximadamente de 1 L a LU puntos o e Ci a distintos niveles d e edades (Terman y Merrill, 1937). Debldo a las desviaclones estandar n o equivalentes y el hecho d e que el crecimiento intelectual n o aumenta linealmente con 10s incrementos de la edad, las razones de CI n o se utilizan ya en las principales pruebas d e ~nteligencia. En lugar de ello, se emplean en la actualidad calificaclones estandar normalizadas, basados en una muestra representativa d e la poblacion a cada nivel. Estas calificaciones, denominadas CI d e desviacion (CIS) tienen una media d e 100 y una desviacion estindar d e 15 (escalas de Wechsler) o 16 (Stanford-Binet) puntos en cada nivel d e edad.

El CI mide el indice de desarrollo intelectual general. En las pruebas apllcadas a la educacion, se encuentran con frecuencia medidas q u e se supone que indican el indice de ejecucion y desarrollo educativo. Estos tndlces reciben varios nombres, tales como cocientes educativos o cocientes de rendimiento. Todos estos indices son razones que utilizan como numera- dor algund iiiedlda o r ejccuclbn y w i n o dznominador 12 edsd :rsnologic:,

calificaciones relacionadas con la normas 24 i

una medida de la capacidad intelectuai o la ubi.aci6n en u n grado escolar. La finalidad de esas razones es la de comparar las realizaciones verdaderas de una persona con su ejecucion esperada (estimado a partir d e s u edad cronologica, su grado escolar o su inteligencia). Esos cocientes t ienen dos desventajas principales. En primer lugar, la raz6n de d o s calificaciones n o confiables sera menos contiable que cualquier otra medida individual. En esa forma, el cociente seri normalmente una medida insegura desde el punto de vista estadistico. En segundo lugar, comparar una medida de rendimiento con otra de capacidad intelectual presupone q u e el rendimien- t o esta determinado exclusivamente por la capacidad intelectual. . Esta suposicion constrictiva e inconsistente con 10s hechos empiricos. En opinion del autor, lo mejor que se puede hacer es ignorar 10s cocientes d e rendimiento basados en la comparacion de las caliticaciones d e pruebas d e rendimiento para medir el destrrollo intelectual.

M E T O D O S P A R A P R E S E N T A R D A T O S

N O R M A T I V O S

1 Anteriormente, en este capitulo, analizamos la construccion d e las normas d e grupo y el desarrollo d e diversos t ipos d e calificaciones relacionadas con las normas. A continuation, pasamos a las t i cn i cas para resumir y presentar datos normativos.

CUADROS DE CONVERSION

La tecnica mas simple y bAsica para p r e s ~ n t a r datos .n.nrm?!ivnc f s e! cuadro de conversi6n o , como se denomina a veces, c u a d r o d e normas . Un cuadro d e conversion muestra las calificaciones brutas o directas y las derivadas equivalentes -ya Sean percentiles, calificaciones e s t i nda r o cualquier o t ro t ipo de calificaciones- para un g rupo normat ivo especifico. En esa forma, el cuadro de conversion permite a 10s usuarios d e las pru-bas convertir una calificacion bruta en una derivada o encontrar la calificacion bruta equivalente a una calificacion derivada particular. Los e lementos esenciales de un cuadro d e conversion son (1) u n a lista d e calificaciones brutas o directas, (2) una lista correspondiente a las calificaciones der i radas o tiansformadas y (3) una description del grupo normativo.

I En el cuadro 10-4 se da un ejemplo de cuadro de conversion. E n este cuadro (que se deriva de 10s cuadros 10- 1 y 10-2) se dan 10s rangos percen-

I tilares y las calificaciones estandar equivalentes d e la calificacion combinada I d e la prueba d e aptitudes universitarias ACT en vn g u p o d e a l u m ~ ~ s dc

' 23.2 2alificaciones relucionadas i o n las normas (Capitulo 10)

Cuadro 10-4. Ejemplo d e cuadro d e normas (conversion) -~ - -

Rangos percentilares y calificaciones estindar equivalentes en una prueba

N = 177 alumnas de primer aiio de artes liberales, en una universidad del oeste medio

- -

de aptitudes universitarias

primer aAo para un programa de estudios en artes liberales (propedeutica). Para leer el cuadro, solo tenernos que tomar en cocsideraci6n la5 calificacio-

nnm-, ,.., hile:. dad-, !&i, ~1 r.:;j!'~~urihn hrr l ta de 111-1 r .q~l f i i :~nte fuel; de 2 7 , >\ I pericii;il seria f 4 :; ~ L I i a l i f i x~ iC : c:tlnd2r 52. !r.tt.r:?r?t?.r!?n?^s 511

calificacion, diciendo que, en comparacion con las alumnas de primer 3 A 0 de artes liberales en esa universidad, tenia una posicion a 0.2 desviaciones estindar por encirna d e la media (calificacion estindar = 57,) 0 que su calificacion superaba a la de 54% de 10s alurnnos de ese curso (rango percentilar = 54).

Hay varios aspectos d e esta interpretacion que vale la pena recalcar. En primer lugar, la calificaci6n se interpret6 en cornparaci6n con las calificaciones d e un grupo normativo especifico: en este caso, las alurnnas de primer afio d e artes liberales de una universidad dada. Para comparar su ejecucion con la de otros grupos se requeririan otros cuadros de normas. En segundo lugar, las calificaciones se expresaron como percentiles y corno calificaciones estindar. En ot ros casos, el cuadro de conversi6n podria incluir s610 un t ip0 de calificaciones derivadas. En tercer lugar, las calificaciones derivadas del .7;::dro de mnversi6r, ::rtn <6]0 !" :)+,-lh:i5n relativa del a!un?no dcntro del

Calificacion~s relacionadas con las rrortms 243

Calificaciones estindar

7 0 66 6 2 5 9 5 5 5 2 4 8 4 4 4 1 3 7 3 4 ,

3 0

Calificaciones brutas o directas

3 2 3 1 30 2 9 2 8 7 7 2 6 2 5 24 2 3 22 2 1

1 grupo norrnativo; no dan evidencias directas d e las calificaciones que pudieran asociarse a la calificacion de una prueba dada . Si sabemos que las calificaciones de la prueba piedicen alguna consecuencia irnportante, podremos sacar ciertas mferencias de las calificaciones. Por e j e~np lo , si la prueba predice las calificaciones universitarias, podremos inferir q u e cuan to m i s aka sea su clasificacion (resultado de la prueba), tanto mayores s c r in lab calificaciones que ob tendr i probablemente.

Rangos percentilares

9 9' 96 89 7 8 6 7 5 4 4 2 3 1 2 1 13 6 1

A la inversa, si no hay evidencias d e validez, 10s d a t o s del cuadro d e conversiones so10 indicarin la clasificaci6n relativa dc. cada estudiante dent ro del grupo -y nada rnis. Es precis0 insistir en este lilrinio pun to . Con demasiada frecuencia, la disponibilidad de 10s da tos normntivos sc torna corno licencia para interpretar la ejecucion en la prueba conlo indi- cation de una ejecucion probablemente aha en alghn cri terio. Sin da tos

i d e validez, las tablas de conversion solo traducen las a l i f i cac iones brutas en algun o t ro tipo de calificacion. lncluso con datos de validez, el dessm-

I pelio en un criterib s61o se puede inferir d e 10s datos normativos. 0 sea, que 10s resultados brutos se convierten en medidas relativas del deseni- pelio, clue no se expresan en t irminos de consecuencias. C o m o veremos m-as adelante. no hay razon por la que 10s datos normativos no s t puedan expresar en funcion de las consecuencias.

CUADROS D E CONVERSIONES MULTIPLES I

Con frecuencia se presentan en el cuadro d e conversion datos d e varias subpruebas (0 escalas) o de varias pruebas de una sola bateria. Cuando se tienen que interpretar esos datos es irnportante esta prcc iucion: a menos que sz use el mismo grupo normativo, las calificaciones n o s s r in compara- i-] - -1: , e~ ~ , ~ r e c ! m e ~ i t e . pucsto que SP besar5n cn ~ilI1c::l.a~ dire : . rn~: , \ q: :.x

datos se basan en un grupo nomlativo c n v i ~ n , rnmo r i - . h e ~ ~r!::r!!?. rz:? t ipo dc cuadro dc corwersion proporciona un mCtodo para comp;il.ar d i~ .c .~r ; i - mcnte la ejecucio~i dc un individuo en varias pruebas o subpruebas.

En el cuadro 10-5 se ilustra un cuadro d e conversibn q u e prcsenta los datos normativos para las diversas subpruebas d e la ACT. I'uetle \.ersth que la niisnia calificacion bruta (calificacion escalar) da c o m o r e s u l ~ a d o rangos percentilares n ~ u y diferentes en las varias subpruebas. A la inversa. para obtener rangos percentilares equivalentes en las varirts subpruebas se requieren calificaciones escalares totalnlente diferentes.

En otras ocasiones, podemos utilizar un cuadro d e conversion para

I niosrrar la ejecuci6n de varios grupos distintos e n una sola prueba. En el

I cuadro 10-6 se da un ejernplo de ese cuadro, q u e proporciona dos t ipos d e inl'or~nacion. En primer lugar, puesto que prcsenta c;llificacioncs dsri- vadab ;#ara varios grupos, el usuario d r la prueba puede utilizar 1:1s califi- I

244 Calificaciones relacionadas con las normas (Capttulo 10)

Cuadro 10-5. Ejemplo de cuadro de convesibn que muestra normas para diferen tes subpruebas

Calificacione: escalares

Matema- ticas

99 9 5 9 0 84 76 66 56 46 3 6 28 2 2 18 14 11 8 6 4 3 2 1

Estudios sociales

Ciencias naturales

Calificacibn combinada

En el cuadro se muestran 10s equisalentes en percentiles en las cuatro pruebas (mas la calificacion combinada) del Programa Estadounidense de Pruebas Universitarias (ACT). La muestra fue de 2,087 estudiantes de primer afio de una universidad del oeste medio.

cdciones de un individuo para varios grupos normativos a1 mismo tiempo. Y, en segundo lugar, el cuadro permite comparaciones entre las ejecucio- nes de varios grupos. Es decir, que a1 obsemar las calificaciones derivadas equivalentes a varias calificaciones brutas podemos inferir quC grupo de normas es mis "consistente". Por ejemplo, en el cuadro 10-6, la universidad D rrpresenta el grupo normativo "mas consistente", porque una califi- cacihn brutn e:~rc..ifla'a kr.Cr9 ' ~ r ! cquival~nte en percentiks mhs bajo que en cuaiquier otro grupo. A ia inversa, la universidad C es el grupo normativo

Calificaciones relacionadas con las normas 245

"mas sensible o vulnerable", puesto que 10s equivalentes en percentiles son casi siempre mas altos. 0 bien, para ver 10s resultados de un mod0 diferente, una calificacion bruta de 28 sera equivalente a un rango percentilar de 82 en la universidad C, 65 en la E, 55 la A, 52 en la B y 35 en la D. Por supuesto, esos descubrimientos reflejan diferencias en 10s antecedentes en matematicas y en las capacidades de 10s estudiantes que eligen ingresar a las diferentes universidades. Como tal, el cuadro de conversion no so10 proporciona datos normativos btiles, sino que, ademis, indica las caracteristicas (en este caso, las capacidades para las matematicas) de 10s alumnos en 10s diversos grupos normativos.

Una advertencia. Si tuvitramos que comparar varios grupos directamente (como en el cuadro 10-6), las calificaciones se hubieran obtenido en condiciones equivalentes. Por ejemplo, si la prueba se administrara como examen de admismn en una universidad y como instrumento para asesoramiento en otra, la motivacibn de 10s dos grupos podria ser diferente. Por supuesto, las diferencias de muestreo entre 10s diversos grupos liaria qus [as comparaciones resultaran poco adecuadas.

PERFILES

Para algunas personas, las presentaciones visuales o g~aficas facilitan la comprension de grupos de calificaciones. El perfil de una prueba s i n e para solucionar esta necesidad. Basicamente, un perfil no es masque una grafica en la que se trazan una serie de calificaciones de una prueba. Todas las calificaciones se trazan en la misma escala, utilizando normas derivadas de rln grupo comun. El perfil muestra de una sola ojeada IT. confifuracion tlc ids La;~fic,.ciu,,cs ; ~ 1 inii;ridii< r;; ;;; ~ i \ : e r s z ~ ~ - u - h ~ n r.--w..-, ; " d i o o n < i t -..--.- ! n nnct;.ih,:

, , , " L _ I L . ' * -. r . - I . . . relativa de sl;; diversas calificiicione;. EII la LA. :2-5 sc - - - - ' - " ^ I "n'f;'

tipico de una prueba.

Se deben seguir varias reglas para que el perfil no presente un cuadro engafioso. En primer lugar, se debe usar para cada prueba el mismo frupo normativo. Si se utilizan diversos grupos normativos para las diversas pruebas, las calificaciones, que se basan en diferentes grupos no serin directamente comparables. En segundo lugar, todas las calificaciones se deben trazar en la misma escala; o sea que todas ellas se tienen que expresar como percentiles o como algun tip0 especifico de calificacion estindar. Como corolario a este segundo punto se tiene la necesidad de utilizar dimensionrs que no exageren las cliferencias pequefias o reduzcan las grandes. Este ultimo problema se puede minimizar, si se sigue una tercera regla: o sea, si se incluye en el perfil algun indice de error. Puesto que, todas las pruP bas psicolbgicas tienen un grado de confiabilidad relativa y puesto que las G i T t r c l l & zn!~e las cnlificacior.:. dc. la. pr::eh:r w n aun mi s rcl~:ivar"ci::e confiablrs, las pequefias diierzncias entre las calificaciones titnilen a exagc-

246 Calificaciones relacionadas con las normas (Capttulo 101 Calificaciones relacionadas con [as normas

Cuadro 10-6. Ejemplo de cuadro de conversidn o cuadros de norrnas que muestra la ejecuci6n de varios grupos normativos en la misma prueba.

INVENTARIO DE ASESDRAMIENTO DE MINNESOTA HOJA DEL PERFIL

Calificacion Universidad

Calificscibn Calificacion estindar V FR SR ES C R M L I estandar

i 1

I .- , I - I

Calificacion V FR SR ES C R M L Calilicacion estandar estandar

En el cuadro se presentan equivalentes en percentiles de las calificaciones de la prueba de matemiticas de la ACT, para cinco carreras, dentro de la misma Universidad (E.U.A.). (Ver la explicaci6n en el texto).

Fig. 10-5. Ilustracih del perfil de una prueba. Reproducido con autorizacion. Copy- right @ 1957 by the Psychological Corporation, Nueva York, N.Y. Derechos reser-

1 vados. rarse. Un intento interesante para rninimizar el peligro de la interpretacibn exagerada (utilizado por la Psychological Corporation en sus Pruebss de Aptitudes Diferenciales) es construir el perfil de tal mod0 que la diferencia de cierta distancia mensurable en el perfil represente una diferencia signifi- cativa entre dos calificaciones; en esa forma, el usuario puede darse cuenta

I con rapidez de qu& pares de calificaciones tienen diferencias significativas. Otra altemativa es la de presentar las calificaciones como bandas, en lupar de calificaciones exactas, de tal mod0 que las diferencias entrt. ellas solo son significativas si las bandas no se superponen.

I

Razonamien- to verbal

Capacidad numbrica

R.V. + C.N.

Razonamien. to abstracto

Ortogrefla y cdlculo para

oficinistas

Razonamien. to mecanico

R elaciones espaciales

0 nografla

Uso del lenguaje

C i i ; k ~ c i u n r s reiacionauus con ius normus (Capttulo i O j

Nombre Escuela Aio' Forma Grado Sexo MURPHY JAMES L. CENTRAL 1972 F dela 9 M

Cal!fi. cacm

nes bruta I dire,

tag 21

23

50

40

29

45

30

62

26 -

prueba S

Per. cen. tiles PERCENTILES

I s ID w n m a m m m n m a n

70 X ~ X & ~ ~ X X -j'

1 55 : i i I I X X X * X X X ~ / : i i I

I 6 10 m n m a s m m n o a n n

PERCENTILES

*F-Percentiles y pruebas del primer semestre (otoRol;S-Percentiles y pruebas del segundo semestre (primavera)

Fig. 10-6 Fj~mpln de uva n r i f i ca de normas n~rcenri lares. La fnrma de l ~ e r f i l se t o m 6 de las Pruebas de aptitudes diferenciales (The Psychological Corporat ion). Obsbrvese que el eje vertical t iene una escala de unidades de calificacaciones es t in - dar, c o n l o r rangos percentilares superpuestos en esa escala. Reproducida c o n autorizacl6n. Copyr ight O 1961. 1963 b y the Psychological Corporation, Nueva York, N.Y. Derechos reservados.

GRAFICAS DE NORMAS PERCENTILARES

Uno de 10s rnejores modos de presentar perfiles de las pruebas -un rnetodo que, a la vez, protege contra las exageraciones y facilita las interpretaciones- es el empleo de grlficas de normas percentilares. Una grifica de normas percentilares es un perfil en el que las calificaciones se dan en rangos percentilares; pero las dimensiones de la escala se trazan de mod0 clue corresponds a una ~ x a l a de c23'kaciones ~s tandar ( z ) . Esto y i e r e

decir que las distancias en el eje de calificaciones (vertical) son i p a l e s a unidades de la escala z y 10s rangos percentilares correspondientes se colocan a lo largo de esta escala. En otras palabras, 10s rangos percentilares se superponen en una escala de calificaciones estindar. La grifica d e norrnas percentilares proporciona las ventajas tanto de 10s percentiles como de las calificaciones estindar, refleja con mayor precisibn la relaci6n de las calificaciones brutas con 10s percentiles y minirniza las probabilidades d e interpretar ma1 las diferencias entre percentiles. En la fig. 10-6 se ilustra un ejernplo de grafica de normas percentilares. Obsirvese q u e en la grifica las diferencias entre rangos percentilares son rnenores cerca drl centro d c la distribucion y mayores en 10s extremes. Asi, la distribucion de-rangos percentilares ofrece mas claramente un paralelo con la distribucion dt: las calificaciones brutas. Por esta razon, quien interpreta la prueba n o tiene tantas probabilidades de exagerar las diferencias pequefias cercanas a1 centrcr de la distribucibn.

OBSERVACION FINAL

En todo este capitulo hemos hecho hincapii en q u e las calificaciones relacionadas con normas solo indican la posicion relativa de una persona en cornparacion con algun grupo normativo pertinente. A menos quc haya ciertos datos de validez o alguna nornia absoluta d e ejecuciont nuestras interpretaciones se limitarin a afimaciones relacionadas solo con la ejecucion en la prueba. No nos dan indicaciones sobre la ejecucion poten- cia1 en algunos criterios externos. En el capitulo que sigue nos ocuparemos de las situaciones en que se interpreta la ejecucion de un individuo en la prueba, comparandolo con algun estindar definido (calificaciones relacionadas con el contenido) o en funcion de la ejecucion en el critcrio (califi- C:C~OIID~ ~ ~ ! ? r l c " ~ d a ; ; ~ v r l I a r cr,nser.c~,nciac c z x d i ~ ~ ; o n ~ ; ) .

1 Brown Cap 10

Travel

Transcript of 1 Brown Cap 10