Diseño, Lectura y Representación de Gráficos
-
Upload
guz12perla -
Category
Documents
-
view
31 -
download
3
description
Transcript of Diseño, Lectura y Representación de Gráficos
Diseño, Lectura y Representación de
Gráficos
Dr. Temístocles Muñoz López
Representaciones Gráficas
SERIE DIDÁCTICA: METODOLOGÍA DELA INVESTIGACIÓN
FCEyH® 2004
Dr. Temístocles Muñoz López2
Representaciones Gráficas
UNIVERSIDAD AUTÓNOMA DE COAHUILA
FACULTAD DE CIENCIAS DE LA EDUCACIÓN Y HUMANIDADES
MAESTRÍA EN METODOLOGÍA DE LA INVESTIGACIÓN
DISEÑO, LECTURA Y REPRESENTACIÓN DE GRÁFICOS
© DR. TEMÍSTOCLES MUÑOZ LÓPEZ
SALTILLO, COAHUILA
SEGUNDA EDICIÓN, AGOSTO DE 2004
Dr. Temístocles Muñoz López3
Representaciones Gráficas
DISEÑO, LECTURA Y REPRESENTACIÓN DE GRÁFICOSSERIE DIDÁCTICA: METODOLOGÍA DE LA INVESTIGACIÓNFACULTAD DE CIENCIAS DE LA EDUCACIÓN Y HUMANIDADESEDIFICIO “N” UNIDAD CAMPO REDONDOTEL. 412-91-33
ISBN:
UNIVERSIDAD AUTÓNOMA DE COAHUILABLVD. GONZÁLEZ LOBO Y V. CARRANZA S/NSALTILLO, COAHUILAC.P. 25000
UNIVERSIDAD AUTÓNOMA DE COAHUILA
SEGUNDA EDICIÓN, AGOSTO DE 2004
IMPRESO EN MÉXICO
Dr. Temístocles Muñoz López4
Representaciones Gráficas
Dr. Temístocles Muñoz López5
Representaciones Gráficas
CONTENIDO
El Diseño, la Lectura y la Representación de los Gráficos..................................................7
APARTADO A. NORMAS GENERALES DE ICONOGRAFÍA ESTADÍSTICA........9
LA ICONOGRAFÍA ESTADÍSTICA Y SUS FUNCIONES...............................................................9Terminología de las representaciones simbólicas.......................................................................................9Normas Generales de presentación............................................................................................................12Normas éticas.............................................................................................................................................19Tipos de iconógrafos como ejemplo...........................................................................................................21Combinaciones personalizadas..................................................................................................................29
APARTADO B. GENERACIÓN Y USO DE GRÁFICOS COMUNES.......................31
I. PRÓLOGO...................................................................................................................31II. HISTOGRAMAS...........................................................................................................32
Introducción...............................................................................................................................................32La Densidad del trazo................................................................................................................................34Estructura de datos.....................................................................................................................................37
III. GRÁFICAS DE PASTEL............................................................................................38Introducción y Propósitos Generales.........................................................................................................38La estructura de los datos..........................................................................................................................38
IV. DIAGRAMA DE CAJAS............................................................................................39Introducción...............................................................................................................................................39La definición del diagrama de cajas..........................................................................................................39La Caja.......................................................................................................................................................39Los valores adyacentes límites...................................................................................................................40Los valores extremos..................................................................................................................................41Comparaciones múltiples...........................................................................................................................41La estructura de datos................................................................................................................................43
V. CARTAS O GRÁFICAS DE BARRAS...............................................................................43Introducción y Propósitos Generales.........................................................................................................43La estructura de datos................................................................................................................................43
VI. DIAGRAMAS DE PROBABILIDAD............................................................................44Introducción...............................................................................................................................................44La lectura del diagrama de probabilidad..................................................................................................46Los outliers.................................................................................................................................................47Las colas largas..........................................................................................................................................47La asimetría................................................................................................................................................47Las mesetas y los valles..............................................................................................................................48Precauciones..............................................................................................................................................48Los detalles técnicos...................................................................................................................................48La estructura de datos................................................................................................................................50
VII. DIAGRAMA DE DISPERSIÓN...................................................................................50Introducción...............................................................................................................................................50Estructura de datos.....................................................................................................................................51
VIII. MATRIZ DE DIAGRAMAS DE DISPERSIÓN..............................................................52
Dr. Temístocles Muñoz López6
Representaciones Gráficas
Introducción...............................................................................................................................................52Estructura de los datos...............................................................................................................................53
IX. DIAGRAMAS DE SUPERFICIE 3D............................................................................53Introducción...............................................................................................................................................53La Estructura de los datos..........................................................................................................................55Estilos del Diagrama de superficie............................................................................................................55
X. DIAGRAMAS DE VIOLÍN.............................................................................................57Introducción...............................................................................................................................................57Los diagramas de violín.............................................................................................................................59Estructura de datos.....................................................................................................................................61
XI. CARTAS DE PARETO..............................................................................................61Introducción...............................................................................................................................................61Muestra el diagrama de una gráfica de Pareto.........................................................................................62Estructura de datos.....................................................................................................................................62
XII. AGRUPAMIENTOS JERÁRQUICOS............................................................................63Introducción...............................................................................................................................................63
XIII. LAS GRÁFICAS DE BARRAS DE ERROR...................................................................64Introducción...............................................................................................................................................65Los valores perdidos...................................................................................................................................65Estructura de datos.....................................................................................................................................66
XIV. MATRIZ REJILLA DE PUNTOS.................................................................................66Introducción...............................................................................................................................................66Estructura de datos.....................................................................................................................................67Las opciones...............................................................................................................................................67Variable (X, Y, Z)........................................................................................................................................68Mínimo y máximo (X, Y, Z).........................................................................................................................68Rebanadas (X, Y, Z)....................................................................................................................................68Decimales de Z...........................................................................................................................................68El estilo del diagrama................................................................................................................................68Bloques.......................................................................................................................................................68Símbolos con un color................................................................................................................................69Símbolos de colores múltiples....................................................................................................................69
APARTADO C. TÓPICOS SELECTOS DE TÉCNICAS GRÁFICAS ANALÍTICAS71
XV. GRÁFICAS CATEGORIZADAS..................................................................................71¿Qué son los Gráficos Categorizados?......................................................................................................72Métodos de Categorización........................................................................................................................74Histogramas...............................................................................................................................................77Diagramas de puntos..................................................................................................................................80Gráficos de Probabilidad...........................................................................................................................82Diagramas Quantil-Quantil.......................................................................................................................83Diagramas Probabilidad-Probabilidad.....................................................................................................84Diagramas de Línea...................................................................................................................................85Diagramas de Caja.....................................................................................................................................86Gráficas de Pastel......................................................................................................................................88Diagramas de puntos de datos perdidos por rango...................................................................................89Diagramas 3D............................................................................................................................................90Diagramas Ternarios.................................................................................................................................91
XVI. CEPILLADO............................................................................................................93XVII. ALISADO DE DISTRIBUCIONES BIVARIANTES....................................................94
Dr. Temístocles Muñoz López7
Representaciones Gráficas
XVIII. COMPRESIÓN DE CAPAS.....................................................................................96XIX. PROYECCIONES DE JUEGOS DE DATOS 3D.............................................................97XX. DIAGRAMAS DE ÍCONOS........................................................................................98
Analizando Diagramas de Íconos..............................................................................................................99Taxonomía de Diagramas de Íconos........................................................................................................101Estandardización de valores....................................................................................................................103Aplicaciones.............................................................................................................................................103Gráficas Relacionales..............................................................................................................................104Tipos de Gráficos de íconos.....................................................................................................................104Íconos enmarcados...................................................................................................................................109
XXI. REDUCCIÓN DE DATOS.........................................................................................110XXII. ROTACIÓN DE DATOS (EN ESPACIO 3D)..........................................................111
Ligas para consultar los tipos de gráficas en Statistica...........................................................................112
APARTADO D. DIAGRAMAS CORRELACIONALES.............................................114
ASCC................................................................................................................................114XXIII. EL ANÁLISIS SISTÉMICO POR MEDIO DE CONSTELACIONES CORRELACIONALES
114INTRODUCCIÓN.....................................................................................................................................114Apuntes complementarios sobre la correlación estadística.....................................................................117Descripción de la técnica de constelaciones correlacionales..................................................................122Elaboración de las constelaciones correlacionales.................................................................................129Lectura de las constelaciones...................................................................................................................133Las conclusiones y su validez externa......................................................................................................135Consideraciones finales............................................................................................................................136
Literatura de consulta......................................................................................................137
Dr. Temístocles Muñoz López8
Representaciones Gráficas
EL DISEÑO, LA LECTURA Y LA REPRESENTACIÓN DE
LOS GRÁFICOS1
En la vida del hombre la simbología juega un papel muy importante, tanto en el
lenguaje como en la correspondencia que guardan las imágenes con una
representación del orden social y natural en que habita.
Todo signo o símbolo encierra información que es evidente solamente para
quienes pertenecen a la cultura que los creó o heredó. Con el desarrollo de las
civilizaciones y sus lenguajes en diferentes espacios geográficos, cada comunidad
étnica, filosófica o científica resulta en una suerte de ínsula que especializa sus
medios de comunicación y su patrimonio cultural. Así, la realidad, aunque puede
ser la misma para todos, es codificada e interpretada por cada comunidad
específica, como una convención social particular, por medio de un sistema de
símbolos.
Los signos gráficos y las formas fónicas pueden variar de una lengua a otra, pero las cosas y las imágenes de las cosas son las mismas para todas.
Aristóteles: De interpretatione, 16-2-8
En su libro sobre la manipulación de la ciencia, Pierre Thuillier (1975) indica que
Leibniz demuestra con ejemplos precisos que las lenguas difieren no solamente
desde el punto de vista fónico, sino sintáctico y semántico. No reflejan solamente
la historia de los pueblos, sino que pueden condicionar la mentalidad y las
costumbres. El uso de signos está incorporado y define tanto el lenguaje de la
comunidad, como la percepción de la realidad y el orden de la realidad misma
para ésa comunidad, solamente ella y para sí, lo decodifica e interpreta en un acto
significador.
1 Cítese como: Muñoz López, Temístocles. 2004. Diseño, Lectura y Representación de Gráficos. Segunda edición. Maestría en Metodología de la Investigación. Facultad de Ciencias de la Educación y Humanidades. Universidad Autónoma de Coahuila. Saltillo.
Dr. Temístocles Muñoz López9
Representaciones Gráficas
Todo signo en si mismo parece muerto: ¿qué es lo que le da vida?... vive de su uso.Wittgenstein (Investigaciones Filosóficas)
Las comunidades académicas y profesionales también utilizan un sistema de
códigos, símbolos y grafías especiales que no solo representan sus ideas, sino
que las delimitan y autoexcluyen de otras comunidades. No obstante, el
aislamiento no es total ni permanente, no son sistemas cerrados, siempre
conservan rasgos comunes entre sí, que se constituyen en puentes o vasos
comunicantes que permiten su desarrollo regulado por el intercambio e
incorporación de nuevas ideas y representaciones.
Es decir, estas comunidades aceptan que en su conjunto pertenecen a una
comunidad epistémica mayor, y que al presentar rasgos científicos comunes,
pueden ser posibles los intercambios conceptuales, metodológicos e
instrumentales, que al asimilarse les propicien ventajas adaptativas dinámicas y un
mayor éxito explicativo y operacional.
Las representaciones gráficas siguen de hecho éste patrón, en el cual, lo que las
comunidades académicas consideran científico, por lo tanto racional, objetivo y
verdadero, en tanto es útil, es incorporado por otras comunidades periféricas. Con
ello el proceso de normalización o normativo para representar los hechos
científicos ha madurado conservando las especificidades y criterios de cada
disciplina en particular.
Dr. Temístocles Muñoz López10
Representaciones Gráficas
APARTADO A. NORMAS GENERALES DE ICONOGRAFÍA ESTADÍSTICA
LA ICONOGRAFÍA ESTADÍSTICA Y SUS FUNCIONES
Existe quizá una respuesta al problema de la relación entre el lenguaje y la realidad. El lenguaje es, o bien un velo tejido por la costumbre entre nosotros y la realidad, y que es
necesario desgarrar, o bien una deformación de la realidad que hace falta rectificar inventando otros símbolos y otros instrumentos.
W. M. Urban, Language and Reality (1951)
Los graphos (in sensu lato) son transformaciones de los datos que sirven para re-
presentarlos, con la finalidad de propiciar o mejorar la comprensión de los
fenómenos que se estudian (función exploratoria), o para mostrar y sustentar
afirmaciones que se hacen sobre ellos (función explicativa). En las publicaciones
académicas las normas generales sobre los graphos se aplican con rigor, y la
creatividad se deja para el esfuerzo por cumplirlas.
En el límite de la creatividad gráfica científicamente aceptable, las
representaciones artísticas de temas académicos en las ilustraciones o los
carteles (posters) pueden utilizarse con fines promocionales siempre y cuando
conserven los criterios de cientificidad.
Terminología de las representaciones simbólicas
Primero es conveniente analizar la terminología general involucrada en el uso de
las representaciones, dado que cada editorial las conceptualiza en forma distinta.
Se presentan a continuación algunos conceptos básicos para analizar, de acuerdo
a la Real Academia Española mediante la consulta en línea en: www.rae.es:
Dr. Temístocles Muñoz López11
Representaciones Gráficas
Representación. (Del lat. representatĭo, -ōnis). f. Acción y efecto de representar. ||
Figura, imagen o idea que sustituye a la realidad. || Cosa que representa otra. ||
Psicol. Imagen o concepto en que se hace presente a la conciencia un objeto
exterior o interior. || Gráfica. f. Mat. Figura con que se expresa la relación entre
diversas magnitudes.
Gráfico, ca. Grafo. m. Ling. Unidad abstracta que comprende el conjunto de
grafías de una letra. Grafo-. (Del gr. γραφειν, escribir). Composición de elementos.
Significa 'escritura'. Grafología, grafomanía. fa. (Del gr. -γραφoς, de la raíz de
γραφειν, escribir). elem. compos. Significa 'que escribe' o 'que describe'.
Mecanógrafo, telégrafo, bolígrafo, hidrógrafo. Gráfico, ca. (Del lat. graphĭcus, y
este del gr. γραφικός). adj. Dicho de una descripción, de una operación o de una
demostración: Que se representa por medio de figuras o signos. U. t. c. s. || m.
Representación de datos numéricos por medio de una o varias líneas que hacen
visible la relación que esos datos guardan entre sí. || f. gráfico (representación
por medio de líneas)
En un diccionario médico biológico encontramos que Graphé, según Francisco
Cortés Gabaudan (http://clasicas.usal.es/dicciomed/) () es
sustantivo: escritura, grabado.
Icono o ícono. (Del fr. icône, este del ruso ikona, y este del gr. bizantino εκών, -
όνoς). Signo que mantiene una relación de semejanza con el objeto representado.
Inform. Representación gráfica esquemática utilizada para identificar funciones o
programas.
La palabra "icono" en sus diversas acepciones procede del griego eikón-eikónos
(‘imagen’), formado sobre el verbo eíko (‘parecer’) En épocas recientes se ha
usado para definir el concepto lingüístico de ‘signo de naturaleza no arbitraria que
guarda alguna semejanza con la cosa representada’.
Esquema. (Del lat. schema, y este del gr. σχημα, figura). m. Representación
gráfica o simbólica de cosas materiales o inmateriales. || Resumen de un escrito,
Dr. Temístocles Muñoz López12
Representaciones Gráficas
discurso, teoría, etc., atendiendo solo a sus líneas o caracteres más significativos.
|| Idea o concepto que alguien tiene de algo y que condiciona su comportamiento.
|| en ~. loc. adv. esquemáticamente (por medio de esquemas).
Figura. (Del lat. figūra). f. Forma exterior de un cuerpo por la cual se diferencia de
otro. || Cosa que representa o significa otra. || ilustración (estampa, grabado de
un libro). || Geom. Línea o conjunto de líneas con que se representa un objeto. ||
Geom. Espacio cerrado por líneas o superficies. ||
Ilustración. f. Acción y efecto de ilustrar. || Estampa, grabado o dibujo que adorna
o documenta un libro. || Publicación, comúnmente periódica, con láminas y
dibujos, además del texto que suele contener. ||.
Semántico, ca. (Del gr. σημαντικός, significativo) adj. Perteneciente o relativo a la
significación de las palabras. || f. Estudio del significado de los signos lingüísticos y
de sus combinaciones, desde un punto de vista sincrónico o diacrónico. V. calco
~, campo ~.
Semiótica. (Del gr. σημειωτικη). f. semiología (estudio de los signos en la vida
social). || Teoría general de los signos.
Señal. (Del lat. signālis, de sĭgnum, seña). f. Marca o nota que se pone o hay en
las cosas para darlas a conocer y distinguirlas de otras. || Signo o medio que se
emplea para luego acordarse de algo. || Distintivo, marca. || Signo (cosa que
representa o sustituye a otra). || Indicio o muestra inmaterial de algo. || Seña (nota,
indicio o gesto). || Vestigio o impresión que queda de algo, por donde se viene en
conocimiento de ello. || Imagen o representación de algo. || Prodigio o cosa
extraordinaria y fuera del orden natural. || dar ~es de algo. fr. Mostrar indicios de
su existencia. || en ~. loc. adv. En prueba, prenda o muestra de algo.
Signo. (Del lat. signum). m. Objeto, fenómeno o acción material que, por
naturaleza o convención, representa o sustituye a otro. || Indicio, señal de algo. ||
Mat. Señal o figura que se usa en los cálculos para indicar la naturaleza de las
Dr. Temístocles Muñoz López13
Representaciones Gráficas
cantidades y las operaciones que se han de ejecutar con ellas. || natural. m. El
que nos hace venir en conocimiento de algo por la analogía o dependencia natural
que tiene con ello.
Símbolo. (Del lat. simbŏlum, y este del gr. σύμβoλoν). m. Representación
sensorialmente perceptible de una realidad, en virtud de rasgos que se asocian
con esta por una convención socialmente aceptada. || Ling. Tipo de abreviación de
carácter científico o técnico, constituida por signos no alfabetizables o por letras, y
que difiere de la abreviatura en carecer de punto; p. ej., N, He, km y $ por Norte,
helio, kilómetro y dólar, respectivamente. || algébrico. m. Letra o figura que
representa un número variable o bien cualquiera de los entes para los cuales se
ha definido la igualdad y la suma.
Sintáctico, ca. (Del gr. συντακτικός). adj. Gram. Perteneciente o relativo a la
sintaxis.
Sintaxis. (Del lat. syntaxis, y este del gr. σύνταξις, de συντασσειν, coordinar). f.
Gram. Parte de la gramática que enseña a coordinar y unir las palabras para
formar las oraciones y expresar conceptos. || Inform. Conjunto de reglas que
definen las secuencias correctas de los elementos de un lenguaje de
programación.
Tabla. (Del lat. tabŭla). Lista o catálogo de cosas puestas por orden sucesivo o
relacionadas entre sí. || Cuadro o catálogo de números de especie determinada,
dispuestos en forma adecuada para facilitar los cálculos. Mat. tabla de
multiplicación de los números dígitos dispuesta en forma de cuadro.
Normas Generales de presentación
Los Criterios
Para la elaboración de las representaciones seguiremos cinco criterios normativos
básicos que necesariamente deben cumplirse:
Dr. Temístocles Muñoz López14
Representaciones Gráficas
Importancia. Denotando lo relevante o sustantivo contra lo adjetivo de lo
que se muestra, como apoyo a los datos de la investigación.
Pertinencia. Implica la inclusión de solamente lo necesario, importante y lo
conveniente.
Estética. Referida a una presentación atractiva, que invite al lector a
consultarla, buscando la proporción entre la forma, el fondo, el ajuste de los
espacios, el tamaño y la forma de las letras.
Equilibrio. Cuidando la distribución de las concentraciones de objetos,
rótulos, espacios vacíos y las anotaciones complementarias.
Simplicidad. Con los menos elementos posibles.
Los epígrafes, referencias cruzadas, fuentes y colores tienen regulaciones
técnicas generales y específicas para cada tipo de publicación, presentación y
editor, los cuales son especificados en “Guías para los autores” que proporcionan
a cada investigador que solicita que su material sea publicado. En adelante
revisaremos los aspectos genéricos.
Las Normas para la elaboración de las representaciones
Los graphos deben ir numerados progresivamente sin anteponer la abreviatura de
número (i.e., Cuadro 3), a continuación se anotará el título, el cual estará escrito
en la parte superior y con letras minúsculas, excepto la inicial de la primera
palabra y las iniciales de los nombres propios. El título finalizará con un punto.
Los rótulos explicativos, descriptivos o de referencia del cuadro, figura, tabla,
gráfico u otro tipo de representación, con su descripción, se denominan epígrafes.
La ubicación del cuadro deberá ser inmediatamente después del párrafo donde se
le menciona por primera vez (anotado como referencia cruzada con solo rótulo y
número), siempre y cuando quepa completo; en caso de que no quepa en la
Dr. Temístocles Muñoz López15
Representaciones Gráficas
misma página donde se le menciona, se colocará al inicio de la siguiente cuartilla,
en la cual debe reanudarse el texto si aún queda espacio después del grapho,
facilitando así la lectura y el análisis de la información. No es aceptable ubicar los
graphos al final de la Literatura Citada. Los graphos que en su versión final ocupen
más de una página no son aceptables.
Cada variable o concepto se identifica con su nombre y unidades. Reduzca las
cifras grandes para dejar sólo los dígitos significativos, de acuerdo con el nivel de
precisión con que se midió la variable. No es necesario utilizar todos los decimales
que salen del listado de la computadora, se recomiendan solamente 2.
En cada grapho solamente presente un máximo de tres líneas horizontales a todo
lo largo o (aunque puede haber varias sublíneas que abarquen parte de las
columnas o conceptos): la primera línea se coloca debajo del título del grapho; la
segunda, abajo de los criterios de clasificación principales y contiene el cuerpo de
datos; y la tercera, al final del grapho.
Después de la última línea horizontal mayor se colocan las notas de pie del
grapho, las que son de dos tipos:
a) Para indicar niveles de significancia estadística y su simbología de
representación, por ejemplo (_____ =p0.05, p0.01) y para
diferenciar los datos resultantes de tratamientos o muestras se emplean
letras minúsculas (a, b, c, etc.); y
b) Para dar información complementaria como llamadas al título, a los
encabezamientos o a los datos, se pueden emplear números arábigos (a
manera de exponentes); sin embargo, si se cuenta con máquina que posea
diferentes símbolos, se recomienda utilizarlos siempre y cuando aporten
claridad a la explicación.
En la Tabla 1 se presenta un ejemplo del formato general. Nótese que cuando se
generaliza se escribe cuadros o tablas o figuras, etc. en minúsculas. Cuando se
Dr. Temístocles Muñoz López16
Representaciones Gráficas
particulariza se escribe con mayúscula, seguido del número. Obsérvese también
que toda la información de este grapho está a doble espacio para que los
asesores, árbitros y editores tengan lugar suficiente para hacer sus anotaciones.
Tabla 1. Características académicas de grupos de alumnos integrados por sus calificaciones en dos años de evaluación †.
Características de aprovechamiento Atributos medidos ¶
Grupos de Historia académica
Calificaciones Calificación Asistencia semestral
Horas diarias de estudio
Alumnos promedios¶ Exámenes Tareas (%) Hrs. medidas Hrs. declaradas
2001 §
Grupo A 87 85 34.2ª 248 3.25
Grupo B 92 89 33.4b 145 3.00
Integración A y B 97 96 31.0c 120 3.12
2002
Grupo A 87 86 28.5 340 3.60
Grupo B 94 92 41.3 280 3.00
Integración A y B F
99 95 35.0 150 2.00
† : Promedios de tres trimestres en 2001 y cuatro en 2002.¶ : Se refiere al obtenido de archivos después del diseño del estudio.§ : En este año, se concentraron manualmente los datos los primeros 20 días después de los exámenes.F : Promedios seguidos de la misma manera en cada año, que no son diferentes estadísticamente, según Duncan (p ≤0.05).
Además de los puntos anteriores, los autores tendrán especial cuidado en no
saturar su escrito con graphos de tamaño reducido, cuando muchas veces en uno
se puede reunir la información de varios. Sin embargo, tampoco es conveniente
que se emplee un cuadro o tabla con demasiadas columnas o hileras, sobre todo
si la información tabulada no se utiliza en la discusión. Todas las variables
incluidas en los cuadros y figuras estarán descritas en el capítulo de Materiales y
Métodos (Metodología), así como leídas y discutidas en el capítulo de Resultados
y/o el de Discusión.
Cuadros
Los cuadros se emplean para clarificar el texto, cuando se presentan nombres o
números con lectura independiente, sintética y complementaria, o cuando su
Dr. Temístocles Muñoz López17
Representaciones Gráficas
uso constituye un ahorro importante de espacio. Son claros, simples y concisos.
Cada cuadro debe presentar datos en forma organizada, de manera que facilite
las comparaciones, muestre clasificaciones, se observe rápidamente algunas
relaciones y, sobre todo, se ahorre espacio del texto. Cada cuadro se explica por
sí mismo y su contenido no se repite en las figuras ni en el texto del artículo,
solamente se hace referencia a él.
Solamente los cuadros y las tablas tienen el epígrafe en su parte superior. Las
demás representaciones iconográficas lo tendrán en la parte inferior.
Tablas
Las tablas son concentrados de datos numéricos ordenados matricialmente para
mostrar los listados de resultados que son la fuente de la información textual
analítica, presentada en forma de lectura interdependiente. Siguen las mismas
normas generales en su presentación.
Figuras y otras representaciones gráficas
Las figuras y otras representaciones como dibujos, gráficas, diagramas y
fotografías tienen básicamente las mismas normas. Su información, en el capítulo
de Resultados, no se duplica en otras representaciones que explican lo mismo, ni
en forma de prosa en el texto.
En caso de las fotografías, deben tener un contraste adecuado para su impresión
o fotocopia de tamaño postal y que claramente señalen lo que el autor desea
mostrar.
Los dibujos, gráficas y diagramas deben ser presentados con toda la información
que permita su comprensión para un público amplio, en un epígrafe al pie de la
figura.
Al igual que en el caso de los cuadros, las figuras se especifican en el texto y en el
título de las mismas como referencias cruzadas con mayúscula inicial, como por
Dr. Temístocles Muñoz López18
Representaciones Gráficas
ejemplo Figura 1, Figura 2,... (Figuras 8 y 9), etc. Los autores deben considerar
que la reproducción de figuras es conveniente hacerlas de un tamaño tal que
permita mantener la nitidez en una reducción hasta de 50% para la impresión final.
Al respecto, se sugiere un tamaño de media página para figuras sencillas y de una
página para figuras complejas, con un tamaño mínimo de 8 puntos para las letras
o números.
En una figura lo que interesa destacar es el contenido y no los ejes.
Consecuentemente, el grosor de estos últimos conviene que sea menor que el de
las líneas interiores. Para indicar las dimensiones de los ejes se sugiere elegir
escalas apropiadas, que destaquen lo que se desea mostrar; las leyendas de cada
eje se colocarán como se indica en la Figura 1. Observe que la figura no tiene
marco, lo que aumenta la simplicidad pero no se pierde contenido. En
consecuencia, los editores solamente se aceptan las figuras si cumplen con los
requisitos indicados por ellos.
Figura 1 . Ejemplo de elementos de una figura.
Dr. Temístocles Muñoz López19
Representaciones Gráficas
Al igual que los cuadros, todas las figuras deberán estar expresamente citadas en
el texto previo, en orden progresivo.
Nunca comience un apartado, ya sea capítulo (título de primer orden) o título de
segundo o tercer orden con una tabla o representación gráfica.
Unidades
Las unidades a usar son las del Sistema Internacional. Se sugiere colocar entre
paréntesis la equivalencia de los símbolos de cualquier otro sistema la primera
vez que se nombre una unidad, si son diferentes.
En una serie de datos con igual unidad de medición, utilice numerales seguidos de
la forma abreviada de la unidad (sin colocar punto final ni mayúsculas al principio);
por ejemplo: 2, 4 y 6 ml L-1, 16, 20 y 33%; 3400, 1200 y 400 kg, 4 y 9 meses.
En cambio, si sólo hay una cifra y ésta es menor de 10, se escribe con palabras
(seis variables, cuatro repeticiones, ocho ambientes), a diferencia de 16 alumnos,
126 casos; sin embargo, si esa cifra va acompañada inmediatamente de alguna
unidad del sistema internacional, debe expresarse con número (2 mg, g-1, 6 g, 5 lt)
No empiece una frase o párrafo con un numeral. Cambie la frase o escriba la
cantidad con letras.
Cuando se trate de números grandes en el texto, procure redondear la cifra y
emplear palabras como parte del número; así, $458,960.00 puede expresarse
como “casi 460 mil pesos”. Recuerde que los símbolos de las unidades de medida
no se pluralizan: kilo(s) = kg, kilómetro(s) = km, hectárea(s) = ha, metro(s) = m,
litro(s) = lt, gramo(s) = g, etc.
Dr. Temístocles Muñoz López20
Representaciones Gráficas
Fórmulas
Los índices y subíndices estarán bien ubicados y legibles. Tenga especial cuidado
en diferenciar claramente los números 0 y 1 de las letras O e l, respectivamente.
El tamaño mínimo aceptable es de 2 mm u 8 puntos.
Las letras griegas, así como los símbolos que se utilizan para marcar o referir, se
explican inmediatamente después de haberse usado por primera vez, excepto
aquellos del dominio del sistema internacional.
Para expresar fracciones use la forma lineal, con exponentes negativos para los
denominadores; ejemplo: g/cm2, kg/ha-1
Las ecuaciones que expresan las derivaciones matemáticas de una fórmula,
progresivas o no, serán numeradas consecutivamente entre paréntesis, al lado
derecho cuando sean más de una. En general se numeran sólo aquéllas
explícitamente referidas en el texto.
Se recomienda el uso de potencias fraccionarias (0.5, 0.33) en vez de raíces
cuadradas, cúbicas, etc.
Las potencias de “e” se expresan mejor como “exp” (abreviatura de la función
exponencial)
En el caso de las fórmulas químicas, la carga de los iones se expresa como lo
señala el ejemplo siguiente: Ca2 y CO3, y no Ca++.
En la escritura de isótopos, el número de masa se indica en la parte superior del
lado izquierdo del símbolo; ejemplo: 15N, 14C, etcétera.
Normas éticas
Las gráficas pueden ser modificadas para facilitar su lectura y magnificar los
efectos de los datos, pero también para crear intencionalmente impresiones falsas,
Dr. Temístocles Muñoz López21
Representaciones Gráficas
de tal forma que es conveniente que el investigador esté pendiente de sus
diseños, y del impacto que las representaciones tienen en otras personas.
La siguiente gráfica puede ser modificada para magnificar los efectos de los datos
y crear las impresiones que convienen a los que la elaboran. En ella se indican
dos variables que miden lo mismo y son recíprocos, de tal suerte que la
modificación no es en los datos, sin en la escala utilizada y las dimensiones del
gráfico.
Dr. Temístocles Muñoz López22
Representaciones Gráficas
El efecto anterior, magnificado, si es preparado para una presentación puede tener
un sentido negativo sobre la percepción pública de la conducción de la política
económica, en tanto que si es con fines de análisis o exploración de los datos
servirá para apreciar con más detalle las variaciones.
La ética (ethos: comportamiento) del investigador le reclama apegarse a la verdad
y a la responsabilidad que tiene con los demás usuarios de la información que
presenta.
Tipos de iconógrafos como ejemplo
• Se enfatiza que los programas estadísticos para la investigación difieren en
la construcción de gráficas, con los programas comerciales de
procesamiento de textos y de bases de datos con hojas de cálculo, en que
los primeros agrupan los datos en rangos numéricos (ambos ejes son
tratados como números o ejes verdaderos X e Y), y los comerciales
presentan solamente la estructura que tienen las tablas de origen (un eje es
tratado como números y otro como etiquetas de categorías).
• Los primeros se llaman “Gráficos Científicos o Técnicos” y los segundos
“Gráficos Secuenciales”.
El análisis preliminar de las bases de datos es altamente recomendable antes de
su procesamiento, para ello los casos atípicos u outliers se eliminan si están más
allá de 3 sigmas, siempre y cuando exista un previo análisis explicativo
independiente de cada uno de ellos, ya que pudieron ser introducidos por “errores
de dedo” en la captura o desviaciones preferenciales afectivas de los sujetos. Para
lograr detectarlos se utilizan gráficos como Box Plot que los marcan.
Las representaciones de datos o dibujos descriptivos pueden clasificarse
convencionalmente y a manera de ejemplo se usa la siguiente tipología general.
Dr. Temístocles Muñoz López23
Representaciones Gráficas
1. Matrices
Las matrices de datos usualmente no se presentan en la investigación a menos de
que se trate de ejemplificar o mostrar con ellas algún hecho relevante que influye
en la investigación. Las matrices son referidas como tablas de doble entrada.
El siguiente ejemplo muestra un fragmento de una base de datos:
Número GEdad GCiudad Región GGénero RMafectoREreconvHreaucas Hregtrad Hregacua1 15 Saltillo Sureste 1 1 0 2 3 52 15 Saltillo Sureste 1 9 7 0 5 83 15 Saltillo Sureste 2 10 9 10 10 94 15 Saltillo Sureste 2 10 9 10 10 85 15 Saltillo Sureste 2 8 1 5 10 106 15 Saltillo Sureste 2 9 2 5 8 97 15 Saltillo Sureste 1 9 7 5 3 58 15 Saltillo Sureste 1 10 7 8 6 79 14 Saltillo Sureste 2 10 1 5 8 910 14 Saltillo Sureste 2 9 7 5 9 911 15 Saltillo Sureste 1 9 3 8 6 812 14 Saltillo Sureste 1 7 2 1 3 713 15 Saltillo Sureste 2 10 3 6 10 714 14 Saltillo Sureste 2 8 3 4 10 915 15 Saltillo Sureste 1 8 1 7 10 916 14 Saltillo Sureste 1 10 1 3 10 717 15 Saltillo Sureste 2 10 0 1 6 5
Se consideran similares: Matrices de correlación (generalmente presentadas como
tablas), Matrices de las bases de datos.
No todas las matrices o tablas requieren ser incluidas en la investigación o el
informe de la misma, a menos que sea estrictamente necesario. El siguiente
ejemplo muestra una matriz de datos de correlación que no aparecerá en la
investigación pero que tiene valor exploratorio y como lectura para los resultados.
Correlaciones canónicas de las variables de la cohorte 16 significativas a p .01 N=69 y una r 0.31
Justicia Autocontrol Autocontrol Autocontrol Autocontrol AutoestimaRMREGJUS RMAUTCON RMCOMRES RMAUTIMP RMPACREC RMCONLIM
HBUEXIG 0.374 0.428 0.346 0.324HCOMPL 0.502
HCONTAUT 0.423HINDMEJ 0.342HNOCAST
Dr. Temístocles Muñoz López24
Representaciones Gráficas
REACTIV 0.348 0.309REAFECTO 0.312 0.478 0.319 0.362REAPADRE 0.359 0.331REAPJUVE 0.449 0.316REAPMOTR 0.338 0.503REBUECON 0.460 0.410 0.394 0.516 0.364 0.539
2. Cuadros
Los cuadros son representaciones de datos importados de otros autores, donde se
concentra la información sistemáticamente organizada y pertinente.
Ejemplo:
Las políticas de desarrollo agrícola relacionadas con los factores de la
sustentabilidad ambiental, son propuestas por Gligo (1990) de acuerdo al siguiente
cuadro:
Factores: Políticas:Global Específica
Coherencia ecológica Científica y Investigación de recur-tecnológica. sos naturales.
Investigación agronó-mica.
Ordenamiento Áreas protegidas.territorial. Áreas de expansión
agrícola.
Estabilidad Socio- Estructura de Reforma agraria.estructural. tenencia. Regulación jurídica.
Complejidad infra- Obras públicas. Riego y drenaje.estructural. Obras viales.
Estabilidad econó- Comercialización. Capacidad de compra.mico-financiera. agropecuaria Precios de productos.
Precios agrícolas. Precios de insumos tec-nológicos.
Créditos agrícolas. Créditos subsidiados.Subsidios para Subsidios para la recu-la recuperación peración de los suelosambiental. erosionados.
Subsidios para la refo-
Dr. Temístocles Muñoz López25
Representaciones Gráficas
restación.
Incertidumbre y Financiera. Fondos de rubros espe-riesgo. cíficos.
Seguros.
3. Tablas para el informe de investigación
Las tablas concentran datos con una entrada de rótulos en la parte superior, y
representan una concentración de datos relevantes y pertinentes de lo que se
desea mostrar.
Se consideran similares: Tablas de resultados estadísticos, Tablas comparativas
de tratamientos.
4. Diagramas
Se consideran similares: Dendrogramas, Rutas, Secuencias, Correlacionales,
Constelaciones, Dispersogramas, Flujo, Diacrónico, Polietapas, Mapas
conceptuales.
Dr. Temístocles Muñoz López26
Representaciones Gráficas
5. Figuras
Se consideran similares: Gráficas de íconos, Caras de Chernoff, Íconos de Pastel,
Estrellas, Íconos de Columnas, Rayos solares, Íconos de Líneas, Íconos
poligonales, Íconos de perfiles.
Dr. Temístocles Muñoz López27
Representaciones Gráficas
6. Gráficos
Se consideran similares: Histogramas, Gráficas de cajas, Gráficas de puntos,
Gráficas de líneas, Gráficas de probabilidad, Gráficas de áreas, Gráficas
circulares, Anillos, Gráficas ternarias, Superficie, Gráficas de contorno, Gráficas
secuenciales.
Dr. Temístocles Muñoz López28
Representaciones Gráficas
Dr. Temístocles Muñoz López29
Representaciones Gráficas
7. Láminas
Ilustraciones coloreadas.
Dr. Temístocles Muñoz López30
Representaciones Gráficas
8. Mapas
Distribuciones territoriales y mentales (si así se especifica), Ubicaciones, Rutas.
Combinaciones personalizadas
Los arreglos específicos de los datos modificando los estilos predeterminados.
Diseños 2D y 3D
Solamente usuales en casos en que se requiere incluir 3 o más variables que se
relacionan dimensionalmente. No se permiten en la mayoría de las editoriales
debido a que se pierde la perspectiva de los ejes X e Y.
Ajustes personalizados
Se permiten las modificaciones predeterminadas en ejes, colores, leyendas, tablas
adjuntas, tendencias, líneas de división. De hecho, es deseable realizar las
modificaciones pertinentes para ganar mayor riqueza en la presentación.
Dr. Temístocles Muñoz López31
Representaciones Gráficas
Simbología
Las literales, símbolos especiales y símbolos internacionales se permiten en la
mayoría de las publicaciones, con la precaución de no saturar la representación,
indicando su significado al pié de la gráfica o en el texto previo.
Colores.
Se requiere preferentemente usar los colores blanco y negro para publicaciones y
en color para presentaciones en pantalla con fines exploratorios.
Dr. Temístocles Muñoz López32
Representaciones Gráficas
APARTADO B. GENERACIÓN Y USO DE GRÁFICOS COMUNES2
I. PRÓLOGO
Se ha seleccionado cuidadosamente el material de los programas NCSS y
Statistica por dos razones: primero, dado que las bases que se aprenden en ellos
para la generación, exploración y lectura de datos de una investigación son
versátiles y sencillos, y en segundo lugar, porque se utiliza extensamente por los
maestros y alumnos en el desarrollo de sus investigaciones en los estudios de
Ciencias Sociales y Naturales.
Se insiste en que los programas estadísticos para la investigación difieren de los
programas comerciales de procesamiento de textos y de bases de datos con hojas
de cálculo para la construcción de gráficas, en que los primeros agrupan los datos
en rangos numéricos (ambos ejes son tratados como números o ejes verdaderos
X e Y), y los comerciales presentan solamente la estructura que tienen las tablas
de origen (un eje es tratado como números y otro como etiquetas de categorías).
Los primeros se llaman “Gráficos Científicos o Técnicos” y los segundos “Gráficos
Secuenciales”.
Evidentemente los gráficos científicos tienen mucha mayor riqueza y poder en la
presentación y la exploración de los datos para convertirlos en información
confiable. Al estudiar éstos módulos básicos, se sigue un criterio de análisis
didáctico para favorecer el aprendizaje del uso de estadísticos por gráficos.
2 La adaptación, traducción y ajustes que presentan los textos seleccionados en éstos apuntes han sido modificados por el autor a partir de materiales originales de NCSS (Number Cruncher Statistical System) y Statistica, para facilitar su comprensión como material de guía.
Dr. Temístocles Muñoz López33
Representaciones Gráficas
Número de clases
Antes de comenzar con la elaboración de gráficos es conveniente conocer el
número de clases, segmentos o porciones en que se distribuirán gráficamente los
datos. Para ello se utilizan dos procedimientos comunes:
1) Fórmula de Sturges para el número de clases (Forns, M., T. Kirchner, y M. Torres (1991). k=1+3.3(log n). donde
k= número de clasesn= tamaño de la muestra
Ejemplo:
Muestra: 257Desarrollo: Log de n = 2.41Base 3.3+1= 4.3k= 10
2) Regla del tanteo (http://www.cofc.edu/~milesd/freqdist.htm) k=5(log n).
donde:k= número de clasesn= tamaño de la muestra
Ejemplo:
Muestra: 257Desarrollo: Log de n = 2.41Base 5k= 12
En ambos casos el número de intervalos de clase es muy similar gráficamente y el
investigador requiere aplicar ambos para observar y decidir cuál es el que muestra
mejor los datos.
II. HISTOGRAMAS
Introducción
La palabra histograma viene de los griegos ístos () que significa mástil, telar,
tejido, trama de filamentos, y gram () a, que significa letra, trazo, signo,
Dr. Temístocles Muñoz López34
Representaciones Gráficas
esquema o gráfico. Por la definición directa de histograma se toma gráfico de
tramas o postes. (Histograma. De histo- y -grama. 1. m. Estad. Representación
gráfica de una distribución de frecuencias por medio de rectángulos, cuyas
anchuras representan intervalos de la clasificación y cuyas alturas representan las
correspondientes frecuencias. Real Academia Española: www.rae.es)
Quizás esta palabra fue elegida
porque un histograma parece
una trama o un conjunto de
postes que están alineados
juntos. Un histograma se utiliza
para exhibir la distribución de los
valores de los datos a lo largo del
número de la línea verdadera.
Compite con el diagrama de
probabilidad como método de análisis gráfico de la normalidad.
A veces no se puede comprender un conjunto grande de observaciones
leyéndolas directamente. Para realizar la lectura de los números, usted debe
resumirlos, clasificando, agrupando, y obteniendo un promedio de ellos. Un
método de hacer esto es construir una distribución de frecuencias. Esto implica el
dividir el rango de los datos en algunos intervalos (generalmente iguales). El
número de las observaciones que se agrupan en cada intervalo se cuenta
gráficamente. Esto da una distribución de frecuencias. El histograma es un gráfico
de distribución de las frecuencias en el cual el eje vertical (y) representa la cuenta
(frecuencia) y el eje horizontal (x) representa el rango posible de los valores de los
datos.
Observe en el siguiente ejemplo de Statistica cómo se incluyen los rangos de los
intervalos y los detalles técnicos de la gráfica. Todas las especificaciones de la
gráfica pueden ser editadas desde el programa antes de que la pueda incluir en su
informe de investigación. Para editar algún aspecto especial en ese programa
Dr. Temístocles Muñoz López35
0.0
13.3
26.7
40.0
40.0 53.3 66.7 80.0
Histogram
SepalLength
Count
Representaciones Gráficas
haga clic con el botón derecho del ratón y selecciones “options” o “layout”.
Observe que entre paréntesis se incluyen los intervalos de clase.
La Densidad del trazo
El histograma se utiliza extensamente y necesita poca explicación. Sin embargo,
tiene sus desventajas. Primero, el número y la anchura de los intervalos son una
decisión subjetiva, con todo, el número de intervalos de clase puede ser calculado
con la fórmula de Sturges k=1+3.3(log n), o la regla de tanteo que se vio en el
apartado anterior, y la selección que hagamos tiene un alto impacto en la
apariencia del histograma. Los valores de límite levemente modificados pueden
dar dramáticas apariencias a diversos histogramas (usted puede experimentar con
NCSS para ver el impacto de cambiar el número de intervalos en la apariencia del
histograma). Otro problema con el histograma es que los rectángulos aparentan
que los datos están separados uniformemente a través del intervalo, pero a
menudo en la realidad éste no es el caso.
También, la apariencia global del histograma representa la naturaleza algo alisada
de la distribución de los datos. Estas quejas contra el histograma han traído
muchas innovaciones. Una de las técnicas más nuevas y populares de la
Dr. Temístocles Muñoz López36
Representaciones Gráficas
presentación para demostrar la distribución de datos es la densidad del trazo. La
densidad se refiere a la frecuencia relativa (concentración) de los puntos de
referencias a lo largo del rango de datos. Matemáticamente, la densidad en un
valor x se define como la fracción de los valores de los datos por la unidad de
medida en un intervalo centrado en x.
Una vez que usted escoja una anchura conveniente del intervalo, puede calcular la
densidad en cualquier (y a cada) valor de x. Si usted calcula la densidad en, por
ejemplo, 50 valores y los conecta, obtiene la densidad del trazo.
Desafortunadamente muchos programas no contienen ésta función. En NCSS, la
anchura del intervalo se especifica como porcentaje. Mientras que usted aumenta
el porcentaje, usted aumenta la cantidad de datos incluidos en cada cálculo de la
densidad. Esto aumenta la suavidad de la gráfica. Los cuatro trazos siguientes de
la densidad fueron hechos de los mismos datos con aumento del porcentaje de la
suavidad. Observe cómo muestran más estas gráficas que el histograma común
presentado al inicio de éste capítulo.
La densidad del trazo al 25% de los datos se representa de la siguiente forma:
0.0
26.7
53.3
80.0
40.0 53.3 66.7 80.0
Histogram
SepalLength
Co
un
t
Con densidad de 30% quedaría así:
Dr. Temístocles Muñoz López37
Representaciones Gráficas
0.0
16.7
33.3
50.0
40.0 53.3 66.7 80.0
Histogram
SepalLength
Co
un
t
En tanto que con 40% la figura se agrupa más, pero mantiene la concentración
marcada:
0.0
13.3
26.7
40.0
40.0 53.3 66.7 80.0
Histogram
SepalLength
Co
un
t
En un caso extremo de agrupamiento al 60% el efecto se exagera de la siguiente
forma:
Dr. Temístocles Muñoz López38
Representaciones Gráficas
0.0
13.3
26.7
40.0
40.0 53.3 66.7 80.0
Histogram
SepalLength
Co
un
t
Mientras se aumenta la anchura del intervalo son incluidos los puntos de
referencias más lejanos y más próximos del valor de centro. Para disminuir el peso
de los puntos que quedan lejos del valor de centro, utilizamos un esquema que
carga los puntos de los pesos proporcionalmente a su distancia del valor del
centro. La función del peso usada es la mitad de la función del coseno, con su pico
en el valor de centro que disminuye simétricamente a cero, después de lo cual se
aplica un peso de cero. Por lo anterior, los puntos tienen un impacto cada vez más
pequeño y más pequeño en la densidad del trazo, mientras que están más al
fondo y más próximos del centro.
Otra manera de pensar en la densidad del trazo es imaginarse que usted
construye 1,000 histogramas de los mismos datos usando posiciones levemente
diversas del límite y toma la altura media del rectángulo en cada uno de 50 valores
a lo largo del rango de datos. Esto le daría un histograma alisado que tiene
muchas de las mismas características de la densidad del trazo. Por lo tanto, la
densidad del trazo se debe pensar como un histograma alisado, en el cual la
anchura del intervalo y el número de compartimientos no están en juego.
Estructura de datos
Dr. Temístocles Muñoz López39
Representaciones Gráficas
El histograma se construye con una sola variable. Una segunda variable se puede
utilizar para dividir la primera variable en grupos (Ej., categoría de edad o género).
No se solicita otro requisito en los datos de entrada. Sin embargo, las
distribuciones disponibles en NCSS asumen que los datos son continuos. Observe
que son ignoradas las filas con valores perdidos en las variables seleccionadas.
III. GRÁFICAS DE PASTEL
Introducción y Propósitos Generales
Los fines generales de la gráfica de pastel es
construir segmentos dividiendo un círculo en
dos o más secciones. La gráfica se utiliza
para mostrar la proporción en que cada parte
contribuye al total. Por lo tanto, debe ser
utilizada cuando usted desea comparar
categorías individuales con el conjunto. Si
usted desea comparar los valores de una
categoría con otra, utilice un diagrama de la
gráfica de dispersión de barras. Por ejemplo,
la gráfica muestra el presupuesto para cada uno de los cuatro departamentos en
una compañía hipotética. Las gráficas de pastel son útiles para exhibir hasta cerca
de seis o siete rebanadas o porciones.
La estructura de los datos
Los valores de datos deben ser positivos y numéricos. Se omiten los valores no
positivos. Los datos se pueden incorporar en la tabla en dos formatos posibles:
verticales u horizontales. En el formato vertical, una variable (columna) contiene
los valores que se graficarán. En el formato horizontal, una fila los contiene. Estos
datos están en la base de datos original de la gráfica.
Dr. Temístocles Muñoz López40
Gráfica de pastel del presupuesto
Marketing
Producción
R&D
Administración
Representaciones Gráficas
IV. DIAGRAMA DE CAJAS
Introducción
Al analizar los datos con un diagrama usted necesita ver a menudo las
características de una sola serie de números, de observaciones o de medidas.
Puede ser que desee conocer el centro y cómo está la distribución de los datos
sobre este valor central. Puede ser que usted desee investigar los valores
extremos atípicos (llamados outliers) o estudiar la distribución de los valores de los
datos (el patrón de los valores de los datos a lo largo del eje de la mediana). Hay
varias técnicas que están disponibles para permitir que usted estudie la
distribución. Éstos incluyen el diagrama de tallo-hoja, el histograma, la densidad
del trazo, el diagrama de probabilidad, y el diagrama de cajas (Box Plot)
presentado en seguida.
La definición del diagrama de cajas
El diagrama de cajas demuestra tres características principales de una variable: su
centro, la distribución de sus datos, y sus outliers o valores atípicos.
La Caja
El diagrama de cajas se compone de una caja (un rectángulo) con las líneas, y los
puntos agregados a ella. La anchura de la caja puede ser arbitraria o convencional
y se debe seleccionar su dimensión para hacer una exhibición agradable a la vista.
La presentación usual de los límites de la cubierta y el fondo de la caja son los
porcentajes 25avo y 75avo. La longitud de la caja es así el rango interquartil (IQR).
Es decir, la caja representa el 50% o mitad de los datos centrales.
El IQR es una medida popular de la distribución. Usted puede representar la caja
como un rectángulo, un diamante, una elipse, o una figura especial diseñada para
hacer comparaciones múltiples. En ella se dibuja una línea a través del centro de
Dr. Temístocles Muñoz López41
Representaciones Gráficas
la caja en el punto medio o mediana (el porcentaje del 50avo). El punto medio es
una medida popular de la localización del valor medio o de centro de las variables.
35.0
50.0
65.0
80.0
1 2 3
Box Plot
Iris
SepalL
ength
35.0
50.0
65.0
80.0
1 2 3
Box Plot
Iris
SepalL
ength
Los valores adyacentes límites
Los valores adyacentes al borde superior de la caja son la observación más
grande, que es menor que, o igual al porcentaje del 75avo más 1.5 veces IQR. El
valor adyacente más bajo de la caja es la observación más pequeña que es mayor
que, o igual al porcentaje del 25avo menos 1.5 veces IQR. Los valores adyacentes
Dr. Temístocles Muñoz López42
Representaciones Gráficas
se exhiben como líneas en forma de T que se extienden en cada extremo de la
caja. Otros valores fuera de los límites son considerados extremos.
Los valores extremos
Los valores que se ubican fuera de los valores adyacentes superiores y más bajos
que la T de la gráfica se llaman valores extremos, anómalos o atípicos (outliers).
Los valores que están debajo de tres IQRs de los 25avo y 75avo porcentajes se
llaman outliers suaves, en tanto que fuera de tres IQRs se llaman outliers severos.
Los outliers suaves no son raros y los outliers severos si lo son.
Comparaciones múltiples
Estas se utilizan a menudo para las distribuciones de varias agrupaciones de
datos, puesto que resumen el centro y la distribución de los datos con apariencia
muy agradable. Al hacer comparaciones concluyentes entre las localizaciones
(puntos medios) de varias agrupaciones, es útil hacer un diagrama de caja
modificado llamado diagrama truncado.
Se construyen los cortes usando la fórmula:
Mediana IQR n 1.57.
Los diagramas truncados de caja se utilizan para hacer comparaciones múltiples
entre las agrupaciones. Si los cortes de dos cajas no se traslapan, podemos
asumir que los puntos medios son perceptiblemente diferentes (los centros son
estadísticamente significativos). El 1.57 se selecciona para el nivel del 95% de
significancia. El diagrama de cajas presentado abajo es el diagrama truncado
clásico.
Dr. Temístocles Muñoz López43
Representaciones Gráficas
40.0
53.3
66.7
80.0
1 2 3
Box Plot
Iris
SepalL
ength
Recientemente, los estadísticos han notado que el diagrama truncado de caja no
permite que usted se centre en las comparaciones múltiples. Se ha propuesto una
versión moderna del diagrama truncado para hacer esta comparación (véase el
diagrama abajo).
40.0
53.3
66.7
80.0
1 2 3
Box Plot
Iris
SepalL
ength
Esta versión modifica el símbolo usado para la caja. De hecho, pone la caja hacia
fuera, y dos líneas horizontales marcan la posición de la caja. La parte que se
grafica es solamente la parte truncada. Esto hace mucho más fácil hacer
comparaciones. Si dos de los cortes se traslapan, los puntos medios del grupo no
Dr. Temístocles Muñoz López44
Representaciones Gráficas
son perceptiblemente diferentes. Observe que al hacer comparaciones entre
varias agrupaciones, los diagramas truncados no requieren ningún ajuste para la
multiplicidad de pruebas en que son conducidos. Mientras que los diagramas
truncados se utilicen informalmente, no hay necesidad de ajustes técnicos.
La estructura de datos
El diagrama de cajas se construye a partir de una variable. Una segunda variable
se puede utilizar para dividir la primera variable en grupos (Ej., categoría de edad
o género). En este caso, un diagrama separado de la caja se exhibe para cada
grupo. No se solicita otro requisito en los datos de entrada.
V. CARTAS O GRÁFICAS DE BARRAS
Introducción y Propósitos Generales
Las gráficas de barras se
utilizan para comparar
visualmente valores
contiguos. Hay algunas
variaciones en la gráfica
de barras, éstas incluyen
la gráfica de barras
vertical, la gráfica de
barras horizontal, la
gráfica de área, y la
gráfica de líneas. Hay
versiones bi y
tridimensionales de cada uno. Arriba se muestra un ejemplo de una gráfica de
barras 3D.
La estructura de datos
Dr. Temístocles Muñoz López45
Representaciones Gráficas
Los datos de la gráfica de barras 3D se incorporan en el formato estándar de la
fila-columna de la hoja de datos. Cada valor numérico de los datos se convierte en
una barra. Los datos alfabéticos se utilizan para etiquetar las filas y las columnas
de la gráfica. En la tabla está un ejemplo de los datos graficados.
FRUTA ABRIL MAYO JUNIO
Manzanas 82 70 20
Peras 73 50 33
Duraznos 67 45 28
Naranjas 85 65 17
Kiwis 54 42 24
Melones 33 58 20
VI. DIAGRAMAS DE PROBABILIDAD
Introducción
Este procedimiento construye los diagramas de probabilidad normal, las
distribuciones de Weibull, Chi-ajustado, de gamma, uniformes, exponenciales, y
mitad-normales. Le permite intentar varias transformaciones para ver si alguna se
acerca más a la distribución de su interés. Los límites de confianza aproximados
se dibujan para ayudar a precisar si un sistema de datos sigue una distribución
dada. Si se especifica una variable agrupadora, se dibuja en una línea separada y
se exhibe para cada valor único de la variable agrupadora.
Dr. Temístocles Muñoz López46
Representaciones Gráficas
40.0
53.3
66.7
80.0
-3.0 -1.0 1.0 3.0
Normal Probability Plot of SepalLength
Normal Distribution
SepalL
ength
Proporcionaremos una breve introducción a las técnicas de gráficas de
probabilidad, y una discusión completa de este asunto se puede encontrar en
Chambers (1983) que procuraremos resumir a continuación.
Muchos análisis estadísticos asumen que los datos están muestreados de una
población más grande con una distribución especificada. A menudo, la distribución
de esta población más grande se asume que es normal (en trabajos de
confiabilidad y de supervivencia la distribución subyacente se asume que es
exponencial o Weibull). Esto a menudo se llama la asunción de normalidad. (note
que la distribución normal a veces es llamada distribución gaussiana para evitar la
confusión con su definición común. Aunque implica que es normal ¡la distribución
generalmente, no lo es! Esta asunción de normalidad se hace por varias razones:
1. Permite que los datos sean representados compactados. Mil valores que vienen
de la distribución normal se pueden resumir por solamente dos números: la media
y la varianza.
2. Permite el uso de varios procedimientos estadísticos, tales como el análisis de
la variabilidad, de pruebas t, o de regresión múltiple.
Dr. Temístocles Muñoz López47
Representaciones Gráficas
3. Permite que las generalizaciones sean hechas de la muestra a la población.
Estas generalizaciones toman generalmente la forma de intervalos de confianza y
de pruebas de hipótesis.
4. Entender la distribución de una muestra puede proporcionar la entrada en el
proceso físico que creó los datos.
Obviamente la naturaleza no genera automáticamente los datos que siguen cierta
distribución de probabilidad. Cuando usted asume que sus datos siguen la
distribución normal, realmente está asumiendo que la distribución de sus datos es
razonablemente aproximada a la distribución normal. La pregunta que se presenta
es ¿que tan bastante cerca está de lo normal? Esta pregunta se puede estudiar
usando procedimientos numéricos y gráficos. Se han desarrollado las pruebas
numéricas de hipótesis que permiten que usted determine si sus datos siguen
cierta distribución. Consulte sobre Ómnibus K.
Las pruebas para la normalidad se proporcionan generalmente en los programas
estadísticos en el apartado de estadística descriptiva. Los procedimientos gráficos
son útiles porque le dan una impresión visual sobre si es válida la asunción de
normalidad. Le permiten precisar si la asunción es invalidada por uno o dos
outliers (que podrían ser quitados), o si los datos siguen una distribución
totalmente dispersa. También sugieren qué transformación de los datos (raíz
cuadrada, registro, lo contrario, los etc.) sigue más de cerca la distribución normal.
El mejor acercamiento es aplicar procedimientos numéricos y gráficos. Dado que
los datos están disponibles en su computadora, toman solamente algunos golpes
de teclado hacer ambos chequeos.
La lectura del diagrama de probabilidad
Esta sección presentará algunos de los fundamentos para el análisis y la lectura
de los diagramas de la probabilidad. Nuestra discusión es breve, así que es
recomendable que busque información adicional si lee regularmente estos
diagramas. También, la experimentación es un profesor muy bueno. Usted debe
Dr. Temístocles Muñoz López48
Representaciones Gráficas
hacer varias prácticas con bases de datos que siguen los patrones que usted
comprende. Genere los diagramas de probabilidad para conseguir una apreciación
de cómo se muestran diversos patrones de datos en los diagramas. Si los puntos
en la probabilidad se trazan en toda la pendiente a lo largo de una línea recta,
usted puede asumir que los datos siguen esa distribución de la probabilidad. Por lo
menos, la distribución real es bastante aproximada para la distribución que usted
ha trazado. Discutiremos brevemente los tipos de patrones que coincidan
generalmente con salidas de la rectitud de esta línea.
Los outliers
Los outliers o casos atípicos son los valores que no siguen el patrón del cuerpo de
los datos. Se localizan en cualquier extremo de la probabilidad. Puesto que los
outliers grandes desviarán seriamente la mayoría de los análisis estadísticos,
usted debe investigarlos cuidadosamente. Si son errores u ocurrencias de una
sola vez deben ser quitados de su análisis. Una vez que se hayan quitado los
outliers, el diagrama de probabilidad debe ser rediseñado sin ellos.
Las colas largas
De vez en cuando algunos puntos en ambos extremos se perderán de la línea.
Estos puntos parecen seguir un patrón, no el patrón del resto de los datos.
Generalmente, los puntos en el extremo de la línea tirarán para arriba, mientras
que los puntos en el fondo de la línea caerán debajo de ella. Esto es causado por
una distribución de los datos con colas más largas que las que se esperan ser
consideradas bajo distribución teórica (Ej., normal). Los datos con colas más
largas pueden causar problemas con algunos procedimientos estadísticos.
La asimetría
Si la probabilidad tiene una curva convexa o cóncava (más que una línea recta),
los datos se sesgan a un lado o al otro de la mitad. Esto puede ser corregido
generalmente usando una fórmula de ajuste como transformación de poder.
Dr. Temístocles Muñoz López49
Representaciones Gráficas
Las mesetas y los valles
Los puntos que arraciman los datos se muestran en el diagrama de probabilidad
como valles y mesetas (desplazamientos horizontales de puntos). Esto puede ser
causado por la granulidad de los datos. Por ejemplo, si la variable puede adquirir
solamente cinco valores, el diagrama exhibirá sus patrones. Cuando ocurren estos
patrones, debe estar seguro que sabe la razón de ellos. ¿Es debido a la
naturaleza discreta de los datos, o los racimos son causados por una segunda
variable extraña?
Precauciones
El estudio de diagramas de la probabilidad es una herramienta muy útil en análisis
de datos, teniendo algunas precauciones debido a que:
1. Estos diagramas acentúan los problemas que pueden aparecer en las colas de
la distribución, no en el centro (puesto que ahí hay muchos puntos agrupados).
2. La variación natural en los datos causará una cierta salida de la rectitud.
3. Puesto que el diagrama considera solamente una variable a la vez, no se
atiende alguna relación que pueda existir con otras variables.
4. Los límites de confianza exhibidos en el diagrama son solamente aproximados.
También, dependen mucho de un tamaño de muestra razonable. Para las
muestras inferiores de 20 casos, estos límites se deben tomar con mucha
precaución. También puede cambiar mucho los límites cambiando el nivel de
confianza (el valor de alfa). Asegúrese de que el valor que usted está utilizando es
razonable.
Los detalles técnicos
Dr. Temístocles Muñoz López50
Representaciones Gráficas
Vamos a asumir que tenemos un sistema de los números x1, x2..., xn y deseamos
estudiar visualmente si la asunción de la normalidad es razonable. El método
básico es:
1. Clasifique los xis del más pequeño al más grande. Represente el sistema
clasificado de números como x(1), x(2)..., x(n). Por lo tanto, x(1) es el mínimo y el
x(n) es el máximo de estos datos.
2. Defina los quantiles empíricos de n, p1, p2..., pn, donde pi = i/n. Éstos son
similares a los porcentajes. Por ejemplo, si n = 5 los pis serían 2, 4, 6, 8, 10. El
valor p2 del 4 se interpreta como significado que éste es el 40° porcentaje.
3. Encuentre un sistema de los números, z1, z2..., el zn, que esperaría de los
datos que siguen exactamente la distribución normal. Por ejemplo, z2 es el
número que contábamos con si obtuviéramos 5 valores de una distribución
normal, clasificándoles, y seleccionado el segundo más bajo. Éstos se llaman los
quantiles.
4. Construya un diagrama de dispersión con los pares x(1) y z1, x(2) y z2,
etcétera. Si los xis vinieran de una distribución normal, anticiparíamos que los
puntos trazados caerán a lo largo de una línea recta. El grado de no-normalidad es
sugerido por la cantidad de la curvatura en el diagrama.
Hay varios refinamientos al procedimiento de arriba. El más común es la definición
de los pis en el paso 2. La fórmula usada generalmente es pi = (i-a)/(n-2a+1),
donde a es un número entre 0 y 1. Muchos estadísticos recomiendan a = 1/3. Éste
es el valor por defecto usado por programas como NCSS (el valor de a se fija en la
opción de la constante del porcentaje). Otra modificación está en el escalamiento
usado para los zis. Si se utilizan los zis del paso 3, la definición terminante es el
diagrama del quantil. Si los zs se convierten a una escala de probabilidad, el
diagrama se conoce como diagrama de probabilidad. Hoy en día estas
definiciones se han debilitado y utilizamos el término de diagrama de probabilidad
para representar cualquiera de estos diagramas. Los diagramas de probabilidad
Dr. Temístocles Muñoz López51
Representaciones Gráficas
se pueden construir para cualquier distribución, aunque el de normalidad es el
más común.
Los cuatro pasos antedichos se utilizan para cualquiera de las siete funciones de
distribución que están disponibles en NCSS. Las tablas de compartimientos, de
Cleveland, de Kleiner, y de Tukey (1983) que se muestran debajo dan la
información técnica sobre estas distribuciones. Una de las características más
útiles de estas tablas es la columna ordenada y marcada en la segunda tabla. Esta
columna define la transformación de los datos que se deben utilizar para alcanzar
un diagrama estándar de probabilidad para esa distribución.
Por ejemplo, si deseaba generar un diagrama gamma de probabilidad, debe tomar
los datos de una mitad de poder. Observe que no hay transformación especial
necesaria para el diagrama normal de probabilidad. Estos límites de confianza
sirven en tanto que la referencia limita cuando está estudiando un diagrama de
probabilidad. Cuando la caída de los puntos está fuera de estos límites, los
consideraría como evidencia que la asunción de la normalidad (o cualquier
distribución que está considerando) es inválida.
La estructura de datos
El diagrama de probabilidad se construye de una sola variable. Una segunda
variable se puede utilizar para dividir la primera variable en grupos (ej., categoría
de edad o género). No se solicita otro requisito en los datos de entrada, sin
embargo, las distribuciones disponibles en NCSS asumen que los datos son
continuos. Las filas que faltan son ignoradas con valores en una de las variables
seleccionadas.
VII. DIAGRAMA DE DISPERSIÓN
Introducción
Dr. Temístocles Muñoz López52
Representaciones Gráficas
El diagrama x-y de dispersión es una de las herramientas de mayor alcance para
analizar datos. NCSS incluye un menú de características para realzar el diagrama
básico de dispersión. Algunas de estas características son líneas de la tendencia
(mínimos cuadrados) y límites de confianza, polinomios, líneas, curvas lowess,
diagramas de caja insertados, y diagramas de girasol.
Lo que sigue es un ejemplo de un diagrama típico de la dispersión con una línea
de tendencia y con diagramas de caja incorporados.
Estructura de datos
El diagrama de dispersión se construye a partir de dos variables. Se puede utilizar
una tercera variable para dividir las primeras dos variables en grupos (Ej.,
categoría de edad o género). No se hacen otros requerimientos para los datos de
entrada.
50.0
116.7
183.3
250.0
50.0 60.0 70.0 80.0
Height (inches) vs Weight (lbs)
Height (inches)
Weig
ht
(lbs)
Si la variable género se incluye para separar los datos:
Dr. Temístocles Muñoz López53
Representaciones Gráficas
50.0
116.7
183.3
250.0
50.0 60.0 70.0 80.0
Height (inches) vs Weight (lbs)
Height (inches)
Weig
ht
(lbs)
Gender
12
Considere que las filas con valores perdidos en una de las variables seleccionadas
serán ignoradas en ambas.
VIII. MATRIZ DE DIAGRAMAS DE DISPERSIÓN
Introducción
La matriz de diagramas de dispersión es una tabla de dispersión múltiple. Cada
diagrama es pequeño para poder introducir muchos diagramas en una página.
Cuando usted necesita dar una mirada de diagramas, por ejemplo al principio de
un análisis de regresión múltiple, la matriz del diagrama de dispersión es una
herramienta muy útil. Lo que sigue es un ejemplo de una matriz del diagrama de
dispersión creada durante la fase inicial de un estudio de la regresión múltiple.
En el siguiente ejemplo hay cinco variables de la prueba que forman un juego de
variables independientes, contrastadas contra ellas mismas considerando cada la
variable como dependiente para organizarlas. Observe cómo puede explorar
rápidamente los diagramas para variables altamente correlacionadas, y outliers.
Dr. Temístocles Muñoz López54
Representaciones Gráficas
Ex_Esc_
Ex_
Esc
_
Raz_Ded_
Raz_Ind_
Pens_Cr_t_
Poten_
Raz
_Ded
_
Raz
_Ind
_
Pen
s_C
r_t_
Pot
en_
Estructura de los datos
Cada diagrama de dispersión se construye a partir de dos variables numéricas. Se
puede utilizar una tercera variable, alfanumérica para controlar el símbolo del
diagrama.
IX. DIAGRAMAS DE SUPERFICIE 3D
Introducción
Los diagramas de superficie 3D
son diagramas de datos
Dr. Temístocles Muñoz López55
Representaciones Gráficas
tridimensionales. Más que mostrar los puntos de referencias individuales, los
diagramas superficiales muestran una relación funcional entre una variable
dependiente señalada (Y), y dos variables independientes (X1 y X2).
El diagrama de puntos es un diagrama que acompaña al diagrama de contorno.
Es importante entender cómo se construyen estos diagramas.
Se construye una rejilla de dos dimensiones de X1 y de X2. El rango de esta rejilla
es igual al rango de los datos. Después, un valor de Y se calcula para cada punto
de la rejilla. Este valor de Y es un promedio cargado de todos los valores de los
datos que se acerquen a este punto de la rejilla. (El número de puntos generados
es un promedio especificado por el usuario). Se construye la superficie
tridimensional usando un promedio de estos valores. Por lo tanto, el diagrama
superficial no muestra la variación en cada punto de rejilla. Estos diagramas son
útiles en el análisis de regresión, para ver la relación entre una variable
dependiente y dos variables independientes.
Pudiéramos pensar que una de las variables, X2, es en realidad Z, o sea la
perspectiva que da fondo de tercera dimensión a la gráfica, pero considere que
ésta puede ser X1 o X2 dependiendo de la perspectiva de la rotación.
Gráfico de superficie 3D
Ex
Esc
Raz Ded Raz Ind
0.0
10.0
2.0
10.0
0.0
10.0
Dr. Temístocles Muñoz López56
Representaciones Gráficas
Recuerde que la regresión múltiple asume que esta superficie es una superficie
perfectamente plana. Por lo tanto, el diagrama superficial le permite precisar
visualmente si la regresión múltiple es apropiada.
Los diagramas de superficie son muy útiles en la exploración de los datos, sobre
todo haciendo rotar el diagrama con las opciones del programa tanto en NCSS
como en Statistica. Después de rotar la figura en tres dimensiones el poder
explicativo del investigador se incrementa, pero desafortunadamente muchas
veces no es posible expresar la explicación en una sola perspectiva de la figura
dentro del informe de investigación, por lo cual se requiere seleccionar la mejor
vista.
La Estructura de los datos
El diagrama de superficie se construye a partir de tres variables. Las variables
(independientes) X1 y X2 se muestran en los ejes horizontales. La variable de Y
se muestra a lo largo del eje vertical. Observe que las tres variables son
numéricas.
Estilos del Diagrama de superficie
Scatter Plot
Ex
Esc
Raz Ded Raz Ind
0.0
10.0
2.0
10.0
0.0 10.0
Dr. Temístocles Muñoz López57
Representaciones Gráficas
La siguiente gráfica está elaborada con Statistica, que además permite la rotación
dinámica.
Abajo se muestran más ejemplos de variantes en los diagramas, que son útiles
para analizar los datos, manipulando el diseño y la rotación.
Dr. Temístocles Muñoz López58
Representaciones Gráficas
X. DIAGRAMAS DE VIOLÍN
Introducción
El Diagrama de Violín, como el diagrama de cajas, es útil para exhibir la media y la
distribución de un sistema de datos. Varios diagramas de caja se pueden exhibir
en anchuras distintas para permitir que usted compare el promedio y la extensión
de varios grupos.
La densidad del trazo en el histograma es útil para exhibir la distribución de los
datos. Desafortunadamente, es difícil comparar varios rastros de densidad
mostrando anchuras. Aún así, se considera una tarea común comparar las
distribuciones de varias agrupaciones de datos. Se ha inventado un nuevo
diagrama que llamamos el diagrama del violín. Este diagrama es un híbrido de la
densidad del trazo y del diagrama de cajas que permite que usted compare varias
distribuciones rápidamente.
Dr. Temístocles Muñoz López59
Representaciones Gráficas
En un diagrama de cajas los datos se mostrarían de la siguiente manera:
5.0
26.7
48.3
70.0
PetalLength
Box Plot
Variables
Am
ount
En tanto que en un histograma con alta densidad de trazo se presentarían así:
0.0
26.7
53.3
80.0
0.0 23.3 46.7 70.0
Histogram
PetalLength
Count
La combinación en los diagramas de violín
El diagrama del violín se hace combinando una forma de caja para trazar con dos
anchuras en proporción a la densidad vertical. Una densidad del trazo se extiende
a la izquierda mientras que la otra se extiende a la derecha. No hay diferencia en
estos rastros de densidad con excepción de la dirección a la cual son extendidos.
Ponemos dos rastros de la densidad en el diagrama para agregar la simetría, que
hace mucho más fácil comparar las agrupaciones. El diagrama del violín destaca
Dr. Temístocles Muñoz López60
Representaciones Gráficas
los picos y los valles de una distribución de variables. Cambiamos el diagrama de
cajas levemente demostrando el punto medio como círculo, hicimos esto de modo
que las comparaciones de los puntos medios pudieran ser hechas rápidamente.
Llamamos a esto un diagrama del violín porque uno de los primeros juegos de
datos que trabajamos tenía el aspecto de un violín. Usted lo encontrará así:
0.0
23.3
46.7
70.0
PetalLength
Violin Plot
Variables
Am
ount
Si usted compara este diagrama con la densidad del trazo y de la caja con los
mismos datos, notará que aunque el diagrama de cajas es útil en muchas
situaciones, no representan los datos que se arraciman (multimodales). Por otra
parte, aunque la densidad del trazo demuestra la distribución de los datos, es
difícil ver la media y su dispersión. La respuesta obvia a estos defectos es
combinar los dos diagramas.
Diagrama de violín al 10% del trazo de los datos:
Dr. Temístocles Muñoz López61
Quartil superior
Mediana
Quartil inferior
Densidad de trazo
Representaciones Gráficas
0.0
23.3
46.7
70.0
SepalLength SepalWidth PetalLength PetalWidth
Violin Plot
Variables
Am
ount
Diagrama de violín al 30% del trazo de los datos:
0.0
23.3
46.7
70.0
SepalLength SepalWidth PetalLength PetalWidth
Violin Plot
Variables
Am
ount
El ejemplo siguiente demuestra los diagramas de violín de las cuatro variables en
datos del diagrama de Fisher. Observe cómo pueden comparar fácilmente los
puntos medios, las longitudes de la caja (la extensión), y los patrones de
distribución de los datos. En este ejemplo, note que las dos variables de petal
(pétalo) demuestran dos picos (bimodal) mientras que las dos variables sepal
(sépalo) son unimodales (un pico). Hay varias opciones que le dejarán ajustar este
diagrama a sus necesidades.
Dr. Temístocles Muñoz López62
Representaciones Gráficas
Estructura de datos
El diagrama del violín se construye de una o más variables. Una segunda variable
se puede utilizar para dividir la primera variable en grupos (Ej., categoría de edad
o género). En este caso, un diagrama del violín se exhibe para cada grupo. No se
solicitan otros requerimientos en los datos de entrada.
XI. CARTAS DE PARETO
Introducción
La descripción de la de las Gráficas de Pareto un economista italiano (Vilfredo
Pareto 1848-1923), notaron una gran desigualdad en la distribución del ingreso.
Algunas pocas personas poseían la mayoría del ingreso. J. M. Juran encontró que
este mismo fenómeno del “vital de pocos” y “el trivial muchos” aplicado a muchas
áreas del proceso estadístico económico. Le acreditan a él acuñar los términos de
la gráfica de Pareto y análisis de Pareto para representar este fenómeno.
En el control de calidad el análisis de Pareto refiere la tendencia al acumulamiento
de los problemas de calidad en unas pocas fuentes posibles del total. Por lo tanto,
aislando y corrigiendo las áreas problemáticas principales, usted obtiene el mayor
aumento de calidad.
La gráfica de Pareto es una representación gráfica que acentúa el principio de
Pareto usando un gráfico de barra en el cual las barras se arreglen en una
magnitud que disminuye. Los programas estadísticos proporcionan diversos
estilos de la gráfica de Pareto, así como un informe numérico.
Muestra el diagrama de una gráfica de Pareto
La gráfica de Pareto siguiente representa el número de tablero-pies de madera
defectuosos (en centenas) a partir de diez diversos aserraderos. Note que tres
Dr. Temístocles Muñoz López63
Representaciones Gráficas
aserraderos explican el casi 80% del producto defectuoso. Obviamente, los
esfuerzos se deben concentrar en corregir defectos en estos tres aserraderos.
0.00
15.00
30.00
45.00
60.00
C I G D E A J F B H
Pareto Chart of FEET
Label
FE
ET
Estructura de datos
La tabla 37.1 muestra los datos para la gráfica antedicha de Pareto. Da el número
de tablero-pies defectuosos (en 100s) a partir de diez diversos aserraderos
(etiquetados A - J).
QATEST, base de Datos Pareto
aserraderos Pies defectuososA 6B 2C 57D 13E 7F 3G 36H 1I 42J 4
XII. AGRUPAMIENTOS JERÁRQUICOS
Introducción
Dr. Temístocles Muñoz López64
Representaciones Gráficas
Breve descripción
Los algoritmos de agrupamientos jerárquicos construyen una jerarquía de racimos
que se exhiben comúnmente como un diagrama de árbol llamado Dendrograma.
Comienzan con cada objeto (casos o variables) en un racimo separado. En cada
paso, los dos racimos que son más similares se ensamblan en un solo racimo
nuevo. Una vez que están fundidos los objetos nunca se separan. Los ocho
métodos que están disponibles representan ocho métodos para definir la
semejanza entre los racimos.
Suponga que deseamos agrupar en racimos los datos bivariados mostrados en el
siguiente diagrama de dispersión. En este caso, el agrupamiento se puede percibir
visualmente. Los datos tienen tres racimos y dos casos aislados, 6 y 13.
0.0
5.3
10.7
16.0
0.0 6.7 13.3 20.0
1
2
3
4
5
6
7
8
9
10
11
12
13
141516
171819
202122
Red vs Blue
Red
Blu
e
Variables
Lo que sigue es correr un dendrograma de los resultados de estos datos con el
algoritmo que arracima el promedio del grupo. El eje horizontal del dendrograma
(rama) representa la distancia o la disimilitud entre los racimos. El eje vertical
representa los objetos y los racimos que comprende cada rama. El dendrograma
es bastante simple de leer.
Dr. Temístocles Muñoz López65
Representaciones Gráficas
2.00 1.50 1.00 0.50 0.00
Dendrogram
Dissimilarity
13245136141517181619202122781091112Row
Recuerde que nuestro interés principal consiste en semejanza y agrupamiento.
Cada ensamble (fusión) de dos racimos es representado en el gráfico al partir una
línea horizontal en otras dos líneas horizontales (ramas). La posición horizontal de
la fractura, mostrada por la barra vertical corta, da la distancia (desemejanza)
entre los dos racimos.
Con este dendrograma puede ver los tres racimos como tres ramas que ocupan
una distancia horizontal casi igual. Los dos outliers, 6 y 13, están fundidos algo
arbitrariamente adentro en distancias mucho más altas. Ésta es la lectura. En este
ejemplo podemos comparar nuestra lectura con un diagrama real de los datos.
Desafortunadamente, esto generalmente no será posible si nuestros datos
consisten en más de dos variables.
XIII. LAS GRÁFICAS DE BARRAS DE ERROR
Introducción
Dr. Temístocles Muñoz López66
Representaciones Gráficas
Propósitos generales y descripción
Las gráficas de barra del error exhiben las líneas de medias y los errores estándar
(o las desviaciones estándar). Los siguientes son ejemplos de los tipos de gráficas
producidas por este procedimiento.
100000.0
150000.0
200000.0
250000.0
300000.0
1 2 3 4
Error Bar Plot
Bedrooms
Price
State
NevVir
100000.0
150000.0
200000.0
250000.0
300000.0
1 2 3 4
Error Bar Plot
Bedrooms
Price
State
NevVir
Los valores perdidos
Dr. Temístocles Muñoz López67
Representaciones Gráficas
Los valores perdidos se quitan sobre la base de caso-por-caso (casewise). Es
decir, un valor que falta en una variable ignora los casos de otras variables en la
misma fila.
Estructura de datos
Cada fila de datos debe contener por lo menos una variable numérica de
respuesta. También pueden ser señaladas hasta dos variables categóricas y hasta
cinco variables clasificatorias. Se produce una gráfica separada para cada valor
único de las variables clasificatorias.
Lo que sigue es un ejemplo numérico de las gráficas anteriores con variables
categóricas y dos de una sola respuesta. Los datos de abajo dan el estado, el
precio de venta, y el número de los dormitorios para 150 características
residenciales vendidas durante cuatro meses en dos estados. Solamente se
muestran las primeros 8 de las 150 observaciones.
Porción de los datos de venta de las propiedades
State Price BedroomsNev 260000 2Nev 66900 3Vir 127900 2Nev 181900 3Nev 262100 2Nev 967500 2Nev 167200 2Nev 395700 2
XIV. MATRIZ REJILLA DE PUNTOS
Introducción
El diagrama de rejilla (matriz) de puntos es un tipo de diagrama del contorno
convertido para exhibir tres variables. Las primeras dos variables se exhiben como
en el diagrama de dispersión en los ejes verticales y horizontales. La tercera
Dr. Temístocles Muñoz López68
Representaciones Gráficas
variable se muestra por el color del bloque o por un símbolo que es codificado de
abajo hacia arriba.
Las variantes pueden ser seleccionadas en muy distintas formas para facilitar la
lectura de los datos.
15.0
22.5
30.0
37.5
45.0
40.0 50.0 60.0 70.0 80.0
Grid Plot of PetalLength
SepalLength
SepalW
idth
PetalLength
A 3.9B 11.7C 19.4D 27.2E 35.0F 42.8G 50.6H 58.3I 66.1
Estructura de datos
El diagrama de rejilla se construye a partir de tres variables. Las variables de X e
Y se muestran en los ejes horizontales y verticales, respectivamente. Se reparte
en ellos la variable Z y sus valores son representados por el símbolo del diagrama
Dr. Temístocles Muñoz López69
Representaciones Gráficas
o el color del bloque (véase los ejemplos arriba). Observe que las tres variables
deben ser numéricas.
Las opciones
Consulte la sección de Opciones donde se describen las opciones disponibles en
este procedimiento.
Variable (X, Y, Z)
Cada caja especifica la variable numérica que es utilizada para construir el
diagrama. La variable de X se exhibe a lo largo del eje horizontal, la variable de Y
a lo largo del eje vertical, y se muestra la variable de Z usando las capas del
contorno.
Mínimo y máximo (X, Y, Z)
Son los valores mínimos y máximos a lo largo de cada eje. Debe tener el cuidado
de utilizarlos dado que pueden distorsionar el diagrama.
Rebanadas (X, Y, Z)
Es el número de las divisiones (puntos de rejilla) a lo largo de cada eje. El número
de rebanadas a lo largo del eje de z es el número de las líneas del contorno. Se
utiliza solamente si la caja de los valores del contorno (z) se deja en blanco.
Decimales de Z
El número de decimales a mostrar en los números de referencia de la leyenda.
El estilo del diagrama
Especifica el método usado para exhibir el valor de la variable de Z.
Bloques
Dr. Temístocles Muñoz López70
Representaciones Gráficas
Los valores de la variable de Z se exhiben como bloques coloreados.
Símbolos con un color
Los valores de la variable de Z son todas las letras con el mismo color. Cada letra
representa una gama de valores.
En el caso de los símbolos:
15.0
22.5
30.0
37.5
45.0
40.0 50.0 60.0 70.0 80.0
Grid Plot of PetalLength
SepalLength
SepalW
idth
B
HF
H
G
B
G
F
G
B
F
G
G
F
H
G
HC
F
G
I
G H
I
F
B
GGF
F
CG
EG
GB
B
F
I
BH
C
F
BI
G
C
F
E
HB
C
G
C
CB
HH
B
BC
F
GB
B
F
F
CB
F
E
B
B
H
H
GF
H
B
B
HH
GH
E
F
F
B
B
I
G
C
FF
FB
B
E
E
F
BB
H
FH
F
BB
G
F
I
H
B G
F
B
F
G
GF
D
FH
G
B
BH
G
GEG
G
H
F
C
B
BG
CB
F
FG
C
BB
GG
H
B
PetalLength
A 3.9B 11.7C 19.4D 27.2E 35.0F 42.8G 50.6H 58.3I 66.1
Símbolos de colores múltiples
Dr. Temístocles Muñoz López71
Representaciones Gráficas
Los valores de la variable de Z se exhiben como letras que tienen diversos
colores. Cada letra representa una gama de valores.
Dr. Temístocles Muñoz López72
Representaciones Gráficas
APARTADO C. TÓPICOS SELECTOS DE TÉCNICAS GRÁFICAS ANALÍTICAS
Técnicas Representativas de Visualización basadas en Statistica
XV. GRÁFICAS CATEGORIZADAS
Uno de los métodos analíticos generales más importantes, y también de gran
alcance, implica el dividir ("partir") los patrones de datos en categorías de
subjuegos con la finalidad comparar los subconjuntos que resultan. Esta técnica
común se conoce bajo una gran variedad de términos (tales como subdivisión,
agrupamiento, categorización, partir, rebanar, perforar, o condicionar) y se utiliza
en análisis exploratorios de datos y las pruebas de hipótesis. Por ejemplo: Una
relación positiva entre la edad y el riesgo de un ataque del corazón puede ser
diferente en los varones y las hembras (puede ser más fuerte en varones). Una
relación prometedora entre tomar una droga y una disminución del nivel del
colesterol puede estar presente en mujeres con una presión arterial baja y en 30 a
40 años. Los índices de capacidad del proceso, o histogramas de capacidad,
pueden ser diferentes por los períodos del tiempo supervisados por diferentes
operadores. Las pendientes de la regresión pueden ser diferentes en diferentes
grupos experimentales.
Hay muchas técnicas de cómputo que se centran en agrupar y que se diseñan
para cuantificar las diferencias que revelará el agrupamiento (Ej.,
ANOVA/MANOVA). Sin embargo, las técnicas gráficas (tales como los gráficos
categorizados discutidos en esta sección) ofrecen ventajas únicas que no se
pueden sustituir por ningún método de cómputo por si mismo, y pueden revelar los
Dr. Temístocles Muñoz López73
Representaciones Gráficas
patrones que no pueden ser cuantificados fácilmente (Ej., las interacciones, las
excepciones, las anomalías complejas), y proporcionan las perspectivas analíticas
multidimensionales, globales únicas, para explorar o "explotar" los datos.
¿Qué son los Gráficos Categorizados?
Se llaman gráficos categorizados (el término fue usado primero en software de
STATISTICA por StatSoft en 1990; también recientemente llamados Gráficos de
Trellis, por Becker, Cleveland, y Clark, en los laboratorios de Bell) a la serie de 2D,
3D, gráficos ternarios, o del nD (tales como los histogramas, diagramas de puntos,
diagramas de líneas, diagrama de superficie, los diagramas de puntos ternarios,
etc.), seleccionados por una variable específica (es decir, grupo o subconjunto de
casos), para seguir el ejemplo gráfico de abajo, de encuestados por la variable de
Nueva York, de Chicago, de Dallas, del etc. Estos gráficos "compuestos" se ponen
secuencialmente en una presentación, permitiendo comparaciones entre los
patrones de los datos mostrados en los gráficos, para cada uno de los grupos
solicitados (Ej., Ciudades).
Se puede utilizar una gran variedad de métodos para seleccionar los
subconjuntos; el más simple de ellos es utilizando una variable categórica (Ej., una
variable Ciudad, con tres valores Nueva York, Chicago, y Dallas). Por ejemplo, el
siguiente gráfico muestra los histogramas de una variable representando los
niveles de stress en cada una de las tres Ciudades.
Uno podría concluir que los datos
sugieren que la gente que vive en
Dallas es menos probable que reporte
estar tensionada, mientras que los
patrones (distribuciones) de la tensión
que reportan en Nueva York y Chicago
son absolutamente similares entre sí.
Dr. Temístocles Muñoz López74
Representaciones Gráficas
Los gráficos categorizados en algunos sistemas de software (Ej., en STATISTICA)
también apoyan las clasificaciones de dos vías o de multivía, donde no hay un
criterio único (Ej., Ciudad) sino dos o más criterios (Ej., Ciudad y época del día) se
utilizan para crear los subconjuntos. Los gráficos categorizados de dos vías se
pueden pensar como " gráficos de tabulaciones cruzadas" donde cada
componente gráfico representa una sección representativa de un nivel de una
variable agrupadora (Ej., Ciudad) y de un nivel de la otra variable agrupadora (Ej.,
tiempo).
La adición de este segundo factor
revela que los patrones de la tensión
que reportan en Nueva York y Chicago
son realmente diferentes cuando se
toma en consideración la hora en que
se hizo la pregunta, mientras que el
factor Tiempo diferencia poco en
Dallas.
Gráficos categorizados contra gráficos de matriz. Los gráficos de matriz
también producen las exhibiciones que contienen gráficos de componentes
múltiples; sin embargo, cada uno de esos gráficos de componentes se basa (o
puede basarse) en el mismo juego de casos, y los gráficos se generan para todas
las combinaciones de variables a partir de una o dos listas. Los gráficos
categorizados requieren una selección de las variables que normalmente deberían
ser seleccionadas para los gráficos no-categorizados del tipo respectivo (Ej., dos
variables para un diagrama de puntos). Sin embargo, en los diagramas
categorizados también necesita especificar al menos una variable agrupadora (o
algunos criterios que se utilizarán para clasificar las observaciones en las
categorías) que contenga la información sobre calidad de miembro del grupo en
cada caso (Ej., Chicago, Dallas). Esa variable agrupadora no será incluida en el
gráfico directamente (es decir, no será trazada) pero servirá como criterio para
Dr. Temístocles Muñoz López75
Representaciones Gráficas
dividir todos los casos analizados en gráficos separados. Según lo ilustrado arriba,
un gráfico será creado para cada grupo (categoría) identificado por la variable
agrupadora.
Escalamiento común contra Escalamiento independiente. Cada gráfico
individual de la categoría se
puede escalar según su propia
gama de los valores
(escalamiento independiente), o
como abajo, todos los gráficos se
pueden escalar a una escala
común de par en par
suficientemente amplia para
acomodar todos los valores en
todas las categorías de gráficos.
El escalamiento común permite
que el analista haga
comparaciones de rangos y
distribuciones de valores entre
categorías. Sin embargo, si los
rangos de valores en las
categorías del gráfico son
considerablemente diferentes
(causando una escala común
muy ancha), entonces algunos de
los gráficos pueden ser difíciles de examinar. El uso del escalamiento
independiente puede hacer más fácil marcar tendencias y patrones específicos
dentro de categorías, pero puede ser más difícil hacer comparaciones de rangos
de valores entre categorías.
Métodos de Categorización
Dr. Temístocles Muñoz López76
Representaciones Gráficas
Hay cinco métodos generales de clasificación de valores y serán repasados
brevemente en esta sección: Modo de número entero, de categorías, de límites,
de códigos, y de subconjuntos múltiples. Observe que los mismos métodos de
clasificación se pueden utilizar para categorizar casos en gráficos componentes y
para categorizar casos dentro de gráficos componentes (Ej., en histogramas o
diagramas de la caja).
Modo de Número Entero. Cuando
usted utiliza el modo de número entero,
los valores del número entero de la
variable agrupadora seleccionada
serán utilizados para definir las
categorías, y será creado un gráfico
para todos los casos que pertenezcan a
cada categoría (definida por esos
valores del número entero). Si la variable agrupadora seleccionada contiene
valores de no-número entero, el software truncará generalmente cada valor
encontrado de la variable agrupadora seleccionada a un valor de número entero.
Categorías. Con este modo de
clasificación, usted especifica el número
de las categorías que desea utilizar. El
software dividirá el rango entero de
valores de la variable agrupadora
seleccionada (de mínimo a máximo) en
el número solicitado de intervalos de
igual longitud.
Límites. El método de los límites también creará la clasificación de intervalo, sin
embargo, los intervalos pueden estar (Ej.) de anchura desigual arbitraria según lo
definido por los límites solicitados del intervalo (por ejemplo, "menos que -10, "
Dr. Temístocles Muñoz López77
Representaciones Gráficas
"mayor que o igual a -10 pero menos de 0, " "mayor que o igual a 0 pero menos de
10, " y "igual o mayor que a 10").
Códigos. Utilice este método si la variable agrupadora seleccionada contiene
"códigos" (es decir, valores significativos específicos, tales como varón, hembra)
de los cuales desea especificar las categorías.
Subconjuntos múltiples. Este método
permite que usted personalice las
categorías, y le permite utilizar más de
una variable para definir la categoría. Es
decir las clasificaciones basadas en
definiciones múltiples del subconjunto de
categorías pueden no representar
Dr. Temístocles Muñoz López78
Representaciones Gráficas
distribuciones de variables (individuales) y distribuciones de frecuencias
específicas de "eventos" específicos, definidos por combinaciones particulares de
valores de varias variables (y definidos por las condiciones que pueden implicar
cualquier número de variables de subjuegos). Por ejemplo, usted puede
especificar seis categorías basadas en combinaciones del género, de la edad, y
del empleo de tres variables.
Histogramas
En general, los histogramas se utilizan para examinar distribuciones de frecuencia
de valores de las variables. Por ejemplo, las demostraciones del diagrama de la
distribución de frecuencia en que los valores, o los rangos específicos de valores
de la variable examinada son los más frecuentes, qué tan diferentes son los
valores, si la mayoría de las observaciones están concentradas alrededor de la
media, si la distribución es simétrica o sesgada, si es multimodal (es decir, si tiene
dos o más picos) o unimodal, etc. Los histogramas son también útiles para evaluar
la semejanza de una distribución observada con distribuciones teóricas o
previstas.
Los histogramas categorizados permiten ser analizados por una o más variables
categóricas, o por cualquiera de uno o más sistemas de reglas de clasificación
lógica (véase los métodos de la clasificación). Hay dos razones importantes por
las que son de interés las distribuciones de frecuencia.
Uno puede aprender sobre la naturaleza de la variable examinada a partir de
la forma de distribución (Ej., una distribución bimodal puede sugerir que la
muestra no sea homogénea, y no consista de las observaciones que
pertenecen a dos poblaciones que se distribuyen más o menos
normalmente).
Mucha de la estadística se basa en asunciones sobre las distribuciones de las
variables analizadas; y los histogramas lo ayudan a uno a probar si esas
Dr. Temístocles Muñoz López79
Representaciones Gráficas
asunciones están resueltas. A menudo, el primer paso en el análisis de un
nuevo subjuego es analizar todas las variables con histogramas.
Histogramas contra rompimientos analíticos. Los histogramas categorizados
proporcionan la información similar a los rompimientos analíticos (Ej., medio, punto
medio, mínimo, máximo, diferenciación de valores, etc.; vea el capítulo de
Estadística Básica y Tablas). Aunque la estadística descriptiva (numérica)
específica es más fácil de leer dentro una tabla, la forma total y las características
descriptivas globales de una distribución son mucho más fáciles de examinar en
un gráfico. Por otra parte, el gráfico proporciona la información cualitativa sobre la
distribución que no se puede representar completamente por un solo índice. Por
ejemplo, la distribución sesgada total del ingreso puede indicar que la mayoría de
gente tiene un ingreso que sea mucho más cercano al mínimo que al máximo del
rango del ingreso. Por otra parte, cuando es analizado por género y el fondo
étnico, esta característica de la distribución de ingresos se puede encontrar más
pronunciada en ciertos subgrupos.
Aunque esta información será contenida en el índice de oblicuidad (para cada
subgrupo), cuando está presentado en la forma gráfica de un histograma, la
información generalmente se reconoce y se recuerda más fácilmente. El
histograma puede también revelar el "impacto" y ello puede representar hechos
importantes sobre la estratificación social específica de la población, o de las
anomalías investigadas en la distribución del ingreso en un grupo particular,
causadas por una reforma fiscal reciente.
Histogramas y diagramas de puntos categorizados. Un uso útil de los métodos
de la clasificación para las variables continuas es representar las relaciones
simultáneas entre tres variables. Se muestra abajo un diagrama de puntos para la
carga 1 de dos variables y la carga 2.
Dr. Temístocles Muñoz López80
Representaciones Gráficas
Ahora suponga que usted quisiera agregar una tercera variable (salida) y examinar
cómo esta se distribuye en diferentes niveles de la distribución común de la carga
1 y de la carga 2. El gráfico siguiente será producido:
En este gráfico, la carga 1 y la carga 2 están ambas categorizadas en 5 intervalos,
y se computa dentro de cada combinación de intervalos la distribución para la
variable de salida. Observe que el "cuadro" (paralelogramo) incluye
Dr. Temístocles Muñoz López81
Representaciones Gráficas
aproximadamente las mismas observaciones (casos) de ambos gráficos
mostrados arriba.
Diagramas de puntos
En general, se utilizan dos diagramas de puntos bidimensionales para visualizar
las relaciones entre dos variables X e Y (Ej., peso y altura). En diagramas de
puntos los puntos de referencias individuales son representados por los puntos
marcados en el espacio bidimensional, donde los ejes representan las variables.
Las dos coordenadas (X e Y) que determinan la localización de cada punto
corresponden a sus valores específicos en las dos variables. Si las dos variables
están fuertemente relacionadas, entonces los puntos de referencias toman una
forma sistemática (Ej., una línea recta o una curva clara). Si las variables no están
relacionadas, entonces los puntos forman una "nube" redondeada.
La opción categorizada del diagrama de puntos permite que usted produzca los
diagramas de puntos categorizados por una o más variables. Vía el método de
múltiples subjuegos (véase los métodos de la clasificación), usted puede también
categorizar el diagrama de puntos basado en las condiciones lógicas de la
selección que definen cada categoría o grupo de observaciones.
Los diagramas de puntos categorizados ofrecen una técnica exploratoria y
analítica de gran alcance para investigar relaciones entre dos o más variables
dentro de diferentes subgrupos.
Homogeneidad de las distribuciones bivariantes (formas de relaciones). El
diagrama de puntos se utiliza típicamente para identificar la naturaleza de
relaciones entre dos variables (Ej., la presión arterial y colesterol), porque pueden
proporcionar mucho más información que un coeficiente de correlación.
Por ejemplo, una carencia de la homogeneidad en la muestra de la cual era
calculada una correlación, puede predisponer el valor de la correlación. Imagine
un caso donde un coeficiente de correlación se calcula de los puntos de
Dr. Temístocles Muñoz López82
Representaciones Gráficas
referencias que vienen a partir de dos
diferentes grupos experimentales,
pero este hecho fue ignorado cuando
la correlación era calculada. Suponga
que la manipulación experimental en
uno de los grupos aumentó los valores
de ambas variables correlacionadas, y
los datos de cada grupo forman así
una "nube" distintiva; en el diagrama de puntos (según lo mostrado en la
ilustración).
En este ejemplo, la alta correlación es enteramente debida al arreglo de los dos
grupos, y no representa la "verdadera" relación entre las dos variables, que es
prácticamente igual a 0 (como se podría considerar con una mirada a cada grupo
por separado).
Si usted sospecha que tal patrón puede existir en sus datos y usted sabe cómo
identificar el "subjuego" posible de datos, entonces producir un diagrama de
puntos categorizado como el anterior puede dar un cuadro más exacto de la
fuerza de la relación entre la variable de X y de Y, dentro de cada grupo (es decir,
después de controlar cada miembro del grupo).
Dr. Temístocles Muñoz López83
Representaciones Gráficas
Relaciones Curvilíneas. La curvilinearidad es otro aspecto de las relaciones entre
las variables que se pueden examinar en diagramas de puntos. No hay pruebas
fáciles o automáticas a utilizar para medir relaciones curvilíneas entre las
variables: El coeficiente estándar de Pearson r mide por si mismo relaciones
lineares, pero algunas correlaciones no paramétricas tales como la r de Spearman
pueden medir relaciones curvilíneas, pero no las relaciones no-monótonas. El
examinar diagramas de puntos permite que uno identifique la forma de las
relaciones, para poder elegir más adelante una transformación apropiada de los
datos al "enderezar" los datos o elegir una ecuación no lineal apropiada de la
estimación a que se ajustará.
Para más información, vea los capítulos en estadística básica, no paramétrica, las
distribuciones, la regresión múltiple, y la valoración no lineal en Statistica.
Gráficos de Probabilidad
Hay tres tipos de diagramas categorizados de probabilidad, Normales, Mitad-
Normales, y Tendenciales. Los diagramas normales de probabilidad proporcionan
una manera rápida de examinar visualmente en qué medida el patrón de datos
sigue una distribución normal.
Uno puede examinar, vía diagramas categorizados de probabilidad, cómo la
distribución de una variable sigue de cerca la distribución normal en diferentes
subgrupos.
Dr. Temístocles Muñoz López84
Representaciones Gráficas
Los diagramas normales categorizados de probabilidad proporcionan una
herramienta eficiente para examinar el aspecto de la normalidad en la
homogeneidad del grupo.
Diagramas Quantil-Quantil
El diagrama categorizado de Quantil-Quantil (o Q-Q) es útil para encontrar la
distribución más apropiada dentro de una familia de distribuciones.
Dr. Temístocles Muñoz López85
Representaciones Gráficas
Con los diagramas categorizados de Q-Q, se produce una serie de diagramas del
Quantil-Quantil (o Q-Q) para cada categoría de los casos identificados por las
variables de la categoría de X o de X y de Y (o identificados por los criterios
múltiples del subconjunto, vea los métodos de la clasificación). Los ejemplos de
las distribuciones que se utilizan para los diagramas de Q-Q son la Distribución
Exponencial, las Distribuciones Extremas, Normal, de Rayleigh, Beta, Gammas,
de Log normal, y de Weibull.
Diagramas Probabilidad-Probabilidad
El diagrama categorizado de Probabilidad-Probabilidad (o los P-P) es útil para
precisar que tan bien está ajustada
una distribución teórica específica
de los datos observados. Este tipo
de gráfico incluye una serie de
diagramas de la Probabilidad-
Probabilidad (o los P-P), uno para
cada categoría de los casos
identificados por las variables de la
categoría de X o de X y de Y (o
Dr. Temístocles Muñoz López86
Representaciones Gráficas
identificado por los criterios múltiples del subconjunto, vea los Métodos de
Clasificación).
En los diagramas P-P, la función de distribución acumulativa observada (la
proporción de los valores en que no falta x) se traza contra una función de
distribución acumulativa teórica para precisar el ajuste de la distribución teórica a
los datos observados. Si todos los puntos en este diagrama caen sobre una línea
de la diagonal (con la intercepción 0 y la pendiente 1), usted puede concluir que la
distribución acumulativa teórica se aproxima adecuadamente la distribución
observada.
Si los puntos de referencias no caen todos en la línea diagonal, usted puede
utilizar este diagrama para precisar visualmente donde los datos siguen y no
siguen la distribución (Ej., si los puntos forman una forma de S a lo largo de la
línea diagonal, los datos pueden necesitar ser transformados después para
ajustados al patrón deseado de la distribución).
Diagramas de Línea
En los diagramas de líneas los puntos
de referencias individuales son
conectados por una línea. El diagrama
de líneas proporciona una manera
simple de presentar visualmente una
secuencia de muchos valores (Ej.,
cotización en la bolsa sobre un
número de días). El gráfico de línea
categorizada de los diagramas es útil cuando uno desea la visión de tales datos
analizados (categorizados) por una variable agrupadora (Ej., el cierre de acciones
cotiza el lunes, martes, el etc.) o algunos otros criterios lógicos que implican una o
más variables (Ej., el cierre cotiza solo para los días cuando hay otras dos
Dr. Temístocles Muñoz López87
Representaciones Gráficas
acciones y el índice de Dow Jones va para arriba, contra el resto de cierres; vea
los Métodos de Clasificación).
Diagramas de Caja
En los diagramas de la caja (término primero usado por Tukey, 1970), los rangos
de valores de una variable seleccionada (o las variables) se trazan por separado
para los grupos de casos definidos con valores de hasta tres variables
(agrupadoras) categóricas, o según lo definido por las categorías de Subjuegos
Múltiples.
La tendencia central (Ej.,
mediana o media), y la del
rango o la variación
estadística (Ej., cuartiles,
errores estándar, o
desviaciones estándar) se
computa para cada grupo
de casos, y los valores
seleccionados se
presentan en uno de cinco
estilos (filamentos truncados de la caja, filamentos truncados, cajas, columnas, o
cierre Alto-Bajo). Los puntos de referencia del afloramiento pueden también ser
trazados (véase las secciones en casos atípicos y extremos).
Por ejemplo, en el gráfico siguiente, los casos atípicos extremos (en este caso, los
puntos mayores o menos de 1.5 veces el rango interquartil) indican
particularmente un "desafortunado" extremo en una combinación que sería de otra
manera casi perfecta de factores:
Sin embargo, en el gráfico siguiente, no hay casos atípicos o valores extremos
evidentes.
Dr. Temístocles Muñoz López88
Representaciones Gráficas
Hay dos usos comunes para los diagramas de caja: (a) demostrar rangos de los
valores para los ítems, los casos o las muestras individuales (Ej., un diagrama
típico de MIN-MAX para las existencias o los productos o los diagramas de datos
agregados con los rangos), y (b) demostrando la variación de conteos en grupos o
muestras individuales (Ej., la caja y el filamento truncado presentan la mediana
para cada muestra como un punto dentro de la caja, los errores estándar en la
caja, y las desviaciones estándar alrededor de la mediana como una caja más
estrecha, o un par de "filamentos truncados").
La caja, al mostrar la variación de conteos permite que uno evalúe rápidamente e
"intuitivamente con imaginación" la fuerza de la relación entre la variable
agrupadora y la variable dependiente. Específicamente, si se asume que la
variable dependiente está distribuida normalmente, y sabiendo qué proporción de
observaciones baja, por ejemplo, dentro de desviaciones estándar ±1 o ±2 de la
media (véase los conceptos elementales), uno puede evaluar fácilmente los
resultados de un experimento y decir que, por ejemplo, las conteos en el cerca de
95% de casos en el grupo experimental 1 pertenecen a una diversa gama que
conteos en cerca del 95% de los casos en el grupo 2.
Dr. Temístocles Muñoz López89
Representaciones Gráficas
Además, pueden ser trazadas las Medias Truncadas supuestas (este término
primero fue utilizado por Tukey, 1962) excluyendo un porcentaje especificado de
casos de los extremos (es decir, las colas) de la distribución de casos.
Gráficas de Pastel
La gráfica de pastel es uno de los formatos más comunes usados para representar
proporciones o valores de variables. Este permite que usted produzca las gráficas
de pastel analizadas por una o más variables (Ej., agrupando variables tales como
género) o categorizadas según algunas condiciones lógicas de selección que
identifiquen subconjuntos múltiples (véase los métodos de la clasificación).
Para los propósitos de esta
discusión, las gráficas de pastel
categorizadas serán interpretadas
siempre como Gráficas de pastel
de frecuencias (en comparación
con gráficas de pastel de los
datos). Este tipo de gráfica de
pastel (a veces llamada gráfica de
pastel de frecuencias) interpreta
los datos como un histograma. Categoriza todos los valores de la variable que
sigue la técnica de la clasificación seleccionada, y después exhibe las frecuencias
relativas como rebanadas de pastel de tamaños proporcionales. Así, ofrecen un
método alternativo para exhibir datos del histograma de frecuencias (véase la
sección en histogramas categorizados).
Pastel-Diagramas de puntos. Otro uso útil de las gráficas de pastel
categorizadas es representar la distribución de las frecuencias relativas de una
variable en cada "ubicación" de la distribución común de otras dos variables. Aquí
está un ejemplo:
Dr. Temístocles Muñoz López90
Representaciones Gráficas
Observe que los pasteles están dibujados en "ubicaciones" donde hay datos. Así,
el gráfico mostrado toma el aspecto de
un diagrama de puntos (de las variables
L1 y L2), con los pasteles individuales
como puntos marcados. Sin embargo,
además de la información contenida en
un diagrama de puntos simple, cada
pastel muestra la distribución relativa de
una tercera variable en la localización
respectiva (es decir, baja, media, y alta calidad).
Diagramas de puntos de datos perdidos por rango
Este gráfico produce una serie de gráficos 2D (uno para cada categoría de los
casos identificados por las variables agrupadoras o por los criterios múltiples del
subconjunto; vea los Métodos de Clasificación) de puntos de referencia que faltan
y/o de "fuera del rango de especificación del usuario" puntos en los cuales usted
puede visualizar el patrón o la distribución de datos que faltan (y/o puntos "fuera
del rango de especificación") dentro de cada subconjunto de los casos (categoría).
Dr. Temístocles Muñoz López91
Representaciones Gráficas
Este gráfico es útil en análisis exploratorio de datos para precisar la distribución
(y/o el "fuera del rango") de datos perdidos, y si los patrones de esos datos
ocurren aleatoriamente.
Diagramas 3D
Este tipo de gráfico permite
que usted produzca los
diagramas de puntos 3D
(diagramas espaciales,
diagramas espectrales,
diagramas de desviación, y
diagramas de trazo), trazos de
contorno, y diagramas de
superficie, para los
subconjuntos de casos
definidos por las categorías especificadas en una variable seleccionada, o las
categorías determinadas por condiciones definidas por el usuario en la selección
de casos (véase los métodos de clasificación). Así, los fines generales de este
diagrama son facilitar comparaciones entre grupos o las categorías, con respecto
a las relaciones entre tres o más variables.
Usos. En general, los gráficos de
3D en los ejes XYZ resumen las
relaciones interactivas entre tres
variables. Las diversas maneras en
las cuales los datos pueden ser
categorizados (en un gráfico
categorizado) permiten que uno
repase esas relaciones
contingentes con un cierto criterio
(Ej., calidad de miembro de grupo).
Dr. Temístocles Muñoz López92
Representaciones Gráficas
Por ejemplo, del diagrama superficial categorizado mostrado al lado, uno puede
concluir que el ajuste del nivel de tolerancia en un aparato no afecta la relación
investigada entre las medidas (Dependiente 1, Dependiente 2, y altura) a menos
que el ajuste sea 3.
El efecto es más sobresaliente cuando usted cambia a la representación del
diagrama del contorno.
Diagramas Ternarios
Un diagrama ternario categorizado se puede utilizar para examinar las relaciones
entre tres o más dimensiones, donde tres de esas dimensiones representan
componentes de una mezcla (es decir, las relaciones entre ellos se obligan de tal
forma que los valores de las tres variables agreguen la misma constante para
cada caso) para cada nivel de una variable agrupadora.
Dr. Temístocles Muñoz López93
Representaciones Gráficas
En diagramas ternarios, los sistemas coordinados triangulares se utilizan para
trazar cuatro (o más) variables (los componentes X, Y, y Z, y las respuestas V1,
V2, etc.) en dos dimensiones (diagramas de puntos o contornos ternarios), o tres
dimensiones (diagramas ternarios de superficie). Para producir gráficos ternarios,
se obliga a las proporciones relativas de cada componente dentro de cada caso a
que se ajusten hasta el mismo valor (Ej., 1).
En un diagrama ternario
categorizado, se produce un
gráfico componente para cada
nivel de la variable
agrupadora (o del subconjunto
de datos definido por el
usuario) y todos los gráficos
componentes se arreglan en
una presentación para permitir
comparaciones entre los
subconjuntos de los datos
(categorías).
Dr. Temístocles Muñoz López94
Representaciones Gráficas
Usos. Un uso típico de este gráfico es cuando la respuesta(s) medida de un
experimento depende de las proporciones relativas de tres componentes (Ej., tres
diferentes productos químicos) que se varíen para precisar una combinación
óptima de esos componentes (Ej., en diseños de la mezcla). Este tipo de gráfico
se puede utilizar también para otros usos, donde las relaciones entre las variables
ajustadas necesitan ser comparadas a través de categorías o de subconjuntos de
datos.
XVI. TÉCNICA DE CEPILLADO
Quizás la más común y primera técnica que se utilizó históricamente de manera
más extensa fue la técnica identificada explícitamente como el análisis exploratorio
de datos gráficos por cepillando, un método interactivo que permite que uno
seleccione, en la presentación en pantalla, los puntos de referencia o los
subconjuntos específicos de datos, y que identifique sus características (Ej.,
comunes), o que examine sus efectos sobre relaciones entre las variables
relevantes (Ej., en matrices del diagrama de puntos), o que identifique casos
atípicos (outliers).
Esas relaciones entre las variables se pueden visualizar por las funciones
ajustadas (Ej., por las líneas 2Ds o las superficies 3D) y sus intervalos de
confianza, así, por ejemplo, uno puede examinar cambios en esas funciones
recíprocamente (temporalmente) quitando o agregando subconjuntos específicos
de datos. Por ejemplo, uno de muchos usos de la técnica de cepillado debe
seleccionar, destacando, en un diagrama de matriz de puntos, todos los puntos de
referencia que pertenezcan a cierta categoría (Ej., un nivel "medio" de ingresos,
observe el subconjunto del componente superior derecho, destacado en el gráfico
de la ilustración de abajo):
Dr. Temístocles Muñoz López95
Representaciones Gráficas
Para examinar cómo esas observaciones específicas contribuyen a las relaciones
entre otras variables en el
mismo subjuego (Ej., la
correlación entre "deuda" y
"activos" en el ejemplo
actual).
Si la facilidad de cepillado
soporta las características
como "cepillado animado"
(véase el ejemplo abajo) o
"función automática de
reajuste", uno puede definir un cepillo dinámico que se moverá sobre las rangos
consecutivas de una variable del criterio (Ej., "ingreso" medido en una escala
continua y no una escala discreta como en la ilustración antedicha), y examinar la
dinámica de la contribución de la variable de criterio y las relaciones entre otras
variables relevantes en el mismo subjuego.
XVII. ALISADO DE DISTRIBUCIONES BIVARIANTES
Los histogramas tridimensionales se utilizan para visualizar tabulaciones cruzadas
de valores en dos variables. Pueden ser considerados para hacer una conjunción
de dos (es decir, univariada) histogramas simples, combinadas de tal forma que
Dr. Temístocles Muñoz López96
Representaciones Gráficas
pueden ser examinadas las frecuencias de co-ocurrencias de valores en las dos
variables. En el formato más común de este gráfico, una barra 3D se dibuja para
cada "celda" en la tabla de la tabulación cruzada, y la altura de la barra representa
la frecuencia de los valores para la celda respectiva de la tabla. Se pueden utilizar
diferentes métodos de clasificación para cada una de las dos variables en las que
se visualiza la distribución bivariante (véase aquí).
Si el software proporciona la
facilidad para alisar, usted puede
ajustar superficies a las
representaciones 3D de los datos
bivariantes de la frecuencia. Así,
cada histograma 3D se puede
transformar en una superficie
alisada. Esta técnica es de
relativamente poca ayuda si está
aplicada a un patrón simple de
datos categorizados (tales como el histograma que fue mostrado arriba).
Dr. Temístocles Muñoz López97
Representaciones Gráficas
Sin embargo, si está aplicado a patrones más complejos de frecuencias, puede
ser una técnica exploratoria valiosa, permitiendo la identificación de regularidades
que son menos evidentes, al examinar las representaciones estándares del
histograma 3D (Ej., vea la superficie sistemática del "patrón de ondas" mostrado
en el histograma alisado de arriba).
XVIII. COMPRESIÓN DE CAPAS
Cuando se utiliza la compresión de capas, el área de trazo del gráfico principal se
reduce de tamaño al espacio, para permitir lugar a los gráficos del margen
derecho superior y lograr la presentación (con un gráfico miniatura en la esquina).
Estos gráficos más
pequeños del margen
representan imágenes
comprimidas vertical y
horizontalmente del
gráfico principal.
En los gráficos 2D la
compresión de capas es
Dr. Temístocles Muñoz López98
Representaciones Gráficas
una técnica exploratoria del análisis de datos que puede facilitar la identificación
de tendencias y de patrones, de otra manera cubiertos en subjuegos de 2
dimensiones. Por ejemplo, en la ilustración siguiente, (basado en un ejemplo
discutido por Cleveland, 1993), puede ser visto que el número de manchas solares
en cada ciclo se decae más lentamente que cuando se levanta en el inicio de cada
ciclo. Esta tendencia no es fácilmente evidente al examinar el diagrama de líneas
estándar; sin embargo, el gráfico comprimido revela el patrón ocultado.
XIX. PROYECCIONES DE JUEGOS DE DATOS 3D
Los diagramas de contorno generados por proyecciones de las superficies
(creadas de los juegos de datos multivariados, típicamente de tres variables) es un
método útil para explorar y examinar analíticamente los datos a partir de las
formas de las superficies.
Con respecto a los diagramas superficiales, pueden ser menos eficaces para
visualizar rápidamente la forma completa de las estructuras de datos 3D,
Dr. Temístocles Muñoz López99
Representaciones Gráficas
sin embargo, su ventaja principal es que permiten el examen preciso y el análisis
de la forma de la superficie (los diagramas de contorno exhiben una serie de
“secciones cruzadas" de la superficie no distorsionadas horizontalmente).
XX. DIAGRAMAS DE ÍCONOS
Los gráficos de íconos representan casos o unidades de observación como
símbolos multidimensionales y ofrecen un poderoso instrumento, aunque no es
fácil utilizarla como técnica exploratoria. La idea general detrás de este método se
capitaliza por la capacidad del investigador, al marcar "automáticamente" las
Dr. Temístocles Muñoz López100
Representaciones Gráficas
relaciones complejas (a veces interactivas) entre las variables múltiples, si esas
relaciones son constantes a través de un juego de casos (en este caso "íconos").
A veces la observación (o una "percepción") de que en ciertos casos "son
similares en algo" viene antes de que el observador (en este caso un analista)
pueda articular cuáles variables específicas son responsables de la consistencia
observada (Lewicki, Hill, y Czyzewska, 1992). Sin embargo, el análisis posterior
que se centra en tales consistencias marcadas puede revelar la naturaleza
específica de las relaciones relevantes entre las variables.
La idea básica de los diagramas de
íconos es representar unidades
individuales de observación como
objetos gráficos particulares, donde
los valores de las variables se
asignan a las características o a
las dimensiones específicas de los
objetos (generalmente un caso =
un objeto). La asignación es tal que el aspecto total del objeto cambia en función
de la configuración de los valores.
Así, los objetos dan "identidades" visuales
únicas para las configuraciones de valores, y
eso se puede identificar por el observador.
Examinar tales íconos puede ayudar a descubrir
los racimos (clusters) específicos de ambas
relaciones simples y las interacciones entre las
variables.
Analizando Diagramas de Íconos
El diseño "ideal" del análisis de los diagramas de íconos consiste en cinco fases:
Dr. Temístocles Muñoz López101
Representaciones Gráficas
1. Seleccione el grupo de variables que va a ser analizado. En muchos casos una
secuencia que comienza al azar es la mejor solución. Usted también puede
intentar incorporar las variables basadas en el orden de una ecuación de la
regresión múltiple, las cargas factoriales en un factor interpretable (véase el
capítulo del análisis factorial), o una técnica multivariada similar. Ese método
puede simplificar y "homogenizar" el aspecto general de los íconos que pueden
facilitar la identificación de patrones escondidos. Puede también lograr algunos
patrones interactivos más difíciles de encontrar. No se pueden dar a este punto
ningunas recomendaciones universales, con excepción de que intente otro método
más rápido (ordenar al azar) antes de involucrarse en un método más
desperdiciador de tiempo.
2. Busque cualquier regularidad potencial, tal como semejanzas entre los grupos
de íconos, los casos atípicos, o las relaciones específicas entre aspectos de los
íconos (Ej., el "si los primeros dos rayos del ícono de estrella son largos, entonces
uno o dos rayos en el otro lado del ícono son generalmente cortos"). Se
recomienda para esta fase el tipo de diagramas de íconos circulares.
3. Si se encuentran algunas regularidades, intente identificarlas en términos de las
variables específicas implicadas.
4. Reasigne las variables a las características de los íconos (o seleccione uno de
los diagramas secuenciales del ícono) para verificar la estructura identificada de
las relaciones (Ej., intente mover juntos los aspectos relacionados del ícono más
cercano para facilitar otras comparaciones). En algunos casos, en el final de esta
fase se recomienda sacar las variables que no parecen contribuir al patrón
identificado.
5. Finalmente, utilice un método cuantitativo (tal como un método de la regresión,
una valoración no lineal, un análisis de función discriminante, o un análisis de
racimos) a la prueba, y cuantifique el patrón identificado o por lo menos algunos
aspectos del patrón.
Dr. Temístocles Muñoz López102
Representaciones Gráficas
Taxonomía de Diagramas de Íconos
La mayoría de los diagramas de íconos se pueden asignar a una de dos
categorías: circular y secuencial.
Íconos circulares. Los diagramas circulares de íconos (diagramas de estrella,
diagramas de rayo de sol, íconos de polígono) tienden al formato de "ajustarse
alrededor del radio" donde los valores de las variables son representados por
distancias entre el centro ("eje") del ícono y de sus bordes.
Esos íconos pueden ayudar a
identificar relaciones interactivas
entre las variables porque la
forma total del ícono puede
asumir patrones totales distintivos
e identificables, dependiendo de
configuraciones multivariadas de
los valores de las variables de
entrada.
Para traducir tales patrones globales en modelos específicos (en términos de
relaciones entre las variables) o verificar las observaciones específicas sobre el
patrón, es provechoso cambiar a uno de los diagramas secuenciales de ícono que
se puedan probar de forma más eficiente cuando uno sabe qué buscar.
Íconos secuenciales. Los
diagramas de ícono secuenciales
(íconos de columna, íconos de
perfil, íconos de línea) siguen un
formato más simple donde los
Dr. Temístocles Muñoz López103
Representaciones Gráficas
símbolos individuales son representados por los diagramas de secuencia
pequeños (de diferentes tipos).
Los valores de variables consecutivas son representados en los diagramas por
distancias entre la base del ícono y los puntos de ruptura consecutivos de la
secuencia (Ej., la altura de las columnas mostradas arriba). Esos diagramas
pueden ser menos eficientes como herramienta para la fase exploratoria inicial del
análisis del ícono, porque los íconos pueden ver similares. Sin embargo, según lo
mencionado antes, pueden ser provechosos en la fase en que se ha revelado ya
un cierto patrón hipotético y uno necesita verificarlo o articularlo en términos de
relaciones entre las variables individuales.
Íconos de Pastel. Los diagramas de
ícono de pastel caen en parte entre las
dos categorías anteriores; todos los
íconos tienen la misma forma (Pastel)
pero se dividen secuencialmente de
diferente forma según los valores de
variables consecutivas.
Desde un punto de vista funcional, pertenecen más al tipo secuencial que a la
categoría circular, aunque pueden ser utilizados para ambos usos.
Caras de Chernoff. Este tipo de ícono es una categoría por sí mismo. Los casos
son visualizados por las caras del diagrama esquemático, de tale forma que los
valores relativos de las variables seleccionadas son representados por variaciones
de características faciales específicas.
Debido a sus características únicas, es
considerado por algunos investigadores
como la última técnica exploratoria
multivariada que es capaz de revelar
patrones ocultos de interrelaciones entre
Dr. Temístocles Muñoz López104
Representaciones Gráficas
las variables, que no se pueden observarse por ninguna otra técnica. Esta
declaración puede ser una exageración, sin embargo. También, debe ser admitido
que las caras de Chernoff son un método que es difícil de utilizar, y requiere
mucha experimentación con la asignación de variables a las características
faciales. Vea también las Técnicas de análisis de datos.
Estandardización de valores
A excepción de casos inusuales, cuando usted se propone que los íconos reflejen
las diferencias globales en rangos de valores entre las variables seleccionadas,
los valores de las variables se deben estandardizar en la escala para asegurar la
compatibilidad de rangos del valor dentro del ícono. Por ejemplo, porque los
valores del juego de datos son más grandes que el punto de referencia global del
escalamiento para los íconos, entonces, si hay variables que están en una gama
de orden mucho más pequeña, pueden no aparecer en el ícono, Ej., en un
diagrama de estrella, los rayos que los representan serán demasiado cortos para
ser visibles.
Aplicaciones
Los diagramas de ícono son generalmente aplicables (1) a las situaciones donde
uno desea encontrar patrones o racimos sistemáticos de observaciones, y (2)
cuando uno desea explorar posibles relaciones complejas entre varias variables.
El primer tipo de uso es similar al análisis de racimos, es decir, puede ser utilizado
para clasificar observaciones.
Por ejemplo, suponga que usted estudió las personalidades de artistas, y registró
los puntajes para varios artistas en un número de cuestionarios de la personalidad.
El diagrama puede ayudarle a precisar si hay racimos naturales de los artistas
distinguidos por los patrones particulares de conteos en diferentes cuestionarios
(Ej., usted puede encontrar que algunos artistas son muy creativos,
indisciplinados, e independientes, mientras que un segundo grupo son
Dr. Temístocles Muñoz López105
Representaciones Gráficas
particularmente inteligentes, disciplinados, y relacionados con el éxito reconocido
del público).
El segundo tipo de uso (la exploración de relaciones entre varias variables) es más
similar al análisis factorial; es decir, puede ser utilizado para detectar qué variables
tienden a "agruparse" Por ejemplo, suponga que usted estudiaba la estructura de
la opinión de la gente con coches. Varios sujetos terminaron los cuestionarios
detallados que clasificaban diferentes coches en numerosas dimensiones. En la
base de datos se registran los promedios en cada dimensión (las variables) para
cada coche (como casos u observaciones).
Cuando estudia usted ahora las caras de Chernoff (cada cara que representa las
opiniones para un coche), si el precio fue asignado a sonrisa y aceleración al
tamaño de orejas, puede ocurrirle que las caras sonrientes tienden a tener orejas
grandes; entonces este "descubrimiento" significa que los coches rápidos son más
costosos. Esto, por supuesto, es un ejemplo simple; en análisis de datos
exploratorios de la vida real, pueden llegar a ser evidentes las relaciones
complejas no obvias entre las variables.
Gráficas Relacionales
Los diagramas de matriz visualizan relaciones entre las variables a partir de una o
dos listas. Si el software permite que usted marque subconjuntos seleccionados,
los diagramas de matriz pueden proporcionar la información similar en diagramas
de ícono.
Si el software permite que usted cree, y que identifique subconjuntos definidos por
el usuario en diagramas de puntos, los diagramas de puntos 2D simples se
pueden utilizar para explorar las relaciones entre dos variables; asimismo, al
explorar las relaciones entre tres variables, los diagramas de puntos 3D
proporcionan una alternativa a los diagramas de ícono.
Tipos de Gráficos de íconos
Dr. Temístocles Muñoz López106
Representaciones Gráficas
Hay varios tipos de diagramas de ícono.
Caras de Chernoff. Una "cara" separada se dibuja para cada caso; los valores
relativos de las variables seleccionadas para cada caso se asignan a las formas y
a los tamaños de las características faciales individuales (Ej., longitud de la nariz,
ángulo de cejas, anchura de la cara).
Para más información vea las caras de Chernoff en taxonomía de los diagramas
de ícono.
Estrellas. Los íconos de estrellas son un tipo circular de diagrama de ícono. Una
estrella separada se traza para cada caso como ícono; los valores relativos de las
variables seleccionadas en cada caso son representados (a la derecha,
comenzando en las 12:00) por la longitud de rayos individuales en cada estrella.
Los extremos de los rayos son conectados por una línea.
Dr. Temístocles Muñoz López107
Representaciones Gráficas
Rayos de Sol. Los íconos de rayos de sol son un tipo circular de diagrama
separado para cada caso, cada rayo representa una de las variables
seleccionadas (hacia la derecha, comenzando en las 12:00), y la longitud del rayo
representa el valor relativo de la variable respectiva. Los valores de los datos de
las variables para cada caso son conectados por una línea.
Polígonos. Los íconos de polígono son un tipo circular que se traza para cada
caso, y los valores relativos de las variables seleccionadas en cada caso son
representados por la distancia del centro del ícono a las esquinas consecutivas del
polígono (a la derecha, comenzando en las 12:00).
Dr. Temístocles Muñoz López108
Representaciones Gráficas
Pasteles. Los íconos de pastel son un tipo circular de diagrama donde los valores
de los datos para cada caso se trazan como gráfica de pastel (a la derecha,
comenzando en las 12:00); los valores relativos de variables seleccionadas son
representados por el tamaño de las rebanadas del Pastel.
Columnas. Los íconos de columnas son un tipo secuencial del diagrama que se
traza para cada caso; los valores relativos de las variables seleccionadas por caso
son representados por la altura de columnas consecutivas.
Dr. Temístocles Muñoz López109
Representaciones Gráficas
Líneas. La línea íconos es un tipo secuencial de diagrama de íconos.
Un gráfico de línea individual se traza para cada caso, y los valores relativos de
las variables seleccionadas para cada caso son representados por la altura de los
puntos consecutivos de la línea, sobre la línea de fondo.
Perfiles. Los íconos de perfil son un tipo secuencial de diagrama de íconos. Un
gráfico individual del área se traza por caso, y los valores relativos de las variables
seleccionadas para cada caso son representados por la altura de los picos
consecutivos del perfil sobre la línea de fondo.
Dr. Temístocles Muñoz López110
Representaciones Gráficas
Íconos enmarcados
Si el software permite que usted especifique subconjuntos múltiples, es útil
especificar los casos (sujetos) cuyos íconos serán enmarcados (y los marcos
serán puestos alrededor de los íconos seleccionados) en el diagrama.
Los patrones de línea de los marcos que identifican subconjuntos específicos se
deben enumerar en la leyenda junto con las condiciones de la selección del caso.
El gráfico siguiente muestra un ejemplo de los subconjuntos marcados.
Dr. Temístocles Muñoz López111
Representaciones Gráficas
Todos los casos (observaciones) que reúnan la condición especificada en el
subconjunto 1 (es decir, los casos para los cuales el valor de la variable Iristype
son iguales a los de la variable Setosa y para los cuáles el número del caso es
menor de 100) están marcados con un marco específico alrededor de los íconos
seleccionados.
Todos los casos que reúnan la condición definida en el subconjunto 2 (es decir, los
casos para los cuales el valor de Iristype son iguales a la variable Virginic, y para
los cuáles es menor el número del caso de 100) tendrán un marco diferente
alrededor de los íconos seleccionados.
XXI. TÉCNICAS DE REDUCCIÓN DE DATOS
A veces se puede obscurecer un patrón existente trazando un subjuego
extremadamente grande (véase la gráfica de abajo que puede tenerse como
animación con los archivos del curso). Cuando usted tiene una base de datos muy
grande, puede ser útil trazar un subconjunto de los datos, de modo que el patrón
no sea ocultado por el número de los marcadores de puntos.
Dr. Temístocles Muñoz López112
Representaciones Gráficas
Algunos software ofrecen métodos para la reducción de datos (u optimización) que
puede ser útil en estos casos. Idealmente,
una opción de la reducción de datos
permitirá que usted especifique un valor n
del número entero menor que el número de
casos en la base de datos. Entonces el
software seleccionará casos de n,
aleatoriamente de los casos disponibles, y
creará el diagrama basado en estos casos
por si mismo.
Observe que tales métodos de la reducción
de subjuegos (o tamaño de muestra) dibujan con eficacia una muestra escogida al
azar de los subjuegos existentes. Obviamente, la naturaleza de tal reducción de
datos es enteramente diferente que cuando los datos se reducen selectivamente a
un subconjunto específico o se parten en los subgrupos basados en ciertos
criterios (Ej., el género, la región, o el nivel de colesterol). Los últimos métodos se
pueden poner en ejecución recíprocamente (Ej., con el método de cepillado
animado), u otras técnicas (Ej., los gráficos categorizados o las condiciones de
selección de casos). Todos estos métodos pueden ayudar posteriormente a
identificar patrones en subjuegos grandes.
XXII. ROTACIÓN DE DATOS (EN ESPACIO 3D)
Cambiando el punto de vista para los diagramas de puntos de 3D los (Ej.,
diagramas espectrales, simples, o espaciales) puede ser una técnica exploratoria
eficaz, puesto que puede revelar los patrones que son fácilmente ocultados, a
menos que usted mire la "nube" de los puntos de referencias desde un ángulo
apropiado (véase la gráfica de abajo que puede tenerse como animación con los
archivos del curso).
Dr. Temístocles Muñoz López113
Representaciones Gráficas
Algunos software ofrecen perspectivas
interactivas, la rotación y los controles que
hacen girar continuamente pueden ser útiles
en estos casos. Idealmente, estos controles
permitirán que usted ajuste el ángulo y la
perspectiva de la gráfica para encontrar la
localización del "punto de vista" más
informativo del gráfico, así como permitirle
que controle su rotación vertical y horizontal.
En tanto que estas posibilidades son útiles para el análisis de datos exploratorio
inicial, pueden ser también absolutamente beneficiosas en explorar el espacio
factorial (véase el Análisis Factorial) y explorar el espacio dimensional (véase el
Escalamiento Multidimensional).
Ligas para consultar los tipos de gráficas en Statistica
StatSoft, Inc. (2003). Electronic Textbook. Graphical Techniques . http://www.statsoft.com/textbook/stathome.html
Gráficas 2D
Barras/Columnas
Barras de Desviación
Barras izquierda Y
Barras Derecha Y
Barras Arriba
Barras X
Cajas
Probabilidad Tendencial
Probabilidad Mitad-Normal
Histogramas de Barras Colgantes
Histogramas
Espectrales
Trazos
Gráficas 3D Secuenciales
Histogramas Bivariantes
Cajas
Rangos
Datos crudos Contorno/Discretos
Secuencial Contorno
Secuencial Superficie
Filamentos Datos Crudos
Datos crudos Superficie
Gráficas 4D/Ternarias
Gráficas 3D Categorizadas
Contorno
Desviación
Diagramas de puntos
Espaciales
Espectrales
Superficie
Gráficas Ternarias Categorizadas
Ternarias Contorno/Area
Ternarias Contorno/Líneas
Ternarias Diagrama de puntos
Dr. Temístocles Muñoz López114
Representaciones Gráficas
Líneas
Gráficas de Pastel
Probabilidad
Probabilidad-Probabilidad
Quantil-Quantil
Rango
Diagramas de puntos
Secuencial/Estacas
Diagrama de puntos Voronoi
Gráficas 3D XYZ
Contorno
Desviación
Diagramas de puntos
Espaciales
Diagramas de puntos
3D Ternarias
Contorno/Área
Contorno/Líneas
Desviación 3D
Espaciales 3D
Gráficas 2D Categorizadas
Probabilidad Tendencial
Probabilidad Mitad-Normal
Probabilidad Normal
Probabilidad-Probabilidad
Quantil-Quantil
Gráficas nD/Ícono
Caras de Chernoff
Columnas
Líneas
Pasteles
Polígonos
Perfiles
Estrellas
Rayos de Sol
Gráficas Matriciales
Columnas
Líneas
Diagramas de puntos
Dr. Temístocles Muñoz López115
Representaciones Gráficas
APARTADO D. DIAGRAMAS CORRELACIONALES
ASCC
XXIII. EL ANÁLISIS SISTÉMICO POR MEDIO DE
CONSTELACIONES CORRELACIONALES
INTRODUCCIÓN
En el trabajo educativo a veces encontramos problemas para elucidar las
relaciones entre las diferentes circunstancias que se asocian a nuestro quehacer.
Se propone esta técnica de Análisis Sistémico por medio de Constelaciones
Correlacionales (ASCC), donde se obtiene una configuración o modelo del
sistema, que surge de un orden que existe en la realidad con un nivel de
aproximación significativo estadísticamente.
La lectura de los datos es simplificada cuando se diagraman las relaciones entre
las variables, lo que permite concentrar la atención en secuencias y
agrupamientos específicos.
Por ejemplo:
Tabla de correlación canónica entre las variables de 13 y 14 años. Correlaciones
significativas a p 0.01, r 0.2578, n= 99. La fila superior corresponde a los 14
años y la primera columna a los 13.
13 14
REAFECT
RMREGJU
RMCONVP
RMAUTIM
RMSENPR
RMDEBIE
RMBIENO
RMASERT
REOPAYU
REAPJUV
REPADEF
REAFECT 0.27
RMREGJ 0.31 0.29
Dr. Temístocles Muñoz López116
Representaciones Gráficas
URMCOMR
E 0.35
RMAUTIM 0.26HNOCAS
T 0.28REPORO
B 0.28RMSENP
R 0.29
RMBIEMA 0.28 0.34 0.34RMAYUD
A 0.30 0.28
REACTIV 0.27 0.30
RESOCIA -0.29 -0.26
RMBIENO 0.30 0.33 0.28RMASER
T 0.27
HAESIMP 0.27
HBUEXIG 0.27REBUEC
O 0.28
REPROLE 0.32 0.29
REVALYS 0.35 0.36
REINVES 0.26 0.32REAPAD
R 0.29 0.34
RECAMEJ 0.26 0.31 0.27REAPCO
M 0.32 0.30REHERE
N 0.26
En un diagrama la representación quedaría de la siguiente forma:
Dr. Temístocles Muñoz López117
Representaciones Gráficas
En este trabajo se pretende destacar la importancia de introducirse al uso de la
estadística en las llamadas comúnmente ciencias sociales (a partir de un énfasis
en muestreo y correlación), para fundamentar la técnica ASCC con el uso del
cómputo en la toma de decisiones, misma que puede ser ampliada en otras áreas
de nivel directivo no educacional como el análisis de procesos administrativos y
productivos.
Se pretende además, sin profundizaciones, abrir las posibilidades de uso de la
estadística para quien no tiene conocimientos de la misma, llevándolo lentamente
en una serie de pasos, para que tome las decisiones más adecuadas con altos
niveles de precisión.
Dr. Temístocles Muñoz López
AREACTIV
ARMBIENO
AREPROLE
AREVALYS
AREINVES
AREAPADR
ARECAMEJ
AHBUEXIG
BREAFECT
ARMAUTIM
BRMAUTIM
AREHEREN
BRMSENPR
ARESOCIA
BRMCONVP BRMBIENO
AHAESIMPBRMASERT
BREPADEF
BRMREGJU
ARMREGJU
AREAPCOM
AHNOCAST
ARMBIEMA ARMAYUDA
ARMCOMRE
BREOPAYU
AREPOROB
BREAPJUV BRMDEBIE
AREAFECT
ARMASERT
AREBUECO
ARMSENPR
118
Representaciones Gráficas
La Técnica de Análisis Sistémico por medio de Constelaciones Correlacionales
está diseñada para la toma de decisiones y se fundamenta en cuatro aspectos
básicos: La Teoría de Sistemas, la teoría y el proceso de la correlación estadística,
el uso de sistemas de cómputo y, la sistematización u organización de los
elementos (variables) que intervienen en el fenómeno, problema u objeto de
estudio.
Ampliando los fundamentos teóricos de la técnica presentada, se puede abordar
con mayor facilidad y una comprensión más completa su utilidad y sus posibles
aplicaciones.
El uso de los sistemas de cómputo ha hecho variar las metodologías y técnicas de
investigación, tanto en diversidad como en una significativa reducción del tiempo
de ejecución de las mismas.
Esto se hace más patente en la aplicación, captura y proceso de la información,
que permite manejar un número significativamente mayor de variables que en las
décadas anteriores en forma muy rápida y altamente precisa, de tal manera que el
investigador puede ampliar considerablemente tanto el número de problemas
analizados como las aplicaciones estadísticas en los mismos, con diferentes,
interesantes y novedosas perspectivas.
Una de las características que se denotan con mayor énfasis en el uso del
procesamiento por cómputo, es que cada vez en mayor medida se utiliza en la
toma de decisiones.
Apuntes complementarios sobre la correlación estadística
Los conceptos de correlación fueron presentados por el científico inglés Sir
Francis Galton (l822-1911), cuando hacía investigaciones sobre la herencia y otras
áreas de la biología, llegando a ser en la actualidad una de las técnicas
estadísticas más utilizadas para analizar o manejar las relaciones en los sistemas
complejos. El análisis de correlación nos permite ver la fuerza o intensidad de las
Dr. Temístocles Muñoz López119
Representaciones Gráficas
relaciones que hay entre dos o más variables que covarían recíprocamente. Si hay
una mayor tendencia para variar conjuntamente, mayor correlación habrá entre
ambas, pudiéndose llegar a una correlación perfecta.
Desde el punto de vista de la
teoría de sistemas, hay
causalidad, entre las múltiples
variables o elementos que
integran un sistema, y si son
dependientes, el cambio
operado en uno de ellos
resultará en un cambio en
otro u otros puntos del
sistema, ya que desde su punto de vista están unidos por cohesión y covarianza.
No habrá de perderse de vista que la correlación estadística mide el grado de
intensidad de la asociación entre variables, y no puede hablarse de causalidad, a
menos que se tengan evidencias consistentes.
El estadístico r mide el grado de correlación entre dos variables, así, un valor de r=
1.00 indica una correlación positiva perfecta, un valor de -1.00 expresa una
correlación negativa perfecta, en tanto que un valor correlacional de 0 (cero) indica
independencia total entre las variables, o falta de correlación entre ellas. En las
ciencias sociales o en la naturaleza no suelen obtenerse correlaciones perfectas
debido al tipo de variables que se estudian y a los instrumentos de medición que
se utilizan, pudiéndose encontrar correlaciones imperfectas de cinco tipos:
1. Altas y positivas
2. Altas y negativas
3. Nulas
4. Bajas y positivas
5. Bajas y negativas
Dr. Temístocles Muñoz López120
Variable 1
Variable 2
1
2
3
4
5
Fertilizantes y riego
Crecimiento
r = 0.85
Representaciones Gráficas
El coeficiente de correlación permite predecir o pronosticar una variable a partir de
los valores obtenidos en la otra. De esta forma, el coeficiente de correlación lineal
r, es la medida de la fuerza de relación lineal entre dos variables, la magnitud del
efecto que cualquier cambio en una variable ejerce o transmite sobre la otra en un
sentido positivo o negativo.
El conocimiento de como varía un elemento o fenómeno con otro del sistema hace
posible explicar la dinámica de una situación o hacer predicciones, de esta
manera, con el conocimiento de la variación conjunta (covariación) se podría
controlar un hecho o fenómeno manipulando otro u otros elementos del sistema,
una aspiración científica y tecnológica del hombre.
De acuerdo con Spiegel, M. (1991), hay varios tipos de correlación:
a) Correlación no lineal. No implica que no haya correlación, sino que esta puede ser curvilínea.
b) Correlación espuria. Es una correlación sin sentido que se establece entre dos variables evidentemente no relacionadas en la realidad.
c) Autocorrelación. Es aquella que nos permite correlacionar valores de una variable X en ciertos tiempos, con valores correspondientes de la misma variable en tiempos anteriores.
d) Correlación Múltiple. Es el grado de correlación que se establece entre tres o más variables.
En suma, la correlación mide el grado o la intensidad de asociación o relación
tendencial que existe entre dos o más variables cualitativas o cuantitativas. A partir
de los cambios que se pueden producir en una variable, se pueden deducir,
inducir y predecir los cambios que sufrirán las otras variables con que se
relaciona.
Las correlaciones definen la concordancia (correlación positiva) o diferencia
(correlación negativa) y además permiten abordar esquemas referenciales
simples, parciales o multivariados en diferentes grados de complejidad. Así,
Dr. Temístocles Muñoz López121
Representaciones Gráficas
podemos mencionar algunas cualidades de diferentes tipos de correlación (S.E.P.
1985), como las siguientes:
a) La correlación positiva que identifica tendencias concordantes de sentido.
b) La correlación negativa que identifica tendencias divergentes o inversas de
sentido.
c) La correlación rectilínea a demostrado su efectividad al referir la dimensión
espacial (longitud, latitud y profundidad) así como lo relacionado con la
previsibilidad de fenómenos de bajo riesgo y aquellos que perfilan constantes o se
los ubica en microdimensiones.
d) La correlación curvilínea ha dado un mayor sentido interpretativo al referir
fenómenos relacionados con las dimensiones temporales, bio-psico-sociales o
personales, así como en relación a las concepciones de relatividad, universo
curvo, previsión de fenómenos de alto riesgo, gradación, variabilidad, ciclicidad o
macrodimensiones.
Una correlación positiva significa que los individuos (variables, elementos o casos)
que obtienen altas calificaciones en una variable, tienden a obtener altas
calificaciones en una segunda variable según González Alanís (1992).
De acuerdo con el mismo autor la clase de coeficiente de correlación que se usa,
depende del tipo de escala en la cual se expresa la variable; de la naturaleza de la
distribución fundamental según sea continua y discreta, y de la forma lineal o no
lineal de la distribución de las calificaciones. Expresa además que:
El coeficiente de correlación del producto-momento de Pearson "r", se puede
emplear con variables de intervalo o de razón.
No encontrar evidencia de una relación entre dos variables, a través de la r de
Pearson, puede significar que las variables están relacionadas en una forma
distinta de la relación lineal.
Dr. Temístocles Muñoz López122
Representaciones Gráficas
La suposición de que existe una relación lineal, es la justificación más
importante para el empleo de la r de Pearson cuando se quiere obtener una
medida de la relación entre variables.
Mientras que las relaciones sean unimodales y relativamente simétricas, el
cálculo de la r de Pearson puede considerarse legítimo.
El coeficiente de correlación por rangos de Spearman, se emplea con datos
de variables ordinales de pares comparados.
Antes de aplicar la correlación de Spearman, ambas escalas deben
expresarse en rangos.
Aunque se pueda obtener la r de Pearson con datos ordenados, la r de
Spearman reduce la tarea del cómputo manual para obtener la correlación.
Cuando las series nominales son dicotómicas, se usa la correlación
tetracórica, entre otras.
Es conveniente que para poder leer los resultados estadísticamente, se contemple
cuando menos la siguiente clasificación de relaciones de acuerdo a S.E.P. (Op.
Cit.):
1. Contingente: Fortuita
2. Casual: Al azar o aleatoria.
3. Causal: Determinación univariable.
4. Concomitante: Dependencia de una relación en función de otro factor de incidencia.
5. Concausal.: Determinación multivariable.
6. Condicional: Causas predisponentes, desencadenantes y determinantes; en una función polivalente, diacrónica y sincrónica, en sus perspectivas relacionales, longitudinales, transversales e integrales.
Dr. Temístocles Muñoz López123
Representaciones Gráficas
Si tenemos una población o una muestra determinada, los valores de r serán
menores en tanto ésta aumente en número, pero conservando altos valores de
significancia (ver Tabla 2), de ahí que en el diseño de una configuración de
múltiples variables interrelacionadas, se nos presente un entramado de líneas que
dificulta leer su significado.
A veces es conveniente, sobre todo en ésta técnica, separar la población en
subpoblaciones por criterios de género, procedencia (rural o urbana), continuación
de estudios (contra deserción) u otras variables nominales que se deriven de sus
propios atributos naturales.
Los métodos estadísticos que generalmente culminaban con medidas de
tendencia central o dispersión, o con los histogramas representativos de la
información recabada, ahora pueden ser llevados con una gran facilidad a las
aplicaciones no paramétricas y análisis multivariados con auxilio del cómputo
estadístico.
Esto ha impactado de manera relevante a las ciencias de la educación, forzando a
los investigadores a introducirse en los beneficios tecnológicos que representan
los tratamientos cuantitativos para el manejo preciso de grandes volumenes de
información. En esta técnica, que tiene carácter exploratorio, se pretende
precisamente mejorar la calidad de las decisiones tomadas en la educación con el
auxilio de la estadística y del cómputo, ampliando el acceso de usuarios a estos
beneficios tecnológicos.
Descripción de la técnica de constelaciones correlacionales.
Antecedentes de la técnica
Durante las diferentes confrontaciones del autor con problemas educativos, tanto
académicos como administrativos, surgieron numerosas opciones sobre las
soluciones, la validez de los resultados y las posibilidades del tratamiento de las
variables educativas para la toma de decisiones escolares. Al irse integrando la
Dr. Temístocles Muñoz López124
Representaciones Gráficas
técnica se fue refinando progresivamente y clarificando su uso para observar el
logro de los objetivos institucionales, y en las perspectivas de la investigación y
evaluación continua en las escuelas, así como en otras aplicaciones derivadas
hacia otros campos de la administración.
Por otra parte, se encontró que la técnica de ASCC podría servir para explicitar el
proceso educativo en el aula, arrojando información útil para la toma de decisiones
y la previsión y control de las variables, llevándolas a un proceso de desarrollo y
prueba en situaciones contingentes, dentro de un amplio espectro de condiciones
educacionales.
La necesidad de depurar y precisar la técnica para facilitar la toma de decisiones,
tanto de la organización escolar como de la práctica educativa, llevó al autor a
usarla en situaciones diversas (Romero Dávila. A. 1992 y Muñoz López, T. 1991),
además de aplicarla en su tesis doctoral (Muñoz López, T. 1997).
Aquí se entienden las Constelaciones Correlacionales como diagramas o
configuraciones desarrollados para modelar o denotar la estructura de un sistema
mediante la aplicación y desarrollo del análisis de la correlación estadística.
Precisando, a partir de la correlación tratada con programas de cómputo, se puede
configurar la estructura fundamental del sistema u orden que existe en la realidad,
además de elucidar la relación de las variables o elementos que lo constituyen en
una constelación de condicionalidad múltiple.
Sin dejar de lado el punto de vista estético, usted obtendrá representaciones
gráficas elegantes y explicativas en las presentaciones de carácter ejecutivo y con
el personal a su cargo, además de garantizar resultados más consistentes en las
propuestas que se deriven del análisis de las estructuras modeladas.
Más adelante también puede trabajar simulaciones con la alteración de los valores
de alguna variable en estudio, antes de hacer los cambios en la realidad, por
ejemplo: ¿Que sucedería si aumentamos el presupuesto destinado a la
capacitación docente?, antes de programarlo en el gasto puede incrementar en
Dr. Temístocles Muñoz López125
Representaciones Gráficas
un, digamos 20%, los valores de su base de datos para ésa variable y observar el
efecto del cambio resultante sobre la correlación con otras variables como el
aprovechamiento escolar o el porciento de avance de los cursos.
Ello permitirá decidir si aumentamos el apoyo a las variables precedentes.
Seguramente si antes no existió correlación, ahora probablemente sea diferente,
pero es menos riesgoso simularlo en un modelo antes de hacerlo realmente.
La terminología relativa a las constelaciones
La denominación de constelaciones se refiere a la semejanza que tienen las
configuraciones que resultan de los sistemas estudiados, con las imágenes
mitológicas estelares que explicaban o significaban un orden y afinidad aparentes
entre los fenómenos terrestres y los del cielo nocturno a los pueblos antiguos,
terminología que hereda la astronomía moderna. El concepto de constelación al
parecer se ha transformado en un término polisémico, razón por la cual se precisa
a continuación el sentido que aquí se le confiere.
Probablemente la psicología y los estudios relativos al comportamiento han usado
en tiempos más recientes el concepto de constelación con mayor asiduidad (como
concepto, no como configuración correlacional), sobre todo en sociogramas. Su
significado varía ampliamente y es utilizado para indicar situaciones donde se
presentan conjuntos, secuencias u ordenaciones de relaciones entre variables de
muy diverso tipo y niveles de complejidad.
Una presentación de algunas investigaciones sobre el uso del concepto de
constelaciones, nos clarifican la polisemia del término. En 1980 Ann M. Johns
analizó la cohesión del discurso comercial; además, B. Beebe y L. Gerstman
(1984) lo aplicaron para definir paquetes de entendimiento maternal facial-visual.
Entre otros estudios sobre "constelaciones", M. Hite y otros (1985), R. Williams y
B. E. Compas (1988), R. W. Bradley en 1982, R. Scott y David A. Stone (1986),
Auvenshine (1987) y Kreppner (1986) estudiaron constelaciones familiares.
Dr. Temístocles Muñoz López126
Representaciones Gráficas
Shore y otros (1987) estudiaron pacientes depresivos en tres culturas tribales
indias americanas y concluyen precisando tres distintas constelaciones
influenciadas culturalmente, G. D. Rowles en 1982 distinguiendo constelaciones
de principios de soporte, y E. Shapiro y R. Tate (1988) utilizaron modelos de
constelaciones con regresión múltiple. Brian Kidd (1984) condujo un estudio sobre
constelaciones de recursos disponibles en el campus y el paso de los alumnos del
nivel medio superior a la universidad. Por otra parte, G. Karrby (1986) estudió las
constelaciones grupales en preescolares analizando sus interacciones.
Barbara L. Goedel (1985) identificó relaciones en las constelaciones fraternales
usando análisis multivariado, en tanto que Byrnes y Canale (1987) trazaron
constelaciones históricas en enseñanza de lenguas extranjeras. Por otra parte,
Dale H. Schunk (1987) indica que el complejo de constelaciones de aptitudes
predice mejor el aprendizaje que cualquier aptitud sola.
Iran Nejad, A. y A. Ortony (1982) discuten la organización funcional de las
constelaciones de elementos neuronales. En un trabajo posterior (1983) los
mismos autores conciben las constelaciones de elementos neuronales como
microsistemas fisiológicos en tanto que Goodman (1989) considera el autismo
como resultado de constelaciones de inapareamientos funcionales.
Malow y otros (1989) encontraron diferentes constelaciones de problemas de la
personalidad, y adicionalmente L. Perfetti (1990) codifica constelaciones
fraternales para programas que salvan memoria de microcomputadora.
Como se observa, la polisemia del concepto se refiere a diversos campos
profesionales y a muy variadas metodologías.
Se pudieron encontrar adicionalmente esquemas metodológicos que dieron ideas
acerca del desarrollo de ésta técnica en trabajos como los de Peter H. Smith
(1981), sobre la Movilidad Política en el México Contemporáneo haciendo uso de
la probabilidad estadística. También están en las correlaciones entre especies de
Dr. Temístocles Muñoz López127
Representaciones Gráficas
plantas por Análisis de Componentes Principales de Laura Pla (1986) y en el
Programa Integral de Investigación Educativa de la S.E.P. (1985).
El proceso y la selección de los datos
La matriz con el concentrado de datos capturada en un programa de cómputo
estadístico procesa la correlación, así obtendremos las relaciones de la variable
uno con el resto y sucesivamente las siguientes hasta obtener todos los resultados
en pantalla.
Los listados comprenden generalmente el número o nombre de las variables, el
número de casos procesados en la muestra, el valor de r que existe entre dos
variables (valor correlacional), además del valor de la probabilidad estadística.
Este último en la mayoría de los programas puede aparecer a la cabeza del listado
como p igual a cero, o sea la probabilidad con que se prueba la hipótesis nula. En
la medida en que aumente el valor de p, aumentará la probabilidad del error hasta
llegar a un máximo de 1. Otros programas dan el nivel de significancia, como
análogo a la probabilidad, que nos indica que hay escasa probabilidad (p<0.05) de
que la relación encontrada se deba al azar.
Mendenhall (1982), menciona que..."es improbable que un fenómeno, observado
en ciencias físicas y especialmente en ciencias sociales, sea función de una sola
variable. Así, es probable que el coeficiente de correlación entre el promedio de
aprovechamiento académico y cualquier otra variable sea bastante pequeño y de
valor cuestionable".
Dado que usted requiere trabajar con un alto nivel de precisión, para el caso de p
igual a cero se procede a seleccionar las variables marcando en los listados las
que tengan valores iguales o menores de 0.05 de probabilidad de error, o mejor p
igual o menor ( ) que 0.01 de probabilidad de error, de acuerdo al criterio del
investigador, criterio que para todos los casos necesita ser el mismo y precisado al
principio de la investigación.
Dr. Temístocles Muñoz López128
Representaciones Gráficas
Los valores aceptables de r que se busca obtener dependen del tamaño de la
muestra. A muestras más grandes el valor de r aceptable es menor y viceversa.
Usted necesitará saber éstos valores antes de leer los datos para saber cuales
son las correlaciones aceptables, para lo cual se presentan en la Tabla 2, donde
se busca el valor de r aceptable según el nivel de probabilidad de error que haya
fijado.
Por ejemplo, si su muestra es de 127 personas o casos, y busca el valor de r
significativo a una probabilidad de error menor o igual a 0.05, buscará en la tabla
el valor de r equivalente a 125 casos (n-2 g.l.) que en éste caso es de r (mayor o
igual a 0.159 para aceptar la correlación entre las variables como significativa.
Si en los valores de la tabla para el tamaño de la muestra no está su caso, es
necesario buscar el valor adecuado en las tablas de los textos de estadística o en
programas especializados de acuerdo al valor de probabilidad deseado y el
tamaño de la muestra.
Tabla 2. Valores significativos de r para diferentes tamaños de muestras (n), representados por los grados de libertad (g.l.). La probabilidad de error (p) aceptada es de 0.05 o 0.01.
g.l. (n-2)
r conp=0.05
r conp=0.01
g.l. (n-2)
r conp=0.05
r conp=0.01
1 0.997 1.000 24 0.388 0.4962 0.950 0.990 25 0.381 0.4873 0.878 0.959 26 0.374 0.4784 0.811 0.917 27 0.367 0.4705 0.754 0.874 28 0.361 0.4636 0.707 0.834 29 0.355 0.4567 0.666 0.798 30 0.349 0.4498 0.632 0.765 35 0.325 0.4189 0.602 0.735 40 0.304 0.39310 0.576 0.708 45 0.288 0.37211 0.553 0.684 50 0.273 0.35412 0.532 0.661 60 0.250 0.32513 0.514 0.641 70 0.232 0.30214 0.497 0.623 80 0.217 0.28315 0.482 0.606 90 0.205 0.26716 0.468 0.590 100 0.195 0.25417 0.456 0.575 125 0.174 0.22818 0.444 0.561 150 0.159 0.20819 0.433 0.549 200 0.138 0.18120 0.423 0.537 300 0.113 0.148
Dr. Temístocles Muñoz López129
Representaciones Gráficas
21 0.413 0.526 400 0.098 0.12822 0.404 0.515 500 0.088 0.11523 0.396 0.505 1000 0.062 0.081
Los datos significativos seleccionados (es recomendable señalarlos con
marcatextos) se pasan a un listado donde se indican progresivamente las
variables en estudio, seguidas de los números de las variables con las cuales
guarda correlación significativa cada una de ellas, teniendo especial cuidado de
denotar con un subrayado y con el signo negativo (-), las correlaciones negativas
que aparecen en los listados de cómputo. Se da como ejemplo la Forma 1.
Forma 1. Listado de variables correlacionadas en un estudio los intereses y hábitos de los alumnos de una escuela técnica forestal de nivel medio superior.
Variable Variables correlacionadas3
1. Interés por Act. al aire libre 4, -5, -10, 11, 12, 13, 16.2. Interés mecánico -9, 11.
3. Interés por el cálculo -94. Interés científicos 1, -8, 11, 12, 14, 16, 19.5. Interés persuasivo -1, -6, -16.
6. Interés artístico -5, 8, -13, -17.7. Interés literario Sin variables correlacionadas.8. Interés musical -4, 6.
9. Interés por servicio social -2, -3.10. Interés de oficina -1, -16, -24, -27.
11. Coeficiente intelectual 1, 2, 4, 12, 19.12. Promedio de hábitos y habilidades (13 a 21) 1, 4, 11, 13 a 21. (no se grafica)
13. Motivación para estudiar 1, -6, 12, 16, 17.14. Organización del tiempo 4, 12.
15. Concentración 12, 18, 20, 21.16. Lectura de textos 1, 4, -5, -10, 12, 12, 19, 20.
17. Elaboración de apuntes -6, 12, 13.18. Redacción de ensayos e informes 12, 15, 18, 21.
19. Disponibilidad de materiales 4, 11, 12, 16, 18.20. Revisión de contenidos vistos 12, 13, 15, 16, 21.
21. Preparación de exámenes 12, 15, 18, 20.22. Memorización y Transf. de Conocimientos Sin variables correlacionadas.
Al término del listado se pueden seleccionar las variables que tienen una relación
espuria (por carecer de sentido o no posibles en la realidad), labor de limpieza que
nos dejará menos relaciones y por lo tanto, menos trabajo al elaborar
posteriormente el diagrama del sistema.
3 Las correlaciones negativas en el concentrado de datos se marcan subrrayándolas.
Dr. Temístocles Muñoz López130
Representaciones Gráficas
Elaboración de las constelaciones correlacionales
A partir de este punto se precisa la parte práctica de la técnica que consiste en
denotar la estructura del sistema con las variables y sus correlaciones. Se
recomienda el uso de pizarrones blancos de acrílico con marcadores de tinta
fugaz, ya que se borran fácilmente al desplazar las variables, aunque puede
utilizar también hojas de rotafolio, lápiz y borrador. El proceso lleva a los
siguientes pasos:
3) Se dibujan círculos que semejan la disposición de las horas en una carátula de reloj (ver Figura 2), tantos círculos como variables existan y dentro de ellos se anota el número de la variable (puede ponerse texto, pero éste tiene la desventaja de ocupar demasiado espacio que en este paso puede ahorrarse).
Figura 2. Variables dispuestas inicialmente en forma de carátula de reloj. El ejemplo corresponde al estudio del perfil del alumno de nivel medio superior de la Escuela Forestal de la SARH en Saltillo durante 1990.
4) De acuerdo a la lista inicial se trazan líneas que unen las variables correlacionadas, quedando así una trama de líneas (correlaciones) entrecruzadas. Observe que no se incluyen las correlaciones de la variable 12
Dr. Temístocles Muñoz López131
12
5
6
17
7
8
9
10
12
13
14
15
3222
120
19
18
16
4
11
Representaciones Gráficas
porque es un promedio de las siguientes diez y produce complicaciones innecesarias porque correlaciona con todas las variables que lo originan.
5) Haciendo uso de la imaginación, pensemos que las líneas son hilos móviles y elásticos que unen las variables. Esto, en una hoja de papel o pizarrón, nos permite desplazar fácilmente primero aquellas variables (círculo numerado) que tengan menos relaciones (1 o 2 líneas) hacia espacios externos a la carátula del reloj, cerca de las variables con las que se relacionan. Será necesario borrarlas y redibujarlas en la nueva posición, iniciando por mover a aquellas variables que tienen pocas líneas o relaciones (Figura 4). Repita el proceso con otras variables.
Figura 3. Líneas que denotan las correlaciones entre las variables. Las correlaciones positivas son líneas sólidas y las negativas punteadas.
6) Buscamos que en el diseño final no exista ninguna línea que se sobreponga a otra, o sea, líneas cruzadas. Ahora procuremos mover las variables de los círculos numerados que tengan más relaciones al centro de la carátula imaginaria inicial en todos los casos posibles. Como se puede observar, la longitud de las líneas variará con los cambios de posición, esto no es importante, pero poco a poco nos llevará a que el sistema o modelo se flexibilice y vaya tomando su propia configuración.
Dr. Temístocles Muñoz López132
12
5
6
17 7
8
9
10
1213
14
15
322
21
20
19
18
16
4
11
Representaciones Gráficas
Figura 4. Resultado de la primera descomposición de variables.
7) El cruce de las líneas tiene que ser resuelto en su totalidad, situación que se complica si tenemos muestras demasiado grandes, dado que tendremos numerosas relaciones con bajos valores correlacionales pero con un alto nivel de significancia.
8) Ahora se puede proceder a anotar en el extremo de la línea una punta que la convierta en flecha, lo que indicará la posibilidad de una relación de condicionalidad e influencia de unas variables sobre otras. Sin perder de vista que deseamos estructurar un sistema explicativo, el criterio que lleva implícita la dirección de la flecha es el de temporalidad, o sea que se presupone y se tiene evidencia de la existencia previa y la influencia de una variable (fuente de la flecha), para que suceda una respuesta en otra (destino de la flecha). Si no tiene evidencia teórica o empírica de la temporalidad y/o de la supuesta condición previa de las variables para el caso específico que estudia, evite indicar los direccionamientos, sólo dibuje la línea.
9) Como paso final se procede a revisar las correlaciones negativas representadas por líneas punteadas (o de otro color), ya que ésto indica el sentido de la correlación (positivo o negativo).
Dr. Temístocles Muñoz López133
1
2
5
6
17
7
8
9
10
12
13
14
15
3
22
21
20
19
18
16
4
11
Representaciones Gráficas
Figura 5. Constelación correlacional ajustando la posición de las variables.
Dado que estamos trabajando con una correlación entre múltiples variables,
generalmente la expresión de una de ellas está condicionada por un número que
puede ser muy grande de variables, y se presume por lo tanto que sobre ella no
hay un efecto puro o único. Podemos decir que esperamos una
multicondicionalidad (ver Figura 5 y la final Figura 6), y a veces permanecen líneas
cruzadas que implican una configuración en tercera dimensión.
10)Considerando lo anterior, pueden analizarse las variables de importancia especial poniéndolas al centro de las demás con las que se correlaciona (Figura 7).
11)No olvide anotar en su esquema final, al margen, aquellas variables que quedaron aisladas del sistema y participaron en la investigación sin tener correlaciones, eso ayuda también a explicar el sistema que se estudia.
Dr. Temístocles Muñoz López134
1
2
56
17
7
8
9
10
12
13
14
15
3
22
21
20
19
18
16
4
11
Representaciones Gráficas
Figura 6. Resultado de la constelación correlacional final.
Se presenta en la Figura 7 un ejemplo de variables de especial interés ubicadas
en el centro del diagrama. Éstas no son constelaciones correlacionales pero
competan la explicación del fenómeno que estudiamos.
Figura 7. Ejemplo de correlaciones con una variable de interés en el centro.
Lectura de las constelaciones
Dr. Temístocles Muñoz López135
1
2
56
17
7
8
9
10
12
13
14
15
3
22
21
20
19
18
16
4
11
1
8
14
19
16
4
1119
5
4
1
10
16
20
Representaciones Gráficas
Toda vez que tenemos configurada la constelación correlacional, será necesario
leerla para transformarla en una explicación del comportamiento del modelo.
Para esto se puede proceder de dos formas, la primera consiste en aislar
imaginariamente subconjuntos de variables que aparecen más o menos
independientes en el sistema, transcribiendo el significado de estos subconjuntos
para posteriormente leerlos como el sistema total.
En el segundo método se puede tomar de los listados una variable de nuestro
interés y aisladamente, se hace incidir sobre ella a las líneas o relaciones que
guarda con otras variables, procurando hacer énfasis en sus características y
consecuencias (Figura 7). Este procedimiento es complementario del primero y de
gran importancia cuando unas pocas variables concentran muchas relaciones.
Es conveniente que identifiquemos tentativamente las variables iniciadoras
predisponentes o desencadenantes como aquellas de las que parten las líneas o
flechas, las variables mediadoras como aquellas que condicionan, reciben y
aportan efectos en otras variables en un numero aproximadamente igual. Las
variables finales caen en esa clasificación tentativa por el hecho de solo recibir
efectos de otras variables y por lo tanto son el producto del sistema.
Es necesario que al final de la lectura de los resultados reconsidere la clasificación
original de las variables y su pertenencia a una determinada categoría o variable
compleja. En la gráfica elaborada es también recomendable dejar anotadas las
variables aisladas (las que no resultaron correlacionadas con otras) y revisar que
no estén presentes las correlaciones espurias, sin sentido o ilógicas.
Probablemente no exista algo más valioso que la experiencia de las personas o
investigadores que se relacionan vivencialmente con el objeto de investigación,
siendo ellos los que pueden destacar o corregir la dirección de las relaciones y
apoyar objetivamente la lectura del sistema.
Dr. Temístocles Muñoz López136
Representaciones Gráficas
Por otra parte, si ésta técnica se aplica en investigaciones científicas formales, no
precisamente en las operacionales y diagnósticos, evite el uso de las flechas y
explore la información con otros estadísticos.
Las conclusiones y su validez externa
Los resultados que se presentan en la lectura de las constelaciones son
enunciados que se establecen a partir de una representación gráfica de las
variables y sus relaciones. El número de enunciados podrá ser demasiado grande
como para explicarlo a otras personas, aún en condiciones óptimas de tiempo y
ambiente.
Otra forma de presentar la explicación de los resultados es mediante la obtención
de conclusiones que sintetizan la lectura final. Para concluir necesitamos primero
reunir los enunciados de los resultados que se refieren a un mismo tópico.
Aquí es necesario pensar que estamos reduciendo varios enunciados en otro
mayor que los contiene, de ésta manera nuestra atención se dirige a las variables
más importantes por su número de relaciones significativas, o por su posición
generadora, mediadora o receptora de influencia de las otras variables en el
sistema estudiado.
Antes de presentar los resultados le conviene verificar la validez externa de su
investigación, lo cual quiere decir que hay seguridad de extrapolarlos a la
población de la que proviene la muestra, de otra forma tendrá que afirmar que sus
estimaciones son válidas al menos para los individuos muestreados.
Si la muestra fue adecuadamente seleccionada, de tal manera que todos los
individuos o casos tuvieron la misma probabilidad de ser tomados y, si su número
representa la proporción adecuada de la población, seguramente podrá extrapolar
con niveles aceptables de confianza que adquirió al seguir con cuidado los pasos
y las recomendaciones prescritos en la técnica.
Dr. Temístocles Muñoz López137
Representaciones Gráficas
Consideraciones finales
La técnica ASCC que aquí se presenta es un intento de inducir a usar la
estadística a todos aquellos maestros, directivos escolares y departamentos
académicos relacionados con la toma de decisiones, que contando con equipo de
cómputo, tienen la necesidad pero no los instrumentos conceptuales para el
enfoque de mayor precisión y confiabilidad de sus problemas y soluciones.
Es necesario que se considere que, si bien, se presenta la posibilidad de un
tratamiento más completo de los datos para transformarlos en información,
siempre será necesario profundizar en el conocimiento de la estadística,
especialmente en puntos relacionados con el muestreo, normalidad, medidas de
tendencia central, medidas de dispersión, teoría de la correlación, diseño de
reactivos de respuesta, escalas y medidas y, los principios fundamentales de la
logística de la investigación científica.
Si usted se interesa en los fundamentos, aplicaciones y las novedades de los
desarrollos estadísticos, es conveniente que consulte algunos textos de éstas en
las ciencias naturales, sobre todo en ecología cuantitativa, y explorando también
los nuevos programas de cómputo estadístico. La anterior recomendación se debe
a que las aplicaciones matemáticas en ciencias sociales para México son muy
restringidas en profundidad y en número de casos de investigadores, en tanto que
en las ciencias naturales son prácticamente rutinas de trabajo de mayor amplitud.
Aunque en algunas técnicas de toma de decisiones derivadas del análisis
sistémico se plantea un objetivo después de plantear el problema, a diferencia de
las investigaciones de otro tipo, esto se considera sólo como una mención sin
mayor profundidad, dado que el nivel operacional que se plantea aquí no lo
requiere.
La toma de decisiones se puede derivar fácilmente de la lectura de la constelación
correlacional obtenida, sin embargo, el sistema o configuración logrado debe ser
Dr. Temístocles Muñoz López138
Representaciones Gráficas
estudiado cuidadosamente para ver las variables que podemos manipular para
lograr los resultados deseados.
El éxito y satisfacción al obtener buenas decisiones usando ésta técnica se
incrementará progresivamente y el usuario la manejará con mayor precisión y
facilidad, sobre todo si se interesa en las lecturas adicionales que encuentre
relacionadas con el tema.
La técnica que se presenta puede ser llevada, con los límites de su imaginación y
sus necesidades, a la toma de decisiones en otros campos de la administración, la
investigación de los fenómenos naturales, algunos casos de producción de bienes
o estudios sociales.
Literatura de consulta
Agencia para el Desarrollo Internacional. 1971. Conferencias sobre Muestreo. Curso suplementario para un estudio de caso sobre encuestas y censos. Versión en español. Bureau of Census. U.S. Department of Commerce.
American Psychological Association. 1999. Electronic reference formats recommended by the American Psychologycal Association. (1999, November 19). Washington, DC. Retrieved November 3, 2000 from: http://www.apa.org/journals/webref.html
Campbell, Stephen K. 1990. Equívocos y Falacias en la Interpretación de Estadísticas. Primera reimpresión. Ed. Limusa. México.
Cochran, William C. 1985. Técnicas de muestreo. Ed. CECSA. México.
Colegio de postgraduados de Chapingo. 1996. Guía para autores. Agrociencia 30:4. 601-610pp.
Forns, M., T. Kirchner, y M. Torres. (1991). Principales modelos de evaluación psicológica. L'estudi d'en llop Barcelona.
García Santos, Aguinaldo. 1990. Muestreo. Apuntes para la maestría en Productividad de la UANE y la Maestría en Educación de la U. A. de C. Saltillo.
Dr. Temístocles Muñoz López139
Representaciones Gráficas
Gibaldi, Joseph, and Walter S. Achtert. MLA Handbook for Writers of Research Papers, 3rd ed. NY: MLA, 1988
Isebrands, J.G. y T.R. Crow. 1975. Introduction to uses and interpretation of Principal Component Analysis in Forest Biology. General technical Report. USDA Forest Service. St. Paul, Minnesota.
Krejcie, R. V. and D. W. Morgan. 1970. Determining sample size for research activities. Educational and Psychological Measurement. 30, 607-610 pp.
Li, Xia, and Nancy Crane. Electronic Style: A Guide to Citing Electronic Information. Westport: Meckler, 1993.
Ludwig, John A. and James F. Reynolds. 1988. Statistical Ecology. A primer on methods and computing. John Wiley & Sons. New York.
Mendenhall, William. 1982. Introducción a la probabilidad y la estadística. Wadsworth Internacional/Iberoamérica. Belmont.
Modern Language Association (MLA on line). 2002. A Writer's Practical Guide To MLA Documentation. http://ccc.commnet.edu/mla/practical_guide.htm.
Muñoz López, Temístocles. 1999. Recomendaciones para elaborar un cuestionario de investigación o para evaluación en ciencias sociales. Perfiles Año 2, Número 12. Coordinación General de Estudios de Postgrado e Investigación. Universidad Autónoma de Coahuila. Saltillo.
Muñoz López, Temístocles. 2000. Apuntes sobre muestreo. Perfiles. Año 3, Número 15. Coordinación General de Estudios de Posgrado e Investigación. Universidad Autónoma de Coahuila. Saltillo. Artículo.
NCSS 2000. 1999. NCSS and PASS Trial. User´s Guide. Utah.
Pla, Laura E. 1986. Análisis multivariado: Método de componentes Principales. Monografía. Secretaría General de la O.E.A. Programa Regional de Desarrollo Científico y Tecnológico. Washington.
Rojas Soriano, R. 1982. Guía para realizar Investigaciones Sociales. Textos Universitarios. UNAM. México.
Romero Dávila, María Antonieta. 1992. La capacitación en el IMSS Delegación Coahuila, con la técnica de Análisis Sistémico por medio de Constelaciones Correlacionales. Tesis de Licenciatura. Fac. de Ciencias de la Educación y Humanidades. U.A. de C., Saltillo.
S.E.P. Coahuila. 1985. Programa Integral de Investigación Educativa. Saltillo.
Dr. Temístocles Muñoz López140
Representaciones Gráficas
Selltiz, C., L. S. Wrightsman y S. W. Cook. 1980. Métodos de investigación en las relaciones sociales. Ediciones RIALP. Madrid.
Smith, Peter H. 1981. La movilidad política en el México Contemporáneo. In. Lecturas de política Mexicana. Centro de Estudios Internacionales. El Colegio de México. México.
StatSoft, Inc. (1997). STATISTICA for Windows [Computer program manual]. Tulsa, OK: StatSoft, Inc., 2300 East 14th Street, Tulsa, OK 74104, phone: (918) 749-1119, fax: (918) 749-2217, email: [email protected], WEB: http://www.statsoft.com
StatSoft, Inc. (2003). Electronic Textbook. Glossary. http://www.statsoft.com/textbook/stathome.html
StatSoft, Inc. (2003). Electronic Textbook. Graphical Techniques. http://www.statsoft.com/textbook/stathome.html
Young, Robert k. y Donald J. Veldman. 1981. Introducción a la estadística aplicada a las ciencias de la conducta. 2ª edición. Ed. Trillas. México.
Dr. Temístocles Muñoz López141