Diseño, Lectura y Representación de Gráficos

Diseño, Lectura y Representación de

Gráficos

Dr. Temístocles Muñoz López

Representaciones Gráficas

SERIE DIDÁCTICA: METODOLOGÍA DELA INVESTIGACIÓN

FCEyH® 2004

Dr. Temístocles Muñoz López2


UNIVERSIDAD AUTÓNOMA DE COAHUILA

FACULTAD DE CIENCIAS DE LA EDUCACIÓN Y HUMANIDADES

MAESTRÍA EN METODOLOGÍA DE LA INVESTIGACIÓN

DISEÑO, LECTURA Y REPRESENTACIÓN DE GRÁFICOS

© DR. TEMÍSTOCLES MUÑOZ LÓPEZ

SALTILLO, COAHUILA

SEGUNDA EDICIÓN, AGOSTO DE 2004



DISEÑO, LECTURA Y REPRESENTACIÓN DE GRÁFICOSSERIE DIDÁCTICA: METODOLOGÍA DE LA INVESTIGACIÓNFACULTAD DE CIENCIAS DE LA EDUCACIÓN Y HUMANIDADESEDIFICIO “N” UNIDAD CAMPO REDONDOTEL. 412-91-33

ISBN:

UNIVERSIDAD AUTÓNOMA DE COAHUILABLVD. GONZÁLEZ LOBO Y V. CARRANZA S/NSALTILLO, COAHUILAC.P. 25000

UNIVERSIDAD AUTÓNOMA DE COAHUILA

SEGUNDA EDICIÓN, AGOSTO DE 2004

IMPRESO EN MÉXICO



CONTENIDO

El Diseño, la Lectura y la Representación de los Gráficos..................................................7

APARTADO A. NORMAS GENERALES DE ICONOGRAFÍA ESTADÍSTICA........9

LA ICONOGRAFÍA ESTADÍSTICA Y SUS FUNCIONES...............................................................9Terminología de las representaciones simbólicas.......................................................................................9Normas Generales de presentación............................................................................................................12Normas éticas.............................................................................................................................................19Tipos de iconógrafos como ejemplo...........................................................................................................21Combinaciones personalizadas..................................................................................................................29

APARTADO B. GENERACIÓN Y USO DE GRÁFICOS COMUNES.......................31

I. PRÓLOGO...................................................................................................................31II. HISTOGRAMAS...........................................................................................................32

Introducción...............................................................................................................................................32La Densidad del trazo................................................................................................................................34Estructura de datos.....................................................................................................................................37

III. GRÁFICAS DE PASTEL............................................................................................38Introducción y Propósitos Generales.........................................................................................................38La estructura de los datos..........................................................................................................................38

IV. DIAGRAMA DE CAJAS............................................................................................39Introducción...............................................................................................................................................39La definición del diagrama de cajas..........................................................................................................39La Caja.......................................................................................................................................................39Los valores adyacentes límites...................................................................................................................40Los valores extremos..................................................................................................................................41Comparaciones múltiples...........................................................................................................................41La estructura de datos................................................................................................................................43

V. CARTAS O GRÁFICAS DE BARRAS...............................................................................43Introducción y Propósitos Generales.........................................................................................................43La estructura de datos................................................................................................................................43

VI. DIAGRAMAS DE PROBABILIDAD............................................................................44Introducción...............................................................................................................................................44La lectura del diagrama de probabilidad..................................................................................................46Los outliers.................................................................................................................................................47Las colas largas..........................................................................................................................................47La asimetría................................................................................................................................................47Las mesetas y los valles..............................................................................................................................48Precauciones..............................................................................................................................................48Los detalles técnicos...................................................................................................................................48La estructura de datos................................................................................................................................50

VII. DIAGRAMA DE DISPERSIÓN...................................................................................50Introducción...............................................................................................................................................50Estructura de datos.....................................................................................................................................51

VIII. MATRIZ DE DIAGRAMAS DE DISPERSIÓN..............................................................52



Introducción...............................................................................................................................................52Estructura de los datos...............................................................................................................................53

IX. DIAGRAMAS DE SUPERFICIE 3D............................................................................53Introducción...............................................................................................................................................53La Estructura de los datos..........................................................................................................................55Estilos del Diagrama de superficie............................................................................................................55

X. DIAGRAMAS DE VIOLÍN.............................................................................................57Introducción...............................................................................................................................................57Los diagramas de violín.............................................................................................................................59Estructura de datos.....................................................................................................................................61

XI. CARTAS DE PARETO..............................................................................................61Introducción...............................................................................................................................................61Muestra el diagrama de una gráfica de Pareto.........................................................................................62Estructura de datos.....................................................................................................................................62

XII. AGRUPAMIENTOS JERÁRQUICOS............................................................................63Introducción...............................................................................................................................................63

XIII. LAS GRÁFICAS DE BARRAS DE ERROR...................................................................64Introducción...............................................................................................................................................65Los valores perdidos...................................................................................................................................65Estructura de datos.....................................................................................................................................66

XIV. MATRIZ REJILLA DE PUNTOS.................................................................................66Introducción...............................................................................................................................................66Estructura de datos.....................................................................................................................................67Las opciones...............................................................................................................................................67Variable (X, Y, Z)........................................................................................................................................68Mínimo y máximo (X, Y, Z).........................................................................................................................68Rebanadas (X, Y, Z)....................................................................................................................................68Decimales de Z...........................................................................................................................................68El estilo del diagrama................................................................................................................................68Bloques.......................................................................................................................................................68Símbolos con un color................................................................................................................................69Símbolos de colores múltiples....................................................................................................................69

APARTADO C. TÓPICOS SELECTOS DE TÉCNICAS GRÁFICAS ANALÍTICAS71

XV. GRÁFICAS CATEGORIZADAS..................................................................................71¿Qué son los Gráficos Categorizados?......................................................................................................72Métodos de Categorización........................................................................................................................74Histogramas...............................................................................................................................................77Diagramas de puntos..................................................................................................................................80Gráficos de Probabilidad...........................................................................................................................82Diagramas Quantil-Quantil.......................................................................................................................83Diagramas Probabilidad-Probabilidad.....................................................................................................84Diagramas de Línea...................................................................................................................................85Diagramas de Caja.....................................................................................................................................86Gráficas de Pastel......................................................................................................................................88Diagramas de puntos de datos perdidos por rango...................................................................................89Diagramas 3D............................................................................................................................................90Diagramas Ternarios.................................................................................................................................91

XVI. CEPILLADO............................................................................................................93XVII. ALISADO DE DISTRIBUCIONES BIVARIANTES....................................................94



XVIII. COMPRESIÓN DE CAPAS.....................................................................................96XIX. PROYECCIONES DE JUEGOS DE DATOS 3D.............................................................97XX. DIAGRAMAS DE ÍCONOS........................................................................................98

Analizando Diagramas de Íconos..............................................................................................................99Taxonomía de Diagramas de Íconos........................................................................................................101Estandardización de valores....................................................................................................................103Aplicaciones.............................................................................................................................................103Gráficas Relacionales..............................................................................................................................104Tipos de Gráficos de íconos.....................................................................................................................104Íconos enmarcados...................................................................................................................................109

XXI. REDUCCIÓN DE DATOS.........................................................................................110XXII. ROTACIÓN DE DATOS (EN ESPACIO 3D)..........................................................111

Ligas para consultar los tipos de gráficas en Statistica...........................................................................112

APARTADO D. DIAGRAMAS CORRELACIONALES.............................................114

ASCC................................................................................................................................114XXIII. EL ANÁLISIS SISTÉMICO POR MEDIO DE CONSTELACIONES CORRELACIONALES

114INTRODUCCIÓN.....................................................................................................................................114Apuntes complementarios sobre la correlación estadística.....................................................................117Descripción de la técnica de constelaciones correlacionales..................................................................122Elaboración de las constelaciones correlacionales.................................................................................129Lectura de las constelaciones...................................................................................................................133Las conclusiones y su validez externa......................................................................................................135Consideraciones finales............................................................................................................................136

Literatura de consulta......................................................................................................137



EL DISEÑO, LA LECTURA Y LA REPRESENTACIÓN DE

LOS GRÁFICOS1

En la vida del hombre la simbología juega un papel muy importante, tanto en el

lenguaje como en la correspondencia que guardan las imágenes con una

representación del orden social y natural en que habita.

Todo signo o símbolo encierra información que es evidente solamente para

quienes pertenecen a la cultura que los creó o heredó. Con el desarrollo de las

civilizaciones y sus lenguajes en diferentes espacios geográficos, cada comunidad

étnica, filosófica o científica resulta en una suerte de ínsula que especializa sus

medios de comunicación y su patrimonio cultural. Así, la realidad, aunque puede

ser la misma para todos, es codificada e interpretada por cada comunidad

específica, como una convención social particular, por medio de un sistema de

símbolos.

Los signos gráficos y las formas fónicas pueden variar de una lengua a otra, pero las cosas y las imágenes de las cosas son las mismas para todas.

Aristóteles: De interpretatione, 16-2-8

En su libro sobre la manipulación de la ciencia, Pierre Thuillier (1975) indica que

Leibniz demuestra con ejemplos precisos que las lenguas difieren no solamente

desde el punto de vista fónico, sino sintáctico y semántico. No reflejan solamente

la historia de los pueblos, sino que pueden condicionar la mentalidad y las

costumbres. El uso de signos está incorporado y define tanto el lenguaje de la

comunidad, como la percepción de la realidad y el orden de la realidad misma

para ésa comunidad, solamente ella y para sí, lo decodifica e interpreta en un acto

significador.

1 Cítese como: Muñoz López, Temístocles. 2004. Diseño, Lectura y Representación de Gráficos. Segunda edición. Maestría en Metodología de la Investigación. Facultad de Ciencias de la Educación y Humanidades. Universidad Autónoma de Coahuila. Saltillo.



Todo signo en si mismo parece muerto: ¿qué es lo que le da vida?... vive de su uso.Wittgenstein (Investigaciones Filosóficas)

Las comunidades académicas y profesionales también utilizan un sistema de

códigos, símbolos y grafías especiales que no solo representan sus ideas, sino

que las delimitan y autoexcluyen de otras comunidades. No obstante, el

aislamiento no es total ni permanente, no son sistemas cerrados, siempre

conservan rasgos comunes entre sí, que se constituyen en puentes o vasos

comunicantes que permiten su desarrollo regulado por el intercambio e

incorporación de nuevas ideas y representaciones.

Es decir, estas comunidades aceptan que en su conjunto pertenecen a una

comunidad epistémica mayor, y que al presentar rasgos científicos comunes,

pueden ser posibles los intercambios conceptuales, metodológicos e

instrumentales, que al asimilarse les propicien ventajas adaptativas dinámicas y un

mayor éxito explicativo y operacional.

Las representaciones gráficas siguen de hecho éste patrón, en el cual, lo que las

comunidades académicas consideran científico, por lo tanto racional, objetivo y

verdadero, en tanto es útil, es incorporado por otras comunidades periféricas. Con

ello el proceso de normalización o normativo para representar los hechos

científicos ha madurado conservando las especificidades y criterios de cada

disciplina en particular.



APARTADO A. NORMAS GENERALES DE ICONOGRAFÍA ESTADÍSTICA

LA ICONOGRAFÍA ESTADÍSTICA Y SUS FUNCIONES

Existe quizá una respuesta al problema de la relación entre el lenguaje y la realidad. El lenguaje es, o bien un velo tejido por la costumbre entre nosotros y la realidad, y que es

necesario desgarrar, o bien una deformación de la realidad que hace falta rectificar inventando otros símbolos y otros instrumentos.

W. M. Urban, Language and Reality (1951)

Los graphos (in sensu lato) son transformaciones de los datos que sirven para re-

presentarlos, con la finalidad de propiciar o mejorar la comprensión de los

fenómenos que se estudian (función exploratoria), o para mostrar y sustentar

afirmaciones que se hacen sobre ellos (función explicativa). En las publicaciones

académicas las normas generales sobre los graphos se aplican con rigor, y la

creatividad se deja para el esfuerzo por cumplirlas.

En el límite de la creatividad gráfica científicamente aceptable, las

representaciones artísticas de temas académicos en las ilustraciones o los

carteles (posters) pueden utilizarse con fines promocionales siempre y cuando

conserven los criterios de cientificidad.

Terminología de las representaciones simbólicas

Primero es conveniente analizar la terminología general involucrada en el uso de

las representaciones, dado que cada editorial las conceptualiza en forma distinta.

Se presentan a continuación algunos conceptos básicos para analizar, de acuerdo

a la Real Academia Española mediante la consulta en línea en: www.rae.es:



Representación. (Del lat. representatĭo, -ōnis). f. Acción y efecto de representar. ||

Figura, imagen o idea que sustituye a la realidad. || Cosa que representa otra. ||

Psicol. Imagen o concepto en que se hace presente a la conciencia un objeto

exterior o interior. || Gráfica. f. Mat. Figura con que se expresa la relación entre

diversas magnitudes.

Gráfico, ca. Grafo. m. Ling. Unidad abstracta que comprende el conjunto de

grafías de una letra. Grafo-. (Del gr. γραφειν, escribir). Composición de elementos.

Significa 'escritura'. Grafología, grafomanía. fa. (Del gr. -γραφoς, de la raíz de

γραφειν, escribir). elem. compos. Significa 'que escribe' o 'que describe'.

Mecanógrafo, telégrafo, bolígrafo, hidrógrafo. Gráfico, ca. (Del lat. graphĭcus, y

este del gr. γραφικός). adj. Dicho de una descripción, de una operación o de una

demostración: Que se representa por medio de figuras o signos. U. t. c. s. || m.

Representación de datos numéricos por medio de una o varias líneas que hacen

visible la relación que esos datos guardan entre sí. || f. gráfico (representación

por medio de líneas)

En un diccionario médico biológico encontramos que Graphé, según Francisco

Cortés Gabaudan (http://clasicas.usal.es/dicciomed/) () es

sustantivo: escritura, grabado.

Icono o ícono. (Del fr. icône, este del ruso ikona, y este del gr. bizantino εκών, -

όνoς). Signo que mantiene una relación de semejanza con el objeto representado.

Inform. Representación gráfica esquemática utilizada para identificar funciones o

programas.

La palabra "icono" en sus diversas acepciones procede del griego eikón-eikónos

(‘imagen’), formado sobre el verbo eíko (‘parecer’) En épocas recientes se ha

usado para definir el concepto lingüístico de ‘signo de naturaleza no arbitraria que

guarda alguna semejanza con la cosa representada’.

Esquema. (Del lat. schema, y este del gr. σχημα, figura). m. Representación

gráfica o simbólica de cosas materiales o inmateriales. || Resumen de un escrito,


http://clasicas.usal.es/dicciomed/

http://buscon.rae.es/draeI/#4


discurso, teoría, etc., atendiendo solo a sus líneas o caracteres más significativos.

|| Idea o concepto que alguien tiene de algo y que condiciona su comportamiento.

|| en ~. loc. adv. esquemáticamente (por medio de esquemas).

Figura. (Del lat. figūra). f. Forma exterior de un cuerpo por la cual se diferencia de

otro. || Cosa que representa o significa otra. || ilustración (estampa, grabado de

un libro). || Geom. Línea o conjunto de líneas con que se representa un objeto. ||

Geom. Espacio cerrado por líneas o superficies. ||

Ilustración. f. Acción y efecto de ilustrar. || Estampa, grabado o dibujo que adorna

o documenta un libro. || Publicación, comúnmente periódica, con láminas y

dibujos, además del texto que suele contener. ||.

Semántico, ca. (Del gr. σημαντικός, significativo) adj. Perteneciente o relativo a la

significación de las palabras. || f. Estudio del significado de los signos lingüísticos y

de sus combinaciones, desde un punto de vista sincrónico o diacrónico. V. calco

~, campo ~.

Semiótica. (Del gr. σημειωτικη). f. semiología (estudio de los signos en la vida

social). || Teoría general de los signos.

Señal. (Del lat. signālis, de sĭgnum, seña). f. Marca o nota que se pone o hay en

las cosas para darlas a conocer y distinguirlas de otras. || Signo o medio que se

emplea para luego acordarse de algo. || Distintivo, marca. || Signo (cosa que

representa o sustituye a otra). || Indicio o muestra inmaterial de algo. || Seña (nota,

indicio o gesto). || Vestigio o impresión que queda de algo, por donde se viene en

conocimiento de ello. || Imagen o representación de algo. || Prodigio o cosa

extraordinaria y fuera del orden natural. || dar ~es de algo. fr. Mostrar indicios de

su existencia. || en ~. loc. adv. En prueba, prenda o muestra de algo.

Signo. (Del lat. signum). m. Objeto, fenómeno o acción material que, por

naturaleza o convención, representa o sustituye a otro. || Indicio, señal de algo. ||

Mat. Señal o figura que se usa en los cálculos para indicar la naturaleza de las


http://buscon.rae.es/draeI/SrvltObtenerHtml?TIPO_HTML=2&LEMA=se%C3%B1a&SUPIND=0&CAREXT=10000#1

http://buscon.rae.es/draeI/SrvltObtenerHtml?TIPO_HTML=2&LEMA=signo&SUPIND=0&CAREXT=10000#1

http://buscon.rae.es/draeI/SrvltObtenerHtml?TIPO_HTML=2&LEMA=semiolog%C3%ADa&SUPIND=0&CAREXT=10000#1

http://buscon.rae.es/draeI/SrvltObtenerHtml?TIPO_HTML=2&LEMA=campo&SUPIND=0&CAREXT=10000#campo_sem%C3%A1ntico.1

http://buscon.rae.es/draeI/SrvltObtenerHtml?TIPO_HTML=2&LEMA=calco&SUPIND=0&CAREXT=10000#calco_sem%C3%A1ntico.1

http://buscon.rae.es/draeI/SrvltObtenerHtml?TIPO_HTML=2&LEMA=calco&SUPIND=0&CAREXT=10000#calco_sem%C3%A1ntico.1

http://buscon.rae.es/draeI/SrvltObtenerHtml?TIPO_HTML=2&LEMA=ilustraci%C3%B3n&SUPIND=0&CAREXT=10000#2

http://buscon.rae.es/draeI/SrvltObtenerHtml?TIPO_HTML=2&LEMA=esquem%C3%A1ticamente&SUPIND=0&CAREXT=10000#1


cantidades y las operaciones que se han de ejecutar con ellas. || natural. m. El

que nos hace venir en conocimiento de algo por la analogía o dependencia natural

que tiene con ello.

Símbolo. (Del lat. simbŏlum, y este del gr. σύμβoλoν). m. Representación

sensorialmente perceptible de una realidad, en virtud de rasgos que se asocian

con esta por una convención socialmente aceptada. || Ling. Tipo de abreviación de

carácter científico o técnico, constituida por signos no alfabetizables o por letras, y

que difiere de la abreviatura en carecer de punto; p. ej., N, He, km y $ por Norte,

helio, kilómetro y dólar, respectivamente. || algébrico. m. Letra o figura que

representa un número variable o bien cualquiera de los entes para los cuales se

ha definido la igualdad y la suma.

Sintáctico, ca. (Del gr. συντακτικός). adj. Gram. Perteneciente o relativo a la

sintaxis.

Sintaxis. (Del lat. syntaxis, y este del gr. σύνταξις, de συντασσειν, coordinar). f.

Gram. Parte de la gramática que enseña a coordinar y unir las palabras para

formar las oraciones y expresar conceptos. || Inform. Conjunto de reglas que

definen las secuencias correctas de los elementos de un lenguaje de

programación.

Tabla. (Del lat. tabŭla). Lista o catálogo de cosas puestas por orden sucesivo o

relacionadas entre sí. || Cuadro o catálogo de números de especie determinada,

dispuestos en forma adecuada para facilitar los cálculos. Mat. tabla de

multiplicación de los números dígitos dispuesta en forma de cuadro.

Normas Generales de presentación

Los Criterios

Para la elaboración de las representaciones seguiremos cinco criterios normativos

básicos que necesariamente deben cumplirse:



Importancia. Denotando lo relevante o sustantivo contra lo adjetivo de lo

que se muestra, como apoyo a los datos de la investigación.

Pertinencia. Implica la inclusión de solamente lo necesario, importante y lo

conveniente.

Estética. Referida a una presentación atractiva, que invite al lector a

consultarla, buscando la proporción entre la forma, el fondo, el ajuste de los

espacios, el tamaño y la forma de las letras.

Equilibrio. Cuidando la distribución de las concentraciones de objetos,

rótulos, espacios vacíos y las anotaciones complementarias.

Simplicidad. Con los menos elementos posibles.

Los epígrafes, referencias cruzadas, fuentes y colores tienen regulaciones

técnicas generales y específicas para cada tipo de publicación, presentación y

editor, los cuales son especificados en “Guías para los autores” que proporcionan

a cada investigador que solicita que su material sea publicado. En adelante

revisaremos los aspectos genéricos.

Las Normas para la elaboración de las representaciones

Los graphos deben ir numerados progresivamente sin anteponer la abreviatura de

número (i.e., Cuadro 3), a continuación se anotará el título, el cual estará escrito

en la parte superior y con letras minúsculas, excepto la inicial de la primera

palabra y las iniciales de los nombres propios. El título finalizará con un punto.

Los rótulos explicativos, descriptivos o de referencia del cuadro, figura, tabla,

gráfico u otro tipo de representación, con su descripción, se denominan epígrafes.

La ubicación del cuadro deberá ser inmediatamente después del párrafo donde se

le menciona por primera vez (anotado como referencia cruzada con solo rótulo y

número), siempre y cuando quepa completo; en caso de que no quepa en la



misma página donde se le menciona, se colocará al inicio de la siguiente cuartilla,

en la cual debe reanudarse el texto si aún queda espacio después del grapho,

facilitando así la lectura y el análisis de la información. No es aceptable ubicar los

graphos al final de la Literatura Citada. Los graphos que en su versión final ocupen

más de una página no son aceptables.

Cada variable o concepto se identifica con su nombre y unidades. Reduzca las

cifras grandes para dejar sólo los dígitos significativos, de acuerdo con el nivel de

precisión con que se midió la variable. No es necesario utilizar todos los decimales

que salen del listado de la computadora, se recomiendan solamente 2.

En cada grapho solamente presente un máximo de tres líneas horizontales a todo

lo largo o (aunque puede haber varias sublíneas que abarquen parte de las

columnas o conceptos): la primera línea se coloca debajo del título del grapho; la

segunda, abajo de los criterios de clasificación principales y contiene el cuerpo de

datos; y la tercera, al final del grapho.

Después de la última línea horizontal mayor se colocan las notas de pie del

grapho, las que son de dos tipos:

a) Para indicar niveles de significancia estadística y su simbología de

representación, por ejemplo (_____ =p0.05, p0.01) y para

diferenciar los datos resultantes de tratamientos o muestras se emplean

letras minúsculas (a, b, c, etc.); y

b) Para dar información complementaria como llamadas al título, a los

encabezamientos o a los datos, se pueden emplear números arábigos (a

manera de exponentes); sin embargo, si se cuenta con máquina que posea

diferentes símbolos, se recomienda utilizarlos siempre y cuando aporten

claridad a la explicación.

En la Tabla 1 se presenta un ejemplo del formato general. Nótese que cuando se

generaliza se escribe cuadros o tablas o figuras, etc. en minúsculas. Cuando se



particulariza se escribe con mayúscula, seguido del número. Obsérvese también

que toda la información de este grapho está a doble espacio para que los

asesores, árbitros y editores tengan lugar suficiente para hacer sus anotaciones.

Tabla 1. Características académicas de grupos de alumnos integrados por sus calificaciones en dos años de evaluación †.

Características de aprovechamiento Atributos medidos ¶

Grupos de Historia académica

Calificaciones Calificación Asistencia semestral

Horas diarias de estudio

Alumnos promedios¶ Exámenes Tareas (%) Hrs. medidas Hrs. declaradas

2001 §

Grupo A 87 85 34.2ª 248 3.25

Grupo B 92 89 33.4b 145 3.00

Integración A y B 97 96 31.0c 120 3.12

2002

Grupo A 87 86 28.5 340 3.60

Grupo B 94 92 41.3 280 3.00

Integración A y B F

99 95 35.0 150 2.00

† : Promedios de tres trimestres en 2001 y cuatro en 2002.¶ : Se refiere al obtenido de archivos después del diseño del estudio.§ : En este año, se concentraron manualmente los datos los primeros 20 días después de los exámenes.F : Promedios seguidos de la misma manera en cada año, que no son diferentes estadísticamente, según Duncan (p ≤0.05).

Además de los puntos anteriores, los autores tendrán especial cuidado en no

saturar su escrito con graphos de tamaño reducido, cuando muchas veces en uno

se puede reunir la información de varios. Sin embargo, tampoco es conveniente

que se emplee un cuadro o tabla con demasiadas columnas o hileras, sobre todo

si la información tabulada no se utiliza en la discusión. Todas las variables

incluidas en los cuadros y figuras estarán descritas en el capítulo de Materiales y

Métodos (Metodología), así como leídas y discutidas en el capítulo de Resultados

y/o el de Discusión.

Cuadros

Los cuadros se emplean para clarificar el texto, cuando se presentan nombres o

números con lectura independiente, sintética y complementaria, o cuando su



uso constituye un ahorro importante de espacio. Son claros, simples y concisos.

Cada cuadro debe presentar datos en forma organizada, de manera que facilite

las comparaciones, muestre clasificaciones, se observe rápidamente algunas

relaciones y, sobre todo, se ahorre espacio del texto. Cada cuadro se explica por

sí mismo y su contenido no se repite en las figuras ni en el texto del artículo,

solamente se hace referencia a él.

Solamente los cuadros y las tablas tienen el epígrafe en su parte superior. Las

demás representaciones iconográficas lo tendrán en la parte inferior.

Tablas

Las tablas son concentrados de datos numéricos ordenados matricialmente para

mostrar los listados de resultados que son la fuente de la información textual

analítica, presentada en forma de lectura interdependiente. Siguen las mismas

normas generales en su presentación.

Figuras y otras representaciones gráficas

Las figuras y otras representaciones como dibujos, gráficas, diagramas y

fotografías tienen básicamente las mismas normas. Su información, en el capítulo

de Resultados, no se duplica en otras representaciones que explican lo mismo, ni

en forma de prosa en el texto.

En caso de las fotografías, deben tener un contraste adecuado para su impresión

o fotocopia de tamaño postal y que claramente señalen lo que el autor desea

mostrar.

Los dibujos, gráficas y diagramas deben ser presentados con toda la información

que permita su comprensión para un público amplio, en un epígrafe al pie de la

figura.

Al igual que en el caso de los cuadros, las figuras se especifican en el texto y en el

título de las mismas como referencias cruzadas con mayúscula inicial, como por



ejemplo Figura 1, Figura 2,... (Figuras 8 y 9), etc. Los autores deben considerar

que la reproducción de figuras es conveniente hacerlas de un tamaño tal que

permita mantener la nitidez en una reducción hasta de 50% para la impresión final.

Al respecto, se sugiere un tamaño de media página para figuras sencillas y de una

página para figuras complejas, con un tamaño mínimo de 8 puntos para las letras

o números.

En una figura lo que interesa destacar es el contenido y no los ejes.

Consecuentemente, el grosor de estos últimos conviene que sea menor que el de

las líneas interiores. Para indicar las dimensiones de los ejes se sugiere elegir

escalas apropiadas, que destaquen lo que se desea mostrar; las leyendas de cada

eje se colocarán como se indica en la Figura 1. Observe que la figura no tiene

marco, lo que aumenta la simplicidad pero no se pierde contenido. En

consecuencia, los editores solamente se aceptan las figuras si cumplen con los

requisitos indicados por ellos.

Figura 1 . Ejemplo de elementos de una figura.



Al igual que los cuadros, todas las figuras deberán estar expresamente citadas en

el texto previo, en orden progresivo.

Nunca comience un apartado, ya sea capítulo (título de primer orden) o título de

segundo o tercer orden con una tabla o representación gráfica.

Unidades

Las unidades a usar son las del Sistema Internacional. Se sugiere colocar entre

paréntesis la equivalencia de los símbolos de cualquier otro sistema la primera

vez que se nombre una unidad, si son diferentes.

En una serie de datos con igual unidad de medición, utilice numerales seguidos de

la forma abreviada de la unidad (sin colocar punto final ni mayúsculas al principio);

por ejemplo: 2, 4 y 6 ml L-1, 16, 20 y 33%; 3400, 1200 y 400 kg, 4 y 9 meses.

En cambio, si sólo hay una cifra y ésta es menor de 10, se escribe con palabras

(seis variables, cuatro repeticiones, ocho ambientes), a diferencia de 16 alumnos,

126 casos; sin embargo, si esa cifra va acompañada inmediatamente de alguna

unidad del sistema internacional, debe expresarse con número (2 mg, g-1, 6 g, 5 lt)

No empiece una frase o párrafo con un numeral. Cambie la frase o escriba la

cantidad con letras.

Cuando se trate de números grandes en el texto, procure redondear la cifra y

emplear palabras como parte del número; así, $458,960.00 puede expresarse

como “casi 460 mil pesos”. Recuerde que los símbolos de las unidades de medida

no se pluralizan: kilo(s) = kg, kilómetro(s) = km, hectárea(s) = ha, metro(s) = m,

litro(s) = lt, gramo(s) = g, etc.



Fórmulas

Los índices y subíndices estarán bien ubicados y legibles. Tenga especial cuidado

en diferenciar claramente los números 0 y 1 de las letras O e l, respectivamente.

El tamaño mínimo aceptable es de 2 mm u 8 puntos.

Las letras griegas, así como los símbolos que se utilizan para marcar o referir, se

explican inmediatamente después de haberse usado por primera vez, excepto

aquellos del dominio del sistema internacional.

Para expresar fracciones use la forma lineal, con exponentes negativos para los

denominadores; ejemplo: g/cm2, kg/ha-1

Las ecuaciones que expresan las derivaciones matemáticas de una fórmula,

progresivas o no, serán numeradas consecutivamente entre paréntesis, al lado

derecho cuando sean más de una. En general se numeran sólo aquéllas

explícitamente referidas en el texto.

Se recomienda el uso de potencias fraccionarias (0.5, 0.33) en vez de raíces

cuadradas, cúbicas, etc.

Las potencias de “e” se expresan mejor como “exp” (abreviatura de la función

exponencial)

En el caso de las fórmulas químicas, la carga de los iones se expresa como lo

señala el ejemplo siguiente: Ca2 y CO3, y no Ca++.

En la escritura de isótopos, el número de masa se indica en la parte superior del

lado izquierdo del símbolo; ejemplo: 15N, 14C, etcétera.

Normas éticas

Las gráficas pueden ser modificadas para facilitar su lectura y magnificar los

efectos de los datos, pero también para crear intencionalmente impresiones falsas,



de tal forma que es conveniente que el investigador esté pendiente de sus

diseños, y del impacto que las representaciones tienen en otras personas.

La siguiente gráfica puede ser modificada para magnificar los efectos de los datos

y crear las impresiones que convienen a los que la elaboran. En ella se indican

dos variables que miden lo mismo y son recíprocos, de tal suerte que la

modificación no es en los datos, sin en la escala utilizada y las dimensiones del

gráfico.



El efecto anterior, magnificado, si es preparado para una presentación puede tener

un sentido negativo sobre la percepción pública de la conducción de la política

económica, en tanto que si es con fines de análisis o exploración de los datos

servirá para apreciar con más detalle las variaciones.

La ética (ethos: comportamiento) del investigador le reclama apegarse a la verdad

y a la responsabilidad que tiene con los demás usuarios de la información que

presenta.

Tipos de iconógrafos como ejemplo

• Se enfatiza que los programas estadísticos para la investigación difieren en

la construcción de gráficas, con los programas comerciales de

procesamiento de textos y de bases de datos con hojas de cálculo, en que

los primeros agrupan los datos en rangos numéricos (ambos ejes son

tratados como números o ejes verdaderos X e Y), y los comerciales

presentan solamente la estructura que tienen las tablas de origen (un eje es

tratado como números y otro como etiquetas de categorías).

• Los primeros se llaman “Gráficos Científicos o Técnicos” y los segundos

“Gráficos Secuenciales”.

El análisis preliminar de las bases de datos es altamente recomendable antes de

su procesamiento, para ello los casos atípicos u outliers se eliminan si están más

allá de 3 sigmas, siempre y cuando exista un previo análisis explicativo

independiente de cada uno de ellos, ya que pudieron ser introducidos por “errores

de dedo” en la captura o desviaciones preferenciales afectivas de los sujetos. Para

lograr detectarlos se utilizan gráficos como Box Plot que los marcan.

Las representaciones de datos o dibujos descriptivos pueden clasificarse

convencionalmente y a manera de ejemplo se usa la siguiente tipología general.



1. Matrices

Las matrices de datos usualmente no se presentan en la investigación a menos de

que se trate de ejemplificar o mostrar con ellas algún hecho relevante que influye

en la investigación. Las matrices son referidas como tablas de doble entrada.

El siguiente ejemplo muestra un fragmento de una base de datos:

Número GEdad GCiudad Región GGénero RMafectoREreconvHreaucas Hregtrad Hregacua1 15 Saltillo Sureste 1 1 0 2 3 52 15 Saltillo Sureste 1 9 7 0 5 83 15 Saltillo Sureste 2 10 9 10 10 94 15 Saltillo Sureste 2 10 9 10 10 85 15 Saltillo Sureste 2 8 1 5 10 106 15 Saltillo Sureste 2 9 2 5 8 97 15 Saltillo Sureste 1 9 7 5 3 58 15 Saltillo Sureste 1 10 7 8 6 79 14 Saltillo Sureste 2 10 1 5 8 910 14 Saltillo Sureste 2 9 7 5 9 911 15 Saltillo Sureste 1 9 3 8 6 812 14 Saltillo Sureste 1 7 2 1 3 713 15 Saltillo Sureste 2 10 3 6 10 714 14 Saltillo Sureste 2 8 3 4 10 915 15 Saltillo Sureste 1 8 1 7 10 916 14 Saltillo Sureste 1 10 1 3 10 717 15 Saltillo Sureste 2 10 0 1 6 5

Se consideran similares: Matrices de correlación (generalmente presentadas como

tablas), Matrices de las bases de datos.

No todas las matrices o tablas requieren ser incluidas en la investigación o el

informe de la misma, a menos que sea estrictamente necesario. El siguiente

ejemplo muestra una matriz de datos de correlación que no aparecerá en la

investigación pero que tiene valor exploratorio y como lectura para los resultados.

Correlaciones canónicas de las variables de la cohorte 16 significativas a p .01 N=69 y una r 0.31

Justicia Autocontrol Autocontrol Autocontrol Autocontrol AutoestimaRMREGJUS RMAUTCON RMCOMRES RMAUTIMP RMPACREC RMCONLIM

HBUEXIG 0.374 0.428 0.346 0.324HCOMPL 0.502

HCONTAUT 0.423HINDMEJ 0.342HNOCAST



REACTIV 0.348 0.309REAFECTO 0.312 0.478 0.319 0.362REAPADRE 0.359 0.331REAPJUVE 0.449 0.316REAPMOTR 0.338 0.503REBUECON 0.460 0.410 0.394 0.516 0.364 0.539

2. Cuadros

Los cuadros son representaciones de datos importados de otros autores, donde se

concentra la información sistemáticamente organizada y pertinente.

Ejemplo:

Las políticas de desarrollo agrícola relacionadas con los factores de la

sustentabilidad ambiental, son propuestas por Gligo (1990) de acuerdo al siguiente

cuadro:

Factores: Políticas:Global Específica

Coherencia ecológica Científica y Investigación de recur-tecnológica. sos naturales.

Investigación agronó-mica.

Ordenamiento Áreas protegidas.territorial. Áreas de expansión

agrícola.

Estabilidad Socio- Estructura de Reforma agraria.estructural. tenencia. Regulación jurídica.

Complejidad infra- Obras públicas. Riego y drenaje.estructural. Obras viales.

Estabilidad econó- Comercialización. Capacidad de compra.mico-financiera. agropecuaria Precios de productos.

Precios agrícolas. Precios de insumos tec-nológicos.

Créditos agrícolas. Créditos subsidiados.Subsidios para Subsidios para la recu-la recuperación peración de los suelosambiental. erosionados.

Subsidios para la refo-



restación.

Incertidumbre y Financiera. Fondos de rubros espe-riesgo. cíficos.

Seguros.

3. Tablas para el informe de investigación

Las tablas concentran datos con una entrada de rótulos en la parte superior, y

representan una concentración de datos relevantes y pertinentes de lo que se

desea mostrar.

Se consideran similares: Tablas de resultados estadísticos, Tablas comparativas

de tratamientos.

4. Diagramas

Se consideran similares: Dendrogramas, Rutas, Secuencias, Correlacionales,

Constelaciones, Dispersogramas, Flujo, Diacrónico, Polietapas, Mapas

conceptuales.



5. Figuras

Se consideran similares: Gráficas de íconos, Caras de Chernoff, Íconos de Pastel,

Estrellas, Íconos de Columnas, Rayos solares, Íconos de Líneas, Íconos

poligonales, Íconos de perfiles.



6. Gráficos

Se consideran similares: Histogramas, Gráficas de cajas, Gráficas de puntos,

Gráficas de líneas, Gráficas de probabilidad, Gráficas de áreas, Gráficas

circulares, Anillos, Gráficas ternarias, Superficie, Gráficas de contorno, Gráficas

secuenciales.



7. Láminas

Ilustraciones coloreadas.



8. Mapas

Distribuciones territoriales y mentales (si así se especifica), Ubicaciones, Rutas.

Combinaciones personalizadas

Los arreglos específicos de los datos modificando los estilos predeterminados.

Diseños 2D y 3D

Solamente usuales en casos en que se requiere incluir 3 o más variables que se

relacionan dimensionalmente. No se permiten en la mayoría de las editoriales

debido a que se pierde la perspectiva de los ejes X e Y.

Ajustes personalizados

Se permiten las modificaciones predeterminadas en ejes, colores, leyendas, tablas

adjuntas, tendencias, líneas de división. De hecho, es deseable realizar las

modificaciones pertinentes para ganar mayor riqueza en la presentación.



Simbología

Las literales, símbolos especiales y símbolos internacionales se permiten en la

mayoría de las publicaciones, con la precaución de no saturar la representación,

indicando su significado al pié de la gráfica o en el texto previo.

Colores.

Se requiere preferentemente usar los colores blanco y negro para publicaciones y

en color para presentaciones en pantalla con fines exploratorios.



APARTADO B. GENERACIÓN Y USO DE GRÁFICOS COMUNES2

I. PRÓLOGO

Se ha seleccionado cuidadosamente el material de los programas NCSS y

Statistica por dos razones: primero, dado que las bases que se aprenden en ellos

para la generación, exploración y lectura de datos de una investigación son

versátiles y sencillos, y en segundo lugar, porque se utiliza extensamente por los

maestros y alumnos en el desarrollo de sus investigaciones en los estudios de

Ciencias Sociales y Naturales.

Se insiste en que los programas estadísticos para la investigación difieren de los

programas comerciales de procesamiento de textos y de bases de datos con hojas

de cálculo para la construcción de gráficas, en que los primeros agrupan los datos

en rangos numéricos (ambos ejes son tratados como números o ejes verdaderos

X e Y), y los comerciales presentan solamente la estructura que tienen las tablas

de origen (un eje es tratado como números y otro como etiquetas de categorías).

Los primeros se llaman “Gráficos Científicos o Técnicos” y los segundos “Gráficos

Secuenciales”.

Evidentemente los gráficos científicos tienen mucha mayor riqueza y poder en la

presentación y la exploración de los datos para convertirlos en información

confiable. Al estudiar éstos módulos básicos, se sigue un criterio de análisis

didáctico para favorecer el aprendizaje del uso de estadísticos por gráficos.

2 La adaptación, traducción y ajustes que presentan los textos seleccionados en éstos apuntes han sido modificados por el autor a partir de materiales originales de NCSS (Number Cruncher Statistical System) y Statistica, para facilitar su comprensión como material de guía.



Número de clases

Antes de comenzar con la elaboración de gráficos es conveniente conocer el

número de clases, segmentos o porciones en que se distribuirán gráficamente los

datos. Para ello se utilizan dos procedimientos comunes:

1) Fórmula de Sturges para el número de clases (Forns, M., T. Kirchner, y M. Torres (1991). k=1+3.3(log n). donde

k= número de clasesn= tamaño de la muestra

Ejemplo:

Muestra: 257Desarrollo: Log de n = 2.41Base 3.3+1= 4.3k= 10

2) Regla del tanteo (http://www.cofc.edu/~milesd/freqdist.htm) k=5(log n).

donde:k= número de clasesn= tamaño de la muestra

Ejemplo:

Muestra: 257Desarrollo: Log de n = 2.41Base 5k= 12

En ambos casos el número de intervalos de clase es muy similar gráficamente y el

investigador requiere aplicar ambos para observar y decidir cuál es el que muestra

mejor los datos.

II. HISTOGRAMAS

Introducción

La palabra histograma viene de los griegos ístos () que significa mástil, telar,

tejido, trama de filamentos, y gram () a, que significa letra, trazo, signo,


http://www.cofc.edu/~milesd/freqdist.htm


esquema o gráfico. Por la definición directa de histograma se toma gráfico de

tramas o postes. (Histograma. De histo- y -grama. 1. m. Estad. Representación

gráfica de una distribución de frecuencias por medio de rectángulos, cuyas

anchuras representan intervalos de la clasificación y cuyas alturas representan las

correspondientes frecuencias. Real Academia Española: www.rae.es)

Quizás esta palabra fue elegida

porque un histograma parece

una trama o un conjunto de

postes que están alineados

juntos. Un histograma se utiliza

para exhibir la distribución de los

valores de los datos a lo largo del

número de la línea verdadera.

Compite con el diagrama de

probabilidad como método de análisis gráfico de la normalidad.

A veces no se puede comprender un conjunto grande de observaciones

leyéndolas directamente. Para realizar la lectura de los números, usted debe

resumirlos, clasificando, agrupando, y obteniendo un promedio de ellos. Un

método de hacer esto es construir una distribución de frecuencias. Esto implica el

dividir el rango de los datos en algunos intervalos (generalmente iguales). El

número de las observaciones que se agrupan en cada intervalo se cuenta

gráficamente. Esto da una distribución de frecuencias. El histograma es un gráfico

de distribución de las frecuencias en el cual el eje vertical (y) representa la cuenta

(frecuencia) y el eje horizontal (x) representa el rango posible de los valores de los

datos.

Observe en el siguiente ejemplo de Statistica cómo se incluyen los rangos de los

intervalos y los detalles técnicos de la gráfica. Todas las especificaciones de la

gráfica pueden ser editadas desde el programa antes de que la pueda incluir en su

informe de investigación. Para editar algún aspecto especial en ese programa


0.0

13.3

26.7

40.0

40.0 53.3 66.7 80.0

Histogram

SepalLength

Count


haga clic con el botón derecho del ratón y selecciones “options” o “layout”.

Observe que entre paréntesis se incluyen los intervalos de clase.

La Densidad del trazo

El histograma se utiliza extensamente y necesita poca explicación. Sin embargo,

tiene sus desventajas. Primero, el número y la anchura de los intervalos son una

decisión subjetiva, con todo, el número de intervalos de clase puede ser calculado

con la fórmula de Sturges k=1+3.3(log n), o la regla de tanteo que se vio en el

apartado anterior, y la selección que hagamos tiene un alto impacto en la

apariencia del histograma. Los valores de límite levemente modificados pueden

dar dramáticas apariencias a diversos histogramas (usted puede experimentar con

NCSS para ver el impacto de cambiar el número de intervalos en la apariencia del

histograma). Otro problema con el histograma es que los rectángulos aparentan

que los datos están separados uniformemente a través del intervalo, pero a

menudo en la realidad éste no es el caso.

También, la apariencia global del histograma representa la naturaleza algo alisada

de la distribución de los datos. Estas quejas contra el histograma han traído

muchas innovaciones. Una de las técnicas más nuevas y populares de la



presentación para demostrar la distribución de datos es la densidad del trazo. La

densidad se refiere a la frecuencia relativa (concentración) de los puntos de

referencias a lo largo del rango de datos. Matemáticamente, la densidad en un

valor x se define como la fracción de los valores de los datos por la unidad de

medida en un intervalo centrado en x.

Una vez que usted escoja una anchura conveniente del intervalo, puede calcular la

densidad en cualquier (y a cada) valor de x. Si usted calcula la densidad en, por

ejemplo, 50 valores y los conecta, obtiene la densidad del trazo.

Desafortunadamente muchos programas no contienen ésta función. En NCSS, la

anchura del intervalo se especifica como porcentaje. Mientras que usted aumenta

el porcentaje, usted aumenta la cantidad de datos incluidos en cada cálculo de la

densidad. Esto aumenta la suavidad de la gráfica. Los cuatro trazos siguientes de

la densidad fueron hechos de los mismos datos con aumento del porcentaje de la

suavidad. Observe cómo muestran más estas gráficas que el histograma común

presentado al inicio de éste capítulo.

La densidad del trazo al 25% de los datos se representa de la siguiente forma:

0.0

26.7

53.3

80.0

40.0 53.3 66.7 80.0

Histogram

SepalLength

Co

un

t

Con densidad de 30% quedaría así:



0.0

16.7

33.3

50.0

40.0 53.3 66.7 80.0

Histogram

SepalLength

Co

un

t

En tanto que con 40% la figura se agrupa más, pero mantiene la concentración

marcada:

0.0

13.3

26.7

40.0

40.0 53.3 66.7 80.0

Histogram

SepalLength

Co

un

t

En un caso extremo de agrupamiento al 60% el efecto se exagera de la siguiente

forma:



0.0

13.3

26.7

40.0

40.0 53.3 66.7 80.0

Histogram

SepalLength

Co

un

t

Mientras se aumenta la anchura del intervalo son incluidos los puntos de

referencias más lejanos y más próximos del valor de centro. Para disminuir el peso

de los puntos que quedan lejos del valor de centro, utilizamos un esquema que

carga los puntos de los pesos proporcionalmente a su distancia del valor del

centro. La función del peso usada es la mitad de la función del coseno, con su pico

en el valor de centro que disminuye simétricamente a cero, después de lo cual se

aplica un peso de cero. Por lo anterior, los puntos tienen un impacto cada vez más

pequeño y más pequeño en la densidad del trazo, mientras que están más al

fondo y más próximos del centro.

Otra manera de pensar en la densidad del trazo es imaginarse que usted

construye 1,000 histogramas de los mismos datos usando posiciones levemente

diversas del límite y toma la altura media del rectángulo en cada uno de 50 valores

a lo largo del rango de datos. Esto le daría un histograma alisado que tiene

muchas de las mismas características de la densidad del trazo. Por lo tanto, la

densidad del trazo se debe pensar como un histograma alisado, en el cual la

anchura del intervalo y el número de compartimientos no están en juego.

Estructura de datos



El histograma se construye con una sola variable. Una segunda variable se puede

utilizar para dividir la primera variable en grupos (Ej., categoría de edad o género).

No se solicita otro requisito en los datos de entrada. Sin embargo, las

distribuciones disponibles en NCSS asumen que los datos son continuos. Observe

que son ignoradas las filas con valores perdidos en las variables seleccionadas.

III. GRÁFICAS DE PASTEL

Introducción y Propósitos Generales

Los fines generales de la gráfica de pastel es

construir segmentos dividiendo un círculo en

dos o más secciones. La gráfica se utiliza

para mostrar la proporción en que cada parte

contribuye al total. Por lo tanto, debe ser

utilizada cuando usted desea comparar

categorías individuales con el conjunto. Si

usted desea comparar los valores de una

categoría con otra, utilice un diagrama de la

gráfica de dispersión de barras. Por ejemplo,

la gráfica muestra el presupuesto para cada uno de los cuatro departamentos en

una compañía hipotética. Las gráficas de pastel son útiles para exhibir hasta cerca

de seis o siete rebanadas o porciones.

La estructura de los datos

Los valores de datos deben ser positivos y numéricos. Se omiten los valores no

positivos. Los datos se pueden incorporar en la tabla en dos formatos posibles:

verticales u horizontales. En el formato vertical, una variable (columna) contiene

los valores que se graficarán. En el formato horizontal, una fila los contiene. Estos

datos están en la base de datos original de la gráfica.


Gráfica de pastel del presupuesto

Marketing

Producción

R&D

Administración


IV. DIAGRAMA DE CAJAS

Introducción

Al analizar los datos con un diagrama usted necesita ver a menudo las

características de una sola serie de números, de observaciones o de medidas.

Puede ser que desee conocer el centro y cómo está la distribución de los datos

sobre este valor central. Puede ser que usted desee investigar los valores

extremos atípicos (llamados outliers) o estudiar la distribución de los valores de los

datos (el patrón de los valores de los datos a lo largo del eje de la mediana). Hay

varias técnicas que están disponibles para permitir que usted estudie la

distribución. Éstos incluyen el diagrama de tallo-hoja, el histograma, la densidad

del trazo, el diagrama de probabilidad, y el diagrama de cajas (Box Plot)

presentado en seguida.

La definición del diagrama de cajas

El diagrama de cajas demuestra tres características principales de una variable: su

centro, la distribución de sus datos, y sus outliers o valores atípicos.

La Caja

El diagrama de cajas se compone de una caja (un rectángulo) con las líneas, y los

puntos agregados a ella. La anchura de la caja puede ser arbitraria o convencional

y se debe seleccionar su dimensión para hacer una exhibición agradable a la vista.

La presentación usual de los límites de la cubierta y el fondo de la caja son los

porcentajes 25avo y 75avo. La longitud de la caja es así el rango interquartil (IQR).

Es decir, la caja representa el 50% o mitad de los datos centrales.

El IQR es una medida popular de la distribución. Usted puede representar la caja

como un rectángulo, un diamante, una elipse, o una figura especial diseñada para

hacer comparaciones múltiples. En ella se dibuja una línea a través del centro de



la caja en el punto medio o mediana (el porcentaje del 50avo). El punto medio es

una medida popular de la localización del valor medio o de centro de las variables.

35.0

50.0

65.0

80.0

1 2 3

Box Plot

Iris

SepalL

ength

35.0

50.0

65.0

80.0

1 2 3

Box Plot

Iris

SepalL

ength

Los valores adyacentes límites

Los valores adyacentes al borde superior de la caja son la observación más

grande, que es menor que, o igual al porcentaje del 75avo más 1.5 veces IQR. El

valor adyacente más bajo de la caja es la observación más pequeña que es mayor

que, o igual al porcentaje del 25avo menos 1.5 veces IQR. Los valores adyacentes



se exhiben como líneas en forma de T que se extienden en cada extremo de la

caja. Otros valores fuera de los límites son considerados extremos.

Los valores extremos

Los valores que se ubican fuera de los valores adyacentes superiores y más bajos

que la T de la gráfica se llaman valores extremos, anómalos o atípicos (outliers).

Los valores que están debajo de tres IQRs de los 25avo y 75avo porcentajes se

llaman outliers suaves, en tanto que fuera de tres IQRs se llaman outliers severos.

Los outliers suaves no son raros y los outliers severos si lo son.

Comparaciones múltiples

Estas se utilizan a menudo para las distribuciones de varias agrupaciones de

datos, puesto que resumen el centro y la distribución de los datos con apariencia

muy agradable. Al hacer comparaciones concluyentes entre las localizaciones

(puntos medios) de varias agrupaciones, es útil hacer un diagrama de caja

modificado llamado diagrama truncado.

Se construyen los cortes usando la fórmula:

Mediana IQR n 1.57.

Los diagramas truncados de caja se utilizan para hacer comparaciones múltiples

entre las agrupaciones. Si los cortes de dos cajas no se traslapan, podemos

asumir que los puntos medios son perceptiblemente diferentes (los centros son

estadísticamente significativos). El 1.57 se selecciona para el nivel del 95% de

significancia. El diagrama de cajas presentado abajo es el diagrama truncado

clásico.



40.0

53.3

66.7

80.0

1 2 3

Box Plot

Iris

SepalL

ength

Recientemente, los estadísticos han notado que el diagrama truncado de caja no

permite que usted se centre en las comparaciones múltiples. Se ha propuesto una

versión moderna del diagrama truncado para hacer esta comparación (véase el

diagrama abajo).

40.0

53.3

66.7

80.0

1 2 3

Box Plot

Iris

SepalL

ength

Esta versión modifica el símbolo usado para la caja. De hecho, pone la caja hacia

fuera, y dos líneas horizontales marcan la posición de la caja. La parte que se

grafica es solamente la parte truncada. Esto hace mucho más fácil hacer

comparaciones. Si dos de los cortes se traslapan, los puntos medios del grupo no



son perceptiblemente diferentes. Observe que al hacer comparaciones entre

varias agrupaciones, los diagramas truncados no requieren ningún ajuste para la

multiplicidad de pruebas en que son conducidos. Mientras que los diagramas

truncados se utilicen informalmente, no hay necesidad de ajustes técnicos.

La estructura de datos

El diagrama de cajas se construye a partir de una variable. Una segunda variable

se puede utilizar para dividir la primera variable en grupos (Ej., categoría de edad

o género). En este caso, un diagrama separado de la caja se exhibe para cada

grupo. No se solicita otro requisito en los datos de entrada.

V. CARTAS O GRÁFICAS DE BARRAS

Introducción y Propósitos Generales

Las gráficas de barras se

utilizan para comparar

visualmente valores

contiguos. Hay algunas

variaciones en la gráfica

de barras, éstas incluyen

la gráfica de barras

vertical, la gráfica de

barras horizontal, la

gráfica de área, y la

gráfica de líneas. Hay

versiones bi y

tridimensionales de cada uno. Arriba se muestra un ejemplo de una gráfica de

barras 3D.




Los datos de la gráfica de barras 3D se incorporan en el formato estándar de la

fila-columna de la hoja de datos. Cada valor numérico de los datos se convierte en

una barra. Los datos alfabéticos se utilizan para etiquetar las filas y las columnas

de la gráfica. En la tabla está un ejemplo de los datos graficados.

FRUTA ABRIL MAYO JUNIO

Manzanas 82 70 20

Peras 73 50 33

Duraznos 67 45 28

Naranjas 85 65 17

Kiwis 54 42 24

Melones 33 58 20

VI. DIAGRAMAS DE PROBABILIDAD

Introducción

Este procedimiento construye los diagramas de probabilidad normal, las

distribuciones de Weibull, Chi-ajustado, de gamma, uniformes, exponenciales, y

mitad-normales. Le permite intentar varias transformaciones para ver si alguna se

acerca más a la distribución de su interés. Los límites de confianza aproximados

se dibujan para ayudar a precisar si un sistema de datos sigue una distribución

dada. Si se especifica una variable agrupadora, se dibuja en una línea separada y

se exhibe para cada valor único de la variable agrupadora.



40.0

53.3

66.7

80.0

-3.0 -1.0 1.0 3.0

Normal Probability Plot of SepalLength

Normal Distribution

SepalL

ength

Proporcionaremos una breve introducción a las técnicas de gráficas de

probabilidad, y una discusión completa de este asunto se puede encontrar en

Chambers (1983) que procuraremos resumir a continuación.

Muchos análisis estadísticos asumen que los datos están muestreados de una

población más grande con una distribución especificada. A menudo, la distribución

de esta población más grande se asume que es normal (en trabajos de

confiabilidad y de supervivencia la distribución subyacente se asume que es

exponencial o Weibull). Esto a menudo se llama la asunción de normalidad. (note

que la distribución normal a veces es llamada distribución gaussiana para evitar la

confusión con su definición común. Aunque implica que es normal ¡la distribución

generalmente, no lo es! Esta asunción de normalidad se hace por varias razones:

1. Permite que los datos sean representados compactados. Mil valores que vienen

de la distribución normal se pueden resumir por solamente dos números: la media

y la varianza.

2. Permite el uso de varios procedimientos estadísticos, tales como el análisis de

la variabilidad, de pruebas t, o de regresión múltiple.



3. Permite que las generalizaciones sean hechas de la muestra a la población.

Estas generalizaciones toman generalmente la forma de intervalos de confianza y

de pruebas de hipótesis.

4. Entender la distribución de una muestra puede proporcionar la entrada en el

proceso físico que creó los datos.

Obviamente la naturaleza no genera automáticamente los datos que siguen cierta

distribución de probabilidad. Cuando usted asume que sus datos siguen la

distribución normal, realmente está asumiendo que la distribución de sus datos es

razonablemente aproximada a la distribución normal. La pregunta que se presenta

es ¿que tan bastante cerca está de lo normal? Esta pregunta se puede estudiar

usando procedimientos numéricos y gráficos. Se han desarrollado las pruebas

numéricas de hipótesis que permiten que usted determine si sus datos siguen

cierta distribución. Consulte sobre Ómnibus K.

Las pruebas para la normalidad se proporcionan generalmente en los programas

estadísticos en el apartado de estadística descriptiva. Los procedimientos gráficos

son útiles porque le dan una impresión visual sobre si es válida la asunción de

normalidad. Le permiten precisar si la asunción es invalidada por uno o dos

outliers (que podrían ser quitados), o si los datos siguen una distribución

totalmente dispersa. También sugieren qué transformación de los datos (raíz

cuadrada, registro, lo contrario, los etc.) sigue más de cerca la distribución normal.

El mejor acercamiento es aplicar procedimientos numéricos y gráficos. Dado que

los datos están disponibles en su computadora, toman solamente algunos golpes

de teclado hacer ambos chequeos.

La lectura del diagrama de probabilidad

Esta sección presentará algunos de los fundamentos para el análisis y la lectura

de los diagramas de la probabilidad. Nuestra discusión es breve, así que es

recomendable que busque información adicional si lee regularmente estos

diagramas. También, la experimentación es un profesor muy bueno. Usted debe



hacer varias prácticas con bases de datos que siguen los patrones que usted

comprende. Genere los diagramas de probabilidad para conseguir una apreciación

de cómo se muestran diversos patrones de datos en los diagramas. Si los puntos

en la probabilidad se trazan en toda la pendiente a lo largo de una línea recta,

usted puede asumir que los datos siguen esa distribución de la probabilidad. Por lo

menos, la distribución real es bastante aproximada para la distribución que usted

ha trazado. Discutiremos brevemente los tipos de patrones que coincidan

generalmente con salidas de la rectitud de esta línea.

Los outliers

Los outliers o casos atípicos son los valores que no siguen el patrón del cuerpo de

los datos. Se localizan en cualquier extremo de la probabilidad. Puesto que los

outliers grandes desviarán seriamente la mayoría de los análisis estadísticos,

usted debe investigarlos cuidadosamente. Si son errores u ocurrencias de una

sola vez deben ser quitados de su análisis. Una vez que se hayan quitado los

outliers, el diagrama de probabilidad debe ser rediseñado sin ellos.

Las colas largas

De vez en cuando algunos puntos en ambos extremos se perderán de la línea.

Estos puntos parecen seguir un patrón, no el patrón del resto de los datos.

Generalmente, los puntos en el extremo de la línea tirarán para arriba, mientras

que los puntos en el fondo de la línea caerán debajo de ella. Esto es causado por

una distribución de los datos con colas más largas que las que se esperan ser

consideradas bajo distribución teórica (Ej., normal). Los datos con colas más

largas pueden causar problemas con algunos procedimientos estadísticos.

La asimetría

Si la probabilidad tiene una curva convexa o cóncava (más que una línea recta),

los datos se sesgan a un lado o al otro de la mitad. Esto puede ser corregido

generalmente usando una fórmula de ajuste como transformación de poder.



Las mesetas y los valles

Los puntos que arraciman los datos se muestran en el diagrama de probabilidad

como valles y mesetas (desplazamientos horizontales de puntos). Esto puede ser

causado por la granulidad de los datos. Por ejemplo, si la variable puede adquirir

solamente cinco valores, el diagrama exhibirá sus patrones. Cuando ocurren estos

patrones, debe estar seguro que sabe la razón de ellos. ¿Es debido a la

naturaleza discreta de los datos, o los racimos son causados por una segunda

variable extraña?

Precauciones

El estudio de diagramas de la probabilidad es una herramienta muy útil en análisis

de datos, teniendo algunas precauciones debido a que:

1. Estos diagramas acentúan los problemas que pueden aparecer en las colas de

la distribución, no en el centro (puesto que ahí hay muchos puntos agrupados).

2. La variación natural en los datos causará una cierta salida de la rectitud.

3. Puesto que el diagrama considera solamente una variable a la vez, no se

atiende alguna relación que pueda existir con otras variables.

4. Los límites de confianza exhibidos en el diagrama son solamente aproximados.

También, dependen mucho de un tamaño de muestra razonable. Para las

muestras inferiores de 20 casos, estos límites se deben tomar con mucha

precaución. También puede cambiar mucho los límites cambiando el nivel de

confianza (el valor de alfa). Asegúrese de que el valor que usted está utilizando es

razonable.

Los detalles técnicos



Vamos a asumir que tenemos un sistema de los números x1, x2..., xn y deseamos

estudiar visualmente si la asunción de la normalidad es razonable. El método

básico es:

1. Clasifique los xis del más pequeño al más grande. Represente el sistema

clasificado de números como x(1), x(2)..., x(n). Por lo tanto, x(1) es el mínimo y el

x(n) es el máximo de estos datos.

2. Defina los quantiles empíricos de n, p1, p2..., pn, donde pi = i/n. Éstos son

similares a los porcentajes. Por ejemplo, si n = 5 los pis serían 2, 4, 6, 8, 10. El

valor p2 del 4 se interpreta como significado que éste es el 40° porcentaje.

3. Encuentre un sistema de los números, z1, z2..., el zn, que esperaría de los

datos que siguen exactamente la distribución normal. Por ejemplo, z2 es el

número que contábamos con si obtuviéramos 5 valores de una distribución

normal, clasificándoles, y seleccionado el segundo más bajo. Éstos se llaman los

quantiles.

4. Construya un diagrama de dispersión con los pares x(1) y z1, x(2) y z2,

etcétera. Si los xis vinieran de una distribución normal, anticiparíamos que los

puntos trazados caerán a lo largo de una línea recta. El grado de no-normalidad es

sugerido por la cantidad de la curvatura en el diagrama.

Hay varios refinamientos al procedimiento de arriba. El más común es la definición

de los pis en el paso 2. La fórmula usada generalmente es pi = (i-a)/(n-2a+1),

donde a es un número entre 0 y 1. Muchos estadísticos recomiendan a = 1/3. Éste

es el valor por defecto usado por programas como NCSS (el valor de a se fija en la

opción de la constante del porcentaje). Otra modificación está en el escalamiento

usado para los zis. Si se utilizan los zis del paso 3, la definición terminante es el

diagrama del quantil. Si los zs se convierten a una escala de probabilidad, el

diagrama se conoce como diagrama de probabilidad. Hoy en día estas

definiciones se han debilitado y utilizamos el término de diagrama de probabilidad

para representar cualquiera de estos diagramas. Los diagramas de probabilidad



se pueden construir para cualquier distribución, aunque el de normalidad es el

más común.

Los cuatro pasos antedichos se utilizan para cualquiera de las siete funciones de

distribución que están disponibles en NCSS. Las tablas de compartimientos, de

Cleveland, de Kleiner, y de Tukey (1983) que se muestran debajo dan la

información técnica sobre estas distribuciones. Una de las características más

útiles de estas tablas es la columna ordenada y marcada en la segunda tabla. Esta

columna define la transformación de los datos que se deben utilizar para alcanzar

un diagrama estándar de probabilidad para esa distribución.

Por ejemplo, si deseaba generar un diagrama gamma de probabilidad, debe tomar

los datos de una mitad de poder. Observe que no hay transformación especial

necesaria para el diagrama normal de probabilidad. Estos límites de confianza

sirven en tanto que la referencia limita cuando está estudiando un diagrama de

probabilidad. Cuando la caída de los puntos está fuera de estos límites, los

consideraría como evidencia que la asunción de la normalidad (o cualquier

distribución que está considerando) es inválida.


El diagrama de probabilidad se construye de una sola variable. Una segunda

variable se puede utilizar para dividir la primera variable en grupos (ej., categoría

de edad o género). No se solicita otro requisito en los datos de entrada, sin

embargo, las distribuciones disponibles en NCSS asumen que los datos son

continuos. Las filas que faltan son ignoradas con valores en una de las variables

seleccionadas.

VII. DIAGRAMA DE DISPERSIÓN

Introducción



El diagrama x-y de dispersión es una de las herramientas de mayor alcance para

analizar datos. NCSS incluye un menú de características para realzar el diagrama

básico de dispersión. Algunas de estas características son líneas de la tendencia

(mínimos cuadrados) y límites de confianza, polinomios, líneas, curvas lowess,

diagramas de caja insertados, y diagramas de girasol.

Lo que sigue es un ejemplo de un diagrama típico de la dispersión con una línea

de tendencia y con diagramas de caja incorporados.

Estructura de datos

El diagrama de dispersión se construye a partir de dos variables. Se puede utilizar

una tercera variable para dividir las primeras dos variables en grupos (Ej.,

categoría de edad o género). No se hacen otros requerimientos para los datos de

entrada.

50.0

116.7

183.3

250.0

50.0 60.0 70.0 80.0

Height (inches) vs Weight (lbs)

Height (inches)

Weig

ht

(lbs)

Si la variable género se incluye para separar los datos:



50.0

116.7

183.3

250.0

50.0 60.0 70.0 80.0

Height (inches) vs Weight (lbs)

Height (inches)

Weig

ht

(lbs)

Gender

12

Considere que las filas con valores perdidos en una de las variables seleccionadas

serán ignoradas en ambas.

VIII. MATRIZ DE DIAGRAMAS DE DISPERSIÓN

Introducción

La matriz de diagramas de dispersión es una tabla de dispersión múltiple. Cada

diagrama es pequeño para poder introducir muchos diagramas en una página.

Cuando usted necesita dar una mirada de diagramas, por ejemplo al principio de

un análisis de regresión múltiple, la matriz del diagrama de dispersión es una

herramienta muy útil. Lo que sigue es un ejemplo de una matriz del diagrama de

dispersión creada durante la fase inicial de un estudio de la regresión múltiple.

En el siguiente ejemplo hay cinco variables de la prueba que forman un juego de

variables independientes, contrastadas contra ellas mismas considerando cada la

variable como dependiente para organizarlas. Observe cómo puede explorar

rápidamente los diagramas para variables altamente correlacionadas, y outliers.



Ex_Esc_

Ex_

Esc

_

Raz_Ded_

Raz_Ind_

Pens_Cr_t_

Poten_

Raz

_Ded

_

Raz

_Ind

_

Pen

s_C

r_t_

Pot

en_

Estructura de los datos

Cada diagrama de dispersión se construye a partir de dos variables numéricas. Se

puede utilizar una tercera variable, alfanumérica para controlar el símbolo del

diagrama.

IX. DIAGRAMAS DE SUPERFICIE 3D

Introducción

Los diagramas de superficie 3D

son diagramas de datos



tridimensionales. Más que mostrar los puntos de referencias individuales, los

diagramas superficiales muestran una relación funcional entre una variable

dependiente señalada (Y), y dos variables independientes (X1 y X2).

El diagrama de puntos es un diagrama que acompaña al diagrama de contorno.

Es importante entender cómo se construyen estos diagramas.

Se construye una rejilla de dos dimensiones de X1 y de X2. El rango de esta rejilla

es igual al rango de los datos. Después, un valor de Y se calcula para cada punto

de la rejilla. Este valor de Y es un promedio cargado de todos los valores de los

datos que se acerquen a este punto de la rejilla. (El número de puntos generados

es un promedio especificado por el usuario). Se construye la superficie

tridimensional usando un promedio de estos valores. Por lo tanto, el diagrama

superficial no muestra la variación en cada punto de rejilla. Estos diagramas son

útiles en el análisis de regresión, para ver la relación entre una variable

dependiente y dos variables independientes.

Pudiéramos pensar que una de las variables, X2, es en realidad Z, o sea la

perspectiva que da fondo de tercera dimensión a la gráfica, pero considere que

ésta puede ser X1 o X2 dependiendo de la perspectiva de la rotación.

Gráfico de superficie 3D

Ex

Esc

Raz Ded Raz Ind

0.0

10.0

2.0

10.0

0.0

10.0



Recuerde que la regresión múltiple asume que esta superficie es una superficie

perfectamente plana. Por lo tanto, el diagrama superficial le permite precisar

visualmente si la regresión múltiple es apropiada.

Los diagramas de superficie son muy útiles en la exploración de los datos, sobre

todo haciendo rotar el diagrama con las opciones del programa tanto en NCSS

como en Statistica. Después de rotar la figura en tres dimensiones el poder

explicativo del investigador se incrementa, pero desafortunadamente muchas

veces no es posible expresar la explicación en una sola perspectiva de la figura

dentro del informe de investigación, por lo cual se requiere seleccionar la mejor

vista.

La Estructura de los datos

El diagrama de superficie se construye a partir de tres variables. Las variables

(independientes) X1 y X2 se muestran en los ejes horizontales. La variable de Y

se muestra a lo largo del eje vertical. Observe que las tres variables son

numéricas.

Estilos del Diagrama de superficie

Scatter Plot

Ex

Esc

Raz Ded Raz Ind

0.0

10.0

2.0

10.0

0.0 10.0



La siguiente gráfica está elaborada con Statistica, que además permite la rotación

dinámica.

Abajo se muestran más ejemplos de variantes en los diagramas, que son útiles

para analizar los datos, manipulando el diseño y la rotación.



X. DIAGRAMAS DE VIOLÍN

Introducción

El Diagrama de Violín, como el diagrama de cajas, es útil para exhibir la media y la

distribución de un sistema de datos. Varios diagramas de caja se pueden exhibir

en anchuras distintas para permitir que usted compare el promedio y la extensión

de varios grupos.

La densidad del trazo en el histograma es útil para exhibir la distribución de los

datos. Desafortunadamente, es difícil comparar varios rastros de densidad

mostrando anchuras. Aún así, se considera una tarea común comparar las

distribuciones de varias agrupaciones de datos. Se ha inventado un nuevo

diagrama que llamamos el diagrama del violín. Este diagrama es un híbrido de la

densidad del trazo y del diagrama de cajas que permite que usted compare varias

distribuciones rápidamente.



En un diagrama de cajas los datos se mostrarían de la siguiente manera:

5.0

26.7

48.3

70.0

PetalLength

Box Plot

Variables

Am

ount

En tanto que en un histograma con alta densidad de trazo se presentarían así:

0.0

26.7

53.3

80.0

0.0 23.3 46.7 70.0

Histogram

PetalLength

Count

La combinación en los diagramas de violín

El diagrama del violín se hace combinando una forma de caja para trazar con dos

anchuras en proporción a la densidad vertical. Una densidad del trazo se extiende

a la izquierda mientras que la otra se extiende a la derecha. No hay diferencia en

estos rastros de densidad con excepción de la dirección a la cual son extendidos.

Ponemos dos rastros de la densidad en el diagrama para agregar la simetría, que

hace mucho más fácil comparar las agrupaciones. El diagrama del violín destaca



los picos y los valles de una distribución de variables. Cambiamos el diagrama de

cajas levemente demostrando el punto medio como círculo, hicimos esto de modo

que las comparaciones de los puntos medios pudieran ser hechas rápidamente.

Llamamos a esto un diagrama del violín porque uno de los primeros juegos de

datos que trabajamos tenía el aspecto de un violín. Usted lo encontrará así:

0.0

23.3

46.7

70.0

PetalLength

Violin Plot

Variables

Am

ount

Si usted compara este diagrama con la densidad del trazo y de la caja con los

mismos datos, notará que aunque el diagrama de cajas es útil en muchas

situaciones, no representan los datos que se arraciman (multimodales). Por otra

parte, aunque la densidad del trazo demuestra la distribución de los datos, es

difícil ver la media y su dispersión. La respuesta obvia a estos defectos es

combinar los dos diagramas.

Diagrama de violín al 10% del trazo de los datos:


Quartil superior

Mediana

Quartil inferior

Densidad de trazo


0.0

23.3

46.7

70.0

SepalLength SepalWidth PetalLength PetalWidth

Violin Plot

Variables

Am

ount

Diagrama de violín al 30% del trazo de los datos:

0.0

23.3

46.7

70.0

SepalLength SepalWidth PetalLength PetalWidth

Violin Plot

Variables

Am

ount

El ejemplo siguiente demuestra los diagramas de violín de las cuatro variables en

datos del diagrama de Fisher. Observe cómo pueden comparar fácilmente los

puntos medios, las longitudes de la caja (la extensión), y los patrones de

distribución de los datos. En este ejemplo, note que las dos variables de petal

(pétalo) demuestran dos picos (bimodal) mientras que las dos variables sepal

(sépalo) son unimodales (un pico). Hay varias opciones que le dejarán ajustar este

diagrama a sus necesidades.



Estructura de datos

El diagrama del violín se construye de una o más variables. Una segunda variable

se puede utilizar para dividir la primera variable en grupos (Ej., categoría de edad

o género). En este caso, un diagrama del violín se exhibe para cada grupo. No se

solicitan otros requerimientos en los datos de entrada.

XI. CARTAS DE PARETO

Introducción

La descripción de la de las Gráficas de Pareto un economista italiano (Vilfredo

Pareto 1848-1923), notaron una gran desigualdad en la distribución del ingreso.

Algunas pocas personas poseían la mayoría del ingreso. J. M. Juran encontró que

este mismo fenómeno del “vital de pocos” y “el trivial muchos” aplicado a muchas

áreas del proceso estadístico económico. Le acreditan a él acuñar los términos de

la gráfica de Pareto y análisis de Pareto para representar este fenómeno.

En el control de calidad el análisis de Pareto refiere la tendencia al acumulamiento

de los problemas de calidad en unas pocas fuentes posibles del total. Por lo tanto,

aislando y corrigiendo las áreas problemáticas principales, usted obtiene el mayor

aumento de calidad.

La gráfica de Pareto es una representación gráfica que acentúa el principio de

Pareto usando un gráfico de barra en el cual las barras se arreglen en una

magnitud que disminuye. Los programas estadísticos proporcionan diversos

estilos de la gráfica de Pareto, así como un informe numérico.

Muestra el diagrama de una gráfica de Pareto

La gráfica de Pareto siguiente representa el número de tablero-pies de madera

defectuosos (en centenas) a partir de diez diversos aserraderos. Note que tres



aserraderos explican el casi 80% del producto defectuoso. Obviamente, los

esfuerzos se deben concentrar en corregir defectos en estos tres aserraderos.

0.00

15.00

30.00

45.00

60.00

C I G D E A J F B H

Pareto Chart of FEET

Label

FE

ET

Estructura de datos

La tabla 37.1 muestra los datos para la gráfica antedicha de Pareto. Da el número

de tablero-pies defectuosos (en 100s) a partir de diez diversos aserraderos

(etiquetados A - J).

QATEST, base de Datos Pareto

aserraderos Pies defectuososA 6B 2C 57D 13E 7F 3G 36H 1I 42J 4

XII. AGRUPAMIENTOS JERÁRQUICOS

Introducción



Breve descripción

Los algoritmos de agrupamientos jerárquicos construyen una jerarquía de racimos

que se exhiben comúnmente como un diagrama de árbol llamado Dendrograma.

Comienzan con cada objeto (casos o variables) en un racimo separado. En cada

paso, los dos racimos que son más similares se ensamblan en un solo racimo

nuevo. Una vez que están fundidos los objetos nunca se separan. Los ocho

métodos que están disponibles representan ocho métodos para definir la

semejanza entre los racimos.

Suponga que deseamos agrupar en racimos los datos bivariados mostrados en el

siguiente diagrama de dispersión. En este caso, el agrupamiento se puede percibir

visualmente. Los datos tienen tres racimos y dos casos aislados, 6 y 13.

0.0

5.3

10.7

16.0

0.0 6.7 13.3 20.0

1

2

3

4

5

6

7

8

9

10

11

12

13

141516

171819

202122

Red vs Blue

Red

Blu

e

Variables

Lo que sigue es correr un dendrograma de los resultados de estos datos con el

algoritmo que arracima el promedio del grupo. El eje horizontal del dendrograma

(rama) representa la distancia o la disimilitud entre los racimos. El eje vertical

representa los objetos y los racimos que comprende cada rama. El dendrograma

es bastante simple de leer.



2.00 1.50 1.00 0.50 0.00

Dendrogram

Dissimilarity

13245136141517181619202122781091112Row

Recuerde que nuestro interés principal consiste en semejanza y agrupamiento.

Cada ensamble (fusión) de dos racimos es representado en el gráfico al partir una

línea horizontal en otras dos líneas horizontales (ramas). La posición horizontal de

la fractura, mostrada por la barra vertical corta, da la distancia (desemejanza)

entre los dos racimos.

Con este dendrograma puede ver los tres racimos como tres ramas que ocupan

una distancia horizontal casi igual. Los dos outliers, 6 y 13, están fundidos algo

arbitrariamente adentro en distancias mucho más altas. Ésta es la lectura. En este

ejemplo podemos comparar nuestra lectura con un diagrama real de los datos.

Desafortunadamente, esto generalmente no será posible si nuestros datos

consisten en más de dos variables.

XIII. LAS GRÁFICAS DE BARRAS DE ERROR

Introducción



Propósitos generales y descripción

Las gráficas de barra del error exhiben las líneas de medias y los errores estándar

(o las desviaciones estándar). Los siguientes son ejemplos de los tipos de gráficas

producidas por este procedimiento.

100000.0

150000.0

200000.0

250000.0

300000.0

1 2 3 4

Error Bar Plot

Bedrooms

Price

State

NevVir

100000.0

150000.0

200000.0

250000.0

300000.0

1 2 3 4

Error Bar Plot

Bedrooms

Price

State

NevVir

Los valores perdidos



Los valores perdidos se quitan sobre la base de caso-por-caso (casewise). Es

decir, un valor que falta en una variable ignora los casos de otras variables en la

misma fila.

Estructura de datos

Cada fila de datos debe contener por lo menos una variable numérica de

respuesta. También pueden ser señaladas hasta dos variables categóricas y hasta

cinco variables clasificatorias. Se produce una gráfica separada para cada valor

único de las variables clasificatorias.

Lo que sigue es un ejemplo numérico de las gráficas anteriores con variables

categóricas y dos de una sola respuesta. Los datos de abajo dan el estado, el

precio de venta, y el número de los dormitorios para 150 características

residenciales vendidas durante cuatro meses en dos estados. Solamente se

muestran las primeros 8 de las 150 observaciones.

Porción de los datos de venta de las propiedades

State Price BedroomsNev 260000 2Nev 66900 3Vir 127900 2Nev 181900 3Nev 262100 2Nev 967500 2Nev 167200 2Nev 395700 2

XIV. MATRIZ REJILLA DE PUNTOS

Introducción

El diagrama de rejilla (matriz) de puntos es un tipo de diagrama del contorno

convertido para exhibir tres variables. Las primeras dos variables se exhiben como

en el diagrama de dispersión en los ejes verticales y horizontales. La tercera



variable se muestra por el color del bloque o por un símbolo que es codificado de

abajo hacia arriba.

Las variantes pueden ser seleccionadas en muy distintas formas para facilitar la

lectura de los datos.

15.0

22.5

30.0

37.5

45.0

40.0 50.0 60.0 70.0 80.0

Grid Plot of PetalLength

SepalLength

SepalW

idth

PetalLength

A 3.9B 11.7C 19.4D 27.2E 35.0F 42.8G 50.6H 58.3I 66.1

Estructura de datos

El diagrama de rejilla se construye a partir de tres variables. Las variables de X e

Y se muestran en los ejes horizontales y verticales, respectivamente. Se reparte

en ellos la variable Z y sus valores son representados por el símbolo del diagrama



o el color del bloque (véase los ejemplos arriba). Observe que las tres variables

deben ser numéricas.

Las opciones

Consulte la sección de Opciones donde se describen las opciones disponibles en

este procedimiento.

Variable (X, Y, Z)

Cada caja especifica la variable numérica que es utilizada para construir el

diagrama. La variable de X se exhibe a lo largo del eje horizontal, la variable de Y

a lo largo del eje vertical, y se muestra la variable de Z usando las capas del

contorno.

Mínimo y máximo (X, Y, Z)

Son los valores mínimos y máximos a lo largo de cada eje. Debe tener el cuidado

de utilizarlos dado que pueden distorsionar el diagrama.

Rebanadas (X, Y, Z)

Es el número de las divisiones (puntos de rejilla) a lo largo de cada eje. El número

de rebanadas a lo largo del eje de z es el número de las líneas del contorno. Se

utiliza solamente si la caja de los valores del contorno (z) se deja en blanco.

Decimales de Z

El número de decimales a mostrar en los números de referencia de la leyenda.

El estilo del diagrama

Especifica el método usado para exhibir el valor de la variable de Z.

Bloques



Los valores de la variable de Z se exhiben como bloques coloreados.

Símbolos con un color

Los valores de la variable de Z son todas las letras con el mismo color. Cada letra

representa una gama de valores.

En el caso de los símbolos:

15.0

22.5

30.0

37.5

45.0

40.0 50.0 60.0 70.0 80.0

Grid Plot of PetalLength

SepalLength

SepalW

idth

B

HF

H

G

B

G

F

G

B

F

G

G

F

H

G

HC

F

G

I

G H

I

F

B

GGF

F

CG

EG

GB

B

F

I

BH

C

F

BI

G

C

F

E

HB

C

G

C

CB

HH

B

BC

F

GB

B

F

F

CB

F

E

B

B

H

H

GF

H

B

B

HH

GH

E

F

F

B

B

I

G

C

FF

FB

B

E

E

F

BB

H

FH

F

BB

G

F

I

H

B G

F

B

F

G

GF

D

FH

G

B

BH

G

GEG

G

H

F

C

B

BG

CB

F

FG

C

BB

GG

H

B

PetalLength

A 3.9B 11.7C 19.4D 27.2E 35.0F 42.8G 50.6H 58.3I 66.1

Símbolos de colores múltiples



Los valores de la variable de Z se exhiben como letras que tienen diversos

colores. Cada letra representa una gama de valores.



APARTADO C. TÓPICOS SELECTOS DE TÉCNICAS GRÁFICAS ANALÍTICAS

Técnicas Representativas de Visualización basadas en Statistica

XV. GRÁFICAS CATEGORIZADAS

Uno de los métodos analíticos generales más importantes, y también de gran

alcance, implica el dividir ("partir") los patrones de datos en categorías de

subjuegos con la finalidad comparar los subconjuntos que resultan. Esta técnica

común se conoce bajo una gran variedad de términos (tales como subdivisión,

agrupamiento, categorización, partir, rebanar, perforar, o condicionar) y se utiliza

en análisis exploratorios de datos y las pruebas de hipótesis. Por ejemplo: Una

relación positiva entre la edad y el riesgo de un ataque del corazón puede ser

diferente en los varones y las hembras (puede ser más fuerte en varones). Una

relación prometedora entre tomar una droga y una disminución del nivel del

colesterol puede estar presente en mujeres con una presión arterial baja y en 30 a

40 años. Los índices de capacidad del proceso, o histogramas de capacidad,

pueden ser diferentes por los períodos del tiempo supervisados por diferentes

operadores. Las pendientes de la regresión pueden ser diferentes en diferentes

grupos experimentales.

Hay muchas técnicas de cómputo que se centran en agrupar y que se diseñan

para cuantificar las diferencias que revelará el agrupamiento (Ej.,

ANOVA/MANOVA). Sin embargo, las técnicas gráficas (tales como los gráficos

categorizados discutidos en esta sección) ofrecen ventajas únicas que no se

pueden sustituir por ningún método de cómputo por si mismo, y pueden revelar los



patrones que no pueden ser cuantificados fácilmente (Ej., las interacciones, las

excepciones, las anomalías complejas), y proporcionan las perspectivas analíticas

multidimensionales, globales únicas, para explorar o "explotar" los datos.

¿Qué son los Gráficos Categorizados?

Se llaman gráficos categorizados (el término fue usado primero en software de

STATISTICA por StatSoft en 1990; también recientemente llamados Gráficos de

Trellis, por Becker, Cleveland, y Clark, en los laboratorios de Bell) a la serie de 2D,

3D, gráficos ternarios, o del nD (tales como los histogramas, diagramas de puntos,

diagramas de líneas, diagrama de superficie, los diagramas de puntos ternarios,

etc.), seleccionados por una variable específica (es decir, grupo o subconjunto de

casos), para seguir el ejemplo gráfico de abajo, de encuestados por la variable de

Nueva York, de Chicago, de Dallas, del etc. Estos gráficos "compuestos" se ponen

secuencialmente en una presentación, permitiendo comparaciones entre los

patrones de los datos mostrados en los gráficos, para cada uno de los grupos

solicitados (Ej., Ciudades).

Se puede utilizar una gran variedad de métodos para seleccionar los

subconjuntos; el más simple de ellos es utilizando una variable categórica (Ej., una

variable Ciudad, con tres valores Nueva York, Chicago, y Dallas). Por ejemplo, el

siguiente gráfico muestra los histogramas de una variable representando los

niveles de stress en cada una de las tres Ciudades.

Uno podría concluir que los datos

sugieren que la gente que vive en

Dallas es menos probable que reporte

estar tensionada, mientras que los

patrones (distribuciones) de la tensión

que reportan en Nueva York y Chicago

son absolutamente similares entre sí.



Los gráficos categorizados en algunos sistemas de software (Ej., en STATISTICA)

también apoyan las clasificaciones de dos vías o de multivía, donde no hay un

criterio único (Ej., Ciudad) sino dos o más criterios (Ej., Ciudad y época del día) se

utilizan para crear los subconjuntos. Los gráficos categorizados de dos vías se

pueden pensar como " gráficos de tabulaciones cruzadas" donde cada

componente gráfico representa una sección representativa de un nivel de una

variable agrupadora (Ej., Ciudad) y de un nivel de la otra variable agrupadora (Ej.,

tiempo).

La adición de este segundo factor

revela que los patrones de la tensión

que reportan en Nueva York y Chicago

son realmente diferentes cuando se

toma en consideración la hora en que

se hizo la pregunta, mientras que el

factor Tiempo diferencia poco en

Dallas.

Gráficos categorizados contra gráficos de matriz. Los gráficos de matriz

también producen las exhibiciones que contienen gráficos de componentes

múltiples; sin embargo, cada uno de esos gráficos de componentes se basa (o

puede basarse) en el mismo juego de casos, y los gráficos se generan para todas

las combinaciones de variables a partir de una o dos listas. Los gráficos

categorizados requieren una selección de las variables que normalmente deberían

ser seleccionadas para los gráficos no-categorizados del tipo respectivo (Ej., dos

variables para un diagrama de puntos). Sin embargo, en los diagramas

categorizados también necesita especificar al menos una variable agrupadora (o

algunos criterios que se utilizarán para clasificar las observaciones en las

categorías) que contenga la información sobre calidad de miembro del grupo en

cada caso (Ej., Chicago, Dallas). Esa variable agrupadora no será incluida en el

gráfico directamente (es decir, no será trazada) pero servirá como criterio para



dividir todos los casos analizados en gráficos separados. Según lo ilustrado arriba,

un gráfico será creado para cada grupo (categoría) identificado por la variable

agrupadora.

Escalamiento común contra Escalamiento independiente. Cada gráfico

individual de la categoría se

puede escalar según su propia

gama de los valores

(escalamiento independiente), o

como abajo, todos los gráficos se

pueden escalar a una escala

común de par en par

suficientemente amplia para

acomodar todos los valores en

todas las categorías de gráficos.

El escalamiento común permite

que el analista haga

comparaciones de rangos y

distribuciones de valores entre

categorías. Sin embargo, si los

rangos de valores en las

categorías del gráfico son

considerablemente diferentes

(causando una escala común

muy ancha), entonces algunos de

los gráficos pueden ser difíciles de examinar. El uso del escalamiento

independiente puede hacer más fácil marcar tendencias y patrones específicos

dentro de categorías, pero puede ser más difícil hacer comparaciones de rangos

de valores entre categorías.

Métodos de Categorización



Hay cinco métodos generales de clasificación de valores y serán repasados

brevemente en esta sección: Modo de número entero, de categorías, de límites,

de códigos, y de subconjuntos múltiples. Observe que los mismos métodos de

clasificación se pueden utilizar para categorizar casos en gráficos componentes y

para categorizar casos dentro de gráficos componentes (Ej., en histogramas o

diagramas de la caja).

Modo de Número Entero. Cuando

usted utiliza el modo de número entero,

los valores del número entero de la

variable agrupadora seleccionada

serán utilizados para definir las

categorías, y será creado un gráfico

para todos los casos que pertenezcan a

cada categoría (definida por esos

valores del número entero). Si la variable agrupadora seleccionada contiene

valores de no-número entero, el software truncará generalmente cada valor

encontrado de la variable agrupadora seleccionada a un valor de número entero.

Categorías. Con este modo de

clasificación, usted especifica el número

de las categorías que desea utilizar. El

software dividirá el rango entero de

valores de la variable agrupadora

seleccionada (de mínimo a máximo) en

el número solicitado de intervalos de

igual longitud.

Límites. El método de los límites también creará la clasificación de intervalo, sin

embargo, los intervalos pueden estar (Ej.) de anchura desigual arbitraria según lo

definido por los límites solicitados del intervalo (por ejemplo, "menos que -10, "



"mayor que o igual a -10 pero menos de 0, " "mayor que o igual a 0 pero menos de

10, " y "igual o mayor que a 10").

Códigos. Utilice este método si la variable agrupadora seleccionada contiene

"códigos" (es decir, valores significativos específicos, tales como varón, hembra)

de los cuales desea especificar las categorías.

Subconjuntos múltiples. Este método

permite que usted personalice las

categorías, y le permite utilizar más de

una variable para definir la categoría. Es

decir las clasificaciones basadas en

definiciones múltiples del subconjunto de

categorías pueden no representar



distribuciones de variables (individuales) y distribuciones de frecuencias

específicas de "eventos" específicos, definidos por combinaciones particulares de

valores de varias variables (y definidos por las condiciones que pueden implicar

cualquier número de variables de subjuegos). Por ejemplo, usted puede

especificar seis categorías basadas en combinaciones del género, de la edad, y

del empleo de tres variables.

Histogramas

En general, los histogramas se utilizan para examinar distribuciones de frecuencia

de valores de las variables. Por ejemplo, las demostraciones del diagrama de la

distribución de frecuencia en que los valores, o los rangos específicos de valores

de la variable examinada son los más frecuentes, qué tan diferentes son los

valores, si la mayoría de las observaciones están concentradas alrededor de la

media, si la distribución es simétrica o sesgada, si es multimodal (es decir, si tiene

dos o más picos) o unimodal, etc. Los histogramas son también útiles para evaluar

la semejanza de una distribución observada con distribuciones teóricas o

previstas.

Los histogramas categorizados permiten ser analizados por una o más variables

categóricas, o por cualquiera de uno o más sistemas de reglas de clasificación

lógica (véase los métodos de la clasificación). Hay dos razones importantes por

las que son de interés las distribuciones de frecuencia.

Uno puede aprender sobre la naturaleza de la variable examinada a partir de

la forma de distribución (Ej., una distribución bimodal puede sugerir que la

muestra no sea homogénea, y no consista de las observaciones que

pertenecen a dos poblaciones que se distribuyen más o menos

normalmente).

Mucha de la estadística se basa en asunciones sobre las distribuciones de las

variables analizadas; y los histogramas lo ayudan a uno a probar si esas



asunciones están resueltas. A menudo, el primer paso en el análisis de un

nuevo subjuego es analizar todas las variables con histogramas.

Histogramas contra rompimientos analíticos. Los histogramas categorizados

proporcionan la información similar a los rompimientos analíticos (Ej., medio, punto

medio, mínimo, máximo, diferenciación de valores, etc.; vea el capítulo de

Estadística Básica y Tablas). Aunque la estadística descriptiva (numérica)

específica es más fácil de leer dentro una tabla, la forma total y las características

descriptivas globales de una distribución son mucho más fáciles de examinar en

un gráfico. Por otra parte, el gráfico proporciona la información cualitativa sobre la

distribución que no se puede representar completamente por un solo índice. Por

ejemplo, la distribución sesgada total del ingreso puede indicar que la mayoría de

gente tiene un ingreso que sea mucho más cercano al mínimo que al máximo del

rango del ingreso. Por otra parte, cuando es analizado por género y el fondo

étnico, esta característica de la distribución de ingresos se puede encontrar más

pronunciada en ciertos subgrupos.

Aunque esta información será contenida en el índice de oblicuidad (para cada

subgrupo), cuando está presentado en la forma gráfica de un histograma, la

información generalmente se reconoce y se recuerda más fácilmente. El

histograma puede también revelar el "impacto" y ello puede representar hechos

importantes sobre la estratificación social específica de la población, o de las

anomalías investigadas en la distribución del ingreso en un grupo particular,

causadas por una reforma fiscal reciente.

Histogramas y diagramas de puntos categorizados. Un uso útil de los métodos

de la clasificación para las variables continuas es representar las relaciones

simultáneas entre tres variables. Se muestra abajo un diagrama de puntos para la

carga 1 de dos variables y la carga 2.



Ahora suponga que usted quisiera agregar una tercera variable (salida) y examinar

cómo esta se distribuye en diferentes niveles de la distribución común de la carga

1 y de la carga 2. El gráfico siguiente será producido:

En este gráfico, la carga 1 y la carga 2 están ambas categorizadas en 5 intervalos,

y se computa dentro de cada combinación de intervalos la distribución para la

variable de salida. Observe que el "cuadro" (paralelogramo) incluye



aproximadamente las mismas observaciones (casos) de ambos gráficos

mostrados arriba.

Diagramas de puntos

En general, se utilizan dos diagramas de puntos bidimensionales para visualizar

las relaciones entre dos variables X e Y (Ej., peso y altura). En diagramas de

puntos los puntos de referencias individuales son representados por los puntos

marcados en el espacio bidimensional, donde los ejes representan las variables.

Las dos coordenadas (X e Y) que determinan la localización de cada punto

corresponden a sus valores específicos en las dos variables. Si las dos variables

están fuertemente relacionadas, entonces los puntos de referencias toman una

forma sistemática (Ej., una línea recta o una curva clara). Si las variables no están

relacionadas, entonces los puntos forman una "nube" redondeada.

La opción categorizada del diagrama de puntos permite que usted produzca los

diagramas de puntos categorizados por una o más variables. Vía el método de

múltiples subjuegos (véase los métodos de la clasificación), usted puede también

categorizar el diagrama de puntos basado en las condiciones lógicas de la

selección que definen cada categoría o grupo de observaciones.

Los diagramas de puntos categorizados ofrecen una técnica exploratoria y

analítica de gran alcance para investigar relaciones entre dos o más variables

dentro de diferentes subgrupos.

Homogeneidad de las distribuciones bivariantes (formas de relaciones). El

diagrama de puntos se utiliza típicamente para identificar la naturaleza de

relaciones entre dos variables (Ej., la presión arterial y colesterol), porque pueden

proporcionar mucho más información que un coeficiente de correlación.

Por ejemplo, una carencia de la homogeneidad en la muestra de la cual era

calculada una correlación, puede predisponer el valor de la correlación. Imagine

un caso donde un coeficiente de correlación se calcula de los puntos de



referencias que vienen a partir de dos

diferentes grupos experimentales,

pero este hecho fue ignorado cuando

la correlación era calculada. Suponga

que la manipulación experimental en

uno de los grupos aumentó los valores

de ambas variables correlacionadas, y

los datos de cada grupo forman así

una "nube" distintiva; en el diagrama de puntos (según lo mostrado en la

ilustración).

En este ejemplo, la alta correlación es enteramente debida al arreglo de los dos

grupos, y no representa la "verdadera" relación entre las dos variables, que es

prácticamente igual a 0 (como se podría considerar con una mirada a cada grupo

por separado).

Si usted sospecha que tal patrón puede existir en sus datos y usted sabe cómo

identificar el "subjuego" posible de datos, entonces producir un diagrama de

puntos categorizado como el anterior puede dar un cuadro más exacto de la

fuerza de la relación entre la variable de X y de Y, dentro de cada grupo (es decir,

después de controlar cada miembro del grupo).



Relaciones Curvilíneas. La curvilinearidad es otro aspecto de las relaciones entre

las variables que se pueden examinar en diagramas de puntos. No hay pruebas

fáciles o automáticas a utilizar para medir relaciones curvilíneas entre las

variables: El coeficiente estándar de Pearson r mide por si mismo relaciones

lineares, pero algunas correlaciones no paramétricas tales como la r de Spearman

pueden medir relaciones curvilíneas, pero no las relaciones no-monótonas. El

examinar diagramas de puntos permite que uno identifique la forma de las

relaciones, para poder elegir más adelante una transformación apropiada de los

datos al "enderezar" los datos o elegir una ecuación no lineal apropiada de la

estimación a que se ajustará.

Para más información, vea los capítulos en estadística básica, no paramétrica, las

distribuciones, la regresión múltiple, y la valoración no lineal en Statistica.

Gráficos de Probabilidad

Hay tres tipos de diagramas categorizados de probabilidad, Normales, Mitad-

Normales, y Tendenciales. Los diagramas normales de probabilidad proporcionan

una manera rápida de examinar visualmente en qué medida el patrón de datos

sigue una distribución normal.

Uno puede examinar, vía diagramas categorizados de probabilidad, cómo la

distribución de una variable sigue de cerca la distribución normal en diferentes

subgrupos.



Los diagramas normales categorizados de probabilidad proporcionan una

herramienta eficiente para examinar el aspecto de la normalidad en la

homogeneidad del grupo.

Diagramas Quantil-Quantil

El diagrama categorizado de Quantil-Quantil (o Q-Q) es útil para encontrar la

distribución más apropiada dentro de una familia de distribuciones.



Con los diagramas categorizados de Q-Q, se produce una serie de diagramas del

Quantil-Quantil (o Q-Q) para cada categoría de los casos identificados por las

variables de la categoría de X o de X y de Y (o identificados por los criterios

múltiples del subconjunto, vea los métodos de la clasificación). Los ejemplos de

las distribuciones que se utilizan para los diagramas de Q-Q son la Distribución

Exponencial, las Distribuciones Extremas, Normal, de Rayleigh, Beta, Gammas,

de Log normal, y de Weibull.

Diagramas Probabilidad-Probabilidad

El diagrama categorizado de Probabilidad-Probabilidad (o los P-P) es útil para

precisar que tan bien está ajustada

una distribución teórica específica

de los datos observados. Este tipo

de gráfico incluye una serie de

diagramas de la Probabilidad-

Probabilidad (o los P-P), uno para

cada categoría de los casos

identificados por las variables de la

categoría de X o de X y de Y (o



identificado por los criterios múltiples del subconjunto, vea los Métodos de

Clasificación).

En los diagramas P-P, la función de distribución acumulativa observada (la

proporción de los valores en que no falta x) se traza contra una función de

distribución acumulativa teórica para precisar el ajuste de la distribución teórica a

los datos observados. Si todos los puntos en este diagrama caen sobre una línea

de la diagonal (con la intercepción 0 y la pendiente 1), usted puede concluir que la

distribución acumulativa teórica se aproxima adecuadamente la distribución

observada.

Si los puntos de referencias no caen todos en la línea diagonal, usted puede

utilizar este diagrama para precisar visualmente donde los datos siguen y no

siguen la distribución (Ej., si los puntos forman una forma de S a lo largo de la

línea diagonal, los datos pueden necesitar ser transformados después para

ajustados al patrón deseado de la distribución).

Diagramas de Línea

En los diagramas de líneas los puntos

de referencias individuales son

conectados por una línea. El diagrama

de líneas proporciona una manera

simple de presentar visualmente una

secuencia de muchos valores (Ej.,

cotización en la bolsa sobre un

número de días). El gráfico de línea

categorizada de los diagramas es útil cuando uno desea la visión de tales datos

analizados (categorizados) por una variable agrupadora (Ej., el cierre de acciones

cotiza el lunes, martes, el etc.) o algunos otros criterios lógicos que implican una o

más variables (Ej., el cierre cotiza solo para los días cuando hay otras dos



acciones y el índice de Dow Jones va para arriba, contra el resto de cierres; vea

los Métodos de Clasificación).

Diagramas de Caja

En los diagramas de la caja (término primero usado por Tukey, 1970), los rangos

de valores de una variable seleccionada (o las variables) se trazan por separado

para los grupos de casos definidos con valores de hasta tres variables

(agrupadoras) categóricas, o según lo definido por las categorías de Subjuegos

Múltiples.

La tendencia central (Ej.,

mediana o media), y la del

rango o la variación

estadística (Ej., cuartiles,

errores estándar, o

desviaciones estándar) se

computa para cada grupo

de casos, y los valores

seleccionados se

presentan en uno de cinco

estilos (filamentos truncados de la caja, filamentos truncados, cajas, columnas, o

cierre Alto-Bajo). Los puntos de referencia del afloramiento pueden también ser

trazados (véase las secciones en casos atípicos y extremos).

Por ejemplo, en el gráfico siguiente, los casos atípicos extremos (en este caso, los

puntos mayores o menos de 1.5 veces el rango interquartil) indican

particularmente un "desafortunado" extremo en una combinación que sería de otra

manera casi perfecta de factores:

Sin embargo, en el gráfico siguiente, no hay casos atípicos o valores extremos

evidentes.



Hay dos usos comunes para los diagramas de caja: (a) demostrar rangos de los

valores para los ítems, los casos o las muestras individuales (Ej., un diagrama

típico de MIN-MAX para las existencias o los productos o los diagramas de datos

agregados con los rangos), y (b) demostrando la variación de conteos en grupos o

muestras individuales (Ej., la caja y el filamento truncado presentan la mediana

para cada muestra como un punto dentro de la caja, los errores estándar en la

caja, y las desviaciones estándar alrededor de la mediana como una caja más

estrecha, o un par de "filamentos truncados").

La caja, al mostrar la variación de conteos permite que uno evalúe rápidamente e

"intuitivamente con imaginación" la fuerza de la relación entre la variable

agrupadora y la variable dependiente. Específicamente, si se asume que la

variable dependiente está distribuida normalmente, y sabiendo qué proporción de

observaciones baja, por ejemplo, dentro de desviaciones estándar ±1 o ±2 de la

media (véase los conceptos elementales), uno puede evaluar fácilmente los

resultados de un experimento y decir que, por ejemplo, las conteos en el cerca de

95% de casos en el grupo experimental 1 pertenecen a una diversa gama que

conteos en cerca del 95% de los casos en el grupo 2.



Además, pueden ser trazadas las Medias Truncadas supuestas (este término

primero fue utilizado por Tukey, 1962) excluyendo un porcentaje especificado de

casos de los extremos (es decir, las colas) de la distribución de casos.

Gráficas de Pastel

La gráfica de pastel es uno de los formatos más comunes usados para representar

proporciones o valores de variables. Este permite que usted produzca las gráficas

de pastel analizadas por una o más variables (Ej., agrupando variables tales como

género) o categorizadas según algunas condiciones lógicas de selección que

identifiquen subconjuntos múltiples (véase los métodos de la clasificación).

Para los propósitos de esta

discusión, las gráficas de pastel

categorizadas serán interpretadas

siempre como Gráficas de pastel

de frecuencias (en comparación

con gráficas de pastel de los

datos). Este tipo de gráfica de

pastel (a veces llamada gráfica de

pastel de frecuencias) interpreta

los datos como un histograma. Categoriza todos los valores de la variable que

sigue la técnica de la clasificación seleccionada, y después exhibe las frecuencias

relativas como rebanadas de pastel de tamaños proporcionales. Así, ofrecen un

método alternativo para exhibir datos del histograma de frecuencias (véase la

sección en histogramas categorizados).

Pastel-Diagramas de puntos. Otro uso útil de las gráficas de pastel

categorizadas es representar la distribución de las frecuencias relativas de una

variable en cada "ubicación" de la distribución común de otras dos variables. Aquí

está un ejemplo:



Observe que los pasteles están dibujados en "ubicaciones" donde hay datos. Así,

el gráfico mostrado toma el aspecto de

un diagrama de puntos (de las variables

L1 y L2), con los pasteles individuales

como puntos marcados. Sin embargo,

además de la información contenida en

un diagrama de puntos simple, cada

pastel muestra la distribución relativa de

una tercera variable en la localización

respectiva (es decir, baja, media, y alta calidad).

Diagramas de puntos de datos perdidos por rango

Este gráfico produce una serie de gráficos 2D (uno para cada categoría de los

casos identificados por las variables agrupadoras o por los criterios múltiples del

subconjunto; vea los Métodos de Clasificación) de puntos de referencia que faltan

y/o de "fuera del rango de especificación del usuario" puntos en los cuales usted

puede visualizar el patrón o la distribución de datos que faltan (y/o puntos "fuera

del rango de especificación") dentro de cada subconjunto de los casos (categoría).



Este gráfico es útil en análisis exploratorio de datos para precisar la distribución

(y/o el "fuera del rango") de datos perdidos, y si los patrones de esos datos

ocurren aleatoriamente.

Diagramas 3D

Este tipo de gráfico permite

que usted produzca los

diagramas de puntos 3D

(diagramas espaciales,

diagramas espectrales,

diagramas de desviación, y

diagramas de trazo), trazos de

contorno, y diagramas de

superficie, para los

subconjuntos de casos

definidos por las categorías especificadas en una variable seleccionada, o las

categorías determinadas por condiciones definidas por el usuario en la selección

de casos (véase los métodos de clasificación). Así, los fines generales de este

diagrama son facilitar comparaciones entre grupos o las categorías, con respecto

a las relaciones entre tres o más variables.

Usos. En general, los gráficos de

3D en los ejes XYZ resumen las

relaciones interactivas entre tres

variables. Las diversas maneras en

las cuales los datos pueden ser

categorizados (en un gráfico

categorizado) permiten que uno

repase esas relaciones

contingentes con un cierto criterio

(Ej., calidad de miembro de grupo).



Por ejemplo, del diagrama superficial categorizado mostrado al lado, uno puede

concluir que el ajuste del nivel de tolerancia en un aparato no afecta la relación

investigada entre las medidas (Dependiente 1, Dependiente 2, y altura) a menos

que el ajuste sea 3.

El efecto es más sobresaliente cuando usted cambia a la representación del

diagrama del contorno.

Diagramas Ternarios

Un diagrama ternario categorizado se puede utilizar para examinar las relaciones

entre tres o más dimensiones, donde tres de esas dimensiones representan

componentes de una mezcla (es decir, las relaciones entre ellos se obligan de tal

forma que los valores de las tres variables agreguen la misma constante para

cada caso) para cada nivel de una variable agrupadora.



En diagramas ternarios, los sistemas coordinados triangulares se utilizan para

trazar cuatro (o más) variables (los componentes X, Y, y Z, y las respuestas V1,

V2, etc.) en dos dimensiones (diagramas de puntos o contornos ternarios), o tres

dimensiones (diagramas ternarios de superficie). Para producir gráficos ternarios,

se obliga a las proporciones relativas de cada componente dentro de cada caso a

que se ajusten hasta el mismo valor (Ej., 1).

En un diagrama ternario

categorizado, se produce un

gráfico componente para cada

nivel de la variable

agrupadora (o del subconjunto

de datos definido por el

usuario) y todos los gráficos

componentes se arreglan en

una presentación para permitir

comparaciones entre los

subconjuntos de los datos

(categorías).



Usos. Un uso típico de este gráfico es cuando la respuesta(s) medida de un

experimento depende de las proporciones relativas de tres componentes (Ej., tres

diferentes productos químicos) que se varíen para precisar una combinación

óptima de esos componentes (Ej., en diseños de la mezcla). Este tipo de gráfico

se puede utilizar también para otros usos, donde las relaciones entre las variables

ajustadas necesitan ser comparadas a través de categorías o de subconjuntos de

datos.

XVI. TÉCNICA DE CEPILLADO

Quizás la más común y primera técnica que se utilizó históricamente de manera

más extensa fue la técnica identificada explícitamente como el análisis exploratorio

de datos gráficos por cepillando, un método interactivo que permite que uno

seleccione, en la presentación en pantalla, los puntos de referencia o los

subconjuntos específicos de datos, y que identifique sus características (Ej.,

comunes), o que examine sus efectos sobre relaciones entre las variables

relevantes (Ej., en matrices del diagrama de puntos), o que identifique casos

atípicos (outliers).

Esas relaciones entre las variables se pueden visualizar por las funciones

ajustadas (Ej., por las líneas 2Ds o las superficies 3D) y sus intervalos de

confianza, así, por ejemplo, uno puede examinar cambios en esas funciones

recíprocamente (temporalmente) quitando o agregando subconjuntos específicos

de datos. Por ejemplo, uno de muchos usos de la técnica de cepillado debe

seleccionar, destacando, en un diagrama de matriz de puntos, todos los puntos de

referencia que pertenezcan a cierta categoría (Ej., un nivel "medio" de ingresos,

observe el subconjunto del componente superior derecho, destacado en el gráfico

de la ilustración de abajo):



Para examinar cómo esas observaciones específicas contribuyen a las relaciones

entre otras variables en el

mismo subjuego (Ej., la

correlación entre "deuda" y

"activos" en el ejemplo

actual).

Si la facilidad de cepillado

soporta las características

como "cepillado animado"

(véase el ejemplo abajo) o

"función automática de

reajuste", uno puede definir un cepillo dinámico que se moverá sobre las rangos

consecutivas de una variable del criterio (Ej., "ingreso" medido en una escala

continua y no una escala discreta como en la ilustración antedicha), y examinar la

dinámica de la contribución de la variable de criterio y las relaciones entre otras

variables relevantes en el mismo subjuego.

XVII. ALISADO DE DISTRIBUCIONES BIVARIANTES

Los histogramas tridimensionales se utilizan para visualizar tabulaciones cruzadas

de valores en dos variables. Pueden ser considerados para hacer una conjunción

de dos (es decir, univariada) histogramas simples, combinadas de tal forma que



pueden ser examinadas las frecuencias de co-ocurrencias de valores en las dos

variables. En el formato más común de este gráfico, una barra 3D se dibuja para

cada "celda" en la tabla de la tabulación cruzada, y la altura de la barra representa

la frecuencia de los valores para la celda respectiva de la tabla. Se pueden utilizar

diferentes métodos de clasificación para cada una de las dos variables en las que

se visualiza la distribución bivariante (véase aquí).

Si el software proporciona la

facilidad para alisar, usted puede

ajustar superficies a las

representaciones 3D de los datos

bivariantes de la frecuencia. Así,

cada histograma 3D se puede

transformar en una superficie

alisada. Esta técnica es de

relativamente poca ayuda si está

aplicada a un patrón simple de

datos categorizados (tales como el histograma que fue mostrado arriba).



Sin embargo, si está aplicado a patrones más complejos de frecuencias, puede

ser una técnica exploratoria valiosa, permitiendo la identificación de regularidades

que son menos evidentes, al examinar las representaciones estándares del

histograma 3D (Ej., vea la superficie sistemática del "patrón de ondas" mostrado

en el histograma alisado de arriba).

XVIII. COMPRESIÓN DE CAPAS

Cuando se utiliza la compresión de capas, el área de trazo del gráfico principal se

reduce de tamaño al espacio, para permitir lugar a los gráficos del margen

derecho superior y lograr la presentación (con un gráfico miniatura en la esquina).

Estos gráficos más

pequeños del margen

representan imágenes

comprimidas vertical y

horizontalmente del

gráfico principal.

En los gráficos 2D la

compresión de capas es



una técnica exploratoria del análisis de datos que puede facilitar la identificación

de tendencias y de patrones, de otra manera cubiertos en subjuegos de 2

dimensiones. Por ejemplo, en la ilustración siguiente, (basado en un ejemplo

discutido por Cleveland, 1993), puede ser visto que el número de manchas solares

en cada ciclo se decae más lentamente que cuando se levanta en el inicio de cada

ciclo. Esta tendencia no es fácilmente evidente al examinar el diagrama de líneas

estándar; sin embargo, el gráfico comprimido revela el patrón ocultado.

XIX. PROYECCIONES DE JUEGOS DE DATOS 3D

Los diagramas de contorno generados por proyecciones de las superficies

(creadas de los juegos de datos multivariados, típicamente de tres variables) es un

método útil para explorar y examinar analíticamente los datos a partir de las

formas de las superficies.

Con respecto a los diagramas superficiales, pueden ser menos eficaces para

visualizar rápidamente la forma completa de las estructuras de datos 3D,



sin embargo, su ventaja principal es que permiten el examen preciso y el análisis

de la forma de la superficie (los diagramas de contorno exhiben una serie de

“secciones cruzadas" de la superficie no distorsionadas horizontalmente).

XX. DIAGRAMAS DE ÍCONOS

Los gráficos de íconos representan casos o unidades de observación como

símbolos multidimensionales y ofrecen un poderoso instrumento, aunque no es

fácil utilizarla como técnica exploratoria. La idea general detrás de este método se

capitaliza por la capacidad del investigador, al marcar "automáticamente" las



relaciones complejas (a veces interactivas) entre las variables múltiples, si esas

relaciones son constantes a través de un juego de casos (en este caso "íconos").

A veces la observación (o una "percepción") de que en ciertos casos "son

similares en algo" viene antes de que el observador (en este caso un analista)

pueda articular cuáles variables específicas son responsables de la consistencia

observada (Lewicki, Hill, y Czyzewska, 1992). Sin embargo, el análisis posterior

que se centra en tales consistencias marcadas puede revelar la naturaleza

específica de las relaciones relevantes entre las variables.

La idea básica de los diagramas de

íconos es representar unidades

individuales de observación como

objetos gráficos particulares, donde

los valores de las variables se

asignan a las características o a

las dimensiones específicas de los

objetos (generalmente un caso =

un objeto). La asignación es tal que el aspecto total del objeto cambia en función

de la configuración de los valores.

Así, los objetos dan "identidades" visuales

únicas para las configuraciones de valores, y

eso se puede identificar por el observador.

Examinar tales íconos puede ayudar a descubrir

los racimos (clusters) específicos de ambas

relaciones simples y las interacciones entre las

variables.

Analizando Diagramas de Íconos

El diseño "ideal" del análisis de los diagramas de íconos consiste en cinco fases:



1. Seleccione el grupo de variables que va a ser analizado. En muchos casos una

secuencia que comienza al azar es la mejor solución. Usted también puede

intentar incorporar las variables basadas en el orden de una ecuación de la

regresión múltiple, las cargas factoriales en un factor interpretable (véase el

capítulo del análisis factorial), o una técnica multivariada similar. Ese método

puede simplificar y "homogenizar" el aspecto general de los íconos que pueden

facilitar la identificación de patrones escondidos. Puede también lograr algunos

patrones interactivos más difíciles de encontrar. No se pueden dar a este punto

ningunas recomendaciones universales, con excepción de que intente otro método

más rápido (ordenar al azar) antes de involucrarse en un método más

desperdiciador de tiempo.

2. Busque cualquier regularidad potencial, tal como semejanzas entre los grupos

de íconos, los casos atípicos, o las relaciones específicas entre aspectos de los

íconos (Ej., el "si los primeros dos rayos del ícono de estrella son largos, entonces

uno o dos rayos en el otro lado del ícono son generalmente cortos"). Se

recomienda para esta fase el tipo de diagramas de íconos circulares.

3. Si se encuentran algunas regularidades, intente identificarlas en términos de las

variables específicas implicadas.

4. Reasigne las variables a las características de los íconos (o seleccione uno de

los diagramas secuenciales del ícono) para verificar la estructura identificada de

las relaciones (Ej., intente mover juntos los aspectos relacionados del ícono más

cercano para facilitar otras comparaciones). En algunos casos, en el final de esta

fase se recomienda sacar las variables que no parecen contribuir al patrón

identificado.

5. Finalmente, utilice un método cuantitativo (tal como un método de la regresión,

una valoración no lineal, un análisis de función discriminante, o un análisis de

racimos) a la prueba, y cuantifique el patrón identificado o por lo menos algunos

aspectos del patrón.



Taxonomía de Diagramas de Íconos

La mayoría de los diagramas de íconos se pueden asignar a una de dos

categorías: circular y secuencial.

Íconos circulares. Los diagramas circulares de íconos (diagramas de estrella,

diagramas de rayo de sol, íconos de polígono) tienden al formato de "ajustarse

alrededor del radio" donde los valores de las variables son representados por

distancias entre el centro ("eje") del ícono y de sus bordes.

Esos íconos pueden ayudar a

identificar relaciones interactivas

entre las variables porque la

forma total del ícono puede

asumir patrones totales distintivos

e identificables, dependiendo de

configuraciones multivariadas de

los valores de las variables de

entrada.

Para traducir tales patrones globales en modelos específicos (en términos de

relaciones entre las variables) o verificar las observaciones específicas sobre el

patrón, es provechoso cambiar a uno de los diagramas secuenciales de ícono que

se puedan probar de forma más eficiente cuando uno sabe qué buscar.

Íconos secuenciales. Los

diagramas de ícono secuenciales

(íconos de columna, íconos de

perfil, íconos de línea) siguen un

formato más simple donde los



símbolos individuales son representados por los diagramas de secuencia

pequeños (de diferentes tipos).

Los valores de variables consecutivas son representados en los diagramas por

distancias entre la base del ícono y los puntos de ruptura consecutivos de la

secuencia (Ej., la altura de las columnas mostradas arriba). Esos diagramas

pueden ser menos eficientes como herramienta para la fase exploratoria inicial del

análisis del ícono, porque los íconos pueden ver similares. Sin embargo, según lo

mencionado antes, pueden ser provechosos en la fase en que se ha revelado ya

un cierto patrón hipotético y uno necesita verificarlo o articularlo en términos de

relaciones entre las variables individuales.

Íconos de Pastel. Los diagramas de

ícono de pastel caen en parte entre las

dos categorías anteriores; todos los

íconos tienen la misma forma (Pastel)

pero se dividen secuencialmente de

diferente forma según los valores de

variables consecutivas.

Desde un punto de vista funcional, pertenecen más al tipo secuencial que a la

categoría circular, aunque pueden ser utilizados para ambos usos.

Caras de Chernoff. Este tipo de ícono es una categoría por sí mismo. Los casos

son visualizados por las caras del diagrama esquemático, de tale forma que los

valores relativos de las variables seleccionadas son representados por variaciones

de características faciales específicas.

Debido a sus características únicas, es

considerado por algunos investigadores

como la última técnica exploratoria

multivariada que es capaz de revelar

patrones ocultos de interrelaciones entre



las variables, que no se pueden observarse por ninguna otra técnica. Esta

declaración puede ser una exageración, sin embargo. También, debe ser admitido

que las caras de Chernoff son un método que es difícil de utilizar, y requiere

mucha experimentación con la asignación de variables a las características

faciales. Vea también las Técnicas de análisis de datos.

Estandardización de valores

A excepción de casos inusuales, cuando usted se propone que los íconos reflejen

las diferencias globales en rangos de valores entre las variables seleccionadas,

los valores de las variables se deben estandardizar en la escala para asegurar la

compatibilidad de rangos del valor dentro del ícono. Por ejemplo, porque los

valores del juego de datos son más grandes que el punto de referencia global del

escalamiento para los íconos, entonces, si hay variables que están en una gama

de orden mucho más pequeña, pueden no aparecer en el ícono, Ej., en un

diagrama de estrella, los rayos que los representan serán demasiado cortos para

ser visibles.

Aplicaciones

Los diagramas de ícono son generalmente aplicables (1) a las situaciones donde

uno desea encontrar patrones o racimos sistemáticos de observaciones, y (2)

cuando uno desea explorar posibles relaciones complejas entre varias variables.

El primer tipo de uso es similar al análisis de racimos, es decir, puede ser utilizado

para clasificar observaciones.

Por ejemplo, suponga que usted estudió las personalidades de artistas, y registró

los puntajes para varios artistas en un número de cuestionarios de la personalidad.

El diagrama puede ayudarle a precisar si hay racimos naturales de los artistas

distinguidos por los patrones particulares de conteos en diferentes cuestionarios

(Ej., usted puede encontrar que algunos artistas son muy creativos,

indisciplinados, e independientes, mientras que un segundo grupo son



particularmente inteligentes, disciplinados, y relacionados con el éxito reconocido

del público).

El segundo tipo de uso (la exploración de relaciones entre varias variables) es más

similar al análisis factorial; es decir, puede ser utilizado para detectar qué variables

tienden a "agruparse" Por ejemplo, suponga que usted estudiaba la estructura de

la opinión de la gente con coches. Varios sujetos terminaron los cuestionarios

detallados que clasificaban diferentes coches en numerosas dimensiones. En la

base de datos se registran los promedios en cada dimensión (las variables) para

cada coche (como casos u observaciones).

Cuando estudia usted ahora las caras de Chernoff (cada cara que representa las

opiniones para un coche), si el precio fue asignado a sonrisa y aceleración al

tamaño de orejas, puede ocurrirle que las caras sonrientes tienden a tener orejas

grandes; entonces este "descubrimiento" significa que los coches rápidos son más

costosos. Esto, por supuesto, es un ejemplo simple; en análisis de datos

exploratorios de la vida real, pueden llegar a ser evidentes las relaciones

complejas no obvias entre las variables.

Gráficas Relacionales

Los diagramas de matriz visualizan relaciones entre las variables a partir de una o

dos listas. Si el software permite que usted marque subconjuntos seleccionados,

los diagramas de matriz pueden proporcionar la información similar en diagramas

de ícono.

Si el software permite que usted cree, y que identifique subconjuntos definidos por

el usuario en diagramas de puntos, los diagramas de puntos 2D simples se

pueden utilizar para explorar las relaciones entre dos variables; asimismo, al

explorar las relaciones entre tres variables, los diagramas de puntos 3D

proporcionan una alternativa a los diagramas de ícono.

Tipos de Gráficos de íconos



Hay varios tipos de diagramas de ícono.

Caras de Chernoff. Una "cara" separada se dibuja para cada caso; los valores

relativos de las variables seleccionadas para cada caso se asignan a las formas y

a los tamaños de las características faciales individuales (Ej., longitud de la nariz,

ángulo de cejas, anchura de la cara).

Para más información vea las caras de Chernoff en taxonomía de los diagramas

de ícono.

Estrellas. Los íconos de estrellas son un tipo circular de diagrama de ícono. Una

estrella separada se traza para cada caso como ícono; los valores relativos de las

variables seleccionadas en cada caso son representados (a la derecha,

comenzando en las 12:00) por la longitud de rayos individuales en cada estrella.

Los extremos de los rayos son conectados por una línea.



Rayos de Sol. Los íconos de rayos de sol son un tipo circular de diagrama

separado para cada caso, cada rayo representa una de las variables

seleccionadas (hacia la derecha, comenzando en las 12:00), y la longitud del rayo

representa el valor relativo de la variable respectiva. Los valores de los datos de

las variables para cada caso son conectados por una línea.

Polígonos. Los íconos de polígono son un tipo circular que se traza para cada

caso, y los valores relativos de las variables seleccionadas en cada caso son

representados por la distancia del centro del ícono a las esquinas consecutivas del

polígono (a la derecha, comenzando en las 12:00).



Pasteles. Los íconos de pastel son un tipo circular de diagrama donde los valores

de los datos para cada caso se trazan como gráfica de pastel (a la derecha,

comenzando en las 12:00); los valores relativos de variables seleccionadas son

representados por el tamaño de las rebanadas del Pastel.

Columnas. Los íconos de columnas son un tipo secuencial del diagrama que se

traza para cada caso; los valores relativos de las variables seleccionadas por caso

son representados por la altura de columnas consecutivas.



Líneas. La línea íconos es un tipo secuencial de diagrama de íconos.

Un gráfico de línea individual se traza para cada caso, y los valores relativos de

las variables seleccionadas para cada caso son representados por la altura de los

puntos consecutivos de la línea, sobre la línea de fondo.

Perfiles. Los íconos de perfil son un tipo secuencial de diagrama de íconos. Un

gráfico individual del área se traza por caso, y los valores relativos de las variables

seleccionadas para cada caso son representados por la altura de los picos

consecutivos del perfil sobre la línea de fondo.



Íconos enmarcados

Si el software permite que usted especifique subconjuntos múltiples, es útil

especificar los casos (sujetos) cuyos íconos serán enmarcados (y los marcos

serán puestos alrededor de los íconos seleccionados) en el diagrama.

Los patrones de línea de los marcos que identifican subconjuntos específicos se

deben enumerar en la leyenda junto con las condiciones de la selección del caso.

El gráfico siguiente muestra un ejemplo de los subconjuntos marcados.



Todos los casos (observaciones) que reúnan la condición especificada en el

subconjunto 1 (es decir, los casos para los cuales el valor de la variable Iristype

son iguales a los de la variable Setosa y para los cuáles el número del caso es

menor de 100) están marcados con un marco específico alrededor de los íconos

seleccionados.

Todos los casos que reúnan la condición definida en el subconjunto 2 (es decir, los

casos para los cuales el valor de Iristype son iguales a la variable Virginic, y para

los cuáles es menor el número del caso de 100) tendrán un marco diferente

alrededor de los íconos seleccionados.

XXI. TÉCNICAS DE REDUCCIÓN DE DATOS

A veces se puede obscurecer un patrón existente trazando un subjuego

extremadamente grande (véase la gráfica de abajo que puede tenerse como

animación con los archivos del curso). Cuando usted tiene una base de datos muy

grande, puede ser útil trazar un subconjunto de los datos, de modo que el patrón

no sea ocultado por el número de los marcadores de puntos.



Algunos software ofrecen métodos para la reducción de datos (u optimización) que

puede ser útil en estos casos. Idealmente,

una opción de la reducción de datos

permitirá que usted especifique un valor n

del número entero menor que el número de

casos en la base de datos. Entonces el

software seleccionará casos de n,

aleatoriamente de los casos disponibles, y

creará el diagrama basado en estos casos

por si mismo.

Observe que tales métodos de la reducción

de subjuegos (o tamaño de muestra) dibujan con eficacia una muestra escogida al

azar de los subjuegos existentes. Obviamente, la naturaleza de tal reducción de

datos es enteramente diferente que cuando los datos se reducen selectivamente a

un subconjunto específico o se parten en los subgrupos basados en ciertos

criterios (Ej., el género, la región, o el nivel de colesterol). Los últimos métodos se

pueden poner en ejecución recíprocamente (Ej., con el método de cepillado

animado), u otras técnicas (Ej., los gráficos categorizados o las condiciones de

selección de casos). Todos estos métodos pueden ayudar posteriormente a

identificar patrones en subjuegos grandes.

XXII. ROTACIÓN DE DATOS (EN ESPACIO 3D)

Cambiando el punto de vista para los diagramas de puntos de 3D los (Ej.,

diagramas espectrales, simples, o espaciales) puede ser una técnica exploratoria

eficaz, puesto que puede revelar los patrones que son fácilmente ocultados, a

menos que usted mire la "nube" de los puntos de referencias desde un ángulo

apropiado (véase la gráfica de abajo que puede tenerse como animación con los

archivos del curso).



Algunos software ofrecen perspectivas

interactivas, la rotación y los controles que

hacen girar continuamente pueden ser útiles

en estos casos. Idealmente, estos controles

permitirán que usted ajuste el ángulo y la

perspectiva de la gráfica para encontrar la

localización del "punto de vista" más

informativo del gráfico, así como permitirle

que controle su rotación vertical y horizontal.

En tanto que estas posibilidades son útiles para el análisis de datos exploratorio

inicial, pueden ser también absolutamente beneficiosas en explorar el espacio

factorial (véase el Análisis Factorial) y explorar el espacio dimensional (véase el

Escalamiento Multidimensional).

Ligas para consultar los tipos de gráficas en Statistica

StatSoft, Inc. (2003). Electronic Textbook. Graphical Techniques . http://www.statsoft.com/textbook/stathome.html

Gráficas 2D

Barras/Columnas

Barras de Desviación

Barras izquierda Y

Barras Derecha Y

Barras Arriba

Barras X

Cajas

Probabilidad Tendencial

Probabilidad Mitad-Normal

Histogramas de Barras Colgantes

Histogramas

Espectrales

Trazos

Gráficas 3D Secuenciales

Histogramas Bivariantes

Cajas

Rangos

Datos crudos Contorno/Discretos

Secuencial Contorno

Secuencial Superficie

Filamentos Datos Crudos

Datos crudos Superficie

Gráficas 4D/Ternarias

Gráficas 3D Categorizadas

Contorno

Desviación

Diagramas de puntos

Espaciales

Espectrales

Superficie

Gráficas Ternarias Categorizadas

Ternarias Contorno/Area

Ternarias Contorno/Líneas

Ternarias Diagrama de puntos


http://www.statsoft.com/textbook/glost.html#Ternary%20Plots,%203D%20-%20Categorized%20Scatterplot

http://www.statsoft.com/textbook/glost.html#Ternary%20Plots,%203D%20-%20Categorized%20Scatterplot

http://www.statsoft.com/textbook/glosc.html#Categorized%20Contour-Lines%20(Ternary%20graph)

http://www.statsoft.com/textbook/glosc.html#Categorized%20Contour-Areas%20(Ternary%20graph)

http://www.statsoft.com/textbook/glosc.html#Categorized%20Plots,%203D%20-%20Surface%20Plot

http://www.statsoft.com/textbook/glosc.html#Categorized%20Plots,%203D%20-%20Spectral%20Plot

http://www.statsoft.com/textbook/glosc.html#Categorized%20Plots,%203D%20-%20Space%20Plot

http://www.statsoft.com/textbook/glosc.html#Categorized%20Plots,%203D%20-%20Scatterplot

http://www.statsoft.com/textbook/glosc.html#Categorized%20Plots,%203D%20-%20Deviation%20Plot

http://www.statsoft.com/textbook/glosc.html#Categorized%20Plots,%203D%20-%20Contour%20Plot

http://www.statsoft.com/textbook/gloss.html#Surface%20Plot%20(from%20Raw%20Data)

http://www.statsoft.com/textbook/gloss.html#Spikes%20(3D)

http://www.statsoft.com/textbook/gloss.html#Sequential%20Surface%20Plot%20(3D)

http://www.statsoft.com/textbook/gloss.html#Sequential%20Contour%20Plot%20(3D)

http://www.statsoft.com/textbook/glosc.html#Contour-Discrete%20Raw%20Data%20Plot

http://www.statsoft.com/textbook/glosc.html#Contour-Discrete%20Raw%20Data%20Plot

http://www.statsoft.com/textbook/glose.html#Error%20Bars%20(3D%20Range%20Plots)

http://www.statsoft.com/textbook/glosb.html#Box%20Plots,%203D

http://www.statsoft.com/textbook/glosh.html#Histograms,%203D%20Bivariate

http://www.statsoft.com/textbook/glost.html#Trace%20Plots

http://www.statsoft.com/textbook/gloss.html#Spectral%20Plot

http://www.statsoft.com/textbook/glosh.html#Histograms,%202D

http://www.statsoft.com/textbook/glosh.html#Hanging%20Bars%20Histogram

http://www.statsoft.com/textbook/glosh.html#Hanging%20Bars%20Histogram

http://www.statsoft.com/textbook/glosh.html#Half-Normal%20Probability%20Plots

http://www.statsoft.com/textbook/glosh.html#Half-Normal%20Probability%20Plots

http://www.statsoft.com/textbook/glosd.html#Detrended%20Probability%20Plots

http://www.statsoft.com/textbook/glosb.html#Box%20Plots,%202D

http://www.statsoft.com/textbook/glosb.html#Bar%20X%20Plot

http://www.statsoft.com/textbook/glosb.html#Bar%20Top%20Plot

http://www.statsoft.com/textbook/glosb.html#Bar%20Right%20Y%20Plot

http://www.statsoft.com/textbook/glosb.html#Bar%20Left%20Y%20Plot

http://www.statsoft.com/textbook/glosb.html#Bar%20Dev%20Plot

http://www.statsoft.com/textbook/glosb.html#Bar-Column%20Plot

http://www.statsoft.com/textbook/glosb



Líneas

Gráficas de Pastel

Probabilidad

Probabilidad-Probabilidad

Quantil-Quantil

Rango

Diagramas de puntos

Secuencial/Estacas

Diagrama de puntos Voronoi

Gráficas 3D XYZ

Contorno

Desviación

Diagramas de puntos

Espaciales

Diagramas de puntos

3D Ternarias

Contorno/Área

Contorno/Líneas

Desviación 3D

Espaciales 3D

Gráficas 2D Categorizadas

Probabilidad Tendencial

Probabilidad Mitad-Normal

Probabilidad Normal

Probabilidad-Probabilidad

Quantil-Quantil

Gráficas nD/Ícono

Caras de Chernoff

Columnas

Líneas

Pasteles

Polígonos

Perfiles

Estrellas

Rayos de Sol

Gráficas Matriciales

Columnas

Líneas

Diagramas de puntos


http://www.statsoft.com/textbook/glosm.html#Matrix%20Plots%20-%20Scatterplot

http://www.statsoft.com/textbook/glosm.html#Matrix%20Plots%20-%20Lines

http://www.statsoft.com/textbook/glosm.html#Matrix%20Plots%20-%20Columns

http://www.statsoft.com/textbook/glosi.html#Icon%20Plots%20-%20Sun%20Rays

http://www.statsoft.com/textbook/glosi.html#Icon%20Plots%20-%20Stars

http://www.statsoft.com/textbook/glosi.html#Icon%20Plots%20-%20Profiles

http://www.statsoft.com/textbook/glosi.html#Icon%20Plots%20-%20Polygons

http://www.statsoft.com/textbook/glosi.html#Icon%20Plots%20-%20Pies

http://www.statsoft.com/textbook/glosi.html#Icon%20Plots%20-%20Lines

http://www.statsoft.com/textbook/glosi.html#Icon%20Plots%20-%20Columns

http://www.statsoft.com/textbook/glosi.html#Icon%20Plots%20-%20Chernoff%20Faces

http://www.statsoft.com/textbook/glosq.html#Quantile-Quantile%20Plots%20-%20Categorized

http://www.statsoft.com/textbook/glosp.html#Probability-Probability%20Plots%20-%20Categorized

http://www.statsoft.com/textbook/glosp.html#Probability-Probability%20Plots%20-%20Categorized

http://www.statsoft.com/textbook/glosc.html#Categorized%20Plots,%202D%20-%20Normal%20Probability%20Plots

http://www.statsoft.com/textbook/glosc.html#Categorized%20Plots,%202D%20-%20Half-Normal%20Probability%20Plots

http://www.statsoft.com/textbook/glosc.html#Categorized%20Plots,%202D%20-%20Half-Normal%20Probability%20Plots

http://www.statsoft.com/textbook/glosc.html#Categorized%20Plots,%202D%20-%20Detrended%20Probability%20Plots

http://www.statsoft.com/textbook/glost.html#Ternary%20Plots,%203D%20-%20Space

http://www.statsoft.com/textbook/glost.html#Ternary%20Plots,%203D%20-%20Deviation

http://www.statsoft.com/textbook/glost.html#Ternary%20Plots,%203D%20-%20Contour-Lines

http://www.statsoft.com/textbook/glost.html#Ternary%20Plots,%203D%20-%20Contour-Areas

http://www.statsoft.com/textbook/glost.html#Ternary%20Plots,%203D

http://www.statsoft.com/textbook/glost.html#Ternary%20Plots,%202D%20-%20Scatterplot

http://www.statsoft.com/textbook/gloss.html#Scatterplot,%203D

http://www.statsoft.com/textbook/glosd.html#Deviation%20Plots

http://www.statsoft.com/textbook/glosc.html#Contour%20Plot

http://www.statsoft.com/textbook/glosu.html#Voronoi%20Scatterplot

http://www.statsoft.com/textbook/gloss.html#Sequential-Stacked%20Plots

http://www.statsoft.com/textbook/gloss.html#Scatterplot,%202D

http://www.statsoft.com/textbook/glosr.html#Range%20Plots%20-%20Columns

http://www.statsoft.com/textbook/glosq.html#Quantile-Quantile%20Plots

http://www.statsoft.com/textbook/glosp.html#Probability-Probability%20Plots

http://www.statsoft.com/textbook/glosn.html#Normal%20Probability%20Plots

http://www.statsoft.com/textbook/glosp.html#Pie%20Chart

http://www.statsoft.com/textbook/glosl.html#Line%20Plots,%202D


APARTADO D. DIAGRAMAS CORRELACIONALES

ASCC

XXIII. EL ANÁLISIS SISTÉMICO POR MEDIO DE

CONSTELACIONES CORRELACIONALES

INTRODUCCIÓN

En el trabajo educativo a veces encontramos problemas para elucidar las

relaciones entre las diferentes circunstancias que se asocian a nuestro quehacer.

Se propone esta técnica de Análisis Sistémico por medio de Constelaciones

Correlacionales (ASCC), donde se obtiene una configuración o modelo del

sistema, que surge de un orden que existe en la realidad con un nivel de

aproximación significativo estadísticamente.

La lectura de los datos es simplificada cuando se diagraman las relaciones entre

las variables, lo que permite concentrar la atención en secuencias y

agrupamientos específicos.

Por ejemplo:

Tabla de correlación canónica entre las variables de 13 y 14 años. Correlaciones

significativas a p 0.01, r 0.2578, n= 99. La fila superior corresponde a los 14

años y la primera columna a los 13.

13 14

REAFECT

RMREGJU

RMCONVP

RMAUTIM

RMSENPR

RMDEBIE

RMBIENO

RMASERT

REOPAYU

REAPJUV

REPADEF

REAFECT 0.27

RMREGJ 0.31 0.29



URMCOMR

E 0.35

RMAUTIM 0.26HNOCAS

T 0.28REPORO

B 0.28RMSENP

R 0.29

RMBIEMA 0.28 0.34 0.34RMAYUD

A 0.30 0.28

REACTIV 0.27 0.30

RESOCIA -0.29 -0.26

RMBIENO 0.30 0.33 0.28RMASER

T 0.27

HAESIMP 0.27

HBUEXIG 0.27REBUEC

O 0.28

REPROLE 0.32 0.29

REVALYS 0.35 0.36

REINVES 0.26 0.32REAPAD

R 0.29 0.34

RECAMEJ 0.26 0.31 0.27REAPCO

M 0.32 0.30REHERE

N 0.26

En un diagrama la representación quedaría de la siguiente forma:



En este trabajo se pretende destacar la importancia de introducirse al uso de la

estadística en las llamadas comúnmente ciencias sociales (a partir de un énfasis

en muestreo y correlación), para fundamentar la técnica ASCC con el uso del

cómputo en la toma de decisiones, misma que puede ser ampliada en otras áreas

de nivel directivo no educacional como el análisis de procesos administrativos y

productivos.

Se pretende además, sin profundizaciones, abrir las posibilidades de uso de la

estadística para quien no tiene conocimientos de la misma, llevándolo lentamente

en una serie de pasos, para que tome las decisiones más adecuadas con altos

niveles de precisión.

Dr. Temístocles Muñoz López

AREACTIV

ARMBIENO

AREPROLE

AREVALYS

AREINVES

AREAPADR

ARECAMEJ

AHBUEXIG

BREAFECT

ARMAUTIM

BRMAUTIM

AREHEREN

BRMSENPR

ARESOCIA

BRMCONVP BRMBIENO

AHAESIMPBRMASERT

BREPADEF

BRMREGJU

ARMREGJU

AREAPCOM

AHNOCAST

ARMBIEMA ARMAYUDA

ARMCOMRE

BREOPAYU

AREPOROB

BREAPJUV BRMDEBIE

AREAFECT

ARMASERT

AREBUECO

ARMSENPR

118


La Técnica de Análisis Sistémico por medio de Constelaciones Correlacionales

está diseñada para la toma de decisiones y se fundamenta en cuatro aspectos

básicos: La Teoría de Sistemas, la teoría y el proceso de la correlación estadística,

el uso de sistemas de cómputo y, la sistematización u organización de los

elementos (variables) que intervienen en el fenómeno, problema u objeto de

estudio.

Ampliando los fundamentos teóricos de la técnica presentada, se puede abordar

con mayor facilidad y una comprensión más completa su utilidad y sus posibles

aplicaciones.

El uso de los sistemas de cómputo ha hecho variar las metodologías y técnicas de

investigación, tanto en diversidad como en una significativa reducción del tiempo

de ejecución de las mismas.

Esto se hace más patente en la aplicación, captura y proceso de la información,

que permite manejar un número significativamente mayor de variables que en las

décadas anteriores en forma muy rápida y altamente precisa, de tal manera que el

investigador puede ampliar considerablemente tanto el número de problemas

analizados como las aplicaciones estadísticas en los mismos, con diferentes,

interesantes y novedosas perspectivas.

Una de las características que se denotan con mayor énfasis en el uso del

procesamiento por cómputo, es que cada vez en mayor medida se utiliza en la

toma de decisiones.

Apuntes complementarios sobre la correlación estadística

Los conceptos de correlación fueron presentados por el científico inglés Sir

Francis Galton (l822-1911), cuando hacía investigaciones sobre la herencia y otras

áreas de la biología, llegando a ser en la actualidad una de las técnicas

estadísticas más utilizadas para analizar o manejar las relaciones en los sistemas

complejos. El análisis de correlación nos permite ver la fuerza o intensidad de las



relaciones que hay entre dos o más variables que covarían recíprocamente. Si hay

una mayor tendencia para variar conjuntamente, mayor correlación habrá entre

ambas, pudiéndose llegar a una correlación perfecta.

Desde el punto de vista de la

teoría de sistemas, hay

causalidad, entre las múltiples

variables o elementos que

integran un sistema, y si son

dependientes, el cambio

operado en uno de ellos

resultará en un cambio en

otro u otros puntos del

sistema, ya que desde su punto de vista están unidos por cohesión y covarianza.

No habrá de perderse de vista que la correlación estadística mide el grado de

intensidad de la asociación entre variables, y no puede hablarse de causalidad, a

menos que se tengan evidencias consistentes.

El estadístico r mide el grado de correlación entre dos variables, así, un valor de r=

1.00 indica una correlación positiva perfecta, un valor de -1.00 expresa una

correlación negativa perfecta, en tanto que un valor correlacional de 0 (cero) indica

independencia total entre las variables, o falta de correlación entre ellas. En las

ciencias sociales o en la naturaleza no suelen obtenerse correlaciones perfectas

debido al tipo de variables que se estudian y a los instrumentos de medición que

se utilizan, pudiéndose encontrar correlaciones imperfectas de cinco tipos:

1. Altas y positivas

2. Altas y negativas

3. Nulas

4. Bajas y positivas

5. Bajas y negativas


Variable 1

Variable 2

1

2

3

4

5

Fertilizantes y riego

Crecimiento

r = 0.85


El coeficiente de correlación permite predecir o pronosticar una variable a partir de

los valores obtenidos en la otra. De esta forma, el coeficiente de correlación lineal

r, es la medida de la fuerza de relación lineal entre dos variables, la magnitud del

efecto que cualquier cambio en una variable ejerce o transmite sobre la otra en un

sentido positivo o negativo.

El conocimiento de como varía un elemento o fenómeno con otro del sistema hace

posible explicar la dinámica de una situación o hacer predicciones, de esta

manera, con el conocimiento de la variación conjunta (covariación) se podría

controlar un hecho o fenómeno manipulando otro u otros elementos del sistema,

una aspiración científica y tecnológica del hombre.

De acuerdo con Spiegel, M. (1991), hay varios tipos de correlación:

a) Correlación no lineal. No implica que no haya correlación, sino que esta puede ser curvilínea.

b) Correlación espuria. Es una correlación sin sentido que se establece entre dos variables evidentemente no relacionadas en la realidad.

c) Autocorrelación. Es aquella que nos permite correlacionar valores de una variable X en ciertos tiempos, con valores correspondientes de la misma variable en tiempos anteriores.

d) Correlación Múltiple. Es el grado de correlación que se establece entre tres o más variables.

En suma, la correlación mide el grado o la intensidad de asociación o relación

tendencial que existe entre dos o más variables cualitativas o cuantitativas. A partir

de los cambios que se pueden producir en una variable, se pueden deducir,

inducir y predecir los cambios que sufrirán las otras variables con que se

relaciona.

Las correlaciones definen la concordancia (correlación positiva) o diferencia

(correlación negativa) y además permiten abordar esquemas referenciales

simples, parciales o multivariados en diferentes grados de complejidad. Así,



podemos mencionar algunas cualidades de diferentes tipos de correlación (S.E.P.

1985), como las siguientes:

a) La correlación positiva que identifica tendencias concordantes de sentido.

b) La correlación negativa que identifica tendencias divergentes o inversas de

sentido.

c) La correlación rectilínea a demostrado su efectividad al referir la dimensión

espacial (longitud, latitud y profundidad) así como lo relacionado con la

previsibilidad de fenómenos de bajo riesgo y aquellos que perfilan constantes o se

los ubica en microdimensiones.

d) La correlación curvilínea ha dado un mayor sentido interpretativo al referir

fenómenos relacionados con las dimensiones temporales, bio-psico-sociales o

personales, así como en relación a las concepciones de relatividad, universo

curvo, previsión de fenómenos de alto riesgo, gradación, variabilidad, ciclicidad o

macrodimensiones.

Una correlación positiva significa que los individuos (variables, elementos o casos)

que obtienen altas calificaciones en una variable, tienden a obtener altas

calificaciones en una segunda variable según González Alanís (1992).

De acuerdo con el mismo autor la clase de coeficiente de correlación que se usa,

depende del tipo de escala en la cual se expresa la variable; de la naturaleza de la

distribución fundamental según sea continua y discreta, y de la forma lineal o no

lineal de la distribución de las calificaciones. Expresa además que:

El coeficiente de correlación del producto-momento de Pearson "r", se puede

emplear con variables de intervalo o de razón.

No encontrar evidencia de una relación entre dos variables, a través de la r de

Pearson, puede significar que las variables están relacionadas en una forma

distinta de la relación lineal.



La suposición de que existe una relación lineal, es la justificación más

importante para el empleo de la r de Pearson cuando se quiere obtener una

medida de la relación entre variables.

Mientras que las relaciones sean unimodales y relativamente simétricas, el

cálculo de la r de Pearson puede considerarse legítimo.

El coeficiente de correlación por rangos de Spearman, se emplea con datos

de variables ordinales de pares comparados.

Antes de aplicar la correlación de Spearman, ambas escalas deben

expresarse en rangos.

Aunque se pueda obtener la r de Pearson con datos ordenados, la r de

Spearman reduce la tarea del cómputo manual para obtener la correlación.

Cuando las series nominales son dicotómicas, se usa la correlación

tetracórica, entre otras.

Es conveniente que para poder leer los resultados estadísticamente, se contemple

cuando menos la siguiente clasificación de relaciones de acuerdo a S.E.P. (Op.

Cit.):

1. Contingente: Fortuita

2. Casual: Al azar o aleatoria.

3. Causal: Determinación univariable.

4. Concomitante: Dependencia de una relación en función de otro factor de incidencia.

5. Concausal.: Determinación multivariable.

6. Condicional: Causas predisponentes, desencadenantes y determinantes; en una función polivalente, diacrónica y sincrónica, en sus perspectivas relacionales, longitudinales, transversales e integrales.



Si tenemos una población o una muestra determinada, los valores de r serán

menores en tanto ésta aumente en número, pero conservando altos valores de

significancia (ver Tabla 2), de ahí que en el diseño de una configuración de

múltiples variables interrelacionadas, se nos presente un entramado de líneas que

dificulta leer su significado.

A veces es conveniente, sobre todo en ésta técnica, separar la población en

subpoblaciones por criterios de género, procedencia (rural o urbana), continuación

de estudios (contra deserción) u otras variables nominales que se deriven de sus

propios atributos naturales.

Los métodos estadísticos que generalmente culminaban con medidas de

tendencia central o dispersión, o con los histogramas representativos de la

información recabada, ahora pueden ser llevados con una gran facilidad a las

aplicaciones no paramétricas y análisis multivariados con auxilio del cómputo

estadístico.

Esto ha impactado de manera relevante a las ciencias de la educación, forzando a

los investigadores a introducirse en los beneficios tecnológicos que representan

los tratamientos cuantitativos para el manejo preciso de grandes volumenes de

información. En esta técnica, que tiene carácter exploratorio, se pretende

precisamente mejorar la calidad de las decisiones tomadas en la educación con el

auxilio de la estadística y del cómputo, ampliando el acceso de usuarios a estos

beneficios tecnológicos.

Descripción de la técnica de constelaciones correlacionales.

Antecedentes de la técnica

Durante las diferentes confrontaciones del autor con problemas educativos, tanto

académicos como administrativos, surgieron numerosas opciones sobre las

soluciones, la validez de los resultados y las posibilidades del tratamiento de las

variables educativas para la toma de decisiones escolares. Al irse integrando la



técnica se fue refinando progresivamente y clarificando su uso para observar el

logro de los objetivos institucionales, y en las perspectivas de la investigación y

evaluación continua en las escuelas, así como en otras aplicaciones derivadas

hacia otros campos de la administración.

Por otra parte, se encontró que la técnica de ASCC podría servir para explicitar el

proceso educativo en el aula, arrojando información útil para la toma de decisiones

y la previsión y control de las variables, llevándolas a un proceso de desarrollo y

prueba en situaciones contingentes, dentro de un amplio espectro de condiciones

educacionales.

La necesidad de depurar y precisar la técnica para facilitar la toma de decisiones,

tanto de la organización escolar como de la práctica educativa, llevó al autor a

usarla en situaciones diversas (Romero Dávila. A. 1992 y Muñoz López, T. 1991),

además de aplicarla en su tesis doctoral (Muñoz López, T. 1997).

Aquí se entienden las Constelaciones Correlacionales como diagramas o

configuraciones desarrollados para modelar o denotar la estructura de un sistema

mediante la aplicación y desarrollo del análisis de la correlación estadística.

Precisando, a partir de la correlación tratada con programas de cómputo, se puede

configurar la estructura fundamental del sistema u orden que existe en la realidad,

además de elucidar la relación de las variables o elementos que lo constituyen en

una constelación de condicionalidad múltiple.

Sin dejar de lado el punto de vista estético, usted obtendrá representaciones

gráficas elegantes y explicativas en las presentaciones de carácter ejecutivo y con

el personal a su cargo, además de garantizar resultados más consistentes en las

propuestas que se deriven del análisis de las estructuras modeladas.

Más adelante también puede trabajar simulaciones con la alteración de los valores

de alguna variable en estudio, antes de hacer los cambios en la realidad, por

ejemplo: ¿Que sucedería si aumentamos el presupuesto destinado a la

capacitación docente?, antes de programarlo en el gasto puede incrementar en



un, digamos 20%, los valores de su base de datos para ésa variable y observar el

efecto del cambio resultante sobre la correlación con otras variables como el

aprovechamiento escolar o el porciento de avance de los cursos.

Ello permitirá decidir si aumentamos el apoyo a las variables precedentes.

Seguramente si antes no existió correlación, ahora probablemente sea diferente,

pero es menos riesgoso simularlo en un modelo antes de hacerlo realmente.

La terminología relativa a las constelaciones

La denominación de constelaciones se refiere a la semejanza que tienen las

configuraciones que resultan de los sistemas estudiados, con las imágenes

mitológicas estelares que explicaban o significaban un orden y afinidad aparentes

entre los fenómenos terrestres y los del cielo nocturno a los pueblos antiguos,

terminología que hereda la astronomía moderna. El concepto de constelación al

parecer se ha transformado en un término polisémico, razón por la cual se precisa

a continuación el sentido que aquí se le confiere.

Probablemente la psicología y los estudios relativos al comportamiento han usado

en tiempos más recientes el concepto de constelación con mayor asiduidad (como

concepto, no como configuración correlacional), sobre todo en sociogramas. Su

significado varía ampliamente y es utilizado para indicar situaciones donde se

presentan conjuntos, secuencias u ordenaciones de relaciones entre variables de

muy diverso tipo y niveles de complejidad.

Una presentación de algunas investigaciones sobre el uso del concepto de

constelaciones, nos clarifican la polisemia del término. En 1980 Ann M. Johns

analizó la cohesión del discurso comercial; además, B. Beebe y L. Gerstman

(1984) lo aplicaron para definir paquetes de entendimiento maternal facial-visual.

Entre otros estudios sobre "constelaciones", M. Hite y otros (1985), R. Williams y

B. E. Compas (1988), R. W. Bradley en 1982, R. Scott y David A. Stone (1986),

Auvenshine (1987) y Kreppner (1986) estudiaron constelaciones familiares.



Shore y otros (1987) estudiaron pacientes depresivos en tres culturas tribales

indias americanas y concluyen precisando tres distintas constelaciones

influenciadas culturalmente, G. D. Rowles en 1982 distinguiendo constelaciones

de principios de soporte, y E. Shapiro y R. Tate (1988) utilizaron modelos de

constelaciones con regresión múltiple. Brian Kidd (1984) condujo un estudio sobre

constelaciones de recursos disponibles en el campus y el paso de los alumnos del

nivel medio superior a la universidad. Por otra parte, G. Karrby (1986) estudió las

constelaciones grupales en preescolares analizando sus interacciones.

Barbara L. Goedel (1985) identificó relaciones en las constelaciones fraternales

usando análisis multivariado, en tanto que Byrnes y Canale (1987) trazaron

constelaciones históricas en enseñanza de lenguas extranjeras. Por otra parte,

Dale H. Schunk (1987) indica que el complejo de constelaciones de aptitudes

predice mejor el aprendizaje que cualquier aptitud sola.

Iran Nejad, A. y A. Ortony (1982) discuten la organización funcional de las

constelaciones de elementos neuronales. En un trabajo posterior (1983) los

mismos autores conciben las constelaciones de elementos neuronales como

microsistemas fisiológicos en tanto que Goodman (1989) considera el autismo

como resultado de constelaciones de inapareamientos funcionales.

Malow y otros (1989) encontraron diferentes constelaciones de problemas de la

personalidad, y adicionalmente L. Perfetti (1990) codifica constelaciones

fraternales para programas que salvan memoria de microcomputadora.

Como se observa, la polisemia del concepto se refiere a diversos campos

profesionales y a muy variadas metodologías.

Se pudieron encontrar adicionalmente esquemas metodológicos que dieron ideas

acerca del desarrollo de ésta técnica en trabajos como los de Peter H. Smith

(1981), sobre la Movilidad Política en el México Contemporáneo haciendo uso de

la probabilidad estadística. También están en las correlaciones entre especies de



plantas por Análisis de Componentes Principales de Laura Pla (1986) y en el

Programa Integral de Investigación Educativa de la S.E.P. (1985).

El proceso y la selección de los datos

La matriz con el concentrado de datos capturada en un programa de cómputo

estadístico procesa la correlación, así obtendremos las relaciones de la variable

uno con el resto y sucesivamente las siguientes hasta obtener todos los resultados

en pantalla.

Los listados comprenden generalmente el número o nombre de las variables, el

número de casos procesados en la muestra, el valor de r que existe entre dos

variables (valor correlacional), además del valor de la probabilidad estadística.

Este último en la mayoría de los programas puede aparecer a la cabeza del listado

como p igual a cero, o sea la probabilidad con que se prueba la hipótesis nula. En

la medida en que aumente el valor de p, aumentará la probabilidad del error hasta

llegar a un máximo de 1. Otros programas dan el nivel de significancia, como

análogo a la probabilidad, que nos indica que hay escasa probabilidad (p<0.05) de

que la relación encontrada se deba al azar.

Mendenhall (1982), menciona que..."es improbable que un fenómeno, observado

en ciencias físicas y especialmente en ciencias sociales, sea función de una sola

variable. Así, es probable que el coeficiente de correlación entre el promedio de

aprovechamiento académico y cualquier otra variable sea bastante pequeño y de

valor cuestionable".

Dado que usted requiere trabajar con un alto nivel de precisión, para el caso de p

igual a cero se procede a seleccionar las variables marcando en los listados las

que tengan valores iguales o menores de 0.05 de probabilidad de error, o mejor p

igual o menor ( ) que 0.01 de probabilidad de error, de acuerdo al criterio del

investigador, criterio que para todos los casos necesita ser el mismo y precisado al

principio de la investigación.



Los valores aceptables de r que se busca obtener dependen del tamaño de la

muestra. A muestras más grandes el valor de r aceptable es menor y viceversa.

Usted necesitará saber éstos valores antes de leer los datos para saber cuales

son las correlaciones aceptables, para lo cual se presentan en la Tabla 2, donde

se busca el valor de r aceptable según el nivel de probabilidad de error que haya

fijado.

Por ejemplo, si su muestra es de 127 personas o casos, y busca el valor de r

significativo a una probabilidad de error menor o igual a 0.05, buscará en la tabla

el valor de r equivalente a 125 casos (n-2 g.l.) que en éste caso es de r (mayor o

igual a 0.159 para aceptar la correlación entre las variables como significativa.

Si en los valores de la tabla para el tamaño de la muestra no está su caso, es

necesario buscar el valor adecuado en las tablas de los textos de estadística o en

programas especializados de acuerdo al valor de probabilidad deseado y el

tamaño de la muestra.

Tabla 2. Valores significativos de r para diferentes tamaños de muestras (n), representados por los grados de libertad (g.l.). La probabilidad de error (p) aceptada es de 0.05 o 0.01.

g.l. (n-2)

r conp=0.05

r conp=0.01

g.l. (n-2)

r conp=0.05

r conp=0.01

1 0.997 1.000 24 0.388 0.4962 0.950 0.990 25 0.381 0.4873 0.878 0.959 26 0.374 0.4784 0.811 0.917 27 0.367 0.4705 0.754 0.874 28 0.361 0.4636 0.707 0.834 29 0.355 0.4567 0.666 0.798 30 0.349 0.4498 0.632 0.765 35 0.325 0.4189 0.602 0.735 40 0.304 0.39310 0.576 0.708 45 0.288 0.37211 0.553 0.684 50 0.273 0.35412 0.532 0.661 60 0.250 0.32513 0.514 0.641 70 0.232 0.30214 0.497 0.623 80 0.217 0.28315 0.482 0.606 90 0.205 0.26716 0.468 0.590 100 0.195 0.25417 0.456 0.575 125 0.174 0.22818 0.444 0.561 150 0.159 0.20819 0.433 0.549 200 0.138 0.18120 0.423 0.537 300 0.113 0.148



21 0.413 0.526 400 0.098 0.12822 0.404 0.515 500 0.088 0.11523 0.396 0.505 1000 0.062 0.081

Los datos significativos seleccionados (es recomendable señalarlos con

marcatextos) se pasan a un listado donde se indican progresivamente las

variables en estudio, seguidas de los números de las variables con las cuales

guarda correlación significativa cada una de ellas, teniendo especial cuidado de

denotar con un subrayado y con el signo negativo (-), las correlaciones negativas

que aparecen en los listados de cómputo. Se da como ejemplo la Forma 1.

Forma 1. Listado de variables correlacionadas en un estudio los intereses y hábitos de los alumnos de una escuela técnica forestal de nivel medio superior.

Variable Variables correlacionadas3

1. Interés por Act. al aire libre 4, -5, -10, 11, 12, 13, 16.2. Interés mecánico -9, 11.

3. Interés por el cálculo -94. Interés científicos 1, -8, 11, 12, 14, 16, 19.5. Interés persuasivo -1, -6, -16.

6. Interés artístico -5, 8, -13, -17.7. Interés literario Sin variables correlacionadas.8. Interés musical -4, 6.

9. Interés por servicio social -2, -3.10. Interés de oficina -1, -16, -24, -27.

11. Coeficiente intelectual 1, 2, 4, 12, 19.12. Promedio de hábitos y habilidades (13 a 21) 1, 4, 11, 13 a 21. (no se grafica)

13. Motivación para estudiar 1, -6, 12, 16, 17.14. Organización del tiempo 4, 12.

15. Concentración 12, 18, 20, 21.16. Lectura de textos 1, 4, -5, -10, 12, 12, 19, 20.

17. Elaboración de apuntes -6, 12, 13.18. Redacción de ensayos e informes 12, 15, 18, 21.

19. Disponibilidad de materiales 4, 11, 12, 16, 18.20. Revisión de contenidos vistos 12, 13, 15, 16, 21.

21. Preparación de exámenes 12, 15, 18, 20.22. Memorización y Transf. de Conocimientos Sin variables correlacionadas.

Al término del listado se pueden seleccionar las variables que tienen una relación

espuria (por carecer de sentido o no posibles en la realidad), labor de limpieza que

nos dejará menos relaciones y por lo tanto, menos trabajo al elaborar

posteriormente el diagrama del sistema.

3 Las correlaciones negativas en el concentrado de datos se marcan subrrayándolas.



Elaboración de las constelaciones correlacionales

A partir de este punto se precisa la parte práctica de la técnica que consiste en

denotar la estructura del sistema con las variables y sus correlaciones. Se

recomienda el uso de pizarrones blancos de acrílico con marcadores de tinta

fugaz, ya que se borran fácilmente al desplazar las variables, aunque puede

utilizar también hojas de rotafolio, lápiz y borrador. El proceso lleva a los

siguientes pasos:

3) Se dibujan círculos que semejan la disposición de las horas en una carátula de reloj (ver Figura 2), tantos círculos como variables existan y dentro de ellos se anota el número de la variable (puede ponerse texto, pero éste tiene la desventaja de ocupar demasiado espacio que en este paso puede ahorrarse).

Figura 2. Variables dispuestas inicialmente en forma de carátula de reloj. El ejemplo corresponde al estudio del perfil del alumno de nivel medio superior de la Escuela Forestal de la SARH en Saltillo durante 1990.

4) De acuerdo a la lista inicial se trazan líneas que unen las variables correlacionadas, quedando así una trama de líneas (correlaciones) entrecruzadas. Observe que no se incluyen las correlaciones de la variable 12


12

5

6

17

7

8

9

10

12

13

14

15

3222

120

19

18

16

4

11


porque es un promedio de las siguientes diez y produce complicaciones innecesarias porque correlaciona con todas las variables que lo originan.

5) Haciendo uso de la imaginación, pensemos que las líneas son hilos móviles y elásticos que unen las variables. Esto, en una hoja de papel o pizarrón, nos permite desplazar fácilmente primero aquellas variables (círculo numerado) que tengan menos relaciones (1 o 2 líneas) hacia espacios externos a la carátula del reloj, cerca de las variables con las que se relacionan. Será necesario borrarlas y redibujarlas en la nueva posición, iniciando por mover a aquellas variables que tienen pocas líneas o relaciones (Figura 4). Repita el proceso con otras variables.

Figura 3. Líneas que denotan las correlaciones entre las variables. Las correlaciones positivas son líneas sólidas y las negativas punteadas.

6) Buscamos que en el diseño final no exista ninguna línea que se sobreponga a otra, o sea, líneas cruzadas. Ahora procuremos mover las variables de los círculos numerados que tengan más relaciones al centro de la carátula imaginaria inicial en todos los casos posibles. Como se puede observar, la longitud de las líneas variará con los cambios de posición, esto no es importante, pero poco a poco nos llevará a que el sistema o modelo se flexibilice y vaya tomando su propia configuración.


12

5

6

17 7

8

9

10

1213

14

15

322

21

20

19

18

16

4

11


Figura 4. Resultado de la primera descomposición de variables.

7) El cruce de las líneas tiene que ser resuelto en su totalidad, situación que se complica si tenemos muestras demasiado grandes, dado que tendremos numerosas relaciones con bajos valores correlacionales pero con un alto nivel de significancia.

8) Ahora se puede proceder a anotar en el extremo de la línea una punta que la convierta en flecha, lo que indicará la posibilidad de una relación de condicionalidad e influencia de unas variables sobre otras. Sin perder de vista que deseamos estructurar un sistema explicativo, el criterio que lleva implícita la dirección de la flecha es el de temporalidad, o sea que se presupone y se tiene evidencia de la existencia previa y la influencia de una variable (fuente de la flecha), para que suceda una respuesta en otra (destino de la flecha). Si no tiene evidencia teórica o empírica de la temporalidad y/o de la supuesta condición previa de las variables para el caso específico que estudia, evite indicar los direccionamientos, sólo dibuje la línea.

9) Como paso final se procede a revisar las correlaciones negativas representadas por líneas punteadas (o de otro color), ya que ésto indica el sentido de la correlación (positivo o negativo).


1

2

5

6

17

7

8

9

10

12

13

14

15

3

22

21

20

19

18

16

4

11


Figura 5. Constelación correlacional ajustando la posición de las variables.

Dado que estamos trabajando con una correlación entre múltiples variables,

generalmente la expresión de una de ellas está condicionada por un número que

puede ser muy grande de variables, y se presume por lo tanto que sobre ella no

hay un efecto puro o único. Podemos decir que esperamos una

multicondicionalidad (ver Figura 5 y la final Figura 6), y a veces permanecen líneas

cruzadas que implican una configuración en tercera dimensión.

10)Considerando lo anterior, pueden analizarse las variables de importancia especial poniéndolas al centro de las demás con las que se correlaciona (Figura 7).

11)No olvide anotar en su esquema final, al margen, aquellas variables que quedaron aisladas del sistema y participaron en la investigación sin tener correlaciones, eso ayuda también a explicar el sistema que se estudia.


1

2

56

17

7

8

9

10

12

13

14

15

3

22

21

20

19

18

16

4

11


Figura 6. Resultado de la constelación correlacional final.

Se presenta en la Figura 7 un ejemplo de variables de especial interés ubicadas

en el centro del diagrama. Éstas no son constelaciones correlacionales pero

competan la explicación del fenómeno que estudiamos.

Figura 7. Ejemplo de correlaciones con una variable de interés en el centro.

Lectura de las constelaciones


1

2

56

17

7

8

9

10

12

13

14

15

3

22

21

20

19

18

16

4

11

1

8

14

19

16

4

1119

5

4

1

10

16

20


Toda vez que tenemos configurada la constelación correlacional, será necesario

leerla para transformarla en una explicación del comportamiento del modelo.

Para esto se puede proceder de dos formas, la primera consiste en aislar

imaginariamente subconjuntos de variables que aparecen más o menos

independientes en el sistema, transcribiendo el significado de estos subconjuntos

para posteriormente leerlos como el sistema total.

En el segundo método se puede tomar de los listados una variable de nuestro

interés y aisladamente, se hace incidir sobre ella a las líneas o relaciones que

guarda con otras variables, procurando hacer énfasis en sus características y

consecuencias (Figura 7). Este procedimiento es complementario del primero y de

gran importancia cuando unas pocas variables concentran muchas relaciones.

Es conveniente que identifiquemos tentativamente las variables iniciadoras

predisponentes o desencadenantes como aquellas de las que parten las líneas o

flechas, las variables mediadoras como aquellas que condicionan, reciben y

aportan efectos en otras variables en un numero aproximadamente igual. Las

variables finales caen en esa clasificación tentativa por el hecho de solo recibir

efectos de otras variables y por lo tanto son el producto del sistema.

Es necesario que al final de la lectura de los resultados reconsidere la clasificación

original de las variables y su pertenencia a una determinada categoría o variable

compleja. En la gráfica elaborada es también recomendable dejar anotadas las

variables aisladas (las que no resultaron correlacionadas con otras) y revisar que

no estén presentes las correlaciones espurias, sin sentido o ilógicas.

Probablemente no exista algo más valioso que la experiencia de las personas o

investigadores que se relacionan vivencialmente con el objeto de investigación,

siendo ellos los que pueden destacar o corregir la dirección de las relaciones y

apoyar objetivamente la lectura del sistema.



Por otra parte, si ésta técnica se aplica en investigaciones científicas formales, no

precisamente en las operacionales y diagnósticos, evite el uso de las flechas y

explore la información con otros estadísticos.

Las conclusiones y su validez externa

Los resultados que se presentan en la lectura de las constelaciones son

enunciados que se establecen a partir de una representación gráfica de las

variables y sus relaciones. El número de enunciados podrá ser demasiado grande

como para explicarlo a otras personas, aún en condiciones óptimas de tiempo y

ambiente.

Otra forma de presentar la explicación de los resultados es mediante la obtención

de conclusiones que sintetizan la lectura final. Para concluir necesitamos primero

reunir los enunciados de los resultados que se refieren a un mismo tópico.

Aquí es necesario pensar que estamos reduciendo varios enunciados en otro

mayor que los contiene, de ésta manera nuestra atención se dirige a las variables

más importantes por su número de relaciones significativas, o por su posición

generadora, mediadora o receptora de influencia de las otras variables en el

sistema estudiado.

Antes de presentar los resultados le conviene verificar la validez externa de su

investigación, lo cual quiere decir que hay seguridad de extrapolarlos a la

población de la que proviene la muestra, de otra forma tendrá que afirmar que sus

estimaciones son válidas al menos para los individuos muestreados.

Si la muestra fue adecuadamente seleccionada, de tal manera que todos los

individuos o casos tuvieron la misma probabilidad de ser tomados y, si su número

representa la proporción adecuada de la población, seguramente podrá extrapolar

con niveles aceptables de confianza que adquirió al seguir con cuidado los pasos

y las recomendaciones prescritos en la técnica.



Consideraciones finales

La técnica ASCC que aquí se presenta es un intento de inducir a usar la

estadística a todos aquellos maestros, directivos escolares y departamentos

académicos relacionados con la toma de decisiones, que contando con equipo de

cómputo, tienen la necesidad pero no los instrumentos conceptuales para el

enfoque de mayor precisión y confiabilidad de sus problemas y soluciones.

Es necesario que se considere que, si bien, se presenta la posibilidad de un

tratamiento más completo de los datos para transformarlos en información,

siempre será necesario profundizar en el conocimiento de la estadística,

especialmente en puntos relacionados con el muestreo, normalidad, medidas de

tendencia central, medidas de dispersión, teoría de la correlación, diseño de

reactivos de respuesta, escalas y medidas y, los principios fundamentales de la

logística de la investigación científica.

Si usted se interesa en los fundamentos, aplicaciones y las novedades de los

desarrollos estadísticos, es conveniente que consulte algunos textos de éstas en

las ciencias naturales, sobre todo en ecología cuantitativa, y explorando también

los nuevos programas de cómputo estadístico. La anterior recomendación se debe

a que las aplicaciones matemáticas en ciencias sociales para México son muy

restringidas en profundidad y en número de casos de investigadores, en tanto que

en las ciencias naturales son prácticamente rutinas de trabajo de mayor amplitud.

Aunque en algunas técnicas de toma de decisiones derivadas del análisis

sistémico se plantea un objetivo después de plantear el problema, a diferencia de

las investigaciones de otro tipo, esto se considera sólo como una mención sin

mayor profundidad, dado que el nivel operacional que se plantea aquí no lo

requiere.

La toma de decisiones se puede derivar fácilmente de la lectura de la constelación

correlacional obtenida, sin embargo, el sistema o configuración logrado debe ser



estudiado cuidadosamente para ver las variables que podemos manipular para

lograr los resultados deseados.

El éxito y satisfacción al obtener buenas decisiones usando ésta técnica se

incrementará progresivamente y el usuario la manejará con mayor precisión y

facilidad, sobre todo si se interesa en las lecturas adicionales que encuentre

relacionadas con el tema.

La técnica que se presenta puede ser llevada, con los límites de su imaginación y

sus necesidades, a la toma de decisiones en otros campos de la administración, la

investigación de los fenómenos naturales, algunos casos de producción de bienes

o estudios sociales.

Literatura de consulta

Agencia para el Desarrollo Internacional. 1971. Conferencias sobre Muestreo. Curso suplementario para un estudio de caso sobre encuestas y censos. Versión en español. Bureau of Census. U.S. Department of Commerce.

American Psychological Association. 1999. Electronic reference formats recommended by the American Psychologycal Association. (1999, November 19). Washington, DC. Retrieved November 3, 2000 from: http://www.apa.org/journals/webref.html

Campbell, Stephen K. 1990. Equívocos y Falacias en la Interpretación de Estadísticas. Primera reimpresión. Ed. Limusa. México.

Cochran, William C. 1985. Técnicas de muestreo. Ed. CECSA. México.

Colegio de postgraduados de Chapingo. 1996. Guía para autores. Agrociencia 30:4. 601-610pp.

Forns, M., T. Kirchner, y M. Torres. (1991). Principales modelos de evaluación psicológica. L'estudi d'en llop Barcelona.

García Santos, Aguinaldo. 1990. Muestreo. Apuntes para la maestría en Productividad de la UANE y la Maestría en Educación de la U. A. de C. Saltillo.


http://www.apa.org/journals/webref.html


Gibaldi, Joseph, and Walter S. Achtert. MLA Handbook for Writers of Research Papers, 3rd ed. NY: MLA, 1988

Isebrands, J.G. y T.R. Crow. 1975. Introduction to uses and interpretation of Principal Component Analysis in Forest Biology. General technical Report. USDA Forest Service. St. Paul, Minnesota.

Krejcie, R. V. and D. W. Morgan. 1970. Determining sample size for research activities. Educational and Psychological Measurement. 30, 607-610 pp.

Li, Xia, and Nancy Crane. Electronic Style: A Guide to Citing Electronic Information. Westport: Meckler, 1993.

Ludwig, John A. and James F. Reynolds. 1988. Statistical Ecology. A primer on methods and computing. John Wiley & Sons. New York.

Mendenhall, William. 1982. Introducción a la probabilidad y la estadística. Wadsworth Internacional/Iberoamérica. Belmont.

Modern Language Association (MLA on line). 2002. A Writer's Practical Guide To MLA Documentation. http://ccc.commnet.edu/mla/practical_guide.htm.

Muñoz López, Temístocles. 1999. Recomendaciones para elaborar un cuestionario de investigación o para evaluación en ciencias sociales. Perfiles Año 2, Número 12. Coordinación General de Estudios de Postgrado e Investigación. Universidad Autónoma de Coahuila. Saltillo.

Muñoz López, Temístocles. 2000. Apuntes sobre muestreo. Perfiles. Año 3, Número 15. Coordinación General de Estudios de Posgrado e Investigación. Universidad Autónoma de Coahuila. Saltillo. Artículo.

NCSS 2000. 1999. NCSS and PASS Trial. User´s Guide. Utah.

Pla, Laura E. 1986. Análisis multivariado: Método de componentes Principales. Monografía. Secretaría General de la O.E.A. Programa Regional de Desarrollo Científico y Tecnológico. Washington.

Rojas Soriano, R. 1982. Guía para realizar Investigaciones Sociales. Textos Universitarios. UNAM. México.

Romero Dávila, María Antonieta. 1992. La capacitación en el IMSS Delegación Coahuila, con la técnica de Análisis Sistémico por medio de Constelaciones Correlacionales. Tesis de Licenciatura. Fac. de Ciencias de la Educación y Humanidades. U.A. de C., Saltillo.

S.E.P. Coahuila. 1985. Programa Integral de Investigación Educativa. Saltillo.



Selltiz, C., L. S. Wrightsman y S. W. Cook. 1980. Métodos de investigación en las relaciones sociales. Ediciones RIALP. Madrid.

Smith, Peter H. 1981. La movilidad política en el México Contemporáneo. In. Lecturas de política Mexicana. Centro de Estudios Internacionales. El Colegio de México. México.

StatSoft, Inc. (1997). STATISTICA for Windows [Computer program manual]. Tulsa, OK: StatSoft, Inc., 2300 East 14th Street, Tulsa, OK 74104, phone: (918) 749-1119, fax: (918) 749-2217, email: [email protected], WEB: http://www.statsoft.com

StatSoft, Inc. (2003). Electronic Textbook. Glossary. http://www.statsoft.com/textbook/stathome.html

StatSoft, Inc. (2003). Electronic Textbook. Graphical Techniques. http://www.statsoft.com/textbook/stathome.html

Young, Robert k. y Donald J. Veldman. 1981. Introducción a la estadística aplicada a las ciencias de la conducta. 2ª edición. Ed. Trillas. México.






http://www.statsoft.com/

Diseño, Lectura y Representación de Gráficos

Documents

Transcript of Diseño, Lectura y Representación de Gráficos