Práctica 1 vgaribayvalentin/ging/materiales_web/practica1_guia.pdfPráctica 1 vgaribay 5 3.-...
Transcript of Práctica 1 vgaribayvalentin/ging/materiales_web/practica1_guia.pdfPráctica 1 vgaribay 5 3.-...
Práctica 1 vgaribay
1
PRÁCTICA 1. INTRODUCCION A STATGRAPHICS. ESTADISTICA DESCRIPTIVA
OBJETIVOS: Conocer los fundamentos del programa Statgraphics. Realizar un análisis descriptivo de variables cualitativas y cuantitativas.
Datos en los ficheros: Cardata.sgd, Pasajeros.sgd, Municipios.sgd, Robles.sgd y Gasolina.sgd.
INTRODUCCIÓN AL MANEJO DE STATGRAPHICS 1.- INICIO DEL PROGRAMA STATGRAPHICS Ventana de la aplicación: Menús, iconos, barra de herramientas y de estado.
Hoja de cálculo: Contiene los datos.
2.- DATOS Y VARIABLES
2.1. Abrir un fichero de datos Cardata: File / Open / Open Data Source STATGRAPHICS. File / Open / Open Data Source STATGRAPHICS Abrir Cardata.sgd
o botón Statgraphics abre fuentes de datos de otros muchos tipos:
archivos de ASCII, txt, csv, xls, sas, jmp, lotus, matlab, statistica, R, dbf … File / Open / Open Data Source > External Data File > seleccionar tipoy archivo
Práctica 1 vgaribay
2
2.2. Insertar nuevas filas o columnas: Selecciona la línea y pulsa el botón derecho / Insert. Selecciona la línea o columna, botón derecho / Insert.
Deshacer acción con botón derecho / Undo Insert.
2.3. Crear nuevas variables: Se pueden introducir nuevos datos manualmente, o bien
1) definirlos a partir de otros ya existentes (transformación de variables): seleccionada la columna nueva, doble click en la cabecera de la vble o botón derecho / Modify Column / Formula escribir fórmula o botón Define…
1 milla = 1,609344 kilómetros ; 1 galón americano = 3,785411784 litros Paso de millas por galón a litros cada 100 km: 100*3,7854118/(mpg*1,609344) Botón Help para ayuda sobre funciones También se puede insertar la expresión en o botón derecho / Generate Data.
2) generarlos pulsando el botón derecho del ratón / Generate Data. números pseudoaleatorios de distribuciones; uniforme, normal… RUNIFORM(100;0;10), RNORMAL(155;0;1)
Práctica 1 vgaribay
3
2.4. Ordenar la tabla de datos según una variable: desde el botón secundario / Sort File.
Deshacer acción con botón derecho / Undo Insert.
Ejemplos: 1) crear la variable accel2 y colocarla en una nueva columna,
Seleccionar columna/ Botón derecho / Insertar Doble click en cabecera / Formula /Define accel*accel o accel^2
2) seleccionar en una nueva columna la potencia de los coches japoneses Select(horsepower; origin=3), Creo nueva variable. Nombre pot_japo
Seleccionar columna/ Botón derecho / Insertar Doble click en cabecera / Formula /Define SELECT(horsepower;origin=3)
3) encontrar el coche con más peso.
Ordeno la hoja por orden decreciente de weight Botón secundario sobre ventana de datos / Sort File
Práctica 1 vgaribay
4
El mayor peso puede encontrarse mediante Nueva columna / Formula MAX(weight)
y el coche de mayor peso, mediante la comparación lógica de weigh con MAX(weight) Nueva columna / Formula MAX(weight)= weight
Práctica 1 vgaribay
5
3.- TRASLADO DE TEXTOS Y GRÁFICOS desde la ventana de salida de los análisis a ventanas StatReporter o StatGallery
・ Para copiar un análisis completo en el StatReporter ventana StatReporter
se pulsa el botón derecho y se elige Copy Analysis to StatReporter. El programa traslada, sin necesidad de la opción “Paste”, todos los paneles al StatReporter y, restaurando éste, se puede añadir o modificar texto.
・ Para trasladar parte del análisis a la Galería (StatGallery), ventana StatGallery
se pulsa botón derecho sobre el panel y se marca Copy Pane to StatGallery.
Hay que restaurar StatGallery y utilizar la opción Paste. 4.- ALMACENAMIENTO
・ Para guardar por primera vez el conjunto de todos los datos y análisis:
File / Save As / Save StatFolio As. o archivo .sgp
・ Si se quiere guardar solamente el conjunto de datos:
File / Save As / Save Data As. o archivo .sgd De manera análoga se procede con StatReporter o StatGallery.
File / Save As / Save StatGallery As. archivo .sgg File / Save As / Save StatReporter As. archivo .rtf
Los componentes de un StatFolio pueden tener distinto nombre o el mismo, distinguiéndose en este caso por la extensión correspondiente.
Práctica 1 vgaribay
6
ESTADÍSTICA DESCRIPTIVA
5.- DESCRIPCIÓN DE DATOS UNIVARIANTES
5.1. Variables cualitativas: Realizar un estudio tabular y gráfico de la variable “origin”. Describe / Categorical Data / Tabulation.
Se obtiene la tabla de frecuencias y los diagramas de barras y sectores.
Probar las opciones (botón secundario) de análisis, de ventana y gráficas de cada ventana.
Retornar a Tabulation desde la barra de herramientas
Práctica 1 vgaribay
7
y probar en (Select) las opciones: “first(30)”, “last(20)” y “exclude(3)”.
Realizar el análisis sólo con los coches de más de 4 cilindros (cylinders>4),
o sólo con los coches del año 1980 (year=80),
o con los coches de marca Ford. (make="Ford")
Práctica 1 vgaribay
8
Obtener un diagrama de Pareto para “origin”: SPC/ Quality Assessment/ Pareto Analysis.
5.2. Variables cuantitativas: Realizar un estudio descriptivo de la variable “accel”. Describe /Numeric Data / One-Variable Analysis.
Realizar los 4 primeros análisis numéricos (TABLES), el diagrama de cajas y el histograma.
Práctica 1 vgaribay
9
・ Manejar las opciones de ventana para añadir más estadísticos,
Sobre Summary Statistics for accel de ventana Analysis – Botón secundario / Pane Options
modificar el nº de clases Sobre Frequency Tabulation for accel o Histograma de ventana Analysis – Botón secundario / Pane Options
y los percentiles. Sobre Percentiles for accel de ventana Analysis – Botón secundario / Pane Options
・ Histograma: Para variar la escala y el nº de clases, y ver los diagramas acumulados y los polígonos
de frecuencias, pulsar botón derecho Pane Options
para cambiar el aspecto usar las botón derecho Graphics Options.
Práctica 1 vgaribay
10
Localizar percentiles de forma aproximada con el polígono de frecuencias relativas acumuladas. Doble click Histograma / Seleccionar la curva / botón derecho > Locate
Click izdo ratón y moverlo sobre la curva del polígono de frecuencias acumuladas
Para realizar el gráfico simultáneo de histograma y polígono de frecuencias, usar StatGallery. Pane Options crea histograma frecuencias botón derecho en Histograma /Copy Pane to StatGallery
Click en Icono StatGallery botón derecho paste en uno de sus paneles
Práctica 1 vgaribay
11
Pane Options en la salida del histograma y crea el polígono de frecuencias
botón derecho sobre Histograma / Copy Pane to StatGallery Click en Icono StatGallery
En StatGallery, botón derecho paste OVERLAY en el mismo panel
De forma similar, podemos superponer el histograma y el polígono de frecuencias acumuladas.
Práctica 1 vgaribay
12
Con un poco más de trabajo, superponemos el histograma de frecuencias y el polígono acumulado
Pane Options crea histograma de frecuencias y modifica escala eje Y (rango 0-100)
botón derecho sobre Histograma / Copy Pane to StatGallery + botón derecho paste en un panel SG
Pane Options crea polígono de frecuencias acumuladas
botón derecho sobre Histograma / Copy Pane to StatGallery
En StatGallery, botón derecho paste OVERLAY en el mismo panel
Práctica 1 vgaribay
13
・ En el Diagrama de Cajas (Gráfico de Caja y Bigotes) identificar puntos extremos y hacerlo
con respecto a otra variable, “make”: Picar en el icono de Identify (?) y seleccionar opciones.
Realizar un diagrama de varillas para “cylinders”. describe / numeric data /one-variable analysis / Cylinders Botón derecho / Pane Options 100 clases con límites 2 y8
Práctica 1 vgaribay
14
Dibujar los datos temporales del nº de pasajeros (fichero Pasajeros.sgd): Plot / Scatterplots / X plot
(elejir líneas en opción de ventana del Gráfico de Series de Tiempo)
o bien Plot / Time Sequence Plot / X plot. Comentar propiedades.
5.3. Transformación de una variable cuantitativa en cualitativa (fichero Cardata.sgd): Un consumo es alto si mpg<30, y bajo en caso contrario. Considerar la variable X (bajo, alto).
Nueva Columna copia de mpg / botón derecho / Recode Data
Realizar un análisis descriptivo de mpg y de X.
Práctica 1 vgaribay
15
Describe / Numeric Data / One-Variable Analysis > mpg
Describe / Numeric Data / One-Variable Analysis > mpg
Práctica 1 vgaribay
16
6.- DESCRIPCIÓN DE DATOS BIVARIANTES 6.1. Asociación entre atributos: Analizar la relación entre las variables “origin” y “cylinders”. Describe / Categorical Data / Crosstabulation.
Observar la tabla de contingencia, el diagrama de barras múltiple y el gráfico de mosaico puedes retocarlos con las opciones de panel y de gráfico
6.2. Asociación entre un atributo y una variable numérica: Analizar la relación entre las variables “mpg” y “cylinders”. Plot / Exploratory Plots / Box-and-Whisker Plots / Multiple Samples.
Práctica 1 vgaribay
17
6.2. Asociación entre variables numéricas: Analizar la relación entre las variables “weight” y “mpg”. Plot / Scatterplots / X-Y Plot.
Asociación lineal NEGATIVA: Pesos ALTOS se asocian a rendimientos BAJOS, y al revés.