CO5316 Prog Analitico
-
Upload
carlos-alfredo-ramirez-pena -
Category
Documents
-
view
213 -
download
0
description
Transcript of CO5316 Prog Analitico
-
UNIVERSIDAD SIMN BOLVAR
DIVISIN Fsica y Matemticas
DEPARTAMENTO Cmputo Cientfico y Estadstica
CDIGO CO5316 ASIGNATURA Anlisis de Datos
REQUISITOS CO3322, CO3321 o equivalente
HORAS/SEMANA T.4 P.0 L.0 UNIDADES CRDITO: 4
VIGENCIA Septiembre 2012
AUTORES I. Garca, Z. Martnez y M. Rodrguez
PROFESOR L. Bravo, I. Llatas, I. Garca, Z. Martnez y M. Rodrguez
Objetivo general:
Desarrollar competencias en el rea de anlisis estadstico de datos multivariados mediante el
software R (ambiente estadstico y lenguaje de programacin, GNU) que permita a los
estudiantes la bsqueda de soluciones a problemas aplicados. El contenido del curso integra
los mtodos descriptivos multivariantes de minera de datos, y de reconocimiento de patrones,
con los procedimientos de inferencia estadstica para vectores de variables.
Objetivos Especficos:
1. Manipular bases de datos usando distintos programas para adecuarse a los requerimientos de R.
2. Programar funciones en R para realizar anlisis estadsticos. 3. Aplicar tcnicas de anlisis descriptivo para generar estadsticas que caracterizan las
relaciones entre varias variables de inters.
4. Aplicar las tcnicas estadsticas multivariadas ms relevantes como herramientas para disminuir la dimensionalidad en problemas con alto nmero de variables de inters.
5. Plantear modelos lineales generalizados que permitan explicar un alto porcentaje de la variabilidad de la(s) variable(s) objetivo.
6. Identificar correctamente el contexto de aplicacin de cada una de las tcnicas multivariadas estudiadas con datos reales.
-
UNIVERSIDAD SIMN BOLVAR
Contenidos
1. Introduccin al curso y al ambiente de trabajo de R (1 semana). 2. Repaso de nociones de lgebra lineal y distribuciones multivariadas (1 semana). 3. Anlisis exploratorio de datos multivariados (1 semana). 4. Repaso de modelos lineales. Modelos de Anlisis de varianza con uno y dos criterios
de clasificacin. Comparacin mltiple de medias (1 semana)
5. Anlisis de modelos lineales generalizados (1 semana) 6. Anlisis de componentes principales (1 semana) 7. Escalamiento multidimensional y anlisis de correspondencias (1 semana). 8. Anlisis de conglomerados (cluster) (2 semanas). 9. Anlisis discriminante (1 semana)
ESTRATEGIAS METODOLGICAS DE ENSEANZA-
APRENDIZAJE
El curso consiste de 4 horas semanales de clases en aula, donde el profesor expone el
contenido de la materia, buscando un balance entre los contenidos tericos y los
ejemplos de aplicacin. Se incentiva la participacin de los alumnos a travs de
preguntas. Se sugieren ejercicios y miniproyectos a ser realizados fuera del aula, para
reforzar los conceptos discutidos en clase y promover el trabajo en equipo. Se fomenta
la investigacin de aplicaciones de las tcnicas estudiadas a datos reales. Se realizarn
presentaciones de los proyectos realizados.
ESTRATEGIAS DE EVALUACIN
Al menos dos pruebas escritas: la primera en semana 6 (30% de la nota final) y la segunda en semana doce (30% de la nota final).
Al menos dos proyectos elaborados en equipos de hasta tres estudiantes, cada uno de 15%.
Al menos dos presentaciones por parte del estudiante (relacionada con el proyecto realizado) , cada una 5%.
-
UNIVERSIDAD SIMN BOLVAR
FUENTES DE INFORMACIN:
Venables W, Ripley B. 2010. Modern Applied Statistics with S (Statistics and Computing). Springer. ISBN-10: 1441930086.
Pea, D. 2010. Anlisis de datos Multivariantes. McGraw . Hill Interamericana de Espana.
Hair J, Black W, Babin B y Anderson R. 2009. Multivariate Data Analysis, 7ma. Edicin.
Johnson R, Wichern D. 2007. Applied Multivariate Statistical Analysis, 6ta. Edicin.
Jobson J.D. 1992. Applied Multivariate Data Analysis. Vol I y II. Springer.
Se utilizar el paquete estadstico R que es un programa de licencia pblica y puede descargarse desde la pgina web http://www.r-project.org/ donde tambin puede encontrarse documentacin en ingls y espaol sobre el software.