CO5316 Prog Analitico

3
  UNIVERSIDAD SIMÓN BOLÍVAR DIVISIÓN Física y Matemáticas DEPARTAMENTO Cómputo Científico y Estadística CÓDIGO CO5316 ASIGNATURA Análisis de Datos REQUISITOS CO3322, CO3321 o equivalente HORAS/SEMANA T.4 P.0 L.0 UNIDADES CRÉDITO: 4 VIGENCIA Septiembre 2012 AUTORES I. García, Z. Martínez y M. Rodríguez PROFESOR L. Bravo, I. Llatas, I. García, Z. Martínez y M. Rodríguez Objetivo general: Desarrollar competencias en el área de análisis estadístico de datos multivariados mediante el software R (ambiente estadístico y lenguaje de programación, GNU) que permita a los estudiantes la búsqueda de soluciones a problemas aplicados. El contenido del curso integra los métodos descriptivos multivariantes de minería de datos, y de reconocimiento de patrones, con los procedimientos de inferencia estadística para vectores de variables. Objetivos Específicos: 1. Manipular bases de datos usando distintos programas para adecuarse a los requerimientos de R. 2. Programar funciones en R para realizar análisis estadísticos. 3. Aplicar técnicas de análisis descriptivo para generar estadísticas que caracterizan las relaciones entre varias variables de interés. 4. Aplicar las técnicas estadísticas multivariadas más relevantes como herramientas para disminuir la dimensionalidad en problemas con alto número de variables de interés. 5. Plantear modelos lineales generalizados que permitan explicar un alto porcentaje de la variabilidad de la(s) variable(s) objetivo. 6. Identificar correctamente el contexto de aplicación de cada una de las técnicas multivariadas estudiadas con datos reales.

description

Analisis de Datos

Transcript of CO5316 Prog Analitico

  • UNIVERSIDAD SIMN BOLVAR

    DIVISIN Fsica y Matemticas

    DEPARTAMENTO Cmputo Cientfico y Estadstica

    CDIGO CO5316 ASIGNATURA Anlisis de Datos

    REQUISITOS CO3322, CO3321 o equivalente

    HORAS/SEMANA T.4 P.0 L.0 UNIDADES CRDITO: 4

    VIGENCIA Septiembre 2012

    AUTORES I. Garca, Z. Martnez y M. Rodrguez

    PROFESOR L. Bravo, I. Llatas, I. Garca, Z. Martnez y M. Rodrguez

    Objetivo general:

    Desarrollar competencias en el rea de anlisis estadstico de datos multivariados mediante el

    software R (ambiente estadstico y lenguaje de programacin, GNU) que permita a los

    estudiantes la bsqueda de soluciones a problemas aplicados. El contenido del curso integra

    los mtodos descriptivos multivariantes de minera de datos, y de reconocimiento de patrones,

    con los procedimientos de inferencia estadstica para vectores de variables.

    Objetivos Especficos:

    1. Manipular bases de datos usando distintos programas para adecuarse a los requerimientos de R.

    2. Programar funciones en R para realizar anlisis estadsticos. 3. Aplicar tcnicas de anlisis descriptivo para generar estadsticas que caracterizan las

    relaciones entre varias variables de inters.

    4. Aplicar las tcnicas estadsticas multivariadas ms relevantes como herramientas para disminuir la dimensionalidad en problemas con alto nmero de variables de inters.

    5. Plantear modelos lineales generalizados que permitan explicar un alto porcentaje de la variabilidad de la(s) variable(s) objetivo.

    6. Identificar correctamente el contexto de aplicacin de cada una de las tcnicas multivariadas estudiadas con datos reales.

  • UNIVERSIDAD SIMN BOLVAR

    Contenidos

    1. Introduccin al curso y al ambiente de trabajo de R (1 semana). 2. Repaso de nociones de lgebra lineal y distribuciones multivariadas (1 semana). 3. Anlisis exploratorio de datos multivariados (1 semana). 4. Repaso de modelos lineales. Modelos de Anlisis de varianza con uno y dos criterios

    de clasificacin. Comparacin mltiple de medias (1 semana)

    5. Anlisis de modelos lineales generalizados (1 semana) 6. Anlisis de componentes principales (1 semana) 7. Escalamiento multidimensional y anlisis de correspondencias (1 semana). 8. Anlisis de conglomerados (cluster) (2 semanas). 9. Anlisis discriminante (1 semana)

    ESTRATEGIAS METODOLGICAS DE ENSEANZA-

    APRENDIZAJE

    El curso consiste de 4 horas semanales de clases en aula, donde el profesor expone el

    contenido de la materia, buscando un balance entre los contenidos tericos y los

    ejemplos de aplicacin. Se incentiva la participacin de los alumnos a travs de

    preguntas. Se sugieren ejercicios y miniproyectos a ser realizados fuera del aula, para

    reforzar los conceptos discutidos en clase y promover el trabajo en equipo. Se fomenta

    la investigacin de aplicaciones de las tcnicas estudiadas a datos reales. Se realizarn

    presentaciones de los proyectos realizados.

    ESTRATEGIAS DE EVALUACIN

    Al menos dos pruebas escritas: la primera en semana 6 (30% de la nota final) y la segunda en semana doce (30% de la nota final).

    Al menos dos proyectos elaborados en equipos de hasta tres estudiantes, cada uno de 15%.

    Al menos dos presentaciones por parte del estudiante (relacionada con el proyecto realizado) , cada una 5%.

  • UNIVERSIDAD SIMN BOLVAR

    FUENTES DE INFORMACIN:

    Venables W, Ripley B. 2010. Modern Applied Statistics with S (Statistics and Computing). Springer. ISBN-10: 1441930086.

    Pea, D. 2010. Anlisis de datos Multivariantes. McGraw . Hill Interamericana de Espana.

    Hair J, Black W, Babin B y Anderson R. 2009. Multivariate Data Analysis, 7ma. Edicin.

    Johnson R, Wichern D. 2007. Applied Multivariate Statistical Analysis, 6ta. Edicin.

    Jobson J.D. 1992. Applied Multivariate Data Analysis. Vol I y II. Springer.

    Se utilizar el paquete estadstico R que es un programa de licencia pblica y puede descargarse desde la pgina web http://www.r-project.org/ donde tambin puede encontrarse documentacin en ingls y espaol sobre el software.