Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis...

33
Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología, Departamento de Salud Pública, PUC.

Transcript of Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis...

Page 1: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

Introducción a R

José Bustos1 & Alex Mellado2

1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro.2 Magister (c) Epidemiología, Departamento de Salud Pública, PUC.

Page 2: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 2

R statistical es un lenguaje de programación gratuito. Esta basado en el lenguaje S desarrollado por Bell.

El lenguaje es adecuado para programar.

Muchas funciones estadísticas ya han sido incluidas.

Los paquetes que se agregan día a día expanden su funcionalidad hacia áreas de ciencia de frontera.

¿Qué es R?

Page 3: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 3

Comenzando en R

Donde obtener R? www.r-project.org

Baje: CRAN

Busque su zona (Mirror: Chile, Brasil).

Seleccione sistema operativo.

Seleccione ej. R-2.4.1-win32.exe

Page 4: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 4

Comenzando en R

R GUI?

Page 5: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 5

Page 6: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 6

Comenzando en R

Abra un script. Ejemplo de una ventana

Page 7: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 7

Comenzando en R

Operaciones básicas. Operaciones Aritméticas:

+, -, *, /, ^ operadores estándar. Matriz Aritmética.

* es un elemento que permite multiplicar. %*% es una matriz de multiplicación

Asignación de un valor Para asignar un valor a una variable utilice “<-”

Page 8: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 8

Comenzando en R

Como llamar a la ayuda en R? R tiene un buen sistema de ayuda. Si no se sabe que función usar, utilice

help.search(“_______”) Ej: help.search(“histogram”).

Page 9: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 9

Pidiendo ayuda

• Detalles acerca de comando especificos cuyo nombre conocemos (input arguments, options, algorithm, results):

>? t.testor >help(t.test)

Page 10: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 10

Importando datos

Como introduzco datos en R?.

Primero, asegurese que sus datos estan en formato fácil de leer, tal como CSV (Comma Separated Values).

Use el siguiente código: D <- read.table(“path”,sep=“,”,header=TRUE)

Page 11: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

Trabajando con los Datos.

Page 12: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 12

R code

Data Manipulation with R (Use R)

Phil Spector

Page 13: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 13

Libro guía para consultas

Page 14: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 14

R Packages

• Hay muchos paquetes que se han agregado a R.

• Estas librerias son creadas y mantenidas por el autor.

Page 15: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 15

Page 16: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 16

Page 17: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 17

Page 18: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 18

Page 19: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 19

R Package - simpleboot

mu = 25; sigma = 5; n = 30x = rnorm(n, mu, sigma)

library(simpleboot)

reps = 10000

X11()

median.boot = one.boot(x, median, R = reps)#print(median.boot)boot.ci(median.boot)hist(median.boot,main="median")

Page 20: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 20

R Package – ggplot2

Ggplot2: Elegant Graphics for Data Analysis (Use R)

Hadley Wickham

Page 21: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 21

R Package – ggplot2

library(ggplot2)

oldFaithfulPlot = ggplot(faithful, aes(eruptions,waiting))

oldFaithfulPlot + layer(geom="point")

oldFaithfulPlot + layer(geom="point") + layer(geom="smooth")

Page 22: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 22

R Package - BioC

BioConductor es un proyecto en R (aplicación) para el análisis y la comprensión de los datos genómicos.

http://www.bioconductor.org

Download > Software > Installation Instructions

source("http://bioconductor.org/biocLite.R")

biocLite()

Page 23: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 23

Page 24: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 24

Page 25: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 25

http://ape.mpl.ird.fr/

Page 26: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 26

Page 27: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 27

REvolution Computing

REvolution R es una distribución mejorada de R.

Optimizada, validada and con soporte.

http://www.revolution-computing.com/

Page 28: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 28

Page 29: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 29

El objetivo principal de este curso en R, es proporcionar herramientas básicas de análisis en lenguaje R para crear, analizar y graficar datos.

Objetivo

Page 30: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 30

Cronograma de actividades

• ¿Qué es R?

• Instalación básica

• Instalación de librerias

• Buscando ayuda en consola R, motor de busqueda, r-list y stackoverflow

• Estructura del lenguaje

• La gran calculadora

• Generación de Objetos

• Escalares

• Vectores

• Matrices

• Generación de variables aleatorias

• Análisis exploratorio (promedio, varianza, n, etc)

• Gráficos en R

Page 31: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 31

Cronograma de actividades

•Análisis gráfico, histogramas, boxplot, scatterplots y gráficos avanzados con gglot2.

• R graphics web (Fuente de gráficos)

• Importación de datos CVS, TXT (puntos, comas, etc), lectura web, R-web.

• Creacion data.frame, manejo de objetos, attach.

• Selección de datos, recodificación, agregar columnas, filas, funcion merge.

• Manejo de datos faltantes

• Identificación puntos atípicos

• Exportar CSV, archivo EXCEL, Workspace, etc.

• Análisis univariado/bivariado,

• normalidad (Shapiro Wilk, KS, bondad), qqplot, ppplot, etc

• Transformaciones variables

• Regresión Lineal.

Page 32: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

AESpro 32

•    Crawley Michael (2007) The R Book.John Wiley & Sons Ltd. Imperial College, Silwood Park, Ascot, Berks.

•    Phil Spector (2008) Data Manipulation with R. Springer Editions. ISBN 978-0-387-74730-9.

•    Yosef Cohen & Jeremiah Y. Cohen (2008) Statistics and Data with R: An applied approach through examples. Online ISBN: 9780470721896.

Literatura citada

Page 33: Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro. 2 Magister (c) Epidemiología,

Ayuda en la web

http://stackoverflow.com/ http://www.r-bloggers.com/ http://www.statmethods.net/ http://addictedtor.free.fr/graphiques/ https://stat.ethz.ch/mailman/listinfo/r-help