Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis...

Post on 22-Jan-2016

215 views 0 download

Transcript of Introducción a R José Bustos 1 & Alex Mellado 2 1 Magister Estadística Aplicada, Análisis...

Introducción a R

José Bustos1 & Alex Mellado2

1 Magister Estadística Aplicada, Análisis Estadístico Profesional AESpro.2 Magister (c) Epidemiología, Departamento de Salud Pública, PUC.

AESpro 2

R statistical es un lenguaje de programación gratuito. Esta basado en el lenguaje S desarrollado por Bell.

El lenguaje es adecuado para programar.

Muchas funciones estadísticas ya han sido incluidas.

Los paquetes que se agregan día a día expanden su funcionalidad hacia áreas de ciencia de frontera.

¿Qué es R?

AESpro 3

Comenzando en R

Donde obtener R? www.r-project.org

Baje: CRAN

Busque su zona (Mirror: Chile, Brasil).

Seleccione sistema operativo.

Seleccione ej. R-2.4.1-win32.exe

AESpro 4

Comenzando en R

R GUI?

AESpro 5

AESpro 6

Comenzando en R

Abra un script. Ejemplo de una ventana

AESpro 7

Comenzando en R

Operaciones básicas. Operaciones Aritméticas:

+, -, *, /, ^ operadores estándar. Matriz Aritmética.

* es un elemento que permite multiplicar. %*% es una matriz de multiplicación

Asignación de un valor Para asignar un valor a una variable utilice “<-”

AESpro 8

Comenzando en R

Como llamar a la ayuda en R? R tiene un buen sistema de ayuda. Si no se sabe que función usar, utilice

help.search(“_______”) Ej: help.search(“histogram”).

AESpro 9

Pidiendo ayuda

• Detalles acerca de comando especificos cuyo nombre conocemos (input arguments, options, algorithm, results):

>? t.testor >help(t.test)

AESpro 10

Importando datos

Como introduzco datos en R?.

Primero, asegurese que sus datos estan en formato fácil de leer, tal como CSV (Comma Separated Values).

Use el siguiente código: D <- read.table(“path”,sep=“,”,header=TRUE)

Trabajando con los Datos.

AESpro 12

R code

Data Manipulation with R (Use R)

Phil Spector

AESpro 13

Libro guía para consultas

AESpro 14

R Packages

• Hay muchos paquetes que se han agregado a R.

• Estas librerias son creadas y mantenidas por el autor.

AESpro 15

AESpro 16

AESpro 17

AESpro 18

AESpro 19

R Package - simpleboot

mu = 25; sigma = 5; n = 30x = rnorm(n, mu, sigma)

library(simpleboot)

reps = 10000

X11()

median.boot = one.boot(x, median, R = reps)#print(median.boot)boot.ci(median.boot)hist(median.boot,main="median")

AESpro 20

R Package – ggplot2

Ggplot2: Elegant Graphics for Data Analysis (Use R)

Hadley Wickham

AESpro 21

R Package – ggplot2

library(ggplot2)

oldFaithfulPlot = ggplot(faithful, aes(eruptions,waiting))

oldFaithfulPlot + layer(geom="point")

oldFaithfulPlot + layer(geom="point") + layer(geom="smooth")

AESpro 22

R Package - BioC

BioConductor es un proyecto en R (aplicación) para el análisis y la comprensión de los datos genómicos.

http://www.bioconductor.org

Download > Software > Installation Instructions

source("http://bioconductor.org/biocLite.R")

biocLite()

AESpro 23

AESpro 24

AESpro 25

http://ape.mpl.ird.fr/

AESpro 26

AESpro 27

REvolution Computing

REvolution R es una distribución mejorada de R.

Optimizada, validada and con soporte.

http://www.revolution-computing.com/

AESpro 28

AESpro 29

El objetivo principal de este curso en R, es proporcionar herramientas básicas de análisis en lenguaje R para crear, analizar y graficar datos.

Objetivo

AESpro 30

Cronograma de actividades

• ¿Qué es R?

• Instalación básica

• Instalación de librerias

• Buscando ayuda en consola R, motor de busqueda, r-list y stackoverflow

• Estructura del lenguaje

• La gran calculadora

• Generación de Objetos

• Escalares

• Vectores

• Matrices

• Generación de variables aleatorias

• Análisis exploratorio (promedio, varianza, n, etc)

• Gráficos en R

AESpro 31

Cronograma de actividades

•Análisis gráfico, histogramas, boxplot, scatterplots y gráficos avanzados con gglot2.

• R graphics web (Fuente de gráficos)

• Importación de datos CVS, TXT (puntos, comas, etc), lectura web, R-web.

• Creacion data.frame, manejo de objetos, attach.

• Selección de datos, recodificación, agregar columnas, filas, funcion merge.

• Manejo de datos faltantes

• Identificación puntos atípicos

• Exportar CSV, archivo EXCEL, Workspace, etc.

• Análisis univariado/bivariado,

• normalidad (Shapiro Wilk, KS, bondad), qqplot, ppplot, etc

• Transformaciones variables

• Regresión Lineal.

AESpro 32

•    Crawley Michael (2007) The R Book.John Wiley & Sons Ltd. Imperial College, Silwood Park, Ascot, Berks.

•    Phil Spector (2008) Data Manipulation with R. Springer Editions. ISBN 978-0-387-74730-9.

•    Yosef Cohen & Jeremiah Y. Cohen (2008) Statistics and Data with R: An applied approach through examples. Online ISBN: 9780470721896.

Literatura citada

Ayuda en la web

http://stackoverflow.com/ http://www.r-bloggers.com/ http://www.statmethods.net/ http://addictedtor.free.fr/graphiques/ https://stat.ethz.ch/mailman/listinfo/r-help