Curso básico de estatística con R - Simposio Dialectoloxía...

52
Curso b´ asico de estat´ ıstica con R Simposio Dialectolox´ ıa Perceptiva M a Jos´ e Ginzo Villamayor Mar´ ıa Oliveira P´ erez [email protected] [email protected] Departamento de Estad´ ıstica e Investigaci´on Operativa Universidade de Santiago de Compostela 17 Xaneiro 2013

Transcript of Curso básico de estatística con R - Simposio Dialectoloxía...

Page 1: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Curso basico de estatıstica con RSimposio Dialectoloxıa Perceptiva

Ma Jose Ginzo Villamayor Marıa Oliveira [email protected] [email protected]

Departamento de Estadıstica e Investigacion Operativa

Universidade de Santiago de Compostela

17 Xaneiro 2013

Page 2: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Obxectivos do curso

Introducir a ferramenta informatica R e R Commander.

Aplicar a exemplos de datos algunhas tecnicas estatısticas, utilizando R.

Curso basico de estatıstica con R

N

Page 3: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Contidos

1 Introducion a R

2 Algunhas tecnicas estatısticas

1 Representacions graficas

2 Contrastes

3 Regresion

4 Analise cluster

3 R Commander

Curso basico de estatıstica con R

N

Page 4: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Que e R?

R e unha linguaxe derivada de S (Bell Labs.) para o tratamento de datos,analise estatıstica e grafica.

Linguaxe estatıstico e matematico.

Entorno para o desenvolvemento de novos metodos de analise de datos.gratuıto (; baixa calidade)dinamico (; inestable)

The R Project for Statistical Computing: http://www.r-project.org

The Comprehensive R Archive Network:http://cran.es.r-project.org/

Curso basico de estatıstica con R

N

Page 5: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Que e R?

Curso basico de estatıstica con R

N

Page 6: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Por que R?

R e unha plataforma independente e gratuıta.

R podese utilizar a distintos niveis.

As analises non tenen que restrinxirse as funcions implementadas nainstalacion basica.

Continuamente ponense a disposicion do usuario novas librarıas coaimplementacion das metodoloxıas mais modernas.

Curso basico de estatıstica con R

N

Page 7: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Instalacion de R

R podese instalar en calquera sistema operativo con ou sen interfaz grafica(Linux, MacOS, Windows, etc) sen importar a potencia do equipo.

Desexable conexion a Internet para instalacion, actualizacion e busca denovos procedementos.

Instalacion:Arquivo instalacion: 32 MBInstalacion basica: 50 MBNo de paquetes totais: 2284Instalacion con todos os paquetes: 2.21 GB

Curso basico de estatıstica con R

N

Page 8: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Instalacion de R

O programa R esta disponible para os principais sistemas operativos (Windows,Linux, MacOS, etc.), e pode descargarse en http://www.r-project.org/.

Curso basico de estatıstica con R

N

Page 9: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Manuais, FAQs e publicacions

http://cran.es.r-project.org/

Search-Menu CRAN

FAQ-Menu Documentation

Manuals-Menu Documentation

Contributed-Menu Documentation

Newsletter-Menu Documentation

Curso basico de estatıstica con R

N

Page 10: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Manuais, FAQs e publicacions

A Beginner’s Guide to R. Zuur, Ieno, Meesters. (2009)

Using R for introductory Statistics. Verzani. (2005)

Introducion a R. Descarga einstalacion.

Traballando con datos en R.

Funcions simples.

Ferramentas para graficos.

Programacion basica en R.

Curso basico de estatıstica con R

N

Page 11: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Manuais, FAQs e publicacions

Tratamiento de datos con R, STATISTICA y SPSS. Castor GuisandeGonzalez, Antonio Vaamonde Liste y Aldo Barreiro Felpeto (2011)

Representacion de datos, estatısticadescriptiva.

Distribucion, intervalos de confianza.

Contrastes de hipoteses e contrastes debondade de axuste.

Contrastes de homoxeneidade envariables cualitativas, cuantitativas.

Contrastes de independencia easociacion en variables cuantitativas.

Regresion.

Series de tempo.

Analise multivariante: metodosfactoriais, metodos de clasificacion.

Modelos de simulacion.

Curso basico de estatıstica con R

N

Page 12: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Manuais, FAQs e publicacions

Analyzing Linguistic Data. A Practical Introduction to Statistics Using R.R. H. Baayen. (2008)

Introducion a R.

Graficos.

Metodos estatısticos basicos.

Analise cluster.

Regresion.

Modelos mixtos.

Curso basico de estatıstica con R

N

Page 13: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Entorno de traballo

Ao abrir o programa R, aparece a seguinte R-consola (fiestra de ordes) paratraballo interactivo en modo comando:

Curso basico de estatıstica con R

N

Page 14: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Entorno de traballo

Na fiestra R Console cada lina na que o usuario pode introducirinformacion inıciase co caracter > que pon o sistema R.

As instruccions nunha mesma lina separanse por “;”para executar asinstruccions que estan nunha lina, pulsase a tecla Retorno ou a Intro.

Podense recuperar linas de instrucions introducidas anteriormentepremendo a tecla coa frecha ascendente do teclado, a fin de reexecutalasou modificalas.

> 1+2*4

[1]9

> (1+2)*4

[1]12

> 3+5;3+6

[1]8

[1]9

Curso basico de estatıstica con R

N

Page 15: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Fiestra de script

Un conxunto de instrucions poden integrarse nun unico arquivo de texto paraformar un script (este tipo de arquivos soense gardar con extension .R).>Archivo<Nuevo script (Ctrl+N)

As instrucions do script copianse e peganse na fiestra de comandos para serexecutadas.

Curso basico de estatıstica con R

N

Page 16: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Fiestra de script

Os arquivos script podense gardar utilizando>Archivo>Guardar como ...

e elixindo a continuacion a ubicacion que interesa.

Por defecto R utiliza un cartafol de traballo onde gardara a informacion.>getwd() #devolve a carpeta de traballo

Para cambiar a carpeta de traballo podese utilizar>Archivo>Cambiar dir....

ou directamente por codigo utilizando setwd (carpeta). Por exemplo:> setwd("c:/")

Curso basico de estatıstica con R

N

Page 17: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Axuda en R

help.search("quero esto")

help(function)

?function

help.start() Abre a axuda en HTML

Curso basico de estatıstica con R

N

Page 18: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

R como unha calculadora (sofisticada)

R permite realizar calculos aritmeticos e, nese sentido, poderiase utilizarcomo unha potente calculadora:

x<-3+1

Asignacion con: <-, <<-, =, ->, ->>.

Podemos utilizar funcions matematicas como:

y<-log(5)

z<-exp(x)

E “case sensitive”:

var<-2*5

VAR<-2^3

Curso basico de estatıstica con R

N

Page 19: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Sobre o directorio de traballo

En todo o manexo de arquivos, debemos ter en conta cal e o directorio detraballo (ou working directory).

O mais importante e situar a R no directorio de traballo do nosoordenador, e dicir, o sitio onde localizaremos todos os datos, os resultados,os graficos, ... da nosa analise.

getwd() # Directorio de traballo actual

Podemos situarnos nun directorio concreto de duas formas:

1 Mediante a funcion setwd(). Como argumento desta funcion debemosescribir a ruta que conduce no noso ordenador ao directorio de traballo,entre comillas. Por exemplo,setwd("D:/CursoEstadistica")

2 Utilizando a opcion Archivo I Cambiar dir... do menu de R

Curso basico de estatıstica con R

N

Page 20: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

As librarıas en R

Unha librarıa ou paquete e un conxunto de funcions sobre unha tematicacomun. A instalacion por defecto de R inclue as librarıas basicasimplementadas polo grupo central de desenadores.

Cando se inicia R, so as funcions contidas en determinadas librarıas donucleo basico estan disponibles para ser utilizadas.

Sen embargo, moitas funcions interesantes non se instalan co paquetebasico senon que estan contidas en paquetes ou librarıas externas que haique instalar por separado. En moitas ocasions e necesario cargar librarıasespecıficas que tenan implementadas algunhas funcions concretas.

Para cargar unha librarıa hai que utilizar a funcion library().

Por exemplo para cargar a librarıa ’survival’ (para a analise desupervivencia), que se instala con paquete basico pero non se carga aoinicio, haberıa que escribir library(survival).

Curso basico de estatıstica con R

N

Page 21: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

As librarıas en R

Existen numerosas librarıas de funcions de R que poden sernos de utilidadee que hai que instalar manualmente.

Para instalar paquetes de R (precısase conexion a internet):Accedemos ao menu Paquetes I Instalar paquete(s)Seleccionar o CRAN-mirror, por comodidade podemos elexir o de Espana.Logo seleccionamos o paquete que queremos instalar. Se o paquete necesitaoutros paquetes, instalaos automaticamente.

A instalacion non implica que os paquetes xa se poidan utilizar.E necesario cargar as librarıas antes de empezar a usalas mediante afuncion library().

Curso basico de estatıstica con R

N

Page 22: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Algunhas librarıas

Librarıa stats: Funcions estatısticas basicas

Librarıa graphics: Funcions graficas basicas

Librarıa languageR: Conxuntos de datos linguısticos e metodosestadısticos basicos aplicados a estes datos

Librarıa sp: Funcions para traballar con datos espaciais

Librarıa maptools: Funcions para traballar con datos espaciais erepresentacion de mapas

...

Curso basico de estatıstica con R

N

Page 23: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Conxuntos de datos disponibles en R

R trae coa instalacion multiples conxuntos de datos.

Para ver un listado dos mesmos basta teclear data()

Para cargar un conxunto en concreto empregase o comando data(name),por exemplo:

data(durationsOnt)

help(durationsOnt)

Curso basico de estatıstica con R

N

Page 24: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Importando datos en R

Introducir datos a man pode convertirse nunha tarefa moi pesada a poucoque o numero de casos ou de variables sexa medianamente alto.

Por outra parte, e bastante comun ter os datos almacenados en arquivosnon propios de R, senon doutros programas (Excel, bases de datos, etc.).

Como parece natural, podremos facer que R lea estes datos.

Curso basico de estatıstica con R

N

Page 25: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Importando datos en R

Os formatos de arquivos mais habituais nos que podemos atopar os datosson:

Arquivos de texto .txt.Arquivos .csv.Arquivos de Microsoft Excel .xls.Arquivos de SPSS .sav.Arquivos de BBDD como .dbf.

Existen outros moitos formatos, pero casi sempre son convertibles a estestipos. De feito, o propio Excel ou o seu analogo en OpenOffice, permitentransformar arquivos de texto en arquivos .xls e viceversa.

Curso basico de estatıstica con R

N

Page 26: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Importando datos en R. Ficheiros de texto

Os arquivos de tipo texto que contenen datos adoitan ter unha estrutura na queos individuos estan nas distintas filas e as variables estan separadas por alguntipo de caracter, tales como comas, tabulacions, espazos ou outros (sep)

d1<-read.table("durationsOnt1.txt",sep=",")

d2<-read.table("durationsOnt2.txt",sep="\t")

E posible que a primeira fila contena os nomes das variables (header)

d3<-read.table("durationsOnt3.txt",sep="\t",header=TRUE)

Tamen e necesario fixarse en como estan especificados os decimais (dec)

d4<-read.table("durationsOnt4.txt",sep="\t",header=TRUE,dec=",")

Exercicio: Os arquivos ALGa_17_2.txt, houses.txt, twosample.txt,

twoseries.txt, places.txt contenen diferentes conxuntos de datos. Abreoscun editor de texto para comprobar a sua estrutura e importaos en R

Curso basico de estatıstica con R

N

Page 27: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Tipos de obxetos en R

R permite crear diferentes tipos de obxetos.Numerosx<-9Vectoresy<-c(1,5,7,9)z<-1:5Matricesa<-matrix(1:6,nrow=2,ncol=3)Variables caractern<-"Hola"Vectores de variables caracterm<-c("Ana","Luis")

Listado de obxetos disponibles na sesion

ls()

De que tipo e cada obxeto?

class(x)

class(a)

Curso basico de estatıstica con R

N

Page 28: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

A linguaxe de programacion R

Tipos de obxetos en R: data.frame

Un data.frame e o tipo de obxeto de R que utiliza para almacenarconxuntos de datos

Un data.frame e unha taboa onde tipicamente as columnas usanse pararepresentar variables e as filas para representar individuos ou observacions

Creamos un data.frame cos datos do sexo e a duracion do prefixo nasal

datos<-data.frame(d4$Sex,d4$DurationPrefixNasal)

class(datos)

fix(datos)

Seleccionamos datos dun data.frame de distintas formas:

datos[1,] # Eleximos os datos da primeira fila

datos[,2] # Eleximos os datos da segunda columna

datos[,"Sex"] # Eleximos os datos da primeira columna

datos$Sex # Eleximos os datos da primeira columna

Curso basico de estatıstica con R

N

Page 29: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Representacions graficas

Representacions graficas

En R podense realizar multitude de graficos.

Alguns comandos para realizar graficos:

Funcion Tipo de graficoplot() Barras, dispersion, caixashist() Histograma

barplot() Diagrama de barrasboxplot() Grafico de caixas

stripchart() Diagrama de dispersionpie() Grafico de sectores

Curso basico de estatıstica con R

N

Page 30: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Representacions graficas

Os graficos en R

A maiorıa das funcions graficas disponen de argumentos para editar ografico:

Argumentos graficostype =“ ” Especifica o tipo de grafico:

”p” puntos”l” linas”n” non grafico”o” puntos e linas

xlab =“texto” Engade texto ao eixeylab =“texto”main =“texto” Tıtulo do graficoxlim = c(mınimo, maximo) Escalas dos eixosylim = c(mınimo, maximo)

A opcion Archivo permite gardar (Metafile, Postscript, PDF, Png, BMPy JEPG), copiar ou imprimir a imaxe.

Curso basico de estatıstica con R

N

Page 31: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Representacions graficas

Graficos de dispersion

Comando “plot”> plot(durationsOnt$DurationPrefixVowel,col="red",xlab="Words",

+ ylab="duration",main="Duration prefix vowel")

Curso basico de estatıstica con R

N

Page 32: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Representacions graficas

Graficos de dispersion

Comando “stripchart”> stripchart(durationsOnt$DurationOfPrefix~durationsOnt$Sex,

+ col=c("red","blue"))

Curso basico de estatıstica con R

N

Page 33: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Representacions graficas

Histograma

Comando “hist”> hist(durationsOnt$YearOfBirth,col="green")

> hist(durationsOnt$YearOfBirth,freq=FALSE,col="green")

Curso basico de estatıstica con R

N

Page 34: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Representacions graficas

Diagramas de caixa

Comando “boxplot”> boxplot(durationsOnt$DurationPrefixVowel~durationsOnt$Sex,

+ col=c("red","blue"))

Curso basico de estatıstica con R

N

Page 35: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Representacions graficas

Diagrama de barras

Comando “barplot”> tab1<-xtabs(~durationsOnt$Sex+durationsOnt$PlosivePresent)

> tab1

no yes

female 15 34

male 13 40

> barplot(tab1,beside=TRUE,col=c("red","blue"),

+ legend.text=TRUE,args.legend=list(x = "topleft"))

Curso basico de estatıstica con R

N

Page 36: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Representacions graficas

Graficos mais complexos

Curso basico de estatıstica con R

N

Page 37: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Contrastes

Contrastes para a media

Exemplo: Suponamos que nun estudo anterior se obtivo unha media de0.053 segundos para a duracion da nasal no prefixo. Para a mostra nova amedia e de:

meanLengthN = mean(durationsOnt$DurationPrefixNasal)meanLengthN[1]0.04981508

E a media observada para a nova mostra significativamente distinta daque se obtivera no estudo anterior?

t.test(durationsOnt$DurationPrefixNasal,mu=0.053)

One Sample t-testdata: durationsOnt$DurationPrefixNasalt = -1.5038, df = 101, p-value = 0.1358alternative hypothesis: true mean is not equal to 0.05395 percent confidence interval:0.04561370 0.05401646sample estimates:mean of x0.04981508

Curso basico de estatıstica con R

N

Page 38: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Contrastes

Contrastes para a media

Exemplo: A media da duracion da vogal no prefixo e igual para homes emulleres?

vowelmale=durationsOnt$DurationPrefixVowel[durationsOnt$Sex=="male"]vowelfemale=durationsOnt$DurationPrefixVowel[durationsOnt$Sex=="female"]t.test(vowelmale,vowelfemale)

Welch Two Sample t-testdata: vowelmale and vowelfemalet = -2.4803, df = 95.878, p-value = 0.01487alternative hypothesis: true difference in means is not equal to 095 percent confidence interval:-0.017990366 -0.001995579

sample estimates:mean of x mean of y

0.05788042 0.06787339

Curso basico de estatıstica con R

N

Page 39: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Contrastes

Outros contrastes

Contrastes para a igualdade de medias.

Contrastes para a igualdade de varianzas.

Contrastes para a igualdade de distribucions.

Curso basico de estatıstica con R

N

Page 40: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Regresion

Regresion

Exemplo: A duracion da nasal no prefixo vese afectada pola frecuencia dapalabra e a presenza da oclusiva?

> prefixnasal.lm=lm(DurationPrefixNasal ~ PlosivePresent + Frequency,+ data = durationsOnt, subset = DurationPrefixNasal > 0)

> prefixnasal.lm

Call:lm(formula = DurationPrefixNasal ~ PlosivePresent + Frequency,

data = durationsOnt, subset = DurationPrefixNasal > 0)Coefficients:

(Intercept) PlosivePresentyes Frequency0.072361 -0.021887 -0.001659

Curso basico de estatıstica con R

N

Page 41: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Regresion

Regresion

Exemplo (cont): A duracion da nasal no prefixo vese afectada polafrecuencia da palabra e a presenza da oclusiva?

Curso basico de estatıstica con R

N

Page 42: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Analise cluster

Analise cluster

A Analise Cluster, ou Analise de Conglomerados, e unha tecnica estatısticamultivariante que ten por finalidade dividir un conxunto de obxectos en gruposde forma que os obxectos dun mesmo grupo sexan moi similares entre si(cohesion interna do grupo) e os dos obxectos de clusters diferentes sexan omais diferente posible (illamento externo do grupo).

Curso basico de estatıstica con R

N

Page 43: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Analise cluster

Analise cluster

Exemplo: Para ilustrar a analise cluster utilizaremos o conxunto de datos“phylogeny” relativos a clasificacion de linguas papues e oceanicasatendendo a caracterısticas gramaticais.

# Cargamos os datos

data(phylogeny)

# Creamos un obxecto distancia apropiado para datos binarios:

phylogeny.dist=dist(phylogeny[ ,3:ncol(phylogeny)],method="binary")

# Indicamos que os nomes das linguas Papues se escriban en maiuscula:

plotnames=as.character(phylogeny$Language) # nomes das linguas

plotnames[phylogeny$Family=="Papuan"] =

+ toupper(plotnames[phylogeny$Family=="Papuan"])

# Facemos a analise cluster coa funcion ‘diana’ da librarıa ‘cluster’

library(cluster)

plot(diana(phylogeny.dist),labels=plotnames,which.plot=2)

Curso basico de estatıstica con R

N

Page 44: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Analise cluster

Analise cluster

Exemplo (cont):

Curso basico de estatıstica con R

N

Page 45: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

R Commander

R Commander. Unha pequena (ou gran) axuda

R Commander e unha interfaz que cubre a maior parte das analisesestatısticos mais habituais mediante menus desplegables como os damaiorıa dos programas habituais.

R Commander permite acceder a moitas capacidades da contornaestatıstica R sen que o usuario tena que conecer a linguaxe deprogramacion.

Para utilizar R Commander, simplemente hai que cargar o paquetemediante a sentenza library(Rcmdr).

Tras cargar o paquete Rcmdr, inıciase a interfaz grafica de R Commander.

Curso basico de estatıstica con R

N

Page 46: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

R Commander

R Commander. Unha pequena (ou gran) axuda

Una vez cargado R Commander vemos unha fiestra na que distinguimos:

1 O menu de fiestras desplegables.

2 A fiestra de instrucions: Cada vezque executemos algunha accion domenu, R Commandertraducira dita accion a codigo deR e escribirao na fiestra.

3 A fiestra de resultados: En xeral,calquer resultado de RCommander mostrarase aquı.

4 A fiestra de mensaxes: Serve paraque R Commander nos informe decalquera aspecto, especialmentedos erros cometidos.

Curso basico de estatıstica con R

N

Page 47: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

R Commander

R Commander. Unha pequena (ou gran) axuda

Fichero: Menu para abrir e gardar arquivos, abrir e gardar contornas detraballo de R, salir de R Commander,...

Editar: Menu para editar contidos dun arquivo (copiar, pegar, cortar,...).

Datos: Menu para ler e manipular datos.

Estatısticos: Menu para analises estatısticas basicas.

Graficos: Menu para crear graficos estatısticos basicos.

Modelos: Menu para resumos estadısticos, intervalos de confianza,contrastes de hipoteses,...

Distribucions: Probabilidades, cuantiles e graficas de distribucionsestatısticas habituais.

Ferramentas: Menu para cargar outros paquetes de R ou establecerdiferentes opcions de visualizacion de R Commander.

Axuda: Informacion sobre R Commander e manual.

Curso basico de estatıstica con R

N

Page 48: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

R Commander

R Commander. Unha pequena (ou gran) axuda

A maiorıa dos procedementos en R Commander requiren que haxa unconxunto de datos activo. Se existen varios conxuntos de datos cargadosen memoria podremos elexir entre eles, aında que so un podera estaractivo.

Formas de introducir datos en R:Directamente a traves do menu Datos I Novo conxunto de datos.Importando os datos dun arquivo de texto ou de outro programa.Importando un conxunto de datos de R.

Curso basico de estatıstica con R

N

Page 49: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

R Commander

R Commander. Resumenes numericos e graficos

Una vez que hai un conxunto de datos activo, podemos usar os menus deR Commander para xerar varios resumos numericos e graficos.

Podese cambiar o conxunto de datos activo premendo no boton horizontalco nome co conxunto de datos activo.

Seleccionando Estatısticos I Resumenes I Conxunto de datos activo,obtense, para cada variable numerica no conxunto de datos, os valoresmaximos e mınimos, o primeiro e o terceiro cuartil, a mediana, a media,ası como o numero de valores que faltan. Para as variables categoricas,obtemos o numero de observacions en cada nivel do factor.

Observamos que o resultado obtense do comando summary.

Curso basico de estatıstica con R

N

Page 50: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

R Commander

R Commander. Resumenes numericos e graficos

A realizacion de graficos en R Commander e bastante intuitiva e levase acabo moi facilmente a traves dos menus

Graficas I HistogramaGraficas I Diagrama de caixasGraficas I Diagrama de dispersionGraficas I Grafica de barrasGraficas I Grafica de sectores

Curso basico de estatıstica con R

N

Page 51: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

R Commander

R Commander. Modelos estatısticos

R Commander permite axustar varios tipos de modelos estatısticos usandoas opciones do menu Estatısticos I Axuste de modelos

Curso basico de estatıstica con R

N

Page 52: Curso básico de estatística con R - Simposio Dialectoloxía ...eio.usc.es/pub/mjginzo/descargas/cursoR/CursoEstadistica.pdf · Librar a maptools: Funci ons para traballar con datos

Curso basico de estatıstica con RSimposio Dialectoloxıa Perceptiva

Ma Jose Ginzo Villamayor Marıa Oliveira [email protected] [email protected]

Departamento de Estadıstica e Investigacion Operativa

Universidade de Santiago de Compostela

17 Xaneiro 2013