Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco...

32
Pràctiques d’Estadística P2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1

Transcript of Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco...

Page 1: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

Pràctiques d’Estadística

P2.1 Estadística Descriptiva

Francisco Palacios Universitat Politècnica de Catalunya

Febrer 2015 v2.1

Page 2: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

Contingut

2

1. Directori de treball 2. Scripts 3. Càlcul d’estadístics 4. Distribució de freqüències 5. Barplot 6. Histograma 7. Boxplot 8. Manipulació de vectors 9. Definició de grups 10.Aplicar funcions per grups. Funció tapply( ) 11.Lectura de vectors amb scan( ) 12.Exemple d’aplicació: Aturades d’emergència en

plantes nuclears (scrams)

Page 3: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

1. Directori de treball

3

Activitat 1 1. Si no ho has fet abans, crea una

carpeta amb el nom aRwork a la teva partició personal, o a un pendrive

2. Dins de la carpeta aRwork, crea una subcarpeta amb el nom accidents

3. Arranca R 4. Tanca RCommander 5. Selecciona el menú

Archivo Cambiar dir 6. Selecciona la carpeta accidents

com a directori de treball 7. Neteja la consola amb [Ctrl+L] 8. Executa getwd( ) per veure quin

és el directori de treball

Page 4: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

2. Scripts. Entrada manual de dades

4

Activitat 2 1. Crea un nou script, i guarda’l

amb el nom exem-accidents 2. Observa que es guarda al

directori de treball 3. Entra les dades en un vector

amb el nom x 4. Verifica que les dades han

entrat correctament 5. Recorda que les línies

s’executen amb [Ctrl+R] 6. Executa tot el script amb

[Ctrl+A] i [Ctrl+R]

El nombre d’accidents laborals registrats en una empresa minera, en els últims 20 mesos, han estat els següents:

1 2 3 1 2 2 3 3 4 2 2 5 6 4 1 3 2 3 0 1

Page 5: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

3. Càlcul d’estadístics

5

Activitat 3 Calcula: 1. El nombre de dades 2. Calcula el mínim i el màxim 3. La mitjana aritmètica 4. La mediana 5. Els quartils 6. El recorregut interquartílic 7. El percentil 70

Page 6: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

3. Càlcul d’estadístics

6

Activitat 4 Calcula: 1. El resum d’estadístiques 2. La desviació típica mostral (𝒔𝒔�, 𝒔𝒔𝒏𝒏−𝟏𝟏) 3. La quasivariància (𝒔𝒔�𝟐𝟐, 𝒔𝒔𝒏𝒏−𝟏𝟏𝟐𝟐 ) 4. La variància (𝒔𝒔𝟐𝟐) 5. La desviació típica (𝒔𝒔)

Page 7: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

4. Distribució de freqüències

7

Activitat 5 Calcula: 1. La distribució de freqüències absolutes 2. La distribució de freqüències relatives 3. Quan val la moda?

La moda val 2

Page 8: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

5. Barplot

8

Activitat 6 1. Dibuixa un diagrama de barres per

a la distribució de freqüències absolutes

Page 9: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

5. Barplot

9

Activitat 7 Dibuixa un barplot per a la distribució de freqüències absolutes

1. Posa el títol amb l’opció main=“accidents” 2. Etiqueta l’eix vertical amb l’opció ylab=“freqüències absolutes” 3. Canvia el color amb l’opció col=“blue”

• Observa que si prems [return] abans de tancar el parèntesis, apareix un signe + a la línia següent i pots continuar escrivint l’ordre

• Per anul·lar l’entrada de línies múltiple, prem [Esc]

Page 10: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

6. Histograma

10

Activitat 8 1. Dibuixa un histograma 2. Observa els límits de les classes 3. Observa les freqüències 4. Observa les marques de classe

Page 11: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

6. Histograma

11

Activitat 9 1. L’opció breaks permet definir els punts extrems de les classes (límits) 2. Dibuixa un histograma amb les classes definides pels punts 0, 1.5, 3, 4.5, 6 3. L’opció col pemet definir el color de les barres (“red”, “blue”, “green”, ... ) 4. Dibuixa les barres de color vermell

Page 12: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

7. Boxplot

12

Activitat 10 1. Dibuixa un boxplot 2. Hi ha cap outlier?

Outlier

Page 13: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

8. Manipulació de vectors

13

Activitat 11.1 Segons el pla de seguretat de la empresa, la taxa màxima d’accidents és 2 accidents/mes.

1. Quants mesos s’ha superat la taxa màxima d’accidents? 2. En quins mesos s’ha superat la taxa màxima? 3. Quina és la proporció de mesos en que s’ha superat la taxa màxima?

• Els valors booleans FALSE i TRUE es comporten com 0 i 1 quan apareixen en expressions aritmètiques

• la funció which( ) proporciona la posició dels elements que compleixen la condició

Page 14: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

8. Manipulació de vectors

14

Activitat 11.2 Segons el pla de seguretat de la empresa, la taxa màxima d’accidents és 2 accidents/mes.

4. Quins són els nombres d’accidents en els mesos que s’ha superat la taxa màxima d’accidents?

5. Quin és el nombre mig d’accidents en els mesos que s’ha superat la taxa màxima?

6. Quin és el nombre mig d’accidents en els mesos que no s’ha superat la taxa màxima?

Page 15: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

8. Manipulació de vectors

15

Activitat 11.2 Segons el pla de seguretat de la empresa, la taxa màxima d’accidents és 2 accidents/mes.

4. Quins són els nombres d’accidents en els mesos que s’ha superat la taxa màxima d’accidents?

5. Quin és el nombre mig d’accidents en els mesos que s’ha superat la taxa màxima?

6. Quin és el nombre mig d’accidents en els mesos que no s’ha superat la taxa màxima?

Page 16: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

9. Definició de grups

16

Activitat 12. Genera un vector, amb el nom class, que contingui una A en aquelles posicions on el nombre d’accidents està dintre del límit, i que contingui una B en les posicions on el nombre d’accidents supera el límit.

• x és un vector que conté les dades • class és un vector que té la mateixa llargada que x i conté una “A” o

una “B” per indicar la classe de la dada d’x corresponent

Page 17: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

10. Aplicar funcions per grups

17

L’ordre tapply(dades, grups, f ) aplica la funció f( ) al vector dades, separant els valors segons els grups definits pel vector grups

Activitat 13. 1. Calcula el nombre d’elements dels grups A i B 2. Calcula la mitjana per grups 3. Calcula el resum d’estadístics per grups

Page 18: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

11. Lectura de vectors amb scan( )

18

• La funció scan( ) permet definir un vector a partir de les dades contingudes en un fitxer de text

• Si les dades estan en files diferents, i fa servir el punt decimal, podem importa-les directament amb l’ordre scan(“nom-fitxer”)

Activitat 14.1 1. Dintre del directori aRwork, crea un

carpeta amb el nom scan-dades 2. Dintre de scan-dades, crea un fitxer de

text amb el nom durada.txt

Page 19: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

11. Lectura de vectors amb scan( )

19

• La funció scan( ) permet definir un vector a partir de les dades contingudes en un fitxer de text

Activitat 14.2 3. Entra, en línies diferents, les

següents dades: 2.5, 4.6, 5.1, 3.1, 12.4 corresponents a la durada ( en minuts) de 5 trucades telefòniques en un servei d’assistència tècnica

4. Guarda les dades i tanca el fitxer 5. Estableix el directori scan-dades

com a directori de treball 6. Verifica el directori de treball amb

getwd( )

Page 20: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

11. Lectura de vectors amb scan( )

20

• La funció scan( ) permet definir un vector a partir de les dades contingudes en un fitxer de text

Activitat 14.3 7. Importa les dades amb l’ordre t=scan(“durada.txt”) 8. Verifica el contingut del vector t 9. Calcula el resum d’estadístics del vector t

Page 21: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

11. Lectura de vectors amb scan( )

21

• L’opció sep=“ ; ” permet importar dades separades per punts i coma • L’opció dec=“ , ” permet importar dades amb coma decimal

Activitat 15.1 1. Al directori scan-dades, crea un fitxer de text amb el nom llargades.txt 2. Entra els següents valors numèrics: 4,1 5,6 6,7 4,2 8,2

usant punts i coma per separar les dades, i comes per indicar els decimals.

3. Guarda les dades i tanca el fitxer

Page 22: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

11. Lectura de vectors amb scan( )

22

• L’opció sep=“ ; ” permet importar dades separades per punts i coma • L’opció dec=“ , ” permet importar dades amb coma decimal

Activitat 15.2 1. Comprova que l’ordre x=scan(“llagades.txt”) no funciona 2. Importa les dades amb l’ordre x = scan(“llargades.txt”, sep=“;”, dec=“,”) 3. Verifica els valors del vector x i calcula la llargada mitjana

Page 23: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015 23

Exemple d’aplicació: Scrams

Page 24: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015 24

Exemple d’aplicació: Scrams

Unplanned nuclear Scrams. Scram is the term used by nuclear engineers to describe a rapid emergency shutdown of a nuclear reactor. The nuclear industry has made a concerted effort to significantly reduce de number of unplanned scrams. The accompanying table gives the number of scrams at each of 56 US nuclear reactor units in a recent year. W. Mendenhall, T. Shincich. Statistics for Engineering and The Sciences fith ed. Pearson Prentice Hall, 2007 (exercice 2.67)

Page 25: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

12. Exemple d’aplicació: lectura de dades

25

Activitat 16 1. Dintre del directori aRwork, crea un

carpeta amb el nom exer-scram 2. Busca el fitxer scrams.txt a Atenea 3. Copia scrams.txt al directori exer-scram 4. Estableix exer-scram com a directori de

treball 5. Verifica el directori de treball amb getwd( )

Page 26: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

12. Exemple d’aplicació: lectura de dades

26

Activitat 17 1. Mira el contingut del fitxer scrams.txt 2. Importa les dades amb l’ordre

x=scan(“scrams.txt”) 3. Verifica el contingut del vector x 4. Inspecciona les dades. Pots treure

alguna conclusió de les dades brutes?

Page 27: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

12. Exemple d’aplicació: lectura de dades

27

Activitat 18 1. Dibuixa un boxplot 2. Hi ha cap outlier? 3. Identifica els índexs dels

outliers 4. Caldria investigar aquests

reactors amb més detall?

valors dels outliers

límit superior màxim valor no atípic 𝑼𝑼∗

𝑼𝑼∗

Posició dels outliers

Page 28: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

12. Exemple d’aplicació: lectura de dades

28

Activitat 19 1. Dibuixa un histograma, té forma de campana? 2. En aquest cas, podríem usar tècniques corresponents a variables

estadístiques normals (histogrames en forma de campana)

Page 29: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

12. Exemple d’aplicació: lectura de dades

29

Activitat 20 1. Calcula la distribució de freqüències. Hi ha més d’un màxim relatiu? 2. Dibuixa un diagrames de barres

màxims relatius de freqüència

Page 30: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

12. Exemple d’aplicació: lectura de dades

30

Activitat 21 1. Calcula el resum d’estadistics. Observa els valors de la mediana i la

mitjana 2. Crea una vector x2 que contingui els valors sense outliers 3. Calcula el resum d’estadístics de x2. Observa els valors de la mediana i

la mitjana. Compara’ls amb els corresponents valors de x

Page 31: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

12. Exemple d’aplicació: lectura de dades

31

Activitat 22 Classifiquem els reactors segons els següent criteri: Classe A: 6 aturades o menys Classe B: més de 6 aturades Genera un vector class que contingui la classe corresponent a cada reactor

Page 32: Pràctiques d’Estadística P2.1 Estadística DescriptivaP2.1 Estadística Descriptiva Francisco Palacios Universitat Politècnica de Catalunya Febrer 2015 v2.1 F. Palacios 2015 Contingut

F. Palacios 2015

12. Exemple d’aplicació: lectura de dades

32

Activitat 23 1. Calcula el nombre d’elements de cada classe amb tapply( ) 2. Calcula la mitjana aritmètica de cada classe amb tapply( ) 3. Fes un boxplot de les classes amb l’ordre boxplot(x~class). Encara es

poden observar outliers? (Usa [AltGr+4] (més espai) per obtenir el caràcter ~)