Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de...

33
0 Open Data BCN [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades Tractament de dades amb full de càlcul Eduscopi. 27/11/2019 Tutorial a partir de les dades d’Open Data BCN

Transcript of Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de...

Page 1: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

0

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Tractament de dades amb full de càlcul

Eduscopi. 27/11/2019

Tutorial a partir de les dades d’Open Data BCN

Page 2: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

1

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Construir un gràfic de correlació

Page 3: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

2

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

OBJECTIU

Obtenir un gràfic de regressió amb què es pugui analitzar la correlació entre dues variables. En l’exemple es compararan la renda familiar i el preu mig de l’habitatge per barris.

Page 4: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

3

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

PREU DE L’HABITATGEAnem a la pàgina del dataset

Habitatges en venda a Barcelona. Mitjana del preu de venda (€/m2) d'un habitatge per barris

Ens descarreguem el .xlsx/.csv del 2015.

Page 5: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

4

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

PREU DE L’HABITATGE

Obrim l’arxiu. Tant amb l’excel com amb el libre office se’ns obrirà sense problemes.

Page 6: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

5

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

RENDA FAMILIAR

Anem a la pàgina del dataset

Distribució territorial de la renda familiar a Barcelona

Ens descarreguem el .csv del 2015.

Page 7: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

6

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

RENDA FAMILIAR

Obrim l’arxiu. Amb el Libre Office ens demanarà com importar les dades (veure els següents passos). En el cas de l’Excel ens l’obre directament, però ens col·loca tota la informació a la primera columna.

Page 8: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

7

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

RENDA FAMILIAR

Per distribuir bé la informació, seleccionem la columna A, anem al menú “Datos” i cliquem el botó “Texto en columnas”.

Page 9: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

8

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

TEXTO EN COLUMNAS

Se’ns obrirà una finestra per configurar la conversió. En el nostre cas els caràcters estan delimitats per comes (segona pantalla).

1 2 3

Page 10: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

9

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

RENDA FAMILIAR

Si tot ha anat bé, hauríem de veure la informació ben distribuïda per columnes.

Page 11: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

10

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per comparar...

Per poder comparar dues variables, el seu dataset ha de compartir una de les columnes i, a més, aquestes columnes han de contenir el mateix nombre d’entrades (files). En el nostre cas comprovem que els dos datasets presenten la columna “Barris” i aquestes columnes estan formades pels mateixos 73 barris.

Tanmateix, observem que una de les dues arriba fins la fila 75 mentre que l’altra es queda a la 74.

Page 12: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

11

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per comparar...

Per igualar les dues columnes, haurem d’eliminar les files que no es troben a l’altra dataset. En el nostre exemple, les files “Barcelona = 100” i “no consta”. Per fer-ho. Seleccionem la fila que volem eliminar, cliquem el botó dret i escollim “Eliminar”.

Page 13: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

12

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per comparar...

Un cop hem eliminat la fila, totes dues columnes tenen el mateix nombre de files i, per tant, ja es poden comparar altres columnes dels dos datasets.

Page 14: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

13

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per comparar...

He de comprovar que els dos datasets estan ordenats de la mateixa manera. En aquest cas com a tots dos els barris es troben ordenats numèricament, no cal que fem res més.

Page 15: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

14

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

REGRESSIÓ

Per poder fer la regressió, hem de passar una de les columnes amb dades per comparar al dataset de l’altra columna que volem comparar. En el nostre exemple, seleccionem i copiem (Ctrl+c) la columna “Índex RFD” i l’enganxem (Ctrl+v) a la columna de la dreta de “Any 2015” (que correspon al preu/m2).

Page 16: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

15

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

ELIMINAR FILES SENSE DADES

La columna "Any 2015" conté camps sense dades o amb "n.d." com a valor. S'han de treure. Per fer-ho, seleccionem "Filtro".

Page 17: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

16

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

ELIMINAR FILES SENSE DADES

Cliquem el triangle desplegable de l'encapçalament de "Any 2015". A les opcions de filtre (amb caselles seleccionables) fem scroll fins abaix de tot on trobarem les opcions “n.d.” y “vacío”. Deseleccionem ambdues opcions. Ens desapareixen les files que contenien aquests valors (els números de files es posen blaus).

Page 18: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

17

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

ELIMINAR FILES SENSE DADES

Per poder treballar amb les dades netes, seleccionem les columnes de la A a la D i les copiem (Ctrl+c). A la part inferior del full de càlcul creem una nova fulla (l'anomenen a l'exemple "Netes" ) mitjançant el botó “+”. A la casella A1 del nou full enganxem (Ctrl+v) les columnes copiades (que ja venen netes).

Page 19: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

18

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

GRÀFICA DE LA REGRESSIÓ

Per insertar la gràfica, seleccionem les columnes que contenen les variables a comparar (a l'exemple, columnes C i D). Cerquem la icona de la gràfica adequada:Al desplegable triem la primera opció:

Page 20: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

19

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

GRÀFICA DE LA REGRESSIÓ

A continuació seleccionem XY (dispersión) i ja ens apareixerà la gràrfica.

Page 21: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

20

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

GRÀFICA DE LA REGRESSIÓ

Ens apareixerà la gràfica com la de l’exemple. Per la distribució dels punts es pot veure que existeix una certa correlació.

Page 22: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

21

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

GRÀFICA DE LA REGRESSIÓ

Podem afegir una línia de tendència si, seleccionant els punts, cliquem el botó dret i escollim "Agregar línea de tendencia". A les opcions escollim lineal i seleccionem les opcions de presentar l’equació i el valor R quadrat.

Page 23: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

22

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

GRÀFICA DE LA REGRESSIÓ

El valor d’R quadrat ens dona una mesura de correlació. Com més proper és a 1, més correlació existeix. El títol del gràfic i dels eixos es poden modificar mitjançant les opcions d’edició del gràfic de cada programa.

Page 24: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

23

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Construir un gràfic d’evolució temporal

Page 25: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

24

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

OBJECTIU

Obtenir un gràfic d’evolució temporal amb el qual es pugui analitzar la variació d’una variable al llarg del temps. En l’exemple s’analitza l’evolució de l’atur registrat per districtes al llarg d’un any.

Page 26: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

25

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

ATUR REGISTRAT PER BARRISAnem a la pàgina del dataset. Ens descarreguem el .xlsx/csv. del 2016.

Atur registrat .Taules Evolutives. Per barris de la ciutat de Barcelona. Percentatges

Atenció! Aquest link ha quedat obsolet. Us podeu descarregar l’arxiu a:

Atur registrat .Taules Evolutives. Per barris de la ciutat de Barcelona. Percentatges

Feu-lo servir només per practicar en aquesta formació!

Page 27: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

26

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

ATUR REGISTRAT PER BARRISObrim l’arxiu. Tant amb l’excel com amb el libre office se’ns obrirà sense problemes.

Page 28: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

27

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per estudiar l’evolució per districtes...El primer que haurem de fer és agrupar els resultats per districte. Per fer-ho, afegirem una fila just a sota de les files d’un districte.

Ens situem a la cel·la corresponent i establim la fórmula per sumar els resultats de cada mes als diferents barris.

=suma(D2:D5)/4

nombre de barris del districte

Page 29: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

28

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per estudiar l’evolució per districtes...Arrosseguem la fórmula a tota la filera a partir del quadratet que es troba a la part inferior-dreta de la cel·la.

Repetim el procés per cadascun dels districtes.

Page 30: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

29

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per estudiar l’evolució per districtes...

Al costat de la taula en comencem una altra només amb els districtes.

Page 31: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

30

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per estudiar l’evolució per districtes...Seleccionem els valors per un dels districtes i situem el cursor a la primera cel·la on volem enganxar els valors. A continuació seleccionem “pegar solo números”.

Page 32: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

31

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per estudiar l’evolució per districtes...

Per fer el gràfic el primer que hem de fer és seleccionar tots els valors que volem representar en el gràfic més les cel·les que encapçalen fileres i columnes.

Page 33: Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de càlcul] Oficina Municipal de Dades Departament d’Estadística i Difusió de Dades

32

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per estudiar l’evolució per districtes...

Al menú superior seleccionem “Insertar>Diagrama” i escollim un diagrama tipus “puntos y líneas”.

Hem d’intercanviar les x i les y.