Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de...

Post on 25-Jul-2020

5 views 0 download

Transcript of Tractament de dades amb full de càlcul [Tractament de ... · [Tractament de dades amb full de...

0

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Tractament de dades amb full de càlcul

Eduscopi. 27/11/2019

Tutorial a partir de les dades d’Open Data BCN

1

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Construir un gràfic de correlació

2

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

OBJECTIU

Obtenir un gràfic de regressió amb què es pugui analitzar la correlació entre dues variables. En l’exemple es compararan la renda familiar i el preu mig de l’habitatge per barris.

3

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

PREU DE L’HABITATGEAnem a la pàgina del dataset

Habitatges en venda a Barcelona. Mitjana del preu de venda (€/m2) d'un habitatge per barris

Ens descarreguem el .xlsx/.csv del 2015.

4

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

PREU DE L’HABITATGE

Obrim l’arxiu. Tant amb l’excel com amb el libre office se’ns obrirà sense problemes.

5

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

RENDA FAMILIAR

Anem a la pàgina del dataset

Distribució territorial de la renda familiar a Barcelona

Ens descarreguem el .csv del 2015.

6

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

RENDA FAMILIAR

Obrim l’arxiu. Amb el Libre Office ens demanarà com importar les dades (veure els següents passos). En el cas de l’Excel ens l’obre directament, però ens col·loca tota la informació a la primera columna.

7

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

RENDA FAMILIAR

Per distribuir bé la informació, seleccionem la columna A, anem al menú “Datos” i cliquem el botó “Texto en columnas”.

8

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

TEXTO EN COLUMNAS

Se’ns obrirà una finestra per configurar la conversió. En el nostre cas els caràcters estan delimitats per comes (segona pantalla).

1 2 3

9

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

RENDA FAMILIAR

Si tot ha anat bé, hauríem de veure la informació ben distribuïda per columnes.

10

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per comparar...

Per poder comparar dues variables, el seu dataset ha de compartir una de les columnes i, a més, aquestes columnes han de contenir el mateix nombre d’entrades (files). En el nostre cas comprovem que els dos datasets presenten la columna “Barris” i aquestes columnes estan formades pels mateixos 73 barris.

Tanmateix, observem que una de les dues arriba fins la fila 75 mentre que l’altra es queda a la 74.

11

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per comparar...

Per igualar les dues columnes, haurem d’eliminar les files que no es troben a l’altra dataset. En el nostre exemple, les files “Barcelona = 100” i “no consta”. Per fer-ho. Seleccionem la fila que volem eliminar, cliquem el botó dret i escollim “Eliminar”.

12

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per comparar...

Un cop hem eliminat la fila, totes dues columnes tenen el mateix nombre de files i, per tant, ja es poden comparar altres columnes dels dos datasets.

13

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per comparar...

He de comprovar que els dos datasets estan ordenats de la mateixa manera. En aquest cas com a tots dos els barris es troben ordenats numèricament, no cal que fem res més.

14

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

REGRESSIÓ

Per poder fer la regressió, hem de passar una de les columnes amb dades per comparar al dataset de l’altra columna que volem comparar. En el nostre exemple, seleccionem i copiem (Ctrl+c) la columna “Índex RFD” i l’enganxem (Ctrl+v) a la columna de la dreta de “Any 2015” (que correspon al preu/m2).

15

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

ELIMINAR FILES SENSE DADES

La columna "Any 2015" conté camps sense dades o amb "n.d." com a valor. S'han de treure. Per fer-ho, seleccionem "Filtro".

16

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

ELIMINAR FILES SENSE DADES

Cliquem el triangle desplegable de l'encapçalament de "Any 2015". A les opcions de filtre (amb caselles seleccionables) fem scroll fins abaix de tot on trobarem les opcions “n.d.” y “vacío”. Deseleccionem ambdues opcions. Ens desapareixen les files que contenien aquests valors (els números de files es posen blaus).

17

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

ELIMINAR FILES SENSE DADES

Per poder treballar amb les dades netes, seleccionem les columnes de la A a la D i les copiem (Ctrl+c). A la part inferior del full de càlcul creem una nova fulla (l'anomenen a l'exemple "Netes" ) mitjançant el botó “+”. A la casella A1 del nou full enganxem (Ctrl+v) les columnes copiades (que ja venen netes).

18

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

GRÀFICA DE LA REGRESSIÓ

Per insertar la gràfica, seleccionem les columnes que contenen les variables a comparar (a l'exemple, columnes C i D). Cerquem la icona de la gràfica adequada:Al desplegable triem la primera opció:

19

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

GRÀFICA DE LA REGRESSIÓ

A continuació seleccionem XY (dispersión) i ja ens apareixerà la gràrfica.

20

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

GRÀFICA DE LA REGRESSIÓ

Ens apareixerà la gràfica com la de l’exemple. Per la distribució dels punts es pot veure que existeix una certa correlació.

21

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

GRÀFICA DE LA REGRESSIÓ

Podem afegir una línia de tendència si, seleccionant els punts, cliquem el botó dret i escollim "Agregar línea de tendencia". A les opcions escollim lineal i seleccionem les opcions de presentar l’equació i el valor R quadrat.

22

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

GRÀFICA DE LA REGRESSIÓ

El valor d’R quadrat ens dona una mesura de correlació. Com més proper és a 1, més correlació existeix. El títol del gràfic i dels eixos es poden modificar mitjançant les opcions d’edició del gràfic de cada programa.

23

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Construir un gràfic d’evolució temporal

24

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

OBJECTIU

Obtenir un gràfic d’evolució temporal amb el qual es pugui analitzar la variació d’una variable al llarg del temps. En l’exemple s’analitza l’evolució de l’atur registrat per districtes al llarg d’un any.

25

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

ATUR REGISTRAT PER BARRISAnem a la pàgina del dataset. Ens descarreguem el .xlsx/csv. del 2016.

Atur registrat .Taules Evolutives. Per barris de la ciutat de Barcelona. Percentatges

Atenció! Aquest link ha quedat obsolet. Us podeu descarregar l’arxiu a:

Atur registrat .Taules Evolutives. Per barris de la ciutat de Barcelona. Percentatges

Feu-lo servir només per practicar en aquesta formació!

26

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

ATUR REGISTRAT PER BARRISObrim l’arxiu. Tant amb l’excel com amb el libre office se’ns obrirà sense problemes.

27

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per estudiar l’evolució per districtes...El primer que haurem de fer és agrupar els resultats per districte. Per fer-ho, afegirem una fila just a sota de les files d’un districte.

Ens situem a la cel·la corresponent i establim la fórmula per sumar els resultats de cada mes als diferents barris.

=suma(D2:D5)/4

nombre de barris del districte

28

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per estudiar l’evolució per districtes...Arrosseguem la fórmula a tota la filera a partir del quadratet que es troba a la part inferior-dreta de la cel·la.

Repetim el procés per cadascun dels districtes.

29

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per estudiar l’evolució per districtes...

Al costat de la taula en comencem una altra només amb els districtes.

30

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per estudiar l’evolució per districtes...Seleccionem els valors per un dels districtes i situem el cursor a la primera cel·la on volem enganxar els valors. A continuació seleccionem “pegar solo números”.

31

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per estudiar l’evolució per districtes...

Per fer el gràfic el primer que hem de fer és seleccionar tots els valors que volem representar en el gràfic més les cel·les que encapçalen fileres i columnes.

32

Open Data BCN[Tractament de dades amb full de càlcul]

Oficina Municipal de DadesDepartament d’Estadística i Difusió de Dades

Per estudiar l’evolució per districtes...

Al menú superior seleccionem “Insertar>Diagrama” i escollim un diagrama tipus “puntos y líneas”.

Hem d’intercanviar les x i les y.