Nociones de Estadística 2015 - Climatología...

Post on 25-Aug-2020

4 views 0 download

Transcript of Nociones de Estadística 2015 - Climatología...

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Nociones de Estadística 2015Climatología 2015

Departamento de Ciencias de la AtmósferaUniversidad de la República, Uruguay.

Setiembre 2015

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 1 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Contenido

1 Tipos de datos

2 Tipos de parámetros para caracterizar una serieMedidas de posiciónCentralizaciónMedidas de dispersión

3 Anomalías

4 Técnicas gráficas de visualización

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 2 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Contenido

1 Tipos de datos

2 Tipos de parámetros para caracterizar una serieMedidas de posiciónCentralizaciónMedidas de dispersión

3 Anomalías

4 Técnicas gráficas de visualización

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 3 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Datos Climáticos

Observaciones (datos medidos; datos interpolados)

Salidas de modelos numéricos: Simulaciones opronósticos (posibilidad de variar condiciones inicialeso de borde)

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 4 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Datos Climáticos

Observaciones (datos medidos; datos interpolados)

Salidas de modelos numéricos: Simulaciones opronósticos (posibilidad de variar condiciones inicialeso de borde)

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 4 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Contenido

1 Tipos de datos

2 Tipos de parámetros para caracterizar una serieMedidas de posiciónCentralizaciónMedidas de dispersión

3 Anomalías

4 Técnicas gráficas de visualización

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 5 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Tipos de parámetros para caracterizar una serie

Posición: dividen un conjunto ordenado de datos engrupos con la misma cantidad de individuos.

Centralización: se refiere a valores respecto a loscuales parecen agruparse los datos.

Dispersión: indican mayor o menor concentración delos datos alrededor del valor central.

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 6 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Tipos de parámetros para caracterizar una serie

Posición: dividen un conjunto ordenado de datos engrupos con la misma cantidad de individuos.

Centralización: se refiere a valores respecto a loscuales parecen agruparse los datos.

Dispersión: indican mayor o menor concentración delos datos alrededor del valor central.

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 6 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Tipos de parámetros para caracterizar una serie

Posición: dividen un conjunto ordenado de datos engrupos con la misma cantidad de individuos.

Centralización: se refiere a valores respecto a loscuales parecen agruparse los datos.

Dispersión: indican mayor o menor concentración delos datos alrededor del valor central.

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 6 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Resistencia

Un método es resistente si no es influidoconsiderablemente por unos pocos datos atípicos(“outliers”).

Ejemplo:

0 0.5 1 1.5 2 2.5

x 104

−25

−20

−15

−10

−5

0

5

10

15

20

25

car

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 7 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Resistencia

Un método es resistente si no es influidoconsiderablemente por unos pocos datos atípicos(“outliers”).

Ejemplo:

0 0.5 1 1.5 2 2.5

x 104

−25

−20

−15

−10

−5

0

5

10

15

20

25

car

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 7 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Medidas de posición

1 Tipos de datos

2 Tipos de parámetros para caracterizar una serieMedidas de posiciónCentralizaciónMedidas de dispersión

3 Anomalías

4 Técnicas gráficas de visualización

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 8 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Medidas de posición

Medidas de posición

Se llama Pr (percentil r) a un valor tal que el r % de lasobservaciones son iguales o menores que él y el (100 %-r %)de las observaciones son mayores a él.

Algunos percentiles importantes:

P50: separa al 50 % de los valores menores del 50 % de lasobservaciones mayores:

q0,5 =

{X(n+1)/2, si es impar(Xn/2 + X(n/2+1))/2, si es par

Cuartiles: Separa al conjunto ordenado de observacionesen 4 partes iguales , cada una de ellas formada por un25 % de los valores.

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 9 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Medidas de posición

Medidas de posición

Se llama Pr (percentil r) a un valor tal que el r % de lasobservaciones son iguales o menores que él y el (100 %-r %)de las observaciones son mayores a él.

Algunos percentiles importantes:

P50: separa al 50 % de los valores menores del 50 % de lasobservaciones mayores:

q0,5 =

{X(n+1)/2, si es impar(Xn/2 + X(n/2+1))/2, si es par

Cuartiles: Separa al conjunto ordenado de observacionesen 4 partes iguales , cada una de ellas formada por un25 % de los valores.

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 9 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Medidas de posición

Medidas de posición

Se llama Pr (percentil r) a un valor tal que el r % de lasobservaciones son iguales o menores que él y el (100 %-r %)de las observaciones son mayores a él.

Algunos percentiles importantes:

P50: separa al 50 % de los valores menores del 50 % de lasobservaciones mayores:

q0,5 =

{X(n+1)/2, si es impar(Xn/2 + X(n/2+1))/2, si es par

Cuartiles: Separa al conjunto ordenado de observacionesen 4 partes iguales , cada una de ellas formada por un25 % de los valores.

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 9 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Medidas de posición

Ejemplo: Calcular el percentil 50 (mediana)

Serie: [13 3 7 2 9 10 2 6 4 0 9 1 5]

Paso 1- ordenar de manera ascendente:

[0 1 2 2 3 4 5 6 7 9 9 10 13]

Paso 2- Ver si la cantidad de componentes de la serie espar o impar

Paso 3- Calcular la mediana con la fórmula anterior.

En este caso es 5.

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 10 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Medidas de posición

Ejemplo: Calcular el percentil 50 (mediana)

Serie: [13 3 7 2 9 10 2 6 4 0 9 1 5]

Paso 1- ordenar de manera ascendente:

[0 1 2 2 3 4 5 6 7 9 9 10 13]

Paso 2- Ver si la cantidad de componentes de la serie espar o impar

Paso 3- Calcular la mediana con la fórmula anterior.

En este caso es 5.

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 10 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Medidas de posición

Ejercicio

Para la serie [13 3 7 2 9 10 2 6 4 0 9 1 5 100]

Calcular:MedianaPercentil 25Percentil 75

Son estas medidas resistentes?

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 11 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Centralización

1 Tipos de datos

2 Tipos de parámetros para caracterizar una serieMedidas de posiciónCentralizaciónMedidas de dispersión

3 Anomalías

4 Técnicas gráficas de visualización

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 12 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Centralización

Centralización

Esta medida nos permite identificar y ubicar el valoralrededor del cual se tienden a reunir los datos (“PuntoCentral”).

Media: promedio.Mediana: valor que cumple que la mitad de los datosson menores y la otra mitad son mayores.Moda: valor que mas veces se repite en los datos; silos que más se repiten son 2 valores, se llamabimodal, si son varios, multimodal.

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 13 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Centralización

Ejemplo

Tengo las siguiente muestra:

[30 20 27 22 21 18 18 25 26 20]

[0 20 27 22 21 18 18 25 26 20]

• Buscar media y moda

• Son estas medidas resistentes?

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 14 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Centralización

Media Vs. Mediana

Coinciden si la distribución es simétrica

Si no coinciden, es preferible la mediana (por ser masresistente, es decir, poco sensible a datos atípicos)

La media siempre es única (a diferencia de la mediana)

La media es muy representativa para algunas variablescomo temperatura media mensual pero no esrepresentativa en otras variables como precipitaciónmensual.

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 15 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Centralización

Media Vs. Mediana

Coinciden si la distribución es simétrica

Si no coinciden, es preferible la mediana (por ser masresistente, es decir, poco sensible a datos atípicos)

La media siempre es única (a diferencia de la mediana)

La media es muy representativa para algunas variablescomo temperatura media mensual pero no esrepresentativa en otras variables como precipitaciónmensual.

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 15 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Centralización

Media Vs. Mediana

Coinciden si la distribución es simétrica

Si no coinciden, es preferible la mediana (por ser masresistente, es decir, poco sensible a datos atípicos)

La media siempre es única (a diferencia de la mediana)

La media es muy representativa para algunas variablescomo temperatura media mensual pero no esrepresentativa en otras variables como precipitaciónmensual.

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 15 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Centralización

Media Vs. Mediana

Coinciden si la distribución es simétrica

Si no coinciden, es preferible la mediana (por ser masresistente, es decir, poco sensible a datos atípicos)

La media siempre es única (a diferencia de la mediana)

La media es muy representativa para algunas variablescomo temperatura media mensual pero no esrepresentativa en otras variables como precipitaciónmensual.

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 15 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Medidas de dispersión

1 Tipos de datos

2 Tipos de parámetros para caracterizar una serieMedidas de posiciónCentralizaciónMedidas de dispersión

3 Anomalías

4 Técnicas gráficas de visualización

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 16 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Medidas de dispersión

Medidas de dispersión

Nos dicen en que medida las observaciones difieren entre si.

Rango: menor-mayor valor

Rango intercuartil (IQR): es la distancia entre el primer ytercer cuartil

Varianza: promedio del cuadrado de las distancias entre cadavalor y la media.

Var = 1N∑

(xi − µ)2

Siendo µ la media y N la cantidad de Valores

Desviación estandar: raíz cuadrada de la varianza (σ)

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 17 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Medidas de dispersión

Medidas de dispersión

Nos dicen en que medida las observaciones difieren entre si.

Rango: menor-mayor valor

Rango intercuartil (IQR): es la distancia entre el primer ytercer cuartil

Varianza: promedio del cuadrado de las distancias entre cadavalor y la media.

Var = 1N∑

(xi − µ)2

Siendo µ la media y N la cantidad de Valores

Desviación estandar: raíz cuadrada de la varianza (σ)

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 17 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Contenido

1 Tipos de datos

2 Tipos de parámetros para caracterizar una serieMedidas de posiciónCentralizaciónMedidas de dispersión

3 Anomalías

4 Técnicas gráficas de visualización

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 18 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Anomalías

¿Cómo se definen usualmente las anomalías en estudiosdel clima?

Las anomalías se definen con respecto al ciclo anual.

Por ejemplo, para datos medios mensuales, el ciclo anualse define como el promedio de todos los eneros,febreros, etc, del período del registro.

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 19 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Anomalías

¿Cómo se definen usualmente las anomalías en estudiosdel clima?

Las anomalías se definen con respecto al ciclo anual.

Por ejemplo, para datos medios mensuales, el ciclo anualse define como el promedio de todos los eneros,febreros, etc, del período del registro.

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 19 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Anomalías

¿Cómo se definen usualmente las anomalías en estudiosdel clima?

Las anomalías se definen con respecto al ciclo anual.

Por ejemplo, para datos medios mensuales, el ciclo anualse define como el promedio de todos los eneros,febreros, etc, del período del registro.

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 19 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Ejemplos

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 20 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Ejemplos

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 21 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Contenido

1 Tipos de datos

2 Tipos de parámetros para caracterizar una serieMedidas de posiciónCentralizaciónMedidas de dispersión

3 Anomalías

4 Técnicas gráficas de visualización

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 22 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Ejemplo: Gráfico de lineas

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 23 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Ejemplos: Histogramas

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 24 / 25

Tipos de datos Tipos de parámetros para caracterizar una serie Anomalías Técnicas gráficas de visualización

Ejemplos

Departamento de Ciencias de la Atmósfera Nociones de Estadística 2015 Setiembre 2015 25 / 25