ISBN: 978-85-7282-778-2 Página 1
PRINCÍPIOS DA ESTATÍSTICA APLICADA A CLIMATOLOGIA
E ANÁLISES DE SERIES TEMPORAIS
Éder Leandro Bayer Maier (a), Tainã Costa Peres (b)
(a) Instituto de Ciencias Humanas e da Informação, FURG, [email protected] (b) Programa de Pós Graduação em Geografia, FURG, [email protected]
Eixo: A Climatologia no contexto dos estudos da paisagem e socioambientais
Resumo
O artigo explora técnicas estatísticas de análise de series temporais usando como exemplo
ciclos temporais padronizados da precipitação entre os anos de 2000 e 2100, a fim de mostrar, de
forma didática, a técnica de análise e as possíveis interpretações. A serie foi construida a partir de
uma função seno dos valores entre – π e π, com intervalo de 0,101 e 0,0262 para simular a
variabilidade interanual e decenal, uma variação entre 30 mm e 160 mm para a variabilidade sazonal
e uma variação aleatória. As técnicas de análise foram média, variância, wavelet e análise de
dependecia por regressão linear, que são utilizadas para caracterização das medidas da tendência central, da variabilidade, dos ciclos temporais e a mensuração da dependência da precipitação com
os fatores que controlam a variabilidade temporal.
Palavras chave: estatística descritiva, inferêncial, serie temporal.
1. Introdução
A falta de análises estatísticas aplicadas em ciências humanas, em especial na geografia, pode
ser um dos limitantes da qualidade das pesquisas publicadas no Brasil. Nesse contexto, a climatologia,
no âmbito da ciência geográfica, tem uma carência de profissionais que desenvolvam análises
estatísticas eficientes e usuais para maior divulgação do conhecimento científico. A estatística
(descritiva e inferencial) pode ser usada para diminuir as análises subjetivas e descritivas, sendo uma
ferramenta que visa gerar resultados agrupados ou inferenciais que podem ser apresentados de forma
simples e de fácil compreensão.
A estatística descritiva é comumente integrada aos quadros de sequência lógica de formação dos
geógrafos no Brasil e possui técnicas de análises eficientes para interpretação de series temporais. A
mesnuração das medidas de tendência central ou de dispersão (média e variância) das amostras geram
ISBN: 978-85-7282-778-2 Página 2
dados que possibilitam extrair informações das observações, evitando as cansativas e exaustivas análises
visuais (e descritivas) das series temporais. Já a estatística inferencial pode ser uma ferramenta mais
avançada para obter parâmetros quantitativos de dependência entre as series temporais ou identificar
ciclos temporais que controlam os modos de variabilidade climática registrados em estações
meteorológicas (ASSIS et al., 1996).
Nesse artigo são apresentados uma serie temporal fictícia e análises estatísticas que
exemplificam as técnicas de análise e interpretação. A serie fictícia é de precipitação e possui um
intervalo temporal entre o ano 2000 e 2100 e as análises estatísticas utilizadas são: média, variância,
análise de dependência por regressão linear e wavelet. A seguir será mostrado a técnica de construção
da serie temporal e as análises estatísticas, vindo explorar uma descrição simples e compreensível da
metodologia e possíveis análises dos resultados da estatística descritiva e inferencial.
2. Materiais e Métodos
Dados foram obtidos a partir de series fictícias que representam os totais mensais da
precipitação no período entre 2000 e 2100 com uma variabilidade sazonal entre 30 mm e 160 mm, um
ciclo interanual com intervalo de frequência de 5 anos, um ciclo decenal com intervalo de frequência
de 10 anos e uma variação aleatória. Sendo que os ciclos, interanual e decenal, variam entre -50 mm e
50 mm e a variação aleatória entre 0 mm e 30 mm.
Os ciclos, interanual e decenal, foram gerados a partir de uma função seno e entre – π e π, com
intervalos 0.101 e 0,0262, respectivamente. Sendo obtidas 2 cristas e 2 cavados em um intervalo de 120
meses, caracterizando uma variação interanual, 1 crista e 1 cavado em 120 meses, determinando a
variabilidade decenal. Por final, os resultados da função seno foram multiplicados por 50 a fim de gerar
uma variação com magnitude coerente com o volume de precipitação representados pelos limiares da
variabilidade sazonal.
O somatório das series fictícias gerou uma serie temporal entre 2000 e 2100 que representa a
variabilidade sazonal, interanual, decenal e a variação aleatória de uma serie temporal da precipitação,
com variação fictícia entre -64 mm e 275 mm, a qual representa a anomalia da precipitação. A média
ISBN: 978-85-7282-778-2 Página 3
aritmética (𝑋 ) é calculada pelo somatório das amostras e divisão pelo número de ocorrência das
mesmas, conforme a Equação 1:
𝑋 =1
𝑛∑ 𝑥𝑖
𝑛𝑖=1 Eq. 1
sendo, 𝑋 é a média, x são as amostras n o número de ocorrência (TOLEDO e OVALLE, 1992).
A média mensal é calculada a partir da identificação de todos os meses (de janeiro até dezembro)
contidos na serie e efetuado o cálculo da média para cada mês do ano (TOLEDO e OVALLE, 1992).
Sendo usual mostrar as médias mensais em um gráfico de barra, onde a magnitude da precipitação é
representada no eixo vertical e a variação dos meses no eixo horizontal.
A variância (𝑠2) é calculada pelo somatório das diferenças entre as amostras e a média da serie,
dividido pelo número de ocorrências de amostras, conforme Equação 2. Essa é uma medida de
dispersão da serie e pode evidenciar parâmetros da variabilidade climática registrados ao longo do tempo
(TOLEDO e OVALLE, 1992).
𝑠2 = ∑ (𝑥−�̅�)𝑛
𝑖=1
𝑛−1 Eq. 2
onde 𝑋 é a média, x é amostra e n é um número de ocorrência.
A análise de dependência por regressão linear compõem a estatística inferêncial, e ela possibilita
comparar duas series temporais a partir de parâmetros visuais e estatísticos. Essa técnica é amplamente
utilizada para analisar a dependência temporal entre dados observados e índices climáticos que
representam modos de variabilidade como, por exemplo, El Niño-Oscilação Sul (ENOS), Oscilação
Ártica (AO) e etc. Sendo assim, são comparadas uma serie independente e outra dependente, mostradas
nos diagramas de dispersão no eixo horizontal e vertical, respectivamente. Além dos diagramas de
dispersão outros parâmetros são empregados nessa análise, como: a equação de regressão linear
(equação de primeiro grau), o somatório do erro (SSE) e a porcentagem da representação da reta de
regressão linear (R2) que podem ser utilizados como parâmetros quantitativos da dependência entre as
duas series.
O wavelet é utilizado para identificar os ciclos temporais em uma serie, sendo que os
aplicativos implementados em programas estatísticos geram o espectrograma como resultado, em que
ISBN: 978-85-7282-778-2 Página 4
no eixo horizontal do gráfico é mostrado o período de observação (ex. 2000 até 2100), no eixo vertical a
frequência dos ciclos temporais contidos na serie e a magnitude da potência espectral é mostrada pela
variação de cores no gráfico (STOLLNITZ et al., 1995).
3. Resultados e Discussões
A serie temporal ficticia (Figura 1) mostra a variação anômala da precipitação entre os anos de
2000 e 2100 (eixo horizontal) e a magnitude das anomalias (eixo vertical), onde é possível observar a
sobreposição dos ciclos temporais simulando a variabilidade sazonal, interanual, decenal e aleatória.
Cabe ressaltar que as anomalias negativas registram períodos de seca ou, em outras palavras,
precipitações abaixo da média mensal. Observa-se também que as anomalias negativas não possuem
magnitudes inferiores a -160 mm, isso acontece porque no mês em que não ocorreu chuvas (registro de
0 mm) a anomalia será a diferença entre esse registro e a média mensal, como por exemplo, 0 - 160
mm, obtendo uma anomalia de -160 mm.
As anomalias positivas representam os períodos de chuvas excessivas (ou acima da
média mensal). No entanto, as anomalias positivas não possuem um limite superior, porque dependem
da disponibilidade de água e mecanismos de convergência para acumular altos índices pluviométricos,
que podem exceder 3 vezes (ou mais) a média mensal.
Para exemplificar, um período com anomalias positivas de grandes magnitudes podem estar
associados a sobreposição de ciclos como, o sazonal (estação chuvosa), o interanual (chuvas acima da
média) e o decenal (chuvas acima da média), favorecendo a intensificação e a maior frequência dos
mecanismos de transporte e convergência da umidade que formam as chuvas.
Ressalta-se que os ciclos temporais em series observadas não são tão evidentes quanto na serie
fictícia (Figura 1), isso ocorre porque os fatores remotos que controlam a precipitação podem ser
ocultados por ciclos com ocorrência em outras escalas temporais. Ou, ainda, os fatores remotos não
possuem controle da precipitação ao longo de todo o período, sendo possível que a influência seja
sazonal (inverno ou verão). Além disso, pode ocorrer a sobreposição dos ciclos, em que as fases
positivas e negativas de duas frequências se sobrepõe, ampliando ou subtraindo os impactos na
precipitação.
ISBN: 978-85-7282-778-2 Página 5
Figura 1 – Variabilidade sazonal, decenal, interanual e aleatória da precipitação simuldada para o período
entre 2000 e 2100.
Figura 2 – Simulação da variabilidade sazonal da precipitação.
Nesse contexto, é importante compreender o principal modo de variabilidade, que é o
sazonal, visto que em um período de 12 meses é registrado um período de chuva e outro com seca. Cabe
ressaltar que no Brasil grande parte das precipitações apresentam um ciclo sazonal bem marcado, como
é possível observar no exemplo da Figura 2.
Geralmente os maiores totais mensais ocorrem no verão dos respectivos hemisférios, visto que
nessa estação sazonal ocorre o transporte, convergência e evaporação da água sobre o continente sul-
americano, favorecendo a formação das precipitações. Em contrapartida, no inverno a continentalidade
favorece a diminuição da temperatura que gera estabilidade atmosférica e diminuição do transporte de
umidade para o interior continental.
ISBN: 978-85-7282-778-2 Página 6
No registro da precipitação existem além do ciclo sazonal as variações aleatórias e a
variabilidade climática que ocorre predominantemente nas escalas interanual, decenal e aleatória. Em
outras paralavras, uma variação intercecenal pode ser representada por 2 ou 3 períodos de chuvas acima
da média ou secas em uma década, já a variabilidade decenal apresenta períodos de chuvas acima da
média ou secas que diferenciam as décadas que compoem a serie temporal.
As variações interdecenais geralmente estão associados a fatores remotos que controlam a
precipitação como, por exemplo, o fenômeno ENOS, visto que a ocorência dos eventos El Niño e La
Niña possui uma frequência entre 3 e 7 anos. Esse fenomeno é o principal fator remoto que causa
variabilidade na precipitação (GRIMM, 2009).
Figura 3 – Espectrograma da potência espectral (em cores) das frequências (eixo vertical) dos ciclos
temporais entre os anos de 2000 e 2100 (eixo horizontal).
A Oscilação Decadal do Pacífico (ODP) ocorre em um intervalo de frequência maior,
classificando períodos (de decadas) de acordo com as fases quentes e frias da ODP. Sendo que, seu
principal impacto é na intensificação ou desintensificação dos efeitos do fenômeno ENOS (KAYANO
e ANDREOLI, 2009).
A mensuração das frequências dos ciclos temporais e de suas ocorrências são informações
fundamentais para a caracterização da variabilidade temporal registrada em estações meteorológicas,
reconstrução paleoclimática ou estimativas futuras. Nesse constexto, existem pacotes de análise
espectral, ou de wavelet, que podem ser operacionalizados em softawares de código aberto ou fechado.
Na Figura 3 é mostrado o espectrograma de análise da serie temporal fictícia da precipitação
entre 2000 e 2100. A periodicidade de recorrência dos ciclos temporais estão representados no eixo
Ciclo decenal Ciclo interanual
Ciclo sazonal
ISBN: 978-85-7282-778-2 Página 7
vertical (Y), onde os principais ciclos apresentam as maiores potências espectrais (em cores), no período
da serie fictícia (200-2100 – no eixo horizontal).
As maiores frequências possuem recorrência de 10 anos (variabilidade decenal) e são
represntadas pelos núcleos amarelos que aparecem na parte superior da Figura 3. Já as menores
frequências são representas pelos núcleos azuis claros, na parte central e inferior da Figura 3,
representado a variabilidade interanual e sazonal, ocorrendo em uma frequência de 5 e 1 ano,
respectivamente. Cabe resaltar que essa escala temporal não favorece a visualização do ciclo sazonal,
visto que existem 100 pequenos núcleos com cor azul claro na porção inferior da Figura 3, entretanto, a
edição da escala de análise das frequências pode comprometer a visualização de outros ciclos, por isso,
optou-se em mostrar as escalas interanuais e decenais porque o ciclo sazonal é mais fácil de ser
observado e compreendido.
A mensuração de paramentos de dependência entre a serie de precipitação e índices climáticos
podem auxiliar na compreensão dos fatores que comtrolam a precipitação. Como exemplo, é mostrado
a análise de dependência por regressão linear, que é composto por duas series temporais (variável
independente e dependente) mostrados na Figura 4A, o diagrama de dispersão (Figura 4B) e parâmetros
estatísticos (Erro médio quadrático - SSE, R-square - R2) e índice de correlação (r).
Os resultados gráficos possibilitam uma análise visual da variabilidade sincronizada (Figura 4A)
e da relação entre as variáveis (Figura 4B), mas são os parametros estatísticos que mensuram o grau de
dependência como, a magnitude do erro (SSE = 3403100), a porcentagem de representação da reta de
regreção (R2= 0.30 – indica que 30% da variação é representada pela reta) e um índice de correlaçã de r
= 0,55. Em outras palavras, as variáveis, independente e dependente, possuem uma variação temporal
sincronizada (com correlação positiva), e a reta de regressão pode estimar a variabilidade temporal de
30% do período com dados (2000-2100).
Além disso, esta análise permite comparar amostras de diferentes parametros atmosféricos
como, por exemplo, verificar o grau de dependência entre a precipitação e a temperatura, ou a relação
entre o vento e a pressão atmosférica. Ou utilizar observações da mesma variável atmosférica, realizada
em diferentes estações meteorlogicas, a fim de completar os períodos que não possuem dados
observações.
ISBN: 978-85-7282-778-2 Página 8
Figura 4 – Variabilidade temporal da variável dependente e independente (A) e o diagrama de dispersão
(B). A Variável independente é o ciclo interanual e a dependente a serie ficticia da precipitação.
4. Considerações finais
As análises estatísticas, descritiva e inferencial, das series temporais são ferramentas simples e
úteis para agrupar e representar de forma organizada e sistemática a diversidade dos registros das
estações meteorológicas. Sendo que, a estatística descritiva gera resultados que mostram as medidas de
tendência central e de dispersão como, por exemplo, a média e a variância. Já a estatística inferencial
auxilia na caracterização dos ciclos temporais e dos fatores que controlam a variabilidade da
precipitação. Possibilitando uma análises quantitativa dos dados climáticos, que favorece a diminuição
das análises subjetivas.
B)
A)
ISBN: 978-85-7282-778-2 Página 9
Agradecimentos
O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível
Superior - Brasil (CAPES) - Código de Financiamento 001.
Referências Bibliográficas
ASSIS, F, N; ARRUDA, H, V; PEREIRA, A, R. Aplicações de Estatística à Climatologia:
teoria e prática. Pelotas: Editora Universitária – UFPEL, 1996, 161p.
GRIMM, A.M. Variabilidade interanual do clima no Brasil. In: CAVALCANTI, I. F.,
FERREIRA, A.N.J.; JUSTI DA SILVA, M.G; SILVA DIAS, M.A.F. (Org.). Tempo e Clima
no Brasil. São Paulo: Oficina de Textos, 2009, p. 353–374.
KAYANO, M, T; ANDREOLI, V, R. Clima da Região Nordeste do Brasil. In: CAVALCANTI,
I, F, A. FERREIRA, N, J. SILVA, M, G, A, J. DIAS, M, A, F, S (Org). Tempo e Clima no
Brasil. Editora Oficina de Textos, São Paulo, 2009, p. 213 – 233.
STOLLNITZ, E. J.; DEROSE, T. D.; SALESIN, D. H. Wavelets for computer graphics: A
primer, part 1. IEEE Computer Graphics and Applications, v. 15, n. 3, p. 76-84, 1995a.
TOLEDO, G, L. OVALLE, I, I. Estatística Básica. São Paulo: Atlas, 1992. 459 p.
Top Related