Analisis Deret Berkala - Pusdiklat BPS · 2020. 2. 28. · Analisis Deret Berkala 9 E. Uji...

13
Analisis Deret Berkala Bahan Ajar (Materi Pelengkap Modul) Diklat Fungsional Statistisi Tingkat Ahli Angkatan 21 Badan Pusat Statistik Tahun 2020 Jimmy Ludin, SST., M.Si. Pusat Pendidikan dan Pelatihan Badan Pusat Statistik Tahun 2020

Transcript of Analisis Deret Berkala - Pusdiklat BPS · 2020. 2. 28. · Analisis Deret Berkala 9 E. Uji...

Page 1: Analisis Deret Berkala - Pusdiklat BPS · 2020. 2. 28. · Analisis Deret Berkala 9 E. Uji kenormalan residual dan uji residual correlogram Dari grafik di atas, dapat dikatakan residualnya

Analisis Deret Berkala

Bahan Ajar (Materi Pelengkap Modul)

Diklat Fungsional Statistisi Tingkat Ahli Angkatan 21 Badan Pusat Statistik

Tahun 2020

Jimmy Ludin, SST., M.Si.

Pusat Pendidikan dan Pelatihan Badan Pusat Statistik

Tahun 2020

Page 2: Analisis Deret Berkala - Pusdiklat BPS · 2020. 2. 28. · Analisis Deret Berkala 9 E. Uji kenormalan residual dan uji residual correlogram Dari grafik di atas, dapat dikatakan residualnya

Analisis Deret Berkala

i

DAFTAR ISI

DAFTAR ISI ............................................................................................................................ i

BAB 1 .....................................................................................Error! Bookmark not defined.

DATA DERET BERKALA MENGGUNAKAN ARIMA ................................................................ 1

A. Pengertian Data Deret Berkala ............................................................................... 1

B. Stasioner ................................................................................................................. 1

C. Klasifikasi Model ARIMA ......................................................................................... 1

D. Musiman dan Model ARIMA ................................................................................... 2

E. Penaksiran Parameter ...............................................Error! Bookmark not defined.

F. Pengujian Parameter Model ................................................................................... 2

G. Pemilihan Model Terbaik ..........................................Error! Bookmark not defined.

H. Peramalan Dengan Model ARIMA ............................Error! Bookmark not defined.

BAB 2 .....................................................................................Error! Bookmark not defined.

CONTOH PENERAPAN ARIMA ............................................................................................. 3

A. Pendahuluan ........................................................................................................... 3

B. Stasioneritas Data ................................................................................................... 3

C. Pemodelan ARIMA Menggunakan Metode Correlogram ....................................... 4

DAFTAR PUSTAKA ............................................................................................................. 11

Page 3: Analisis Deret Berkala - Pusdiklat BPS · 2020. 2. 28. · Analisis Deret Berkala 9 E. Uji kenormalan residual dan uji residual correlogram Dari grafik di atas, dapat dikatakan residualnya

Analisis Deret Berkala

1

DATA DERET BERKALA MENGGUNAKAN ARIMA

A. Pengertian Data Deret Berkala

Data deret berkala atau deret waktu adalah sekumpulan data observasi

yang variabelnya diukur dalam urutan periode waktu, misalnya bulanan,

triwulanan, tahunan, dan sebagainya. Tujuan dari pengukuran data deret berkala

adalah untuk menemukan pola data secara historis dan menerapkan pola tersebut

untuk peramalan. Peramalan deret berkala didasarkan pada nilai variabel yang

telah lalu.

Menurut Box et al (1994), jika sekumpulan observasi tersebut bersifat

kontinyu, maka dikatakan sebagai deret waktu kontinyu, dan jika sekumpulan

observasi tersebut bersifat diskrit, maka dikatakan sebagai deret waktu diskrit.

Sekumpulan observasi dari deret waktu diskrit terbentuk pada waktu t = 1,2,…,N

dan dapat di tuliskan dengan Zt = Z1, Z2, …, ZN..

B. Stasioner

Menurut Box et al (1994), untuk menggunakan model ARIMA, maka syarat

utama yang harus dipenuhi adalah stasioneritas, baik dalam rata-rata maupun

varians. Data deret waktu dikatakan stasioner dalam varians jika variansnya

tidak dipengaruhi oleh waktu atau variansnya konstan. Stastioner dalam rata-

rata yaitu jika nilai rata-ratanya konstan dan tidak dipengaruhi oleh waktu

(Makridakis et al, 1999).

Untuk melihat stasioneritas digunakan tes unit root atau biasa disebut

juga sebagai tes ADF (Augmented Dickey-Fuller). Untuk mengatasi

ketidakstasioneran data dalam rata-rata, maka dapat dilakukan proses

differencing.

C. Klasifikasi Model ARIMA

Model Box-Jenkins (ARIMA) dibagi ke dalam 3 kelompok, yaitu: model

autoregressive (AR), moving average (MA), dan model campuran ARIMA

(autoregressive moving average) yang mempunyai karakteristik dari dua model

pertama.

1. Autoregressive Model (AR)

Page 4: Analisis Deret Berkala - Pusdiklat BPS · 2020. 2. 28. · Analisis Deret Berkala 9 E. Uji kenormalan residual dan uji residual correlogram Dari grafik di atas, dapat dikatakan residualnya

Analisis Deret Berkala

2

Model autoregressive mendasarkan pada asumsi data pada periode sekarang

dipengaruhi oleh data periode sebelumnya. Misalnya adalah impor beras pada

semester ini dipengaruhi oleh impor beras semeseter sebelumnya.

2. Moving Average Model (MA)

Model moving average mendasarkan pada asumsi data pada periode sekarang

dipengaruhi oleh nilai residual data periode sebelumnya.

3. Model Campuran

a. Proses ARMA

Model autoregressive moving average mendasarkan pada asumsi data pada

periode sekarang dipengaruhi oleh data periode sebelumnya dan juga oleh

nilai residual data periode sebelumnya.

b. Proses ARIMA

Hampir sama seperti model ARMA, model autoregressive integrated moving

average mendasarkan pada asumsi data pada periode sekarang

dipengaruhi oleh data periode sebelumnya dan juga oleh nilai residual data

periode sebelumnya, hanya saja apabila non-stasioneritas ditambahkan

pada campuran proses ARMA, maka model umum ARIMA (p,d,q) terpenuhi.

D. Musiman dan Model ARIMA

Musiman didefinisikan sebagai suatu pola yang berulang-ulang dalam

selang waktu yang tetap.untuk data yang stasioner, faktor musiman dapat

ditentukan dengan mengidentifikasi koefisien autokorelasi pada dua atau tiga time-

lag yang berbeda nyata dari nol. Autokorelasi yang secara signifikan berbeda dari

nol menyatakan adanya suatu pola dalam data. Untuk mengenali adanya faktor

musiman, seseorang harus melihat pada autokorelasi yang tinggi.

Proses identifikasi dari model musiman tergantung pada alat-alat statistik

berupa autokorelasi dan parsial autokorelasi, serta pengetahuan terhadap system

(atau proses) yang dipelajari.

E. Pengujian Parameter Model

Pengujian parameter dapat dilakukan sebagai berikut:

a. Pengujian masing-masing parameter model secara parsial

b. Pengujian model secara keseluruhan

Page 5: Analisis Deret Berkala - Pusdiklat BPS · 2020. 2. 28. · Analisis Deret Berkala 9 E. Uji kenormalan residual dan uji residual correlogram Dari grafik di atas, dapat dikatakan residualnya

Analisis Deret Berkala

3

PENERAPAN METODE ARIMA

A. Pendahuluan

Pada bagian ini akan dibahas mengenai pembentukan model ARIMA dari

data curah hujan dengan menggunakan metode ARIMA. Data tersebut dibagi

menjadi dua bagian di mana bagian pertama memuat data curah hujan dari bulan

Januari 2006 sampai bulan Desember 2012 dan akan digunakan untuk

pembentukan model. Data bagian kedua memuat data dari bulan Januari 2013

sampai bulan Desember 2013 yang akan digunakan untuk melihat akurasi

peramalan. Plot datanya adalah sebagai berikut:

Dari grafik di atas, bisa tuliskan deskripsi atau gambaran plot data Time series

tersebut. Bisa berupa ukuran-ukuran statistik, seperti maksimum, minimum, rata-

rata, standar deviasi, dan lain-lain. Bisa secara keseluruhan atau secara tahunan.

Data di bagi 2 bagian untuk training dan testing. Data Training digunakan untuk

pemodelan yaitu data dari tahun 2006 sampai tahun 2012. Data testing digunakan

untuk membandingkan hasil prediksi yaitu data tahun 2013..

B. Stasioneritas Data

Sebelum melakukan pemodelan terhadap data deret waktu, maka data

tersebut harus memenuhi asumsi stasioner terhadap rata-rata.

Data tersebut dilihat stasioneritasnya dengan menggunakan tes

Augmented Dickey Fuller. Hipotesis dari tes ADF adalah sebagai berikut:

0

100

200

300

400

500

600

700

800

2006 2007 2008 2009 2010 2011 2012 2013 2014

huja

n

Page 6: Analisis Deret Berkala - Pusdiklat BPS · 2020. 2. 28. · Analisis Deret Berkala 9 E. Uji kenormalan residual dan uji residual correlogram Dari grafik di atas, dapat dikatakan residualnya

Analisis Deret Berkala

4

H0 : a = 1 , data deret waktu tidak stasioner

H1 : a < 1 , data deret waktu stasioner

hasilnya adalah sebagai berikut:

Augmented Dickey-Fuller test for hujan

testing down from 11 lags, criterion AIC

sample size 73

unit-root null hypothesis: a = 1

test without constant

including 10 lags of (1-L)hujan

model: (1-L)y = (a-1)*y(-1) + ... + e

estimated value of (a - 1): 0,0157966

test statistic: tau_nc(1) = 0,274853

asymptotic p-value 0,7657

1st-order autocorrelation coeff. for e: -0,014

lagged differences: F(10, 62) = 4,276 [0,0002]

test with constant

including 4 lags of (1-L)hujan

model: (1-L)y = b0 + (a-1)*y(-1) + ... + e

estimated value of (a - 1): -0,752454

test statistic: tau_c(1) = -6,43947

asymptotic p-value 9,782e-009

1st-order autocorrelation coeff. for e: -0,001

lagged differences: F(4, 73) = 6,654 [0,0001]

Dari output diatas, nilai p-value adalah 9,78 x 10^-9 (lebih kecil dari 0,05), maka

dapat dikatakan bahwa data stasioner pada level pada model ARIMA dengan

konstanta.

C. Pemodelan ARIMA Menggunakan Metode Correlogram

Setelah data sudah bersifat stasioner, maka selanjutnya dapat diidentifikasi

model yang sesuai dengan data. Untuk mengidentifikasi model dari data dapat

digunakan plot ACF dan PACF sebagai berikut:

Page 7: Analisis Deret Berkala - Pusdiklat BPS · 2020. 2. 28. · Analisis Deret Berkala 9 E. Uji kenormalan residual dan uji residual correlogram Dari grafik di atas, dapat dikatakan residualnya

Analisis Deret Berkala

5

Autocorrelation function for hujan ***, **, * indicate significance at the 1%, 5%, 10% levels using standard error 1/T^0.5 LAG ACF PACF Q-stat. [p-value] 1 0.6911 *** 0.6911 *** 41.5732 [0.000] 2 0.3618 *** -0.2218 ** 53.1056 [0.000] 3 0.0753 -0.1549 53.6110 [0.000] 4 -0.2364 ** -0.3248 *** 58.6595 [0.000] 5 -0.4954 *** -0.2798 ** 81.0983 [0.000] 6 -0.5445 *** -0.0155 108.5614 [0.000] 7 -0.4493 *** 0.0040 127.5020 [0.000] 8 -0.2359 ** 0.1203 132.7894 [0.000] 9 0.0193 0.0625 132.8254 [0.000] 10 0.2822 *** 0.1251 140.5987 [0.000] 11 0.4728 *** 0.1181 162.7225 [0.000] 12 0.5140 *** 0.0269 189.2273 [0.000] 13 0.4310 *** 0.0434 208.1300 [0.000] 14 0.3012 *** 0.1243 217.4914 [0.000] 15 0.0668 -0.0337 217.9580 [0.000] 16 -0.2263 ** -0.1484 223.3970 [0.000] 17 -0.3871 *** 0.0098 239.5528 [0.000] 18 -0.4645 *** -0.1032 263.1638 [0.000] 19 -0.4101 *** 0.0650 281.8509 [0.000] 20 -0.2574 ** -0.0223 289.3277 [0.000] 21 -0.0448 -0.0215 289.5582 [0.000] 22 0.1987 * 0.0806 294.1565 [0.000] 23 0.4462 *** 0.1996 * 317.7332 [0.000] 24 0.4612 *** -0.1577 343.3388 [0.000]

Gambar 2.3. Output berupa Plot ACF dan PACF

-1

-0.5

0

0.5

1

0 5 10 15 20 25

lag

ACF for hujan

+- 1.96/T^0.5

-1

-0.5

0

0.5

1

0 5 10 15 20 25

lag

PACF for hujan

+- 1.96/T^0.5

Page 8: Analisis Deret Berkala - Pusdiklat BPS · 2020. 2. 28. · Analisis Deret Berkala 9 E. Uji kenormalan residual dan uji residual correlogram Dari grafik di atas, dapat dikatakan residualnya

Analisis Deret Berkala

6

Berdasarkan gambar, ternyata tidak mudah untuk menentukan model yang

sesuai. Banyak model yang bisa dibentuk berdasarkan gambar tersebut. Dari

model-model yang dapat dibentuk tersebut harus dipilih model yang bisa

menghasilkan nilai AIC paling kecil, parameternya signifikan dan residualnya

berdistribusi normal dan tidak ada otokorelasi.

Pada gambar tersebut juga terlihat bahwa pada plot ACF, lag yang

signifikan yaitu lag 1, 2, kemudian terputus. dan membentuk pola sinusoidal.

Kemudian pada plot PACF-nya dapat dilihat lag yang signifikan yaitu pada lag 1,

2, 4, 5, Lag yang signifikan pada plot PACF terputus setelah lag ke 2. Berdasarkan

tabel 2.1, maka model yang bisa dibentuk dengan melihat pola ACF dan PACF

diatas adalah:

ARIMA (1,0,0), ARIMA (2,0,0), ARIMA (4,0,0), ARIMA (5,0,0), ARIMA (1,0,1),

ARIMA (1,0,2), ARIMA (2,0,1), ARIMA (2,0,2), dst

D. Estimasi Parameter ARIMA

ARIMA (1,0,0) coefficient std. error z p-value

-------------------------------------------------------

const 302,148 55,7216 5,422 5,88e-08

***

phi_1 0,697355 0,0775684 8,990 2,47e-019

***

Mean dependent var 292,2810 S.D. dependent var

222,7029

Mean of innovations −1,189024 S.D. of innovations

158,4406

R-squared 0,487827 Adjusted R-squared

0,487827

Log-likelihood −545,0158 Akaike criterion

1096,032

Schwarz criterion 1103,324 Hannan-Quinn

1098,963

ARIMA (2,0,0) coefficient std. error z p-value

--------------------------------------------------------

const 298,505 44,7230 6,675 2,48e-011

***

phi_1 0,861899 0,106188 8,117 4,79e-016

***

Page 9: Analisis Deret Berkala - Pusdiklat BPS · 2020. 2. 28. · Analisis Deret Berkala 9 E. Uji kenormalan residual dan uji residual correlogram Dari grafik di atas, dapat dikatakan residualnya

Analisis Deret Berkala

7

phi_2 −0,233423 0,105875 −2,205 0,0275

**

Mean dependent var 292,2810 S.D. dependent var

222,7029

Mean of innovations −0,804126 S.D. of innovations

153,9543

R-squared 0,516400 Adjusted R-squared

0,510503

Log-likelihood −542,6609 Akaike criterion

1093,322

Schwarz criterion 1103,045 Hannan-Quinn

1097,231

ARIMA (4,0,0)

Parametenya tidak signifikan

ARIMA (5,0,0)

Parameternya tidak signifikan

ARIMA (1,0,1)

Parameternya signifikan di level 10%

ARIMA (1,0,2)

Parametenya tidak signifikan

ARIMA (2,0,1) coefficient std. error z p-value

--------------------------------------------------------

const 296,511 23,0045 12,89 5,17e-038

***

phi_1 1,50153 0,0948337 15,83 1,83e-056

***

phi_2 −0,713093 0,0789760 −9,029 1,73e-019

***

theta_1 −0,700562 0,0932022 −7,517 5,62e-014

***

Mean dependent var 292,2810 S.D. dependent var

222,7029

Mean of innovations −0,917919 S.D. of innovations

145,2173

R-squared 0,569795 Adjusted R-squared

0,559173

Log-likelihood −537,9306 Akaike criterion

1085,861

Page 10: Analisis Deret Berkala - Pusdiklat BPS · 2020. 2. 28. · Analisis Deret Berkala 9 E. Uji kenormalan residual dan uji residual correlogram Dari grafik di atas, dapat dikatakan residualnya

Analisis Deret Berkala

8

Schwarz criterion 1098,015 Hannan-Quinn

1090,747

ARIMA (2,0,2) coefficient std. error z p-value

---------------------------------------------------------

const 296,033 19,5730 15,12 1,12e-051

***

phi_1 1,68495 0,0524195 32,14 1,08e-226

***

phi_2 −0,945254 0,0515952 −18,32 5,67e-075

***

theta_1 −1,27562 0,182801 −6,978 2,99e-012

***

theta_2 0,611473 0,153379 3,987 6,70e-05

***

Mean dependent var 292,2810 S.D. dependent var

222,7029

Mean of innovations 0,780309 S.D. of innovations

137,2022

R-squared 0,616713 Adjusted R-squared

0,602340

Log-likelihood −533,6828 Akaike criterion

1079,366

Schwarz criterion 1093,951 Hannan-Quinn

1085,229

Dari model ARIMA diatas, model ARIMA terbaik yaitu model ARIMA (2,0,2)

karena AIC, SIC, HQC paling kecil.

Page 11: Analisis Deret Berkala - Pusdiklat BPS · 2020. 2. 28. · Analisis Deret Berkala 9 E. Uji kenormalan residual dan uji residual correlogram Dari grafik di atas, dapat dikatakan residualnya

Analisis Deret Berkala

9

E. Uji kenormalan residual dan uji residual correlogram

Dari grafik di atas, dapat dikatakan residualnya berdistribusi normal, hal ini

dapat dilihat dari nilai p-value = 0,28 >0,05. Teruskan analisisnya…..

Dari grafik diatas, dapat dikatakan bahwa residualnya tidak terjadi

autokorelasi, hal ini dapat dilihat bahwa lag residualnya tidak ada yang signifikan

atau tidak ada yang melewati garis batas.

0

0,0005

0,001

0,0015

0,002

0,0025

0,003

0,0035

-400 -300 -200 -100 0 100 200 300 400

Density

uhat10

relative frequency

N(0,78031 141,48)Test statistic for normality:

Chi-square(2) = 2,544 [0,2803]

-0,3

-0,2

-0,1

0

0,1

0,2

0,3

0 2 4 6 8 10 12 14 16

lag

Residual ACF

+- 1,96/T^0,5

-0,3

-0,2

-0,1

0

0,1

0,2

0,3

0 2 4 6 8 10 12 14 16

lag

Residual PACF

+- 1,96/T^0,5

Page 12: Analisis Deret Berkala - Pusdiklat BPS · 2020. 2. 28. · Analisis Deret Berkala 9 E. Uji kenormalan residual dan uji residual correlogram Dari grafik di atas, dapat dikatakan residualnya

Analisis Deret Berkala

10

F. Peramalan

Setelah didapatkan model ARIMA dari metode Correlogram, maka

selanjutnya dilakukan peramalan dengan menggunakan model ARIMA tersebut.

Peramalan dilakukan sebanyak 12 observasi kedepan dan hasil dari peramalan

tersebut dibandingkan dengan data bagian kedua. Hasil peramalan model ARIMA

tersebut dapat dilihat sebagai berikut :

Dari tabel tersebut mengindikasikan bahwa peramalan dengan metode

Correlogram menghasilkan tingkat akurasi yang tinggi. Plot hasil peramalan

dengan kedua metode tersebut dapat dilihat pada gambar berikut:

Tahun Data Asli Prediksi 2013:01 765,0 591,3

2013:02 480,0 592,3

2013:03 350,0 516,2

2013:04 251,0 386,9

2013:05 183,0 241,1

2013:06 41,0 117,5

2013:07 22,0 47,2

2013:08 1,0 45,5

2013:09 28,0 109,1

2013:10 180,0 217,9

2013:11 295,0 341,0

2013:12 424,0 445,8

1. Tuliskan analisis tentang data prediksi

- Maksimum, minimum, rata-rata, std.deviasi, dll (dari materi Explorasi Data)

2. Tambahkan di bab kesimpulan dan ”saran”

Gambar 2.5. Hasil Peramalan dengan Metode Correlogran

-400

-200

0

200

400

600

800

1000

2009,5 2010 2010,5 2011 2011,5 2012 2012,5 2013 2013,5 2014

hujan

forecast

95 percent interval

Page 13: Analisis Deret Berkala - Pusdiklat BPS · 2020. 2. 28. · Analisis Deret Berkala 9 E. Uji kenormalan residual dan uji residual correlogram Dari grafik di atas, dapat dikatakan residualnya

Analisis Deret Berkala

11

DAFTAR PUSTAKA

Box, G.E.P., Jenkins, G.M., dan Reissel, G.C., 1994. Time Series Analysis Forecasting and Control, edisi ketiga. Englewood Cliffs : Prentice Hall.

Ludin, J, “Pendekatan Algoritma Genetika Untuk Pemodelan Data Deret Waktu”, Tesis, Fakultas MIPA, Institut Teknologi Sepuluh November, 2011

Makridakis, S., Wheelwright, S.C., dan McGee, V.E., 1999. Metode dan Aplikasi Peramalan, Jilid 1 Edisi Kedua, Terjemahan Ir. Hari Suminto, Bina Rupa Aksara, Jakarta.