Analisis Data Time Series Linear di Stata (Lag & Lead Data, Deterministic Forecasting)

Hallo teman-teman, kali ini kita akan coba untuk analisis sederhana data time series dengan regresi linier di Stata ya!

Kita akan menggunakan dataset dari Wooldridge yang bisa diakses melalui Stata. Ini merupakan data time series dari tahun 1947 – 1988. Variabel yang ada pada dataset ini adalah indeks harga rumah per tahun, jumlah investasi pada rumah per tahun, jumlah populasi per tahun, dan beberapa variabel yang sudah dijadikan fungsi logaritma. Kali ini, kita akan mengecek apakah jumlah investasi pada rumah per tahun memiliki tren berdasarkan data tahun 1947 – 1988. Selain itu, kita juga akan mencoba untuk melakukan pembuatan variabel lag dan lead serta difference dan melakukan deterministic forecasting.

Pertama, kita bisa mengakses data tersebut dengan menuliskan perintah dibawah ini

ssc install bcuse

Setelah loading dan instalasi selesai seperti gambar diatas kita bisa menuliskan perintah selanjutnya sketchup 2018 license key

Bcuse hseinv

Nanti akan muncul tampilan seperti ini dimana terdapat 42 observasi dan 14 variabel. Untuk memudahkan kita hanya akan menyimpan beberapa variabel dan sisanya di drop ajaya! Caranya seperti ini untuk men drop variabel yang tidak akan kita gunakan.

Drop inv pop price lpop t invpc linvpc lprice_1 linvpc_1 gprice ginvpc

Nantinya kita hanya akan memiliki 3 variabel, yaitu year, linv (fungsi logaritma jumlah investasi pada rumah per tahun), dan lprice (fungsi logaritma indeks harga rumah per tahun) malwarebytes 3.1.2 crack


Langkah pertama untuk melakukan analisis time series adalah kita harus memberi tahu Stata terlebih dahulu bahwa data yang ingin kita regresi adalah data time series. Untuk melakukan itu kita harus membuat variabel waktu terlebih dahulu yang biasa disebut t

Gen t = _n

Perintah diatas akan membuat satu variabel baru bernama t yang merupakan variabel waktu kita. Selanjutnya baru menggunakan perintah selanjutnya untuk meng set data menjadi time series

Tsset t, yearly

(Kita menggunakan ,yearly karena data kita merupakan tahunan)

Selanjutnya kita baru bisa mengecek apakah variabel linv memiliki tren seiring berjalannya waktu dengan regresi OLS sederhana

Reg linv lprice t

Bisa dilihat bahwa variabel t memiliki P>I t I bernilai < 0.05 (signifikan mempengaruhi linv) yang menandakan variabel dependen kita atau variabel linv memiliki tren seiring berjalannya waktu. Jika kita lihat juga pada bagian coefficient maka bisa dilihat juga bahwa variabel t memiliki coefficient 0.0240715 yang artinya tren linv seiring berjalannya waktu adalah tren positif (cenderung meningkat seiring bertambahnya tahun). 

Variabel lag, lead, dan difference

Variabel Lag

Dalam analisis time series biasanya diperlukan juga untuk membuat variabel lag dan lead, caranya seperti iniya! Kalian bisa langsung aja mengetik perintah seperti dibawah ini. Misalnya, kita mau membuat variabel dengan lag 1 tahun pada variabel linv

Gen laglinv = l1.linv

(l1 = lag 1, data mundur 1 tahun)

Jika kita lihat pada laman browse data, maka akan terlihat ada variabel baru bernama laglinv. Variabel ini berisi data linv tetapi memiliki lag 1 tahun. Contohnya pada tahun kedua (1948) berisikan data linv dari tahun 1947, dan begitu seterusnya. Untuk tahun 1947 sendiri variabel laglinv tidak memiliki nilai hal ini disebabkan data untuk lag 1 tahun atau data 1946 tidak tersedia.

Variabel Lead

Selanjutnya, tidak hanya variabel lag, kita juga bisa membuat variabel lead atau variabel dengan isi data 1 tahun setelahnya. Caranya seperti iniya!

Gen leadlinv = f1.linv

(f1 = future 1, data maju 1 tahun)

Jika kita lihat pada laman browse data, maka akan terlihat ada variabel baru bernama leadlinv. Variabel ini berisi data linv tetapi memiliki data maju 1 tahun. Contohnya pada tahun kedua (1987) berisikan data linv dari tahun 1988, dan begitu seterusnya. Untuk tahun 1988 sendiri variabel leadlinv tidak memiliki nilai hal ini disebabkan data untuk 1 tahun setelahnya atau data 1989 tidak tersedia.


Fungsi variabel lag dan lead ini akan berguna apabila kita ingin mencari perbedaan setiap tahun dari data time series kita. Misalnya kita ingin mengetahui perbedaan nilai linv setiap tahunnya maka kita bisa melakukan perintah dibawah ini

Gen dlinv = linv - laglinv

(dlinv = difference pada linv, didapat dengan cara mengurangi variabel linv dengan variabel linv lag 1 tahun, akan menghasilkan hitungan linv tahun ini dikurangi linv tahun sebelumnya)

Variabel baru bernama dlinv akan muncul dan menghasilkan hasil pengurangan linv pada tahun tertentu dengan tahun sebelumnya. Misal pada baris 2 berarti berisikan selisih antara linv pada tahun 1948 dengan linv pada tahun 1947. Untuk baris 1 dlinv tidak memiliki nilai sebab variabel laglinv tidak memiliki nilai.

Deterministic Forecasting

Untuk permulaan, kita bisa juga melakukan deterministic forecasting atau prediksi sederhana pada suatu variabel menggunakan data historis time series yang ada. Caranya seperti iniya!

Pertama, kita harus menambahkan tahun terlebih dahulu pada data kita. Kita bisa melakukannya dengan mengklik bagian Data Editor dan menambahkan 5 tahun pada data kita seperti gambar dibawah (1989 – 1993)

Selanjutnya kita harus mengulang langkah meng set data menjadi time series, oleh karena itu kita bisa menuliskan perintah dibawah ini, kita harus drop dulu variabel t nya

Drop t

Setelah variabel t hilang, kita ulang lagi langkah dibawah ini 

Gen t = _n

(lakukan sampai variabel t berjumlah 47, mengikuti sebanyak jumlah data tahun kita)

Kemudian kita set lagi data kita sebagai data time series

Tsset t, yearly

Selanjutnya, lakukan regresi antara variabel linv dengan t

Reg linv t

Kita harus memastikan bahwa variabel t atau waktu memiliki pengarih signifikan dengan linv sehingga menandakan bahwa linv memiliki tren positif seiring berjalannya waktu. Jika hasilnya signifikan (p value (P> I t I) < 0.05) maka kita bisa melanjutkan prosesnya. 

Nah selanutnya kita bisa melakukan deterministic forecasting dengan mengetik

Predict linvf

Variabel baru bernama linvf akan muncul dan menghasilkan perhitungan untuk prediksi 5 tahun kedepan dari data linv asli kita (1989 – 1993). Hasil prediksi ini menggunakan data historis yang sebelumnya kita dapatkan. Namun, ini merupakan versi prediksi yang masih sangat sederhana dan memiliki banyak keterbatasan yang bisa saja hasilnya penuh dengan bias dan tidak sesuai dengan keadaan nyata hal ini sangat tergantung dengan bentuk datanya. Oleh karena itu, untuk metode prediksi time series yang lebih advance akan dibahas dilain kesempatan ya!

Semoga bermanfaat ya teman-teman, selamat belajar!

3 Comments

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *