Skip to main content

Day 7 - Supervised Learning

https://www.techfor.id/wp-content/uploads/2021/08/Picture1-6.png


Supervised Learning adalah adalah subkategori pembelajaran mesin (Machine Learning) dan kecerdasan buatan (AI). Ditentukan oleh penggunaan kumpulan data berlabel untuk melatih algoritma yang mengklasifikasikan data atau memprediksi hasil secara akurat. Supervised Learning menggunakan satu set pelatihan untuk mengajarkan model untuk menghasilkan output yang diinginkan. Dataset pelatihan ini mencakup input dan output yang benar, yang memungkinkan model untuk belajar dari waktu ke waktu. Algoritma nantinya mengukur akurasinya melalui fungsi kerugian (Loss Function), lalu menyesuaikan hingga kesalahan cukup diminimalkan.

https://www.techfor.id/wp-content/uploads/2021/08/Picture2-5-1024x512.png

 

Supervised Learning  dipisahkan menjadi dua jenis masalah terkait penggalian data (Data Mining) :

  1. Klasifikasi (Classification) : menggunakan algoritma untuk secara akurat menetapkan data uji ke dalam kategori tertentu. Jenis ini mengenali entitas tertentu dalam kumpulan data dan mencoba menarik beberapa kesimpulan tentang bagaimana entitas tersebut harus diberi label atau didefinisikan.
    Algoritma klasifikasi yang umum digunakan adalah linear classifiers, support vector machines (SVM), decision trees, dan yang lainnya

  2. Regresi (Regression) : digunakan untuk memahami hubungan antara variabel terikat dan variabel bebas. Jenis Ini biasanya digunakan untuk membuat proyeksi, seperti untuk pendapatan penjualan untuk bisnis tertentu. Regresi linier, regresi logistik, dan regresi polinomial adalah algoritma regresi yang paling populer digunakan saat ini.

Forecasting : LSTM

Long short term memory network (LSTM) adalah salah satu modifikasi dari recurrent neural network atau RNN. Banyak modifikasi dari RNN, tetapi LSTM merupakan salah satu yang populer di antaranya. LSTM hadir untuk melengkapi kekurangan RNN yang tidak dapat memprediksi kata berdasarkan informasi lampau yang disimpan dalam jangka waktu lama. 

Dengan demikian, LSTM mampu mengingat kumpulan informasi yang telah disimpan dalam jangka waktu panjang, sekaligus menghapus informasi yang tidak lagi relevan. LSTM lebih efisien dalam memproses, memprediksi, sekaligus mengklasifikasikan data berdasarkan urutan waktu tertentu.

 

STRUKTUR LSTM

  • FORGET GATE
    Gerbang pertama dalam LSTM disebut dengan forget gate. Mudahnya, gerbang ini bertugas untuk melupakan beberapa informasi yang tidak relevan dan sudah tidak diperlukan oleh sebuah sistem. Alhasil, LSTM dapat menyajikan kumpulan informasi yang lengkap, tetapi tetap aktual sesuai dengan kebutuhan.

  •  INPUT GATE
    Berikutnya, ada gerbang kedua, yakni input gate yang bertugas untuk memasukkan informasi yang berguna untuk mendukung keakuratan data. Tugas input gate adalah untuk menambahkan informasi yang sebelumnya telah diseleksi terlebih dahulu melalui gerbang forget gate. Gerbang ini tidak dimiliki oleh RNN yang hanya memungkinkan satu input data untuk satu output data. Dalam input gate kemudian dikenal istilah input modulation gate yang sering tidak ditulis dalam beberapa ulasan tentang LSTM. Sesuai namanya, input modulation gate berfungsi untuk memodulasi informasi yang ada, sehingga dapat mengurangi kecepatan konvergensi dari data zero-mean.

  • OUTPUT GATE
    Terakhir adalah output gate yang menjadi gerbang terakhir untuk menghasilkan informasi data yang komplet dan aktual. Gerbang ini bisa menjadi yang terakhir atas sebuah informasi atau hanya menjadi bagian dari tahap pertama saja, sebelum akhirnya informasi akan diproses lewat input gate di sel berikutnya.

 

Forecasting : ARIMA

ARIMA merupakan gabungan dari AR dan MA dimana AR adalah singkatan dri autoregresif dan MA merupakan moving average sedangkan I yang ditengah merupakan integrated dimana kegunaannya untuk diferensiasi jika data tidak stasioner. ARIMA digunakan untuk mengolah data runtun waktu yang univariate. ARIMA sering juga disebut metode runtun waktu Box-Jenkins. ARIMA sangat baik ketepatannya untuk peramalan jangka pendek, sedangkan untuk peramalan jangka panjang ketepatan peramalannya kurang baik. Biasanya akan cenderung flat (mendatar/konstan) untuk periode yang cukup panjang. Model Autoregresif Integrated Moving Average (ARIMA) adalah model yang secara penuh mengabaikan independen variabel dalam membuat peramalan. ARIMA menggunakan nilai masa lalu dan sekarang dari variabel dependen untuk menghasilkan peramalan jangka pendek yang akurat. ARIMA cocok jika observasi dari deret waktu (time series) secara statistik berhubungan satu sama lain (dependent). Pada model ARIMA terdiri dari 3 komponen yaitu p, d, dan q. Dimana p merupakan ordo dari autoregresif atau AR(p), d merupakan diferensiasi, dan q merupakan ordo dari moving average MA(q)Tahapan dalam mengolah ARIMA:

  • Pra pengolahan data

  • Identifikasi model

  • Estimasi parameter model

  • Cek diagnostik residual

  • Peramalan

 

Referensi Baca



Last modified: Friday, 10 February 2023, 2:32 PM