Skip to main content

Day 9 - Reinforcement Learning & Incremental Learning

Pembahasan Materi

  1. Reinforcement Learning : Q-Learning

  2. Reinforcement Learning : SARSA

  3. Incremental Learning

  4. Transfer Learning

Mengenal Metode Machine Learning yang Digunakan Data Science

A. Reinforcement learning

Reinforcement learning adalah tipe algoritma machine learning yang bisa membuat agent software dan mesin bekerja secara otomatis untuk menentukan perilaku yang ideal sehingga dapat memaksimalkan kinerja algoritmanya. DAlam beberapa tahun terakhir, penggunaan reinforcement learning terus meningkat, contohnya DeepMind and the Deep Q learning pada tahun 2014, AlphaGo di tahun 2016, dan OpenAI dan PPO di tahun 2017. Algoritma Reinforcement Learning didefinisikan sebagai metode machine learning yang berkaitan dengan cara software agent mengambil tindakan di environmentnya. Algoritma ini merupakan bagian dari metode deep learning yang akan memaksimalkan sebagian reward kumulatif. Contoh pertama penggunaan reinforcement learning adalah di sektor manufaktur. Beberapa perusahaan manufaktur menggunakan robot dengan reinforcement learning untuk mengambil barang dari satu tempat ke tempat lain. Robot ini akan dilatih untuk menghafal objek dan melakukan pekerjaan dengan kecepatan dan presisi yang tinggi. Selain itu robot-robot ini juga bisa digunakan untuk menyortir berjuta-juta produk di gudang supermarket atau e-commerce. Tujuan pemanfaatan robot ini adalah untuk menghindari human error sehingga produk tersebut dapat dikirim ke konsumen yang tepat. Pabrik tesla pun menggunakan lebih dari 160 robot yang bekerja untuk merakit mobil sehingga dapat mengurangi resiko cacat saat proses produksi.

Algoritma reinforcement learning juga dapat diaplikasikan pada power system. Reinforcement learning dan teknik pengoptimalan digunakan untuk menilai keamanan sistem tenaga listrik dan meningkatkan kinerja Microgrid. Metode adaptive learning digunakan untuk mengembangkan sistem pengontrol dan pelindung. Teknologi transmisi dengan perangkat High-Voltage Direct Current (HVDC) dan Flexible Alternating Current Transmission System devices (FACTS) berdasarkan reinforcement learning dapat membantu mengurangi transmisi dan emisi CO2 secara efektif. Reinforcement learning digunakan untuk mengembangkan struktur kontrol yang terdistribusi untuk satu set sumber pembangkit. 

Selain di sektor manufaktur dan power system, reinforcement learning juga dapat digunakan di sektor keuangan. Perusahaan Pit.AI merupakan perusahaan pertama yang memanfaatkan reinforcement learning untuk mengevaluasi strategi perdagangan. Algoritma ini ternyata menjadi tool yang kuat pada sistem pelatihan untuk mengoptimalkan tujuan keuangan. Algoritma reinforcement learning ini memiliki peran yang sangat besar dalam perdagangan pasar saham karena algoritma Q-Learning (salah satu tipe reinforcement learning) dapat mempelajari strategi perdagangan yang optimal melalui satu instruksi sederhana dengan memaksimalkan nilai portofolio.

B. Incremental Learning

Incremental supervised learning: algorithms and applications in pattern  recognition | SpringerLink

Metode pengembangan perangkat lunak di mana produk dirancang, diimplementasikan, dan diuji secara bertahap hingga produk selesai. Model ini menggabungkan elemen-elemen model waterfall dengan filosofi iteratif dari prototyping. Ada banyak situasi di mana kebutuhan perangkat lunak awal didefinisikan dengan cukup baik, tetapi ruang lingkup keseluruhan dari upaya pengembangan menghalangi proses yang murni linier. Selain itu, mungkin ada kebutuhan yang mendesak untuk menyediakan seperangkat fungsionalitas perangkat lunak yang terbatas kepada pengguna dengan cepat dan kemudian memperbaiki dan memperluas fungsionalitas tersebut dalam rilis perangkat lunak yang lebih baru. Dalam kasus seperti itu, model yang dibutuhkan adalah model incremental.

 

Referensi Baca



Last modified: Friday, 10 February 2023, 2:33 PM