Kecerdasan Buatan (AI) adalah bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang umumnya terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan masalah, dan pengenalan pola. Tujuan AI adalah untuk memberikan kemampuan untuk mengolah input dan menjelaskan output pada perangkat lunak. Pengertian dataset adalah sebuah kumpulan data yang berasal dari informasi-informasi pada masa lalu dan siap untuk dikelola menjadi sebuah informasi baru.
Kumpulan data yang ada di dataset bisa di-load dari sumber data apa pun yang valid, seperti SQL Server database, Microsoft Access database, ataupun dari XML file. Dataset tetap ada di memori dan data di dalamnya bisa dimanipulasi dan di-update tanpa bergantung pada database asalnya. Jika diperlukan, dataset bisa bertindak sebagai template untuk memperbarui database pusat. Dataset berisi koleksi dari nol atau lebih DataTable Object, di mana masing-masing merupakan representasi tabel di memori. Dataset terdiri dari dua jenis, antara lain:
Atribut adalah bagian data, yang mewakili karakteristik atau feature dari objek data. Atribut, dimensi, feature, dan variabel sering digunakan secara bergantian dalam literatur. Istilah dimensi ini umumnya digunakan dalam literatur data warehouse. Dalam literatur Machine learning cenderung menggunakan istilah feature, sementara statistik lebih menggunakan istilah variabel. Jenis atribut ditentukan oleh himpunan nilai yang mungkin muncul, yaitu nominal, biner, ordinal, atau numerik. Dalam bagian berikut, kita bahas tentang masing-masing jenis.
A. Data-Centric AI
Data-Centric AI adalah
pendekatan teknologi yang muncul di AI. Evolusi pendekatan baru biasanya
dimulai dengan beberapa ahli yang melakukan teknik secara intuitif. Ketika para
ahli ini mendiskusikan dan mempublikasikan ide-ide mereka, prinsip-prinsip ini
menjadi lebih luas dan akhirnya, alat dikembangkan untuk membuat aplikasi
mereka lebih sistematis dan tersedia untuk semua orang.
B. BigQuery Explainable AI (XAI)
BigQuery Explainable AI (XAI) adalah seperangkat alat dan kerangka kerja untuk membantu memahami dan menafsirkan prediksi yang dibuat oleh model pembelajaran mesin, yang terintegrasi secara bawaan dengan sejumlah produk dan layanan Google. Dapat men-debug dan meningkatkan kinerja model, dan membantu orang lain memahami perilaku model. Juga dapat membuat atribusi fitur untuk prediksi model di Tabel AutoML, BigQuery ML, dan Vertex AI, serta menyelidiki perilaku model secara visual menggunakan alat.
C. Automated ML
Pembelajaran mesin otomatis, juga disebut sebagai ML atau AutoML otomatis, adalah proses mengotomatiskan tugas pengembangan model pembelajaran mesin yang memakan waktu dan berulang. Pembelajaran mesin otomatis memungkinkan ilmuwan data, analis, dan pengembang untuk membangun model ML dengan skala, efisiensi, dan produktivitas tinggi sambil mempertahankan kualitas model.
Carilah beberapa dataset yang ada di internet, salah satu sumber yang sering digunakan para data saintis adalah kaggle.com namun dataset dapat dicari melalui sumber lainnya. Lakukanlah analisis dataset yang Anda kumpulkan, seperti melakukan analisis pada tipe data yang dimilikinya.