Mekanisme ini memungkinkan mesin cerdas untuk meningkatkan kapabilitas dan kinerjanya dari waktu ke waktu, secara otomatis belajar dengan pengalaman untuk melakukan tugas-tugas tertentu, meningkatkan kinerjanya lebih dan lebih dari waktu ke waktu.
Contohnya adalah AlphaGo, Perangkat lunak Pembelajaran Mesin untuk game Go yang dikembangkan oleh DeepMind. AlpaGo adalah perangkat lunak pertama yang mampu mengalahkan master manusia dalam game di pesawat goban ukuran standar (19 × 19). Perangkat lunak AlphaGo dididik dengan mengamati jutaan gerakan yang dilakukan oleh pemain Go selama permainan yang berbeda, dan membuat mesin bermain melawan dirinya sendiri, dengan hasil bahwa ia mampu mengalahkan apa yang diyakini sebagai pemain terbaik di dunia permainan ini.
Sekarang mari kita masuk ke tiga kategori utama pembelajaran mesin.
Sistem menerima contoh yang diberi label sesuai dengan keluaran yang diinginkan. Artinya, kumpulan data yang berguna untuk menginstruksikan mesin terdiri dari elemen-elemen yang mewakili situasi nyata yang terdiri dari data input "fitur"Dan dari data keluaran"target". Dengan mengacu pada contoh artikel Apa itu Pembelajaran Mesin, tentang apa itu dan tujuannya, persiapan pelatihan adalah jenis yang diawasi karena kami memiliki kasus rute individual, untuk masing-masing fitur (kendaraan, rute) dan target (waktu perjalanan) yang ditentukan. Kumpulan data biasanya jauh lebih kompleks, contohnya sangat terbatas dan didaktik, dengan tujuan menyederhanakan pemahaman tentang Pembelajaran Mesin Terbimbing.
Kasus jenis ini memungkinkan algoritma untuk mempelajari dasar jenis rute dan kendaraan, apa yang bisa menjadi waktu perjalanan. Ada dua jenis masalah dalam pembelajaran mesin yang diawasi:
Mempertimbangkan kembali contoh rute jalan raya, kita dapat mengatakan bahwa itu adalah regresi. Jika targetnya terdiri dari penilaian seperti: cepat jika di bawah satu jam, lambat antara 1 dan dua jam, sangat lambat jika di atas dua jam. Dalam hal ini akan menjadi masalah klasifikasi.
Tidak ada data berlabel, sistemlah yang, mulai dari input, harus menemukan struktur dalam data. Kami praktis tidak memiliki target, tetapi hanya input data. Seolah-olah dalam contoh kami hanya memiliki data rute dan kendaraan, tetapi tidak memiliki data waktu perjalanan.
Dalam pendekatan ini, algoritma harus mengidentifikasi kategori dengan mencari struktur tersembunyi dalam data. Alat utama yang dapat digunakan dalam pendekatan tanpa pengawasan adalah: kekelompokan dan aturan asosiasi.
Sistem menerima masukan dari lingkungan dan mengambil tindakan. Sistem mencoba mengambil tindakan untuk menerima hadiah. Sistem akan mencoba menerapkan tindakan yang mengoptimalkan hadiah tergantung pada keadaan lingkungan sekitar.
Sistem penghargaan diimplementasikan melalui komponen, yang disebut agen. Agen memutuskan suatu tindakan yang akan dilakukan terhadap lingkungan dan dari sini ia menerimanya Penghargaan dan mungkin informasi tentang keadaan lingkungan, sebagai konsekuensi dari tindakan yang dimulai.
Misalnya, jika kita memikirkan sistem yang didedikasikan untuk permainan catur, agen adalah komponen yang menentukan langkah, lingkungan adalah permainan itu sendiri. Sebagai konsekuensi dari setiap gerakan yang dilakukan oleh agen, keadaan permainan berubah (dipahami sebagai situasi saat ini, posisi semua bidak, juga sebagai konsekuensi dari langkah lawan), menerima umpan balik saat bidak lawan dimakan, oleh karena itu dimaksudkan sebagai hadiah untuk bergerak. Dengan cara ini agen belajar, dan mendidik dirinya sendiri.
Oleh karena itu jelas bahwa pilihan antara jenis pembelajaran mesin tergantung pada konteksnya. Artinya, jenis pendekatan dipilih berdasarkan data yang tersedia dan kemungkinan memiliki riwayat yang mencakup deskripsi keadaan setiap kasus individu (input), dan juga hasil (output). Jadi dengan kumpulan data jenis ini, Anda dapat melanjutkan untuk menggunakan pendekatan yang diawasi.
Sebaliknya, jika Anda tidak memiliki kemungkinan untuk mengetahui data keluaran (target) secara apriori, atau Anda ingin menemukan target baru, maka perlu untuk mengidentifikasi hubungan antara data masukan untuk menemukan keadaan yang tidak pernah dialami dalam sejarah, atau menghadapi pembelajaran terhadap lingkungan yang berkembang dan bereaksi. Dalam hal ini perlu untuk memilih teknik tanpa pengawasan atau penguatan.
Ercole Palmeri: Kecanduan inovasi
Senin lalu, Financial Times mengumumkan kesepakatan dengan OpenAI. FT melisensikan jurnalisme kelas dunianya…
Jutaan orang membayar layanan streaming, membayar biaya berlangganan bulanan. Sudah menjadi pendapat umum bahwa Anda…
Coveware by Veeam akan terus menyediakan layanan respons insiden pemerasan siber. Coveware akan menawarkan kemampuan forensik dan remediasi…
Pemeliharaan prediktif merevolusi sektor minyak & gas, dengan pendekatan inovatif dan proaktif terhadap manajemen pembangkit listrik.…