Ushbu mexanizmlar aqlli mashinaga vaqt o'tishi bilan o'z imkoniyatlari va ish faoliyatini yaxshilashga, muayyan vazifalarni bajarish uchun tajriba bilan avtomatik ravishda o'rganishga, vaqt o'tishi bilan ishlashini yaxshilashga imkon beradi.
Bunga misol keltirish mumkin AlphaGotomonidan ishlab chiqilgan Go o'yini uchun Machine Learning dasturi DeepMind. AlpaGo samolyotda o'yinda inson ustasini mag'lub etishga qodir birinchi dastur edi goban standart o'lcham (19 × 19). AlphaGo dasturiy ta'minoti Go o'yinchilari tomonidan turli o'yinlar davomida qilingan millionlab harakatlarni kuzatish va mashinaning o'ziga qarshi o'ynashi orqali o'qitilgan, natijada u ushbu o'yin dunyosidagi eng yaxshi o'yinchi deb hisoblanganlarni mag'lub etishga muvaffaq bo'lgan.
Keling, mashinani o'rganishning uchta asosiy toifasiga o'tamiz.
Tizim kerakli natijaga ko'ra etiketlangan misollarni oladi. Ya'ni, mashinaga ko'rsatma berish uchun foydali bo'lgan ma'lumotlar to'plamlari kirish ma'lumotlaridan tashkil topgan real vaziyatlarni ifodalovchi elementlardan iborat "Xususiyatlari"Va chiqish ma'lumotlaridan"maqsad". Maqolaning misoliga murojaat qilgan holda Machine Learning nima, u nima haqida va uning maqsadlari, treningga tayyorgarlik nazorat qilinadigan turdagi edi, chunki bizda marshrutlarning alohida holatlari bor edi, ularning har biri uchun xususiyatlar (avtomobil, marshrut) va maqsad (sayohat vaqti) ko'rsatilgan. Ma'lumotlar to'plamlari odatda ancha murakkab, misol nazorat ostidagi mashinani o'rganishni tushunishni soddalashtirish uchun juda cheklangan va didaktik edi.
Ushbu turdagi holat algoritmga marshrut turi va transport vositasining asosini, sayohat vaqti qancha bo'lishi mumkinligini o'rganishga imkon beradi. Nazorat ostidagi mashinalarni o'rganishda ikki turdagi muammolar mavjud:
Avtomobil yo'llari misolini qayta ko'rib chiqsak, bu regressiya deb aytishimiz mumkin. Agar maqsad bir soatdan kam bo'lsa tez, 1 soatdan ikki soatgacha sekin, ikki soatdan ortiq bo'lsa juda sekin. Bunday holda, bu tasniflash muammosi bo'lar edi.
Belgilangan ma'lumotlar yo'q, bu tizim kirishlardan boshlab ma'lumotlar tarkibini topishi kerak. Bizda amalda maqsad yo'q, faqat kiritilgan ma'lumotlar. Go'yo misolda bizda faqat marshrut va transport ma'lumotlari bor edi, lekin sayohat vaqti ma'lumotlari emas.
Ushbu yondashuvda algoritmlar ma'lumotlardagi yashirin tuzilmalarni izlash orqali toifalarni aniqlashi kerak. Nazoratsiz yondashuvda qo'llanilishi mumkin bo'lgan asosiy vositalar Kümeleme va uyushma qoidalari.
Tizim atrof-muhitdan ma'lumot oladi va harakatlarni amalga oshiradi. Tizim mukofotlarni olish uchun harakatlarni amalga oshirishga harakat qiladi. Tizim atrof-muhit holatiga qarab mukofotni optimallashtiradigan harakatlarni amalga oshirishga harakat qiladi.
Mukofot tizimi deb ataladigan komponent orqali amalga oshiriladi agent. Agent atrof-muhitga nisbatan amalga oshiriladigan harakatni hal qiladi va shundan u harakatni oladi mukofot va, ehtimol, boshlangan harakat natijasida atrof-muhit holati to'g'risida ma'lumot.
Misol uchun, shaxmat o'yiniga bag'ishlangan tizim haqida o'ylaydigan bo'lsak, agent - bu harakatni hal qiluvchi komponent, muhit - o'yinning o'zi. Agent tomonidan amalga oshirilgan har bir harakat natijasida o'yin holati o'zgaradi (hozirgi vaziyat, barcha donalarning holati, shuningdek, raqib harakatining natijasi sifatida tushuniladi), fikr-mulohazalarni raqibning yegan to'plami sifatida qabul qiladi. harakat uchun mukofot sifatida mo'ljallangan. Shunday qilib, agent o'zini o'zi o'rganadi va tarbiyalaydi.
Shu sababli, mashinani o'rganish turlari o'rtasidagi tanlov kontekstga bog'liqligi aniq. Ya'ni, yondashuv turi mavjud ma'lumotlar va tarixga ega bo'lish imkoniyati asosida tanlanadi, unda har bir alohida ishning (kirish) holatlari tavsifi, shuningdek, natija (chiqish) mavjud. Shunday qilib, ushbu turdagi ma'lumotlar to'plami bilan siz nazorat qilinadigan yondashuvdan foydalanishni davom ettirishingiz mumkin.
Boshqa tomondan, sizda chiqish ma'lumotlarini (maqsadini) apriori bilish imkoniyati bo'lmasa yoki siz yangi maqsadlarni kashf qilmoqchi bo'lsangiz, unda hech qachon boshdan kechirmagan holatlarni aniqlash uchun kirish ma'lumotlari o'rtasidagi aloqalarni aniqlash kerak. tarix, yoki rivojlanayotgan va reaksiyaga kirishadigan muhitga qarab o'rganishga duch kelish. Bunday holda, nazoratsiz yoki mustahkamlash usullarini tanlash kerak.
Ercole Palmeri: Innovatsiyalarga qaram
O'tgan dushanba kuni Financial Times OpenAI bilan shartnoma imzolaganini e'lon qildi. FT o'zining jahon darajasidagi jurnalistikasini litsenziyalaydi...
Millionlab odamlar oylik abonent to'lovlarini to'lab, oqim xizmatlari uchun to'laydilar. Umumiy fikr, siz ...
Veeam tomonidan ishlab chiqarilgan Coveware kiber tovlamachilik hodisalariga javob berish xizmatlarini taqdim etishda davom etadi. Coveware sud tibbiyoti va remediatsiya imkoniyatlarini taklif qiladi ...
Bashoratli texnik xizmat ko'rsatish zavodlarni boshqarishga innovatsion va proaktiv yondashuv bilan neft va gaz sektorini inqilob qilmoqda.…