Компьютерийн

Машины сургалтын төрлүүд

Машины сургалт (автомат сурах) гэдэг нь хиймэл оюун ухааны ертөнцөд хамаарах механизмуудын багцыг хэлдэг. Машин сургалтын гурван төрөл байдаг: хяналттай, хяналтгүй, бататгасан сургалт.

Эдгээр механизмууд нь ухаалаг машинд цаг хугацаа өнгөрөх тусам чадвар, гүйцэтгэлийг сайжруулах, тодорхой ажлуудыг гүйцэтгэх туршлагатай автоматаар суралцах боломжийг олгодог. 

Жишээ нь AlphaGo, Go тоглоомын машин сургалтын программ хангамжийг боловсруулсан Deepmind. AlpaGo бол онгоцонд тоглохдоо хүний ​​мастерыг ялах чадвартай анхны программ хангамж юм Гобан стандарт хэмжээ (19 × 19). AlphaGo программ хангамж нь янз бүрийн тоглоомын үеэр Go тоглогчдын хийсэн сая сая нүүдлийг ажиглаж, машин өөрийн эсрэг тоглох замаар боловсрол эзэмшсэн бөгөөд үр дүнд нь энэ тоглоомын дэлхийн шилдэг тоглогч гэж үздэг байсан тоглогчийг ялж чадсан юм.

Одоо машин сургалтын гурван үндсэн ангилалд орцгооё.

Хяналттай суралцах

Систем нь хүссэн гаралтын дагуу хаяглагдсан жишээнүүдийг хүлээн авдаг. Өөрөөр хэлбэл, машиныг зааварлахад хэрэгтэй өгөгдлийн багц нь оролтын өгөгдлөөс бүрдсэн бодит нөхцөл байдлыг илэрхийлэх элементүүдээс бүрддэг.онцлог"Мөн гаралтын өгөгдлөөс"зорилтот". Өгүүллийн жишээн дээр үндэслэн Машины сургалт гэж юу вэ, энэ нь юу вэ, түүний зорилго, сургалтын бэлтгэл нь хяналттай төрлийн байсан тул бид тус бүрдээ онцлог (тээврийн хэрэгсэл, маршрут) болон зорилтот (аяллын хугацаа) тодорхойлогдсон маршрутын тохиолдол байдаг. Мэдээллийн багц нь ихэвчлэн илүү төвөгтэй байдаг, жишээ нь хяналттай машин сургалтын талаарх ойлголтыг хялбарчлах зорилгоор маш хязгаарлагдмал, дидактик байсан.

Энэ төрлийн тохиолдол нь алгоритмд маршрут, тээврийн хэрэгслийн төрлийг судлах боломжийг олгодог, аяллын хугацаа ямар байж болох юм. Хяналттай машин сургалтын хоёр төрлийн асуудал байдаг:

  1. регресс: зорилт нь тасралтгүй хувьсагчаас бүрдэх үед, энэ нь хэмжигдэхүүн, тоо;
  2. ангилал: зорилтот анги эсвэл ангиллаар төлөөлөх боломжтой үед.

Авто замын маршрутын жишээг дахин авч үзвэл энэ нь регресс гэж хэлж болно. Хэрэв зорилтот үнэлгээ нь: нэг цагаас бага бол хурдан, 1-XNUMX цагийн хооронд удаашруулна, хоёр цагаас илүү бол маш удаан. Энэ тохиолдолд ангиллын асуудал байх болно.

Хяналтгүй суралцах

Шошгологдсон өгөгдөл байхгүй, энэ нь оролтоос эхлээд өгөгдлийн бүтцийг олох ёстой систем юм. Бидэнд бараг ямар ч зорилго байхгүй, зөвхөн өгөгдөл оруулдаг. Жишээн дээр бид зөвхөн зам, тээврийн хэрэгслийн мэдээлэлтэй байсан ч аяллын цагийн мэдээлэл байгаагүй юм шиг.

Энэ аргын хувьд алгоритмууд нь өгөгдлийн далд бүтцийг хайх замаар категориудыг тодорхойлох ёстой. Хяналтгүй арга барилд ашиглаж болох гол хэрэгслүүд нь clustering болон холбооны дүрэм.

Инновацийн мэдээллийн товхимол
Инновацийн талаарх хамгийн чухал мэдээг бүү алдаарай. Тэднийг имэйлээр хүлээн авахын тулд бүртгүүлнэ үү.

Бататгах сургалт

Систем нь орчноос мэдээлэл хүлээн авч, арга хэмжээ авдаг. Систем нь шагнал авахын тулд арга хэмжээ авахыг оролддог. Систем нь хүрээлэн буй орчны төлөв байдлаас шалтгаалан урамшууллыг оновчтой болгох арга хэмжээг хэрэгжүүлэхийг хичээх болно. 

Шагналын систем нь бүрэлдэхүүн хэсэгээр дамжин хэрэгждэг агент. Агент нь хүрээлэн буй орчинд ямар арга хэмжээ авахаа шийдэж, үүнээс нэгийг нь хүлээн авдаг шагнал эхлүүлсэн арга хэмжээний үр дүнд хүрээлэн буй орчны төлөв байдлын талаарх мэдээлэл байж магадгүй.

Жишээлбэл, хэрэв бид шатрын тоглоомд зориулагдсан системийг бодох юм бол төлөөлөгч нь нүүдлийг шийддэг бүрэлдэхүүн хэсэг, орчин бол тоглоом өөрөө юм. Агентын хийсэн нэг нүүдлийн үр дүнд тоглоомын байдал өөрчлөгддөг (одоогийн нөхцөл байдал, бүх тасгийн байрлал, мөн өрсөлдөгчийн нүүдлийн үр дагавар гэж ойлгогддог), өрсөлдөгчийн бөмбөг идсэн мэт санал хүсэлтийг хүлээн авдаг. нүүдлийн шагнал болгон өгөх зорилготой. Ингэж төлөөлөгч өөрөө суралцаж, өөрийгөө хүмүүжүүлдэг.

Дүгнэлт

Тиймээс машин сургалтын төрлүүдийн хоорондох сонголт нь нөхцөл байдлаас хамаардаг нь тодорхой байна. Өөрөөр хэлбэл, хандлагын төрлийг байгаа өгөгдөл, тухайн тохиолдол бүрийн нөхцөл байдлын тайлбар (оролт), үр дүн (гаралт) агуулсан түүхтэй байх боломж дээр үндэслэн сонгоно. Иймд ийм төрлийн өгөгдлийн багцтай бол та хяналттай аргыг ашиглаж болно.

Нөгөө талаас, хэрэв танд гаралтын өгөгдлийг (зорилтот) априори мэдэх боломж байхгүй эсвэл шинэ зорилтуудыг олж мэдэхийг хүсч байгаа бол оролтын өгөгдлүүдийн хоорондын холбоосыг тодорхойлох шаардлагатай. түүх, эсвэл хувьсан өөрчлөгдөж, хариу үйлдэл үзүүлэх орчин руу суралцах. Энэ тохиолдолд хяналтгүй эсвэл бэхжүүлэх арга техникийг сонгох шаардлагатай.

Ercole Palmeri: Инновацид донтсон


Инновацийн мэдээллийн товхимол
Инновацийн талаарх хамгийн чухал мэдээг бүү алдаарай. Тэднийг имэйлээр хүлээн авахын тулд бүртгүүлнэ үү.

Сүүлийн үеийн нийтлэл

Ирээдүй энд байна: Тээвэрлэлтийн салбар дэлхийн эдийн засагт хэрхэн хувьсгал хийж байна

Тэнгисийн цэргийн салбар бол 150 тэрбумын зах зээл рүү тэмүүлсэн дэлхийн эдийн засгийн жинхэнэ хүч юм...

1 нь 2024 байж болно

Хэвлэн нийтлэгчид болон OpenAI нар хиймэл оюун ухаанаар боловсруулсан мэдээллийн урсгалыг зохицуулах гэрээнд гарын үсэг зурав.

Өнгөрсөн даваа гарагт Financial Times сонин OpenAI-тай гэрээ байгуулснаа зарлав. FT нь дэлхийн жишигт нийцсэн сэтгүүлзүйн лицензийг олгодог ...

30 Дөрөвдүгээр сар 2024

Онлайн төлбөр: Стрийминг үйлчилгээ нь таныг хэрхэн үүрд төлөхийг эндээс харна уу

Сая сая хүмүүс стриминг үйлчилгээний төлбөр төлж, сар бүр захиалгын хураамж төлдөг. Таны нийтлэг ойлголт бол ...

29 Дөрөвдүгээр сар 2024

Veeam нь хамгаалалтаас авахуулаад хариу арга хэмжээ авах, сэргээх хүртэл ransomware-ийн хамгийн цогц дэмжлэгийг үзүүлдэг

Coveware by Veeam нь кибер хулгайн гэмт хэргийн хариу арга хэмжээг үргэлжлүүлэн үзүүлэх болно. Coveware нь шүүх эмнэлэг, нөхөн сэргээх чадварыг санал болгоно ...

23 Дөрөвдүгээр сар 2024

Инновацийг өөрийн хэлээр уншаарай

Инновацийн мэдээллийн товхимол
Инновацийн талаарх хамгийн чухал мэдээг бүү алдаарай. Тэднийг имэйлээр хүлээн авахын тулд бүртгүүлнэ үү.

биднийг дагаарай