Informātika

Mašīnmācīšanās veidi

Termins mašīnmācīšanās (automātiskā mācīšanās) attiecas uz mehānismu kopumu, kas pieder mākslīgā intelekta pasaulei. Ir trīs mašīnmācīšanās veidi: uzraudzīta, neuzraudzīta un pastiprinoša mācīšanās.

Šie mehānismi ļauj viedai mašīnai laika gaitā uzlabot savas iespējas un veiktspēju, automātiski apgūstot pieredzi ar noteiktu uzdevumu izpildi, laika gaitā arvien vairāk uzlabojot tā veiktspēju.

Piemērs ir AlphaGo, Mašīnmācīšanās programmatūra spēlei Go, ko izstrādāja Deepmind. AlpaGo bija pirmā programmatūra, kas spēj uzvarēt cilvēku meistaru spēlē lidmašīnā Gobans standarta izmērs (19 × 19). AlphaGo programmatūra tika izglītota, novērojot miljoniem kustību, ko Go spēlētāji veica dažādu spēļu laikā, un liekot mašīnai spēlēt pret sevi, kā rezultātā tā spēja pārspēt to, kurš tika uzskatīts par labāko spēlētāju pasaulē.

Tagad apskatīsim trīs galvenās mašīnmācības kategorijas.

Uzraudzīta mācīšanās

Sistēma saņem piemērus, kas marķēti atbilstoši vēlamajai izvadei. Tas nozīmē, ka datu kopas, kas ir noderīgas mašīnas instrukcijām, sastāv no elementiem, kas atspoguļo reālas situācijas, ko veido ievades dati.funkcijas"Un no izejas datiem"mērķis". Atsaucoties uz raksta piemēru Kas ir mašīnmācīšanās, kas tā ir un tās mērķi, apmācību sagatavošana bija pārraudzīta tipa, jo mums bija atsevišķi maršrutu gadījumi, katram no kuriem tika norādītas pazīmes (transportlīdzeklis, maršruts) un mērķis (ceļa laiks). Datu kopas parasti ir daudz sarežģītākas, piemērs bija ārkārtīgi ierobežots un didaktisks, lai vienkāršotu izpratni par uzraudzīto mašīnmācīšanos.

Šāda veida gadījums ļauj algoritmam izpētīt maršruta un transportlīdzekļa veida bāzi, kāds varētu būt brauciena laiks. Uzraudzītajā mašīnmācībā ir divu veidu problēmas:

regresija: ja mērķi veido nepārtraukts mainīgais, tas ir, daudzums, skaitlis;
klasifikācija: ja mērķi var attēlot ar klasi vai kategoriju.

Pārskatot automaģistrāļu maršrutu piemēru, varam teikt, ka tā ir regresija. Ja mērķis sastāvēja no novērtējuma, piemēram: ātri, ja mazāk nekā stundu, lēni no 1 līdz divām stundām, ļoti lēni, ja ilgāk par divām stundām. Šajā gadījumā tā būtu bijusi klasifikācijas problēma.

Mācības bez uzraudzības

Nav marķētu datu, tā ir sistēma, kurai, sākot no ievadiem, datos jāatrod struktūra. Mums praktiski nav mērķu, bet tikai ievaddati. It kā piemērā mums būtu tikai maršruta un transportlīdzekļa dati, bet ne ceļojuma laika dati.

Šajā pieejā algoritmiem ir jāidentificē kategorijas, meklējot datos slēptās struktūras. Galvenie rīki, ko var izmantot bez uzraudzības, ir Grupēšana un asociācijas noteikumi.

Pastiprināšanas mācības

Sistēma saņem ievadi no vides un veic darbības. Sistēma mēģina veikt darbības, lai saņemtu atlīdzību. Sistēma mēģinās īstenot darbības, kas optimizē atlīdzību atkarībā no apkārtējās vides stāvokļa.

Atlīdzības sistēma tiek īstenota, izmantojot komponentu, ko sauc aģents. Aģents izlemj, kādu darbību veikt ar vidi, un no tā saņem atlīdzība un, iespējams, informācija par vides stāvokli uzsāktās darbības rezultātā.

Piemēram, ja mēs domājam par sistēmu, kas paredzēta šaha spēlei, aģents ir sastāvdaļa, kas izlemj gājienu, vide ir pati spēle. Katra aģenta veiktā gājiena rezultātā mainās spēles stāvoklis (to saprot kā pašreizējo situāciju, visu figūru novietojumu, arī kā pretinieka gājiena sekas), saņemot atgriezenisko saiti kā pretinieka figūru apēstu, tāpēc paredzēts kā atlīdzība par pārvietošanos. Tādā veidā aģents mācās un izglīto sevi.

secinājumi

Tāpēc ir skaidrs, ka izvēle starp mašīnmācības veidiem ir atkarīga no konteksta. Tas ir, pieejas veids tiek izvēlēts, pamatojoties uz pieejamajiem datiem un iespēju iegūt vēsturi, kas ietver katra atsevišķa gadījuma apstākļu aprakstu (ievade), kā arī rezultātu (izeju). Tātad, izmantojot šāda veida datu kopu, varat turpināt izmantot uzraudzītu pieeju.

No otras puses, ja jums nav iespējas a priori zināt izejas datus (mērķi) vai vēlaties atklāt jaunus mērķus, tad ir nepieciešams identificēt saiknes starp ievades datiem, lai atklātu apstākļus, kas nekad nav pieredzēti vēsturi vai mācīšanos pret vidi, kas attīstās un reaģē. Šajā gadījumā ir jāizvēlas bez uzraudzības vai pastiprināšanas paņēmieni.

Ercole Palmeri: Atkarīgi no inovācijām