računalnik

Vrste strojnega učenja

Izraz strojno učenje (samodejno učenje) se nanaša na nabor mehanizmov, ki pripadajo svetu umetne inteligence. Obstajajo tri vrste strojnega učenja: nadzorovano, nenadzorovano in učenje s krepitvijo.

Ti mehanizmi omogočajo inteligentnemu stroju, da sčasoma izboljša svoje zmogljivosti in zmogljivosti, samodejno se z izkušnjami uči izvajati določene naloge in sčasoma vedno bolj izboljšuje njegovo delovanje.

Primer je AlphaGo, programsko opremo za strojno učenje za igro Go, ki jo je razvil Deepmind. AlpaGo je bila prva programska oprema, ki je lahko premagala človeškega gospodarja v igri na letalu goban standardna velikost (19 × 19). Programska oprema AlphaGo je bila izobražena z opazovanjem milijonov potez, ki so jih naredili igralci Go med različnimi igrami, in s tem, da je stroj igral sam s seboj, zaradi česar je lahko premagal tistega, za katerega se je verjelo, da je najboljši igralec na svetu te igre.

Pojdimo zdaj na tri glavne kategorije strojnega učenja.

Učenje pod nadzorom

Sistem prejme primere, označene glede na želeni rezultat. To pomeni, da so nizi podatkov, uporabni za poučevanje stroja, sestavljeni iz elementov, ki predstavljajo resnične situacije, sestavljene iz vhodnih podatkov.lastnosti"In iz izhodnih podatkov"ciljna". S sklicevanjem na primer članka Kaj je strojno učenje, za kaj gre in njegovi cilji, je bila priprava usposabljanja nadzorovanega tipa, saj smo imeli posamezne primere poti, za vsako izmed katerih so bile določene lastnosti (vozilo, pot) in cilj (čas potovanja). Podatkovni nizi so običajno veliko bolj kompleksni, primer je bil izjemno omejen in didaktičen, z namenom poenostavitve razumevanja nadzorovanega strojnega učenja.

Primer te vrste omogoča algoritmu, da na podlagi vrste poti in vozila preuči, kakšen bi lahko bil čas potovanja. Pri nadzorovanem strojnem učenju obstajata dve vrsti težav:

regresija: ko je cilj sestavljen iz zvezne spremenljivke, to je količine, števila;
razvrstitev: ko je cilj lahko predstavljen z razredom ali kategorijo.

Če ponovno pogledamo primer avtocestnih tras, lahko rečemo, da gre za regresijo. Če je bil cilj sestavljen iz ocene, kot je: hitro, če manj kot eno uro, počasi med 1 in dvema urama, zelo počasi, če več kot dve uri. V tem primeru bi šlo za problem klasifikacije.

Učenje brez nadzora

Ni označenih podatkov, sistem je tisti, ki mora, izhajajoč iz vnosov, najti strukturo v podatkih. Tarč praktično nimamo, ampak samo vhodne podatke. Kot da bi imeli v primeru samo podatke o poti in vozilu, ne pa tudi podatkov o času potovanja.

Pri tem pristopu morajo algoritmi identificirati kategorije z iskanjem skritih struktur v podatkih. Glavna orodja, ki jih je mogoče uporabiti pri nenadzorovanem pristopu, so grozdenje in pravila združenja.

Učenje s krepitvijo

Sistem sprejema vhodne podatke iz okolja in ukrepa. Sistem poskuša izvesti dejanja, da bi prejel nagrade. Sistem bo poskušal izvajati dejanja, ki optimizirajo nagrado glede na stanje okolja.

Sistem nagrajevanja je implementiran preko komponente, imenovane zastopnik. Agent se odloči za akcijo, ki jo bo izvedel v okolju, in jo od tega prejme nagrada in morebitne informacije o stanju okolja kot posledice začete akcije.

Na primer, če pomislimo na sistem, namenjen igri šaha, je agent komponenta, ki odloča o potezi, okolje je igra sama. Kot posledica vsake posamezne poteze agenta se spremeni stanje igre (razumljeno kot trenutna situacija, položaj vseh figur, tudi kot posledica nasprotnikove poteze), povratna informacija pa prejme kot nasprotnikova figura pojedena, torej namenjen kot nagrada za selitev. Na ta način se agent uči in izobražuje.

sklepi

Očitno je torej, da je izbira med vrstami strojnega učenja odvisna od konteksta. To pomeni, da se vrsta pristopa izbere na podlagi razpoložljivih podatkov in možnosti zgodovine, ki vključuje opis okoliščin vsakega posameznega primera (input) in tudi rezultat (output). Torej lahko z naborom podatkov te vrste nadaljujete z uporabo nadzorovanega pristopa.

Če po drugi strani nimate možnosti, da bi vnaprej poznali izhodne podatke (cilj), ali želite odkriti nove cilje, potem je treba identificirati povezave med vhodnimi podatki, da bi odkrili okoliščine, ki jih nikoli niste doživeli. zgodovine ali soočiti se z učenjem v okolju, ki se razvija in reagira. V tem primeru se je treba odločiti za nenadzorovane ali armirne tehnike.

Ercole Palmeri: Zasvojen z inovacijami