Þessir búnaðir gera kleift að greindur vél geti bætt getu sína og frammistöðu með tímanum, sjálfkrafa að læra með reynslu til að framkvæma ákveðin verkefni, bæta árangur hennar meira og meira með tímanum.
Dæmi er AlphaGo, Machine Learning hugbúnaður fyrir Go leikinn þróaður af DeepMind. AlpaGo var fyrsti hugbúnaðurinn sem var fær um að sigra mannlegan meistara í leiknum í flugvél goban staðlað stærð (19 × 19). AlphaGo hugbúnaðurinn var menntaður með því að fylgjast með milljónum hreyfinga sem Go leikmenn gerðu í mismunandi leikjum og láta vélina spila á móti sjálfri sér, með þeim afleiðingum að hún gat sigrað það sem talið var vera besti leikmaðurinn í heimi þessa leiks.
Við skulum nú fara í þrjá meginflokka vélanáms.
Kerfið fær dæmi merkt í samræmi við æskilegan útgang. Það er að gagnasöfnin sem eru gagnleg til að kenna vélinni eru samsett úr þáttum sem tákna raunverulegar aðstæður sem samanstanda af inntaksgögnum "Lögun"Og frá úttaksgögnum"miða". Með vísan í dæmi greinarinnar Hvað er vélanám, um hvað snýst það og markmið þess, undirbúningur þjálfunarinnar var af eftirlitsgerð þar sem við höfðum einstök tilvik um leiðir, fyrir hverja þeirra eiginleika (ökutæki, leið) og markmið (ferðatími) voru tilgreindir. Gagnasöfn eru yfirleitt mun flóknari, dæmið var afar takmarkað og kennslufræðilegt, með það að markmiði að einfalda skilning á Supervised Machine Learning.
Tilfelli af þessari gerð gerir reikniritinu kleift að rannsaka grundvöll tegundar leiðar og farartækis, hver gæti verið ferðatíminn. Það eru tvenns konar vandamál í vélanámi undir eftirliti:
Ef við endurskoðum dæmið um hraðbrautaleiðir getum við sagt að það sé afturför. Ef markið fólst í mati eins og: hratt ef undir klukkutíma, hægt á milli 1 og tveggja klukkustunda, mjög hægt ef meira en tvær klukkustundir. Í þessu tilviki hefði það verið flokkunarvandamál.
Það eru engin merkt gögn, það er kerfið sem, út frá inntakinu, verður að finna uppbyggingu í gögnunum. Við höfum nánast engin markmið, heldur aðeins inntaksgögn. Eins og í dæminu hefðum við aðeins upplýsingar um leið og ökutæki, en ekki gögn um ferðatíma.
Í þessari nálgun verða reikniritin að bera kennsl á flokka með því að leita að falnum byggingum í gögnunum. Helstu verkfærin sem hægt er að nota í eftirlitslausri nálgun eru þyrping og reglum samtakanna.
Kerfið fær inntak frá umhverfinu og grípur til aðgerða. Kerfið reynir að grípa til aðgerða til að fá verðlaun. Kerfið mun reyna að innleiða aðgerðir sem hámarka verðlaunin eftir ástandi umhverfisins í kring.
Verðlaunakerfið er útfært í gegnum hluti sem kallast umboðsmaður. Umboðsmaður ákveður aðgerð sem á að framkvæma á umhverfinu og úr því fær hann eina verðlaun og hugsanlega upplýsingar um ástand umhverfisins, sem afleiðing af aðgerðinni sem hafin var.
Til dæmis, ef við hugsum um kerfi tileinkað skák, þá er umboðsmaðurinn sá þáttur sem ræður ferðinni, umhverfið er leikurinn sjálfur. Sem afleiðing af hverri einustu hreyfingu sem umboðsmaðurinn gerir breytist staða leiksins (skilið sem núverandi ástand, stöðu allra hluta, einnig sem afleiðing af hreyfingu andstæðingsins), fær viðbrögð sem bit andstæðingsins sem er étinn, því ætlað sem verðlaun fyrir flutninginn. Þannig lærir umboðsmaðurinn og menntar sig.
Það er því augljóst að valið á milli tegunda vélanáms fer eftir samhenginu. Það er að segja að tegund nálgunar er valin á grundvelli fyrirliggjandi gagna og möguleika á að hafa sögu sem felur í sér lýsingu á aðstæðum hvers einstaks máls (inntak), og einnig niðurstöðu (úttak). Þannig að með gagnasetti af þessari gerð geturðu haldið áfram að nota eftirlitsaðferð.
Ef þú hefur aftur á móti ekki möguleika á að þekkja úttaksgögnin (markmiðið) fyrirfram, eða þú vilt uppgötva ný markmið, þá er nauðsynlegt að bera kennsl á tengsl milli inntaksgagnanna til að uppgötva aðstæður sem aldrei hafa upplifað í sögu, eða að horfast í augu við nám í átt að umhverfi sem þróast og bregst við. Í þessu tilviki er nauðsynlegt að velja eftirlitslausa eða styrkingartækni.
Ercole Palmeri: Nýsköpunarfíkill
Að þróa fínhreyfingar með litun undirbýr börn fyrir flóknari færni eins og að skrifa. Að lita…
Flotageirinn er sannkallað alþjóðlegt efnahagsveldi sem hefur siglt í átt að 150 milljarða markaði...
Síðasta mánudag tilkynnti Financial Times um samning við OpenAI. FT leyfir heimsklassa blaðamennsku…
Milljónir manna borga fyrir streymisþjónustu og greiða mánaðarlega áskriftargjöld. Það er almenn skoðun að þú…