Informatikk

Typer maskinlæring

Begrepet Machine Learning (automatisk læring) refererer til et sett med mekanismer som tilhører verden av kunstig intelligens. Det er tre typer maskinlæring: overvåket, uovervåket og forsterkende læring.

Disse mekanismene lar en intelligent maskin forbedre sine evner og ytelser over tid, automatisk lære med erfaring å utføre visse oppgaver, forbedre ytelsen mer og mer over tid.

Et eksempel er AlphaGo, Machine Learning-programvare for Go-spillet utviklet av DeepMind. AlpaGo var den første programvaren som var i stand til å beseire en menneskelig mester i spillet på et fly goban standardstørrelse (19 × 19). AlphaGo-programvaren ble utdannet ved å observere millioner av bevegelser gjort av Go-spillere under forskjellige spill, og la maskinen spille mot seg selv, med det resultat at den var i stand til å slå det som ble antatt å være den beste spilleren i dette spillets verden.

La oss nå gå inn på de tre hovedkategoriene for maskinlæring.

Veiledet læring

Systemet mottar eksempler merket i henhold til ønsket utgang. Det vil si at datasettene som er nyttige for å instruere maskinen består av elementer som representerer reelle situasjoner som består av inndata "egenskaper"Og fra utdata"mål". Med henvisning til eksemplet på artikkelen Hva er Machine Learning, hva det handler om og dens mål, forberedelsen av opplæringen var av den veiledede typen da vi hadde enkelttilfeller av ruter, for hver av disse funksjonene (kjøretøy, rute) og mål (reisetid) var spesifisert. Datasett er vanligvis mye mer komplekse, eksemplet var ekstremt begrenset og didaktisk, med sikte på å forenkle forståelsen av Supervised Machine Learning.

Et tilfelle av denne typen lar algoritmen studere grunnlaget for rutetypen og kjøretøyet, hva som kan være reisetiden. Det er to typer problemer i overvåket maskinlæring:

regresjon: når målet består av en kontinuerlig variabel, det vil si en mengde, et tall;
klassifisering: når målet kan representeres av en klasse eller kategori.

Ved å revurdere eksemplet med motorveiruter kan vi si at det er en regresjon. Hvis målet besto av en vurdering som: rask hvis under en time, sakte mellom 1 og to timer, veldig sakte hvis over to timer. I dette tilfellet ville det vært et klassifiseringsproblem.

Uovervåket læring

Det er ingen merkede data, det er systemet som ut fra inngangene må finne en struktur i dataene. Vi har praktisk talt ingen mål, men kun inndata. Som om vi i eksemplet bare hadde rute- og kjøretøydata, men ikke reisetidsdata.

I denne tilnærmingen må algoritmene identifisere kategorier ved å se etter skjulte strukturer i dataene. De viktigste verktøyene som kan brukes i den uovervåkede tilnærmingen er gruppering og foreningens regler.

Forsterkende læring

Systemet mottar innspill fra omgivelsene og iverksetter handlinger. Systemet prøver å iverksette tiltak for å motta belønninger. Systemet vil prøve å implementere handlinger som optimaliserer belønningen avhengig av tilstanden til omgivelsene.

Belønningssystemet implementeres gjennom en komponent, kalt agenten. Agenten bestemmer en handling som skal utføres på miljøet og fra dette mottar han en belønning og eventuelt informasjon om miljøtilstanden, som en konsekvens av den igangsatte handlingen.

For eksempel, hvis vi tenker på et system dedikert til sjakkspillet, er agenten komponenten som bestemmer trekket, miljøet er selve spillet. Som en konsekvens av hvert enkelt trekk gjort av agenten, endres spillets tilstand (forstått som den nåværende situasjonen, plasseringen av alle brikkene, også som en konsekvens av motstanderens trekk), og mottar tilbakemelding som en motstanders brikke spist, derfor ment som en belønning for flyttingen. På denne måten lærer agenten og utdanner seg selv.

Konklusjoner

Det er derfor åpenbart at valget mellom typene maskinlæring avhenger av konteksten. Det vil si at type tilnærming velges på bakgrunn av tilgjengelige data og muligheten for å ha en historikk som inkluderer beskrivelsen av omstendighetene i hver enkelt sak (innspill), og også et resultat (output). Så med et datasett av denne typen kan du fortsette å bruke en overvåket tilnærming.

Hvis du på den annen side ikke har muligheten til å kjenne utdataene (målet) på forhånd, eller du ønsker å oppdage nye mål, er det nødvendig å identifisere koblinger mellom inndataene for å oppdage omstendigheter som aldri har vært opplevd i historie, eller å møte en læring mot et miljø som utvikler seg og reagerer. I dette tilfellet er det nødvendig å velge teknikker uten tilsyn eller forsterkning.

Ercole Palmeri: Innovasjonsavhengig