Informatik

Typer av maskininlärning

Termen Machine Learning (automatisk inlärning) syftar på en uppsättning mekanismer som hör till världen av artificiell intelligens. Det finns tre typer av maskininlärning: övervakad, oövervakad och förstärkningsinlärning.

Dessa mekanismer gör det möjligt för en intelligent maskin att förbättra dess kapacitet och prestanda över tid, automatiskt lära med erfarenhet för att utföra vissa uppgifter, förbättra dess prestanda mer och mer med tiden.

Ett exempel är AlphaGo, Machine Learning programvara för Go-spelet utvecklat av Deepmind. AlpaGo var den första programvaran som kunde besegra en mänsklig mästare i spelet på ett plan goban standardstorlek (19 × 19). AlphaGo-mjukvaran utbildades genom att observera miljontals drag gjorda av Go-spelare under olika spel, och låta maskinen spela mot sig själv, med resultatet att den kunde slå vad som ansågs vara den bästa spelaren i detta spels värld.

Låt oss nu gå in på de tre huvudkategorierna för maskininlärning.

Övervakat lärande

Systemet tar emot exempel märkta enligt önskad utdata. Det vill säga, datauppsättningarna som är användbara för att instruera maskinen består av element som representerar verkliga situationer som består av indata "pass"Och från utdata"mål". Med hänvisning till exemplet i artikeln Vad är Machine Learning, vad det handlar om och dess mål, förberedelserna av utbildningen var av den övervakade typen då vi hade individuella fall av rutter, för var och en av vilka egenskaper (fordon, rutt) och mål (restid) specificerades. Datauppsättningar är vanligtvis mycket mer komplexa, exemplet var extremt begränsat och didaktiskt, med syftet att förenkla förståelsen av Supervised Machine Learning.

Ett fall av denna typ gör att algoritmen kan studera grunden för typen av rutt och fordon, vad som kan vara restiden. Det finns två typer av problem i övervakad maskininlärning:

regression: när målet består av en kontinuerlig variabel, det vill säga en kvantitet, ett tal;
klassificering: när målet kan representeras av en klass eller kategori.

Om vi ser över exemplet med motorvägsrutter kan vi säga att det är en regression. Om målet bestod av en bedömning som: snabbt om under en timme, långsamt mellan 1 och två timmar, mycket långsamt om över två timmar. I det här fallet skulle det ha varit ett klassificeringsproblem.

Oövervakat lärande

Det finns inga märkta data, det är systemet som med utgångspunkt från ingångarna måste hitta en struktur i datan. Vi har praktiskt taget inga mål, utan bara indata. Som om vi i exemplet bara hade rutt- och fordonsdata, men inte restidsdata.

I detta tillvägagångssätt måste algoritmerna identifiera kategorier genom att leta efter dolda strukturer i datan. De viktigaste verktygen som kan användas i det oövervakade tillvägagångssättet är klustring och föreningens regler.

Förstärkningsinlärning

Systemet tar emot input från omgivningen och vidtar åtgärder. Systemet försöker vidta åtgärder för att få belöningar. Systemet kommer att försöka implementera åtgärder som optimerar belöningen beroende på tillståndet i den omgivande miljön.

Belöningssystemet implementeras genom en komponent som kallas medel. Agenten bestämmer en åtgärd som ska utföras på miljön och från detta får han en pris och eventuellt information om miljöns tillstånd, som en konsekvens av den inledda åtgärden.

Om vi till exempel tänker på ett system dedikerat till schackspelet är agenten komponenten som bestämmer draget, miljön är själva spelet. Som en konsekvens av varje enskilt drag som görs av agenten förändras spelets tillstånd (förstått som den aktuella situationen, positionen för alla pjäser, även som en konsekvens av motståndarens drag), får feedback som en motståndares pjäs som äts, därför tänkt som en belöning för flytten. På detta sätt lär sig agenten och utbildar sig själv.

Slutsatser

Det är därför uppenbart att valet mellan typerna av maskininlärning beror på sammanhanget. Det vill säga att typen av tillvägagångssätt väljs utifrån tillgängliga data och möjligheten att ha en historik som inkluderar beskrivningen av omständigheterna i varje enskilt fall (input), och även ett resultat (output). Så med en datamängd av denna typ kan du fortsätta att använda ett övervakat tillvägagångssätt.

Om du å andra sidan inte har möjlighet att känna till utdata (mål) a priori, eller om du vill upptäcka nya mål, då är det nödvändigt att identifiera länkar mellan indata för att upptäcka omständigheter som aldrig upplevts i historia, eller att möta ett lärande mot en miljö som utvecklas och reagerar. I detta fall är det nödvändigt att välja oövervakade tekniker eller förstärkningstekniker.

Ercole Palmeri: Innovationsberoende