Informatica

Soorten machine learning

De term Machine Learning (automatisch leren) verwijst naar een reeks mechanismen die behoren tot de wereld van kunstmatige intelligentie. Er zijn drie soorten machine learning: begeleid, niet-gesuperviseerd en versterkend leren.

Deze mechanismen stellen een intelligente machine in staat om zijn mogelijkheden en prestaties in de loop van de tijd te verbeteren, automatisch te leren met ervaring om bepaalde taken uit te voeren, waardoor de prestaties in de loop van de tijd steeds beter worden.

Een voorbeeld is AlphaGo, Machine Learning-software voor de Go-game ontwikkeld door DeepMind. AlpaGo was de eerste software die in staat was om een menselijke meester in het spel in een vliegtuig te verslaan goban standaardformaat (19 × 19). De AlphaGo-software is ontwikkeld door miljoenen zetten van Go-spelers tijdens verschillende spellen te observeren en de machine tegen zichzelf te laten spelen, met als resultaat dat het in staat was om de beste speler ter wereld van dit spel te verslaan.

Laten we nu ingaan op de drie hoofdcategorieën van machine learning.

Leren onder toezicht

Het systeem ontvangt voorbeelden gelabeld volgens de gewenste output. Dat wil zeggen dat de datasets die nuttig zijn voor het instrueren van de machine bestaan uit elementen die reële situaties vertegenwoordigen die zijn samengesteld uit invoergegevens "functionaliteiten"En van uitvoergegevens"doel". Met verwijzing naar het voorbeeld van het artikel Wat is Machine Learning, waar gaat het over en wat zijn de doelen ervan?, was de voorbereiding van de training van het type onder toezicht, aangezien we individuele gevallen van routes hadden, voor elk waarvan kenmerken (voertuig, route) en doel (reistijd) werden gespecificeerd. Datasets zijn meestal veel complexer, het voorbeeld was extreem beperkt en didactisch, met als doel het begrip van Supervised Machine Learning te vereenvoudigen.

Een geval van dit type stelt het algoritme in staat om de basis van het type route en voertuig te bestuderen, wat de reistijd zou kunnen zijn. Er zijn twee soorten problemen bij gesuperviseerd machine learning:

regressie: wanneer het doel bestaat uit een continue variabele, dat is een grootheid, een getal;
classificatie: wanneer het doel kan worden weergegeven door een klasse of categorie.

Als we het voorbeeld van snelwegroutes heroverwegen, kunnen we zeggen dat het een regressie is. Als het doel bestond uit een beoordeling zoals: snel als het minder dan een uur is, langzaam tussen 1 en twee uur, heel langzaam als het meer dan twee uur duurt. In dit geval zou het een classificatieprobleem zijn geweest.

Leren zonder toezicht

Er zijn geen gelabelde data, het is het systeem dat, uitgaande van de inputs, een structuur in de data moet zoeken. We hebben praktisch geen doelen, maar alleen invoergegevens. Alsof we in het voorbeeld alleen de route- en voertuiggegevens hadden, maar niet de reistijdgegevens.

In deze benadering moeten de algoritmen categorieën identificeren door te zoeken naar verborgen structuren in de gegevens. De belangrijkste instrumenten die kunnen worden gebruikt in de niet-gesuperviseerde benadering zijn de: clustering en verenigingsregels.

Versterkend leren

Het systeem ontvangt input van de omgeving en onderneemt acties. Het systeem probeert acties te ondernemen om beloningen te ontvangen. Het systeem zal proberen acties te implementeren die de beloning optimaliseren, afhankelijk van de toestand van de omgeving.

Het beloningssysteem wordt geïmplementeerd via een component, genaamd agent. De agent besluit een actie op het milieu uit te voeren en ontvangt hiervan een beloning en eventueel informatie over de toestand van het milieu als gevolg van de ingezette actie.

Als we bijvoorbeeld denken aan een systeem dat is toegewijd aan het schaakspel, is de agent het onderdeel dat de zet bepaalt, de omgeving is het spel zelf. Als gevolg van elke zet van de agent verandert de staat van het spel (begrepen als de huidige situatie, positie van alle stukken, ook als gevolg van de zet van de tegenstander), feedback ontvangen als een stuk van een tegenstander opgegeten, dus bedoeld als beloning voor de verhuizing. Op deze manier leert de agent en leidt hij zichzelf op.

conclusies

Het is dan ook evident dat de keuze tussen de soorten machine learning afhangt van de context. Dat wil zeggen, het type aanpak wordt gekozen op basis van de beschikbare gegevens en de mogelijkheid om een geschiedenis te hebben die de beschrijving van de omstandigheden van elk individueel geval (input), en ook een resultaat (output) omvat. Met zo'n dataset kun je dus overgaan tot een gesuperviseerde aanpak.

Als u daarentegen niet de mogelijkheid hebt om de outputgegevens (target) a priori te kennen, of als u nieuwe targets wilt ontdekken, dan is het noodzakelijk om verbanden tussen de inputgegevens te identificeren om omstandigheden te ontdekken die nooit eerder in de geschiedenis, of om het hoofd te bieden aan een leerproces naar een omgeving die evolueert en reageert. In dit geval is het noodzakelijk om te kiezen voor onbewaakte of wapeningstechnieken.

Ercole Palmeri: Innovatie verslaafd