Informatică

Tipuri de învățare automată

Termenul Machine Learning (învățare automată) se referă la un set de mecanisme aparținând lumii inteligenței artificiale. Există trei tipuri de învățare automată: învățare supravegheată, nesupravegheată și învățare prin întărire.

Aceste mecanisme permit unei mașini inteligente să-și îmbunătățească capacitățile și performanțele în timp, învățând automat cu experiență să îndeplinească anumite sarcini, îmbunătățindu-și performanțele din ce în ce mai mult în timp. 

Un exemplu este AlphaGo, software de învățare automată pentru jocul Go dezvoltat de DeepMind. AlpaGo a fost primul software capabil să învingă un maestru uman în joc într-un avion goban dimensiune standard (19 × 19). Software-ul AlphaGo a fost educat prin observarea a milioane de mișcări făcute de jucătorii Go în timpul diferitelor jocuri și ca aparatul să joace împotriva ei înșiși, astfel încât a reușit să învingă ceea ce se credea a fi cel mai bun jucător din lume al acestui joc.

Să trecem acum la cele trei categorii principale de învățare automată.

Învățare supravegheată

Sistemul primește exemple etichetate în funcție de rezultatul dorit. Adică seturile de date utile pentru instruirea mașinii sunt alcătuite din elemente care reprezintă situații reale formate din date de intrare”caracteristici„Și din datele de ieșire”ţintă". Cu referire la exemplul articolului Ce este Machine Learning, despre ce este vorba și obiectivele sale, pregătirea antrenamentului a fost de tip supravegheat întrucât am avut cazuri individuale de trasee, pentru fiecare dintre acestea fiind specificate caracteristici (vehicul, traseu) și țintă (timp de călătorie). Seturile de date sunt de obicei mult mai complexe, exemplul a fost extrem de limitat și didactic, cu scopul de a simplifica înțelegerea învățării automate supravegheate.

Un caz de acest tip permite algoritmului să studieze baza tipului de rută și vehicul, care ar putea fi timpul de călătorie. Există două tipuri de probleme în învățarea automată supravegheată:

  1. regresiune: când ținta este alcătuită dintr-o variabilă continuă, adică o cantitate, un număr;
  2. clasificare: când ținta poate fi reprezentată printr-o clasă sau categorie.

Reluând exemplul traseelor ​​de autostradă, putem spune că este o regresie. Dacă ținta a constat într-o evaluare precum: rapid dacă mai puțin de o oră, încet între 1 și două ore, foarte lent dacă peste două ore. În acest caz ar fi fost o problemă de clasificare.

Învățare nesupravegheată

Nu există date etichetate, este sistemul care, pornind de la intrări, trebuie să găsească o structură în date. Practic nu avem ținte, ci doar date de intrare. Ca și cum în exemplu am avea doar datele despre rută și vehicul, dar nu și datele despre timpul de călătorie.

În această abordare, algoritmii trebuie să identifice categorii prin căutarea structurilor ascunse în date. Principalele instrumente care pot fi utilizate în abordarea nesupravegheată sunt clustering și regulile de asociere.

Buletin informativ de inovare
Nu rata cele mai importante știri despre inovație. Înscrieți-vă pentru a le primi pe e-mail.

Consolidarea învățării

Sistemul primește input de la mediu și întreprinde acțiuni. Sistemul încearcă să întreprindă acțiuni pentru a primi recompense. Sistemul va încerca să implementeze acțiuni care să optimizeze recompensa în funcție de starea mediului înconjurător. 

Sistemul de recompense este implementat printr-o componentă, numită agent. Agentul decide o acțiune care urmează să fie efectuată asupra mediului și din aceasta primește una recompensă si eventual informatii despre starea mediului inconjurator, ca o consecinta a actiunii initiate.

De exemplu, dacă ne gândim la un sistem dedicat jocului de șah, agentul este componenta care decide mutarea, mediul este jocul în sine. Ca o consecință a fiecărei mișcări efectuate de agent, starea jocului se schimbă (înțeles ca situație curentă, poziția tuturor pieselor, și ca o consecință a mișcării adversarului), primind feedback ca piesă mâncată a adversarului, deci menit ca o recompensă pentru mutare. În acest fel, agentul învață și se educă singur.

concluzii

Prin urmare, este evident că alegerea între tipurile de învățare automată depinde de context. Adică, tipul de abordare este ales pe baza datelor disponibile și a posibilității de a avea un istoric care să includă descrierea circumstanțelor fiecărui caz individual (input), precum și un rezultat (ieșire). Deci, cu un set de date de acest tip, puteți continua să utilizați o abordare supravegheată.

Dacă, pe de altă parte, nu aveți posibilitatea de a cunoaște datele de ieșire (țintă) a priori, sau doriți să descoperiți noi ținte, atunci este necesar să identificați legături între datele de intrare pentru a descoperi circumstanțe niciodată experimentate în istorie, sau să înfrunte o învățare față de un mediu care evoluează și reacționează. In acest caz este necesar sa optezi pentru tehnici nesupravegheate sau de intarire.

Ercole Palmeri: dependent de inovație


Buletin informativ de inovare
Nu rata cele mai importante știri despre inovație. Înscrieți-vă pentru a le primi pe e-mail.

Articole recente

Plăți online: Iată cum serviciile de streaming vă fac să plătiți pentru totdeauna

Milioane de oameni plătesc pentru serviciile de streaming, plătind taxe lunare de abonament. Este o părere comună că tu...

Aprilie 29 2024

Veeam oferă cel mai complet suport pentru ransomware, de la protecție la răspuns și recuperare

Coveware de la Veeam va continua să ofere servicii de răspuns la incidente de extorcare cibernetică. Coveware va oferi capacități criminalistice și de remediere...

Aprilie 23 2024

Revoluția verde și digitală: cum întreținerea predictivă transformă industria petrolului și gazelor

Întreținerea predictivă revoluționează sectorul petrolului și gazelor, cu o abordare inovatoare și proactivă a managementului uzinelor...

Aprilie 22 2024

Autoritatea de reglementare antitrust din Marea Britanie ridică alarma BigTech cu privire la GenAI

CMA din Marea Britanie a emis un avertisment cu privire la comportamentul Big Tech pe piața inteligenței artificiale. Acolo…

Aprilie 18 2024