મશીન લર્નિંગના પ્રકાર

મશીન લર્નિંગ (ઓટોમેટિક લર્નિંગ) શબ્દ કૃત્રિમ બુદ્ધિમત્તાની દુનિયા સાથે જોડાયેલા મિકેનિઝમ્સના સમૂહનો સંદર્ભ આપે છે. મશીન લર્નિંગના ત્રણ પ્રકાર છે: સુપરવાઇઝ્ડ, અનસુપરવાઇઝ્ડ અને રિઇન્ફોર્સમેન્ટ લર્નિંગ.

આ પદ્ધતિઓ એક બુદ્ધિશાળી મશીનને સમય જતાં તેની ક્ષમતાઓ અને પ્રભાવમાં સુધારો કરવાની મંજૂરી આપે છે, આપમેળે અમુક કાર્યો કરવા માટે અનુભવ સાથે શીખી જાય છે, સમય જતાં તેના પ્રભાવને વધુને વધુ સુધારે છે.

એક ઉદાહરણ છે આલ્ફાગો, દ્વારા વિકસિત ગો ગેમ માટે મશીન લર્નિંગ સોફ્ટવેર Deepmind. અલ્પાગો એ પહેલું સોફ્ટવેર હતું જે પ્લેનમાં રમતમાં માનવ માસ્ટરને હરાવવા સક્ષમ હતું ગોબન પ્રમાણભૂત કદ (19 × 19). AlphaGo સોફ્ટવેરને વિવિધ રમતો દરમિયાન ગો ખેલાડીઓ દ્વારા કરવામાં આવતી લાખો ચાલોનું અવલોકન કરીને અને મશીનને પોતાની સામે રમતા રાખવાથી શિક્ષિત કરવામાં આવ્યું હતું, પરિણામે તે આ રમતના વિશ્વના શ્રેષ્ઠ ખેલાડી તરીકે માનવામાં આવતા તેને હરાવવામાં સક્ષમ હતું.

ચાલો હવે મશીન લર્નિંગની ત્રણ મુખ્ય શ્રેણીઓમાં જઈએ.

નિરીક્ષણ કરેલ શિક્ષણ

સિસ્ટમ ઇચ્છિત આઉટપુટ અનુસાર લેબલ થયેલ ઉદાહરણો મેળવે છે. એટલે કે, મશીનને સૂચના આપવા માટે ઉપયોગી ડેટાસેટ્સ એવા તત્વોથી બનેલા છે જે ઇનપુટ ડેટાથી બનેલી વાસ્તવિક પરિસ્થિતિઓનું પ્રતિનિધિત્વ કરે છે.વિશેષતા"અને આઉટપુટ ડેટામાંથી"લક્ષ્ય" લેખના ઉદાહરણના સંદર્ભમાં મશીન લર્નિંગ શું છે, તે શું છે અને તેના લક્ષ્યો, પ્રશિક્ષણની તૈયારી દેખરેખ હેઠળની હતી કારણ કે અમારી પાસે રૂટના વ્યક્તિગત કેસ હતા, જેમાં પ્રત્યેક સુવિધાઓ (વાહન, રૂટ) અને લક્ષ્ય (મુસાફરીનો સમય) નિર્દિષ્ટ કરવામાં આવ્યા હતા. ડેટા સેટ સામાન્ય રીતે વધુ જટિલ હોય છે, ઉદાહરણ અત્યંત મર્યાદિત અને ઉપદેશાત્મક હતું, જેનો ઉદ્દેશ્ય સુપરવાઇઝ્ડ મશીન લર્નિંગની સમજને સરળ બનાવવાનો હતો.

આ પ્રકારનો કેસ એલ્ગોરિધમને માર્ગ અને વાહનના પ્રકાર, મુસાફરીનો સમય શું હોઈ શકે તેના આધારે અભ્યાસ કરવાની મંજૂરી આપે છે. નિરીક્ષણ કરેલ મશીન લર્નિંગમાં બે પ્રકારની સમસ્યાઓ છે:

પ્રત્યાગમાન: જ્યારે લક્ષ્ય સતત ચલથી બનેલું હોય, તે એક જથ્થો છે, સંખ્યા;
વર્ગીકરણ: જ્યારે લક્ષ્ય વર્ગ અથવા શ્રેણી દ્વારા રજૂ કરી શકાય છે.

મોટરવે રૂટના ઉદાહરણ પર પુનર્વિચાર કરતા, આપણે કહી શકીએ કે તે રીગ્રેસન છે. જો લક્ષ્યમાં મૂલ્યાંકન શામેલ હોય જેમ કે: જો એક કલાકથી ઓછી હોય તો ઝડપી, 1 થી બે કલાકની વચ્ચે ધીમી, જો બે કલાકથી વધુ હોય તો ખૂબ જ ધીમું. આ કિસ્સામાં તે એક વર્ગીકરણ સમસ્યા હશે.

દેખરેખ વિનાનું શિક્ષણ

ત્યાં કોઈ લેબલ થયેલ ડેટા નથી, તે સિસ્ટમ છે જે ઇનપુટ્સથી શરૂ કરીને, ડેટામાં માળખું શોધવું આવશ્યક છે. અમારી પાસે વ્યવહારીક રીતે કોઈ લક્ષ્ય નથી, પરંતુ ફક્ત ડેટા ઇનપુટ છે. જેમ કે ઉદાહરણમાં અમારી પાસે માત્ર રૂટ અને વાહનનો ડેટા છે, પરંતુ મુસાફરીના સમયનો ડેટા નથી.

આ અભિગમમાં, અલ્ગોરિધમ્સે ડેટામાં છુપાયેલા બંધારણોને શોધીને શ્રેણીઓ ઓળખવી આવશ્યક છે. મુખ્ય ટૂલ્સ જેનો ઉપયોગ અસુરક્ષિત અભિગમમાં થઈ શકે છે તે છે ક્લસ્ટરીંગ અને સંગઠનના નિયમો.

મજબૂતીકરણ શિક્ષણ

સિસ્ટમ પર્યાવરણમાંથી ઇનપુટ મેળવે છે અને પગલાં લે છે. સિસ્ટમ પુરસ્કારો મેળવવા માટે પગલાં લેવાનો પ્રયાસ કરે છે. સિસ્ટમ આસપાસના વાતાવરણની સ્થિતિના આધારે પુરસ્કારને શ્રેષ્ઠ બનાવતી ક્રિયાઓ અમલમાં મૂકવાનો પ્રયાસ કરશે.

ઈનામ સિસ્ટમ એક ઘટક દ્વારા લાગુ કરવામાં આવે છે, જેને કહેવાય છે એજન્ટ. એજન્ટ પર્યાવરણ પર હાથ ધરવા માટેની ક્રિયા નક્કી કરે છે અને તેમાંથી તેને એક પ્રાપ્ત થાય છે પુરસ્કાર અને સંભવતઃ પર્યાવરણની સ્થિતિ વિશેની માહિતી, શરૂ કરાયેલી કાર્યવાહીના પરિણામ સ્વરૂપે.

ઉદાહરણ તરીકે, જો આપણે ચેસની રમતને સમર્પિત સિસ્ટમ વિશે વિચારીએ, તો એજન્ટ એ ઘટક છે જે ચાલ નક્કી કરે છે, પર્યાવરણ એ રમત છે. એજન્ટ દ્વારા કરવામાં આવતી દરેક એક ચાલના પરિણામ સ્વરૂપે, રમતની સ્થિતિ બદલાય છે (વર્તમાન પરિસ્થિતિ તરીકે સમજવામાં આવે છે, તમામ ટુકડાઓની સ્થિતિ, વિરોધીની ચાલના પરિણામ તરીકે પણ), પ્રતિસ્પર્ધી દ્વારા ઉઠાવવામાં આવેલા ટુકડા તરીકે પ્રતિસાદ પ્રાપ્ત થાય છે, તેથી ચાલ માટે પુરસ્કાર તરીકે બનાવાયેલ છે. આ રીતે એજન્ટ શીખે છે, અને પોતાને શિક્ષિત કરે છે.

તારણો

તેથી તે સ્પષ્ટ છે કે મશીન લર્નિંગના પ્રકારો વચ્ચેની પસંદગી સંદર્ભ પર આધારિત છે. એટલે કે, અભિગમનો પ્રકાર ઉપલબ્ધ ડેટાના આધારે પસંદ કરવામાં આવે છે અને ઇતિહાસ હોવાની સંભાવના છે જેમાં દરેક વ્યક્તિગત કેસ (ઇનપુટ) અને પરિણામ (આઉટપુટ) ના સંજોગોનું વર્ણન શામેલ હોય છે. તેથી આ પ્રકારના ડેટા સેટ સાથે, તમે નિરીક્ષિત અભિગમનો ઉપયોગ કરવા આગળ વધી શકો છો.

જો, બીજી બાજુ, તમારી પાસે આઉટપુટ ડેટા (લક્ષ્ય) ને પ્રાથમિકતા જાણવાની શક્યતા નથી, અથવા તમે નવા લક્ષ્યો શોધવા માંગતા હો, તો પછી ક્યારેય અનુભવી ન હોય તેવા સંજોગો શોધવા માટે ઇનપુટ ડેટા વચ્ચેની લિંક્સ ઓળખવી જરૂરી છે. ઈતિહાસ, અથવા પર્યાવરણ તરફના શિક્ષણનો સામનો કરવો કે જે વિકસિત થાય છે અને પ્રતિક્રિયા આપે છે. આ કિસ્સામાં, દેખરેખ વિનાની અથવા મજબૂતીકરણની તકનીકો પસંદ કરવી જરૂરી છે.

Ercole Palmeri: ઇનોવેશન વ્યસની