કમ્પ્યુટર

મશીન લર્નિંગના પ્રકાર

મશીન લર્નિંગ (ઓટોમેટિક લર્નિંગ) શબ્દ કૃત્રિમ બુદ્ધિમત્તાની દુનિયા સાથે જોડાયેલા મિકેનિઝમ્સના સમૂહનો સંદર્ભ આપે છે. મશીન લર્નિંગના ત્રણ પ્રકાર છે: સુપરવાઇઝ્ડ, અનસુપરવાઇઝ્ડ અને રિઇન્ફોર્સમેન્ટ લર્નિંગ.

આ પદ્ધતિઓ એક બુદ્ધિશાળી મશીનને સમય જતાં તેની ક્ષમતાઓ અને પ્રભાવમાં સુધારો કરવાની મંજૂરી આપે છે, આપમેળે અમુક કાર્યો કરવા માટે અનુભવ સાથે શીખી જાય છે, સમય જતાં તેના પ્રભાવને વધુને વધુ સુધારે છે. 

એક ઉદાહરણ છે આલ્ફાગો, દ્વારા વિકસિત ગો ગેમ માટે મશીન લર્નિંગ સોફ્ટવેર Deepmind. અલ્પાગો એ પહેલું સોફ્ટવેર હતું જે પ્લેનમાં રમતમાં માનવ માસ્ટરને હરાવવા સક્ષમ હતું ગોબન પ્રમાણભૂત કદ (19 × 19). AlphaGo સોફ્ટવેરને વિવિધ રમતો દરમિયાન ગો ખેલાડીઓ દ્વારા કરવામાં આવતી લાખો ચાલોનું અવલોકન કરીને અને મશીનને પોતાની સામે રમતા રાખવાથી શિક્ષિત કરવામાં આવ્યું હતું, પરિણામે તે આ રમતના વિશ્વના શ્રેષ્ઠ ખેલાડી તરીકે માનવામાં આવતા તેને હરાવવામાં સક્ષમ હતું.

ચાલો હવે મશીન લર્નિંગની ત્રણ મુખ્ય શ્રેણીઓમાં જઈએ.

નિરીક્ષણ કરેલ શિક્ષણ

સિસ્ટમ ઇચ્છિત આઉટપુટ અનુસાર લેબલ થયેલ ઉદાહરણો મેળવે છે. એટલે કે, મશીનને સૂચના આપવા માટે ઉપયોગી ડેટાસેટ્સ એવા તત્વોથી બનેલા છે જે ઇનપુટ ડેટાથી બનેલી વાસ્તવિક પરિસ્થિતિઓનું પ્રતિનિધિત્વ કરે છે.વિશેષતા"અને આઉટપુટ ડેટામાંથી"લક્ષ્ય" લેખના ઉદાહરણના સંદર્ભમાં મશીન લર્નિંગ શું છે, તે શું છે અને તેના લક્ષ્યો, પ્રશિક્ષણની તૈયારી દેખરેખ હેઠળની હતી કારણ કે અમારી પાસે રૂટના વ્યક્તિગત કેસ હતા, જેમાં પ્રત્યેક સુવિધાઓ (વાહન, રૂટ) અને લક્ષ્ય (મુસાફરીનો સમય) નિર્દિષ્ટ કરવામાં આવ્યા હતા. ડેટા સેટ સામાન્ય રીતે વધુ જટિલ હોય છે, ઉદાહરણ અત્યંત મર્યાદિત અને ઉપદેશાત્મક હતું, જેનો ઉદ્દેશ્ય સુપરવાઇઝ્ડ મશીન લર્નિંગની સમજને સરળ બનાવવાનો હતો.

આ પ્રકારનો કેસ એલ્ગોરિધમને માર્ગ અને વાહનના પ્રકાર, મુસાફરીનો સમય શું હોઈ શકે તેના આધારે અભ્યાસ કરવાની મંજૂરી આપે છે. નિરીક્ષણ કરેલ મશીન લર્નિંગમાં બે પ્રકારની સમસ્યાઓ છે:

  1. પ્રત્યાગમાન: જ્યારે લક્ષ્ય સતત ચલથી બનેલું હોય, તે એક જથ્થો છે, સંખ્યા;
  2. વર્ગીકરણ: જ્યારે લક્ષ્ય વર્ગ અથવા શ્રેણી દ્વારા રજૂ કરી શકાય છે.

મોટરવે રૂટના ઉદાહરણ પર પુનર્વિચાર કરતા, આપણે કહી શકીએ કે તે રીગ્રેસન છે. જો લક્ષ્યમાં મૂલ્યાંકન શામેલ હોય જેમ કે: જો એક કલાકથી ઓછી હોય તો ઝડપી, 1 થી બે કલાકની વચ્ચે ધીમી, જો બે કલાકથી વધુ હોય તો ખૂબ જ ધીમું. આ કિસ્સામાં તે એક વર્ગીકરણ સમસ્યા હશે.

દેખરેખ વિનાનું શિક્ષણ

ત્યાં કોઈ લેબલ થયેલ ડેટા નથી, તે સિસ્ટમ છે જે ઇનપુટ્સથી શરૂ કરીને, ડેટામાં માળખું શોધવું આવશ્યક છે. અમારી પાસે વ્યવહારીક રીતે કોઈ લક્ષ્ય નથી, પરંતુ ફક્ત ડેટા ઇનપુટ છે. જેમ કે ઉદાહરણમાં અમારી પાસે માત્ર રૂટ અને વાહનનો ડેટા છે, પરંતુ મુસાફરીના સમયનો ડેટા નથી.

આ અભિગમમાં, અલ્ગોરિધમ્સે ડેટામાં છુપાયેલા બંધારણોને શોધીને શ્રેણીઓ ઓળખવી આવશ્યક છે. મુખ્ય ટૂલ્સ જેનો ઉપયોગ અસુરક્ષિત અભિગમમાં થઈ શકે છે તે છે ક્લસ્ટરીંગ અને સંગઠનના નિયમો.

ઇનોવેશન ન્યૂઝલેટર
નવીનતા પરના સૌથી મહત્વપૂર્ણ સમાચારને ચૂકશો નહીં. તેમને ઇમેઇલ દ્વારા પ્રાપ્ત કરવા માટે સાઇન અપ કરો.

મજબૂતીકરણ શિક્ષણ

સિસ્ટમ પર્યાવરણમાંથી ઇનપુટ મેળવે છે અને પગલાં લે છે. સિસ્ટમ પુરસ્કારો મેળવવા માટે પગલાં લેવાનો પ્રયાસ કરે છે. સિસ્ટમ આસપાસના વાતાવરણની સ્થિતિના આધારે પુરસ્કારને શ્રેષ્ઠ બનાવતી ક્રિયાઓ અમલમાં મૂકવાનો પ્રયાસ કરશે. 

ઈનામ સિસ્ટમ એક ઘટક દ્વારા લાગુ કરવામાં આવે છે, જેને કહેવાય છે એજન્ટ. એજન્ટ પર્યાવરણ પર હાથ ધરવા માટેની ક્રિયા નક્કી કરે છે અને તેમાંથી તેને એક પ્રાપ્ત થાય છે પુરસ્કાર અને સંભવતઃ પર્યાવરણની સ્થિતિ વિશેની માહિતી, શરૂ કરાયેલી કાર્યવાહીના પરિણામ સ્વરૂપે.

ઉદાહરણ તરીકે, જો આપણે ચેસની રમતને સમર્પિત સિસ્ટમ વિશે વિચારીએ, તો એજન્ટ એ ઘટક છે જે ચાલ નક્કી કરે છે, પર્યાવરણ એ રમત છે. એજન્ટ દ્વારા કરવામાં આવતી દરેક એક ચાલના પરિણામ સ્વરૂપે, રમતની સ્થિતિ બદલાય છે (વર્તમાન પરિસ્થિતિ તરીકે સમજવામાં આવે છે, તમામ ટુકડાઓની સ્થિતિ, વિરોધીની ચાલના પરિણામ તરીકે પણ), પ્રતિસ્પર્ધી દ્વારા ઉઠાવવામાં આવેલા ટુકડા તરીકે પ્રતિસાદ પ્રાપ્ત થાય છે, તેથી ચાલ માટે પુરસ્કાર તરીકે બનાવાયેલ છે. આ રીતે એજન્ટ શીખે છે, અને પોતાને શિક્ષિત કરે છે.

તારણો

તેથી તે સ્પષ્ટ છે કે મશીન લર્નિંગના પ્રકારો વચ્ચેની પસંદગી સંદર્ભ પર આધારિત છે. એટલે કે, અભિગમનો પ્રકાર ઉપલબ્ધ ડેટાના આધારે પસંદ કરવામાં આવે છે અને ઇતિહાસ હોવાની સંભાવના છે જેમાં દરેક વ્યક્તિગત કેસ (ઇનપુટ) અને પરિણામ (આઉટપુટ) ના સંજોગોનું વર્ણન શામેલ હોય છે. તેથી આ પ્રકારના ડેટા સેટ સાથે, તમે નિરીક્ષિત અભિગમનો ઉપયોગ કરવા આગળ વધી શકો છો.

જો, બીજી બાજુ, તમારી પાસે આઉટપુટ ડેટા (લક્ષ્ય) ને પ્રાથમિકતા જાણવાની શક્યતા નથી, અથવા તમે નવા લક્ષ્યો શોધવા માંગતા હો, તો પછી ક્યારેય અનુભવી ન હોય તેવા સંજોગો શોધવા માટે ઇનપુટ ડેટા વચ્ચેની લિંક્સ ઓળખવી જરૂરી છે. ઈતિહાસ, અથવા પર્યાવરણ તરફના શિક્ષણનો સામનો કરવો કે જે વિકસિત થાય છે અને પ્રતિક્રિયા આપે છે. આ કિસ્સામાં, દેખરેખ વિનાની અથવા મજબૂતીકરણની તકનીકો પસંદ કરવી જરૂરી છે.

Ercole Palmeri: ઇનોવેશન વ્યસની


ઇનોવેશન ન્યૂઝલેટર
નવીનતા પરના સૌથી મહત્વપૂર્ણ સમાચારને ચૂકશો નહીં. તેમને ઇમેઇલ દ્વારા પ્રાપ્ત કરવા માટે સાઇન અપ કરો.

તાજેતરના લેખો

ભાવિ અહીં છે: શિપિંગ ઉદ્યોગ વૈશ્વિક અર્થતંત્રમાં કેવી રીતે ક્રાંતિ લાવી રહ્યો છે

નૌકાદળ ક્ષેત્ર એ સાચી વૈશ્વિક આર્થિક શક્તિ છે, જેણે 150 અબજના બજાર તરફ નેવિગેટ કર્યું છે...

1 મે 2024

પ્રકાશકો અને OpenAI આર્ટિફિશિયલ ઇન્ટેલિજન્સ દ્વારા પ્રક્રિયા કરાયેલ માહિતીના પ્રવાહને નિયંત્રિત કરવા માટે કરાર પર હસ્તાક્ષર કરે છે

ગયા સોમવારે, ફાઇનાન્શિયલ ટાઇમ્સે OpenAI સાથેના સોદાની જાહેરાત કરી હતી. FT તેના વિશ્વ કક્ષાના પત્રકારત્વને લાઇસન્સ આપે છે...

30 એપ્રિલ 2024

ઓનલાઈન ચુકવણીઓ: સ્ટ્રીમિંગ સેવાઓ તમને કાયમ માટે કેવી રીતે ચૂકવણી કરે છે તે અહીં છે

લાખો લોકો સ્ટ્રીમિંગ સેવાઓ માટે ચૂકવણી કરે છે, માસિક સબ્સ્ક્રિપ્શન ફી ચૂકવે છે. સામાન્ય અભિપ્રાય છે કે તમે…

29 એપ્રિલ 2024

Veeam રેન્સમવેર માટે સૌથી વધુ વ્યાપક સમર્થન આપે છે, સુરક્ષાથી લઈને પ્રતિસાદ અને પુનઃપ્રાપ્તિ સુધી

Veeam દ્વારા Coveware સાયબર ગેરવસૂલી ઘટના પ્રતિભાવ સેવાઓ પ્રદાન કરવાનું ચાલુ રાખશે. કોવવેર ફોરેન્સિક્સ અને ઉપચાર ક્ષમતાઓ પ્રદાન કરશે...

23 એપ્રિલ 2024

તમારી ભાષામાં ઇનોવેશન વાંચો

ઇનોવેશન ન્યૂઝલેટર
નવીનતા પરના સૌથી મહત્વપૂર્ણ સમાચારને ચૂકશો નહીં. તેમને ઇમેઇલ દ્વારા પ્રાપ્ત કરવા માટે સાઇન અપ કરો.

અમને અનુસરો