റോബോട്ടുകൾക്ക് തങ്ങളുടെ സഹമനുഷ്യരിൽ നിന്ന് ഉത്സാഹത്തോടെയും രീതിപരമായും പഠിക്കാൻ കഴിയും

ഗവേഷണ കേന്ദ്രങ്ങളുമായും കമ്പനികളുമായും സഹകരിച്ച് ഗൂഗിൾ നടത്തിയ സമീപകാല ഗവേഷണം, കൃത്രിമ കാഴ്ചയും സ്വാഭാവിക ഭാഷാ സംസ്കരണവും പോലുള്ള മെഷീൻ ലേണിംഗിൽ (എംഎൽ) പ്രധാന ഫലങ്ങൾ നൽകി.

വിജയകരവും പൊതുവായതും പങ്കിട്ടതുമായ സമീപനം എല്ലാ ഡാറ്റയും ഫലപ്രദമായി ആഗിരണം ചെയ്യാൻ കഴിയുന്ന വലുതും വൈവിധ്യപൂർണ്ണവുമായ ഡാറ്റാസെറ്റുകളും ആവിഷ്‌കൃത മോഡലുകളും പ്രയോജനപ്പെടുത്തുന്നു. റോബോട്ടിക്സിൽ ഈ സമീപനം പ്രയോഗിക്കാൻ വിവിധ ശ്രമങ്ങൾ നടന്നിട്ടുണ്ടെങ്കിലും, മറ്റ് ഉപമേഖലകളിലെന്നപോലെ റോബോട്ടുകൾ ഇതുവരെ ഉയർന്ന ശേഷിയുള്ള മോഡലുകളെ ചൂഷണം ചെയ്തിട്ടില്ല.

വർഷങ്ങളായി, നമ്മുടെ മാനുഷിക കഴിവുകളെ പൂരകമാക്കുന്നതിനും മെച്ചപ്പെടുത്തുന്നതിനും ഞങ്ങൾ പലപ്പോഴും സാങ്കേതികവിദ്യയെ ആശ്രയിക്കുന്നു. വിവരങ്ങൾ പങ്കിടാൻ സഹായിക്കുന്ന പ്രിന്ററുകൾ, ഗണിതത്തിനുള്ള കാൽക്കുലേറ്ററുകൾ, വേഗത്തിൽ നീങ്ങാൻ ഞങ്ങളെ സഹായിക്കുന്ന വിമാനങ്ങൾ എന്നിവ ഞങ്ങൾ വികസിപ്പിച്ചെടുത്തു. സമീപ വർഷങ്ങളിൽ, പ്രത്യേകിച്ച് മെഷീൻ ലേണിംഗ് മേഖലയിൽ, തിരയൽ, അസിസ്റ്റന്റുകൾ, മാപ്‌സ് എന്നിവയും അതിലേറെയും പോലെയുള്ള ഉപയോഗപ്രദമായ സാങ്കേതികവിദ്യകൾ ശക്തിപ്പെടുത്തുന്നതിന് വിവരങ്ങൾ പ്രോസസ്സ് ചെയ്യുന്നതിനുള്ള പുതിയ വഴികൾ ഞങ്ങൾ വികസിപ്പിച്ചെടുത്തിട്ടുണ്ട്.

ട്രാൻസ്ഫോർമർ

2017 ന് മുമ്പ് സിസ്റ്റങ്ങൾ മെഷീൻ ലേണിംഗ് ശരിയായ ഉത്തരത്തിൽ എത്തിച്ചേരുന്നതിന് അവരുടെ ഇൻപുട്ടിന്റെ ഏത് ഭാഗമാണ് പ്രസക്തമെന്ന് നിർണ്ണയിക്കാൻ അവർ പാടുപെട്ടു. ട്രാൻസ്ഫോർമർ ശ്രദ്ധ എന്ന ആശയം അവതരിപ്പിച്ചു: അതിന്റെ ഇൻപുട്ടിന്റെ പ്രധാന ഭാഗം ശ്രദ്ധിച്ചുകൊണ്ട്, മോഡലിന് ചലനാത്മകമായി ഏത് വിവരമാണ് പ്രാധാന്യമുള്ളതും അല്ലാത്തതും തിരഞ്ഞെടുക്കാൻ കഴിയുന്നത്. ട്രാൻസ്‌ഫോർമറുകൾ വളരെ പ്രസക്തമാണെന്ന് തെളിയിക്കപ്പെട്ടിട്ടുണ്ട്, അവ ആധുനിക ഭാഷാ മോഡലുകളുടെ മാതാവായി മാറിയിരിക്കുന്നു, ഇത് കൃത്രിമ ബുദ്ധിക്ക് ഇന്ധനം പകരുന്നു. ഇന്ന്, ഇമേജൻ, പാർടി തുടങ്ങിയ ചിത്രങ്ങൾ സൃഷ്ടിക്കുന്ന ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മേഖലയിൽ പോലും.

വർഷങ്ങളായി, വെബിൽ നിന്നുള്ള വലിയ അളവിലുള്ള ടെക്സ്റ്റ് ഡാറ്റയിൽ ട്രാൻസ്ഫോർമറുകൾ പരിശീലിപ്പിച്ചിട്ടുണ്ട്. വിവർത്തന സേവനങ്ങൾ നൽകുന്നതിനും മനുഷ്യ സംഭാഷണത്തിന് രൂപം നൽകുന്നതിനും ഉയർന്ന നിലവാരമുള്ള തിരയൽ ഫലങ്ങൾ ഇന്ധനമാക്കുന്നതിനും ഭാഷയിലെ ട്രെൻഡുകളും പാറ്റേണുകളും തിരിച്ചറിയാൻ അവ സഹായിക്കുന്നു. ഈയിടെയായി, ചിത്രങ്ങൾ, വീഡിയോ, സംസാരം എന്നിവയുൾപ്പെടെ ഭാഷയ്ക്ക് പുറമെ മറ്റ് തരത്തിലുള്ള വിവരങ്ങളും മനസ്സിലാക്കാൻ സഹായിക്കുന്നതിന് ട്രാൻസ്ഫോർമറുകൾ കൂടുതൽ വ്യാപകമായി സ്വീകരിച്ചിട്ടുണ്ട്. തീർച്ചയായും, ട്രാൻസ്‌ഫോർമറുകൾ സംഭാഷണത്തിലും ദൃശ്യപരമായ ജോലികളിലും മികവ് പുലർത്തുന്നു, അതിനാൽ റോബോട്ടുകൾ എന്താണ് കാണുന്നതെന്നും അവ എങ്ങനെ പ്രവർത്തിക്കുന്നുവെന്നും മനസ്സിലാക്കാൻ ഈ സാങ്കേതികവിദ്യ ഉപയോഗിക്കാൻ ഞങ്ങൾക്ക് കഴിഞ്ഞു.

റോബോട്ടുകളിലേക്കുള്ള ട്രാൻസ്ഫോർമറുകളുടെ പ്രയോഗം

എവരിഡേ റോബോട്ടുകളുമായുള്ള സഹകരണത്തിൽ നിന്ന്, റോബോട്ടുമായി ആശയവിനിമയം നടത്താൻ ആളുകളെ അനുവദിക്കുക മാത്രമല്ല, റോബോട്ടിന്റെ മൊത്തത്തിലുള്ള പ്രകടനം മെച്ചപ്പെടുത്താനും PaLM പോലുള്ള ശക്തമായ ഭാഷാ മോഡലിനെ ഒരു റോബോട്ട് ലേണിംഗ് മോഡലിലേക്ക് സംയോജിപ്പിക്കാൻ കഴിയുമെന്ന് ഗൂഗിൾ തെളിയിച്ചിട്ടുണ്ട്. "എനിക്ക് വിശക്കുന്നു, എനിക്ക് ഒരു ലഘുഭക്ഷണം കൊണ്ടുവരിക" അല്ലെങ്കിൽ "ഈ ചോർച്ച വൃത്തിയാക്കാൻ എന്നെ സഹായിക്കൂ" എന്നിങ്ങനെ വ്യത്യസ്ത തരത്തിലുള്ള അഭ്യർത്ഥനകൾ മനസിലാക്കാൻ സഹായിക്കുന്ന ബോട്ടുകളെ ഈ ഭാഷാ മോഡൽ അനുവദിച്ചു.

റോബോട്ടുകളെ അവർ ഇതിനകം കണ്ടതിൽ നിന്ന് കൂടുതൽ പഠിക്കാൻ സഹായിക്കുന്നതിന്, ട്രാൻസ്‌ഫോർമർ എന്ന PalM-ന്റെ അതേ ആർക്കിടെക്ചർ Google ഉപയോഗിക്കുന്നു. അതുകൊണ്ട് "എനിക്ക് വിശക്കുന്നു, എനിക്കൊരു ലഘുഭക്ഷണം കൊണ്ടുവരിക" എന്ന അഭ്യർത്ഥനയുടെ പിന്നിലെ ഭാഷ മനസ്സിലാക്കുന്നതിനുപകരം, ലഘുഭക്ഷണങ്ങൾ കാണുകയും കൊണ്ടുവരികയും ചെയ്യുന്നത് പോലെയുള്ള അവളുടെ എല്ലാ കൂട്ടായ അനുഭവങ്ങളിൽ നിന്നും - ഞങ്ങൾ ചെയ്യുന്നതുപോലെ - അവൾക്ക് പഠിക്കാൻ കഴിയും.

ഗവേഷണം

130.000 ഡെമോൺസ്ട്രേഷനുകളിൽ നിന്ന് ശേഖരിച്ച ഡാറ്റ ഉപയോഗിച്ചാണ് ട്രാൻസ്‌ഫോർമറിന്റെ പരിശീലനം - ഒരു വ്യക്തി ഒരു ടാസ്‌ക് നിർവഹിക്കാൻ റോബോട്ട് പ്രവർത്തിപ്പിക്കുമ്പോൾ - 700 ദൈനംദിന റോബോട്ടുകളുടെ സഹായ റോബോട്ടുകൾ പൂർത്തിയാക്കിയ 13-ലധികം തരം ജോലികൾ. വസ്തുക്കളെ എടുക്കുകയും സ്ഥാപിക്കുകയും ചെയ്യുക, ഡ്രോയറുകൾ തുറക്കുകയും അടയ്ക്കുകയും ചെയ്യുക, വസ്തുക്കൾ ഡ്രോയറുകളിലും പുറത്തും വയ്ക്കുക, നീളമേറിയ വസ്തുക്കൾ മുകളിൽ വലത് കോണിൽ സ്ഥാപിക്കുക, വസ്തുക്കൾ ഇടിക്കുക, നാപ്കിനുകൾ വലിക്കുക, ക്യാനുകൾ തുറക്കുക തുടങ്ങിയ കഴിവുകൾ പ്രവർത്തനങ്ങളിൽ ഉൾപ്പെടുന്നു. 1-ലധികം ജോലികൾ ചെയ്യാൻ കഴിവുള്ള അത്യാധുനിക റോബോട്ടിക്സ് ട്രാൻസ്ഫോർമർ മോഡൽ അല്ലെങ്കിൽ RT-700 ആണ് ഫലം. വിജയശതമാനം 97% ആണ്, അവന്റെ പഠനങ്ങളെ പുതിയ പ്രവർത്തനങ്ങൾ, വസ്തുക്കൾ, ചുറ്റുപാടുകൾ എന്നിവയിലേക്ക് സാമാന്യവൽക്കരിക്കുന്നു.
ടെക്‌സ്‌റ്റിൽ കാണുന്ന ട്രെൻഡുകളും പാറ്റേണുകളും അടിസ്ഥാനമാക്കി ഒരു ട്രാൻസ്‌ഫോർമർ അധിഷ്‌ഠിത ഭാഷാ മോഡൽ അടുത്ത വാക്ക് എങ്ങനെ പ്രവചിക്കുന്നു. റോബോട്ട് പെർസെപ്ഷൻ ഡാറ്റയിലും അനുബന്ധ പ്രവർത്തനങ്ങളിലും RT-1 പരിശീലിപ്പിച്ചതിനാൽ ഒരു റോബോട്ട് ഏർപ്പെടാൻ സാധ്യതയുള്ള അടുത്ത പെരുമാറ്റം തിരിച്ചറിയാൻ കഴിയും. ഈ സമീപനം റോബോട്ടിനെ പുതിയ ജോലികളിലേക്ക് പഠിച്ച കാര്യങ്ങൾ സാമാന്യവൽക്കരിക്കാൻ അനുവദിക്കുന്നു. അതിന്റെ പരിശീലന ഡാറ്റയിലെ അനുഭവങ്ങളെ അടിസ്ഥാനമാക്കി പുതിയ വസ്തുക്കളും പരിതസ്ഥിതികളും കൈകാര്യം ചെയ്തുകൊണ്ടാണ് ഇത് ചെയ്യുന്നത് - റോബോട്ടുകൾക്കുള്ള അപൂർവ നേട്ടം, ഇടുങ്ങിയ ജോലികൾക്കായി കർശനമായി കോഡ് ചെയ്യപ്പെടുന്നവ.

പരസ്പരം പഠിക്കുക

മനുഷ്യരെന്ന നിലയിൽ, നാം നമ്മുടെ സ്വന്തം അനുഭവങ്ങളിൽ നിന്നും പരസ്പരം പഠിക്കുന്നു. ഞങ്ങൾ പഠിച്ച കാര്യങ്ങൾ ഞങ്ങൾ പലപ്പോഴും പങ്കിടുകയും ഞങ്ങൾ നേരിട്ട പരാജയങ്ങളെ അടിസ്ഥാനമാക്കി സിസ്റ്റങ്ങൾ പുനർനിർമ്മിക്കുകയും ചെയ്യുന്നു. റോബോട്ടുകൾ പരസ്പരം ആശയവിനിമയം നടത്തുന്നില്ലെങ്കിലും, വിവിധ തരം റോബോട്ടുകളിൽ നിന്നുള്ള ഡാറ്റാസെറ്റുകൾ എങ്ങനെ വിജയകരമായി സംയോജിപ്പിക്കാമെന്നും പെരുമാറ്റങ്ങൾ അവയിലുടനീളം കൈമാറാമെന്നും ഗവേഷണം കാണിക്കുന്നു. നിരവധി റോബോട്ടുകളിൽ നിന്നുള്ള ഡാറ്റ സംയോജിപ്പിക്കുന്നതിലൂടെ, മോഡലിന്റെ ശേഷി ഏകദേശം ഇരട്ടിയാക്കാനും ഒരു പുതിയ ദൃശ്യത്തിലേക്ക് സാമാന്യവൽക്കരിക്കാനും അവർക്ക് കഴിയുമെന്ന് ഗൂഗിൾ തെളിയിച്ചിട്ടുണ്ട്. വ്യത്യസ്‌ത റോബോട്ടുകളും പുതിയ ടാസ്‌ക്കുകളും ഉപയോഗിച്ച് പരീക്ഷണം തുടരുന്നതിലൂടെ, ഒരാൾക്ക് RT-1-നുള്ള പരിശീലന ഡാറ്റ വർദ്ധിപ്പിക്കാനും റോബോട്ട് സ്വഭാവം മെച്ചപ്പെടുത്താനും റോബോട്ട് പഠനത്തിന് വഴക്കമുള്ളതും അളക്കാവുന്നതുമായ സമീപനമാക്കി മാറ്റാൻ കഴിഞ്ഞേക്കും എന്നാണ് ഇതിനർത്ഥം.

കൂടുതൽ ഉപയോഗപ്രദമായ റോബോട്ടിക്സിലേക്ക്

ഗൂഗിൾ ഓപ്പൺ സോഴ്‌സ് ട്രാൻസ്‌ഫോർമർ ഗവേഷണം നടത്തുന്നതുപോലെ, റോബോട്ടിക്‌സ് സ്‌പെയ്‌സിൽ കൂടുതൽ ഗവേഷണം പ്രോത്സാഹിപ്പിക്കുന്നതിന് RT-1 ഓപ്പൺ സോഴ്‌സ് ആയിരിക്കും. മനുഷ്യ കേന്ദ്രീകൃത പരിതസ്ഥിതികളുടെ അനന്തമായ വ്യതിയാനങ്ങൾ കൈകാര്യം ചെയ്യാൻ കഴിയുന്ന റോബോട്ടിക് പഠന സംവിധാനങ്ങളിലേക്കുള്ള ആദ്യപടിയാണിത്.

Ercole Palmeri

മയക്കുമരുന്ന്