വിജയകരവും പൊതുവായതും പങ്കിട്ടതുമായ സമീപനം എല്ലാ ഡാറ്റയും ഫലപ്രദമായി ആഗിരണം ചെയ്യാൻ കഴിയുന്ന വലുതും വൈവിധ്യപൂർണ്ണവുമായ ഡാറ്റാസെറ്റുകളും ആവിഷ്കൃത മോഡലുകളും പ്രയോജനപ്പെടുത്തുന്നു. റോബോട്ടിക്സിൽ ഈ സമീപനം പ്രയോഗിക്കാൻ വിവിധ ശ്രമങ്ങൾ നടന്നിട്ടുണ്ടെങ്കിലും, മറ്റ് ഉപമേഖലകളിലെന്നപോലെ റോബോട്ടുകൾ ഇതുവരെ ഉയർന്ന ശേഷിയുള്ള മോഡലുകളെ ചൂഷണം ചെയ്തിട്ടില്ല.
വർഷങ്ങളായി, നമ്മുടെ മാനുഷിക കഴിവുകളെ പൂരകമാക്കുന്നതിനും മെച്ചപ്പെടുത്തുന്നതിനും ഞങ്ങൾ പലപ്പോഴും സാങ്കേതികവിദ്യയെ ആശ്രയിക്കുന്നു. വിവരങ്ങൾ പങ്കിടാൻ സഹായിക്കുന്ന പ്രിന്ററുകൾ, ഗണിതത്തിനുള്ള കാൽക്കുലേറ്ററുകൾ, വേഗത്തിൽ നീങ്ങാൻ ഞങ്ങളെ സഹായിക്കുന്ന വിമാനങ്ങൾ എന്നിവ ഞങ്ങൾ വികസിപ്പിച്ചെടുത്തു. സമീപ വർഷങ്ങളിൽ, പ്രത്യേകിച്ച് മെഷീൻ ലേണിംഗ് മേഖലയിൽ, തിരയൽ, അസിസ്റ്റന്റുകൾ, മാപ്സ് എന്നിവയും അതിലേറെയും പോലെയുള്ള ഉപയോഗപ്രദമായ സാങ്കേതികവിദ്യകൾ ശക്തിപ്പെടുത്തുന്നതിന് വിവരങ്ങൾ പ്രോസസ്സ് ചെയ്യുന്നതിനുള്ള പുതിയ വഴികൾ ഞങ്ങൾ വികസിപ്പിച്ചെടുത്തിട്ടുണ്ട്.
2017 ന് മുമ്പ് സിസ്റ്റങ്ങൾ മെഷീൻ ലേണിംഗ് ശരിയായ ഉത്തരത്തിൽ എത്തിച്ചേരുന്നതിന് അവരുടെ ഇൻപുട്ടിന്റെ ഏത് ഭാഗമാണ് പ്രസക്തമെന്ന് നിർണ്ണയിക്കാൻ അവർ പാടുപെട്ടു. ട്രാൻസ്ഫോർമർ ശ്രദ്ധ എന്ന ആശയം അവതരിപ്പിച്ചു: അതിന്റെ ഇൻപുട്ടിന്റെ പ്രധാന ഭാഗം ശ്രദ്ധിച്ചുകൊണ്ട്, മോഡലിന് ചലനാത്മകമായി ഏത് വിവരമാണ് പ്രാധാന്യമുള്ളതും അല്ലാത്തതും തിരഞ്ഞെടുക്കാൻ കഴിയുന്നത്. ട്രാൻസ്ഫോർമറുകൾ വളരെ പ്രസക്തമാണെന്ന് തെളിയിക്കപ്പെട്ടിട്ടുണ്ട്, അവ ആധുനിക ഭാഷാ മോഡലുകളുടെ മാതാവായി മാറിയിരിക്കുന്നു, ഇത് കൃത്രിമ ബുദ്ധിക്ക് ഇന്ധനം പകരുന്നു. ഇന്ന്, ഇമേജൻ, പാർടി തുടങ്ങിയ ചിത്രങ്ങൾ സൃഷ്ടിക്കുന്ന ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മേഖലയിൽ പോലും.
വർഷങ്ങളായി, വെബിൽ നിന്നുള്ള വലിയ അളവിലുള്ള ടെക്സ്റ്റ് ഡാറ്റയിൽ ട്രാൻസ്ഫോർമറുകൾ പരിശീലിപ്പിച്ചിട്ടുണ്ട്. വിവർത്തന സേവനങ്ങൾ നൽകുന്നതിനും മനുഷ്യ സംഭാഷണത്തിന് രൂപം നൽകുന്നതിനും ഉയർന്ന നിലവാരമുള്ള തിരയൽ ഫലങ്ങൾ ഇന്ധനമാക്കുന്നതിനും ഭാഷയിലെ ട്രെൻഡുകളും പാറ്റേണുകളും തിരിച്ചറിയാൻ അവ സഹായിക്കുന്നു. ഈയിടെയായി, ചിത്രങ്ങൾ, വീഡിയോ, സംസാരം എന്നിവയുൾപ്പെടെ ഭാഷയ്ക്ക് പുറമെ മറ്റ് തരത്തിലുള്ള വിവരങ്ങളും മനസ്സിലാക്കാൻ സഹായിക്കുന്നതിന് ട്രാൻസ്ഫോർമറുകൾ കൂടുതൽ വ്യാപകമായി സ്വീകരിച്ചിട്ടുണ്ട്. തീർച്ചയായും, ട്രാൻസ്ഫോർമറുകൾ സംഭാഷണത്തിലും ദൃശ്യപരമായ ജോലികളിലും മികവ് പുലർത്തുന്നു, അതിനാൽ റോബോട്ടുകൾ എന്താണ് കാണുന്നതെന്നും അവ എങ്ങനെ പ്രവർത്തിക്കുന്നുവെന്നും മനസ്സിലാക്കാൻ ഈ സാങ്കേതികവിദ്യ ഉപയോഗിക്കാൻ ഞങ്ങൾക്ക് കഴിഞ്ഞു.
എവരിഡേ റോബോട്ടുകളുമായുള്ള സഹകരണത്തിൽ നിന്ന്, റോബോട്ടുമായി ആശയവിനിമയം നടത്താൻ ആളുകളെ അനുവദിക്കുക മാത്രമല്ല, റോബോട്ടിന്റെ മൊത്തത്തിലുള്ള പ്രകടനം മെച്ചപ്പെടുത്താനും PaLM പോലുള്ള ശക്തമായ ഭാഷാ മോഡലിനെ ഒരു റോബോട്ട് ലേണിംഗ് മോഡലിലേക്ക് സംയോജിപ്പിക്കാൻ കഴിയുമെന്ന് ഗൂഗിൾ തെളിയിച്ചിട്ടുണ്ട്. "എനിക്ക് വിശക്കുന്നു, എനിക്ക് ഒരു ലഘുഭക്ഷണം കൊണ്ടുവരിക" അല്ലെങ്കിൽ "ഈ ചോർച്ച വൃത്തിയാക്കാൻ എന്നെ സഹായിക്കൂ" എന്നിങ്ങനെ വ്യത്യസ്ത തരത്തിലുള്ള അഭ്യർത്ഥനകൾ മനസിലാക്കാൻ സഹായിക്കുന്ന ബോട്ടുകളെ ഈ ഭാഷാ മോഡൽ അനുവദിച്ചു.
റോബോട്ടുകളെ അവർ ഇതിനകം കണ്ടതിൽ നിന്ന് കൂടുതൽ പഠിക്കാൻ സഹായിക്കുന്നതിന്, ട്രാൻസ്ഫോർമർ എന്ന PalM-ന്റെ അതേ ആർക്കിടെക്ചർ Google ഉപയോഗിക്കുന്നു. അതുകൊണ്ട് "എനിക്ക് വിശക്കുന്നു, എനിക്കൊരു ലഘുഭക്ഷണം കൊണ്ടുവരിക" എന്ന അഭ്യർത്ഥനയുടെ പിന്നിലെ ഭാഷ മനസ്സിലാക്കുന്നതിനുപകരം, ലഘുഭക്ഷണങ്ങൾ കാണുകയും കൊണ്ടുവരികയും ചെയ്യുന്നത് പോലെയുള്ള അവളുടെ എല്ലാ കൂട്ടായ അനുഭവങ്ങളിൽ നിന്നും - ഞങ്ങൾ ചെയ്യുന്നതുപോലെ - അവൾക്ക് പഠിക്കാൻ കഴിയും.
130.000 ഡെമോൺസ്ട്രേഷനുകളിൽ നിന്ന് ശേഖരിച്ച ഡാറ്റ ഉപയോഗിച്ചാണ് ട്രാൻസ്ഫോർമറിന്റെ പരിശീലനം - ഒരു വ്യക്തി ഒരു ടാസ്ക് നിർവഹിക്കാൻ റോബോട്ട് പ്രവർത്തിപ്പിക്കുമ്പോൾ - 700 ദൈനംദിന റോബോട്ടുകളുടെ സഹായ റോബോട്ടുകൾ പൂർത്തിയാക്കിയ 13-ലധികം തരം ജോലികൾ. വസ്തുക്കളെ എടുക്കുകയും സ്ഥാപിക്കുകയും ചെയ്യുക, ഡ്രോയറുകൾ തുറക്കുകയും അടയ്ക്കുകയും ചെയ്യുക, വസ്തുക്കൾ ഡ്രോയറുകളിലും പുറത്തും വയ്ക്കുക, നീളമേറിയ വസ്തുക്കൾ മുകളിൽ വലത് കോണിൽ സ്ഥാപിക്കുക, വസ്തുക്കൾ ഇടിക്കുക, നാപ്കിനുകൾ വലിക്കുക, ക്യാനുകൾ തുറക്കുക തുടങ്ങിയ കഴിവുകൾ പ്രവർത്തനങ്ങളിൽ ഉൾപ്പെടുന്നു. 1-ലധികം ജോലികൾ ചെയ്യാൻ കഴിവുള്ള അത്യാധുനിക റോബോട്ടിക്സ് ട്രാൻസ്ഫോർമർ മോഡൽ അല്ലെങ്കിൽ RT-700 ആണ് ഫലം. വിജയശതമാനം 97% ആണ്, അവന്റെ പഠനങ്ങളെ പുതിയ പ്രവർത്തനങ്ങൾ, വസ്തുക്കൾ, ചുറ്റുപാടുകൾ എന്നിവയിലേക്ക് സാമാന്യവൽക്കരിക്കുന്നു.
ടെക്സ്റ്റിൽ കാണുന്ന ട്രെൻഡുകളും പാറ്റേണുകളും അടിസ്ഥാനമാക്കി ഒരു ട്രാൻസ്ഫോർമർ അധിഷ്ഠിത ഭാഷാ മോഡൽ അടുത്ത വാക്ക് എങ്ങനെ പ്രവചിക്കുന്നു. റോബോട്ട് പെർസെപ്ഷൻ ഡാറ്റയിലും അനുബന്ധ പ്രവർത്തനങ്ങളിലും RT-1 പരിശീലിപ്പിച്ചതിനാൽ ഒരു റോബോട്ട് ഏർപ്പെടാൻ സാധ്യതയുള്ള അടുത്ത പെരുമാറ്റം തിരിച്ചറിയാൻ കഴിയും. ഈ സമീപനം റോബോട്ടിനെ പുതിയ ജോലികളിലേക്ക് പഠിച്ച കാര്യങ്ങൾ സാമാന്യവൽക്കരിക്കാൻ അനുവദിക്കുന്നു. അതിന്റെ പരിശീലന ഡാറ്റയിലെ അനുഭവങ്ങളെ അടിസ്ഥാനമാക്കി പുതിയ വസ്തുക്കളും പരിതസ്ഥിതികളും കൈകാര്യം ചെയ്തുകൊണ്ടാണ് ഇത് ചെയ്യുന്നത് - റോബോട്ടുകൾക്കുള്ള അപൂർവ നേട്ടം, ഇടുങ്ങിയ ജോലികൾക്കായി കർശനമായി കോഡ് ചെയ്യപ്പെടുന്നവ.
മനുഷ്യരെന്ന നിലയിൽ, നാം നമ്മുടെ സ്വന്തം അനുഭവങ്ങളിൽ നിന്നും പരസ്പരം പഠിക്കുന്നു. ഞങ്ങൾ പഠിച്ച കാര്യങ്ങൾ ഞങ്ങൾ പലപ്പോഴും പങ്കിടുകയും ഞങ്ങൾ നേരിട്ട പരാജയങ്ങളെ അടിസ്ഥാനമാക്കി സിസ്റ്റങ്ങൾ പുനർനിർമ്മിക്കുകയും ചെയ്യുന്നു. റോബോട്ടുകൾ പരസ്പരം ആശയവിനിമയം നടത്തുന്നില്ലെങ്കിലും, വിവിധ തരം റോബോട്ടുകളിൽ നിന്നുള്ള ഡാറ്റാസെറ്റുകൾ എങ്ങനെ വിജയകരമായി സംയോജിപ്പിക്കാമെന്നും പെരുമാറ്റങ്ങൾ അവയിലുടനീളം കൈമാറാമെന്നും ഗവേഷണം കാണിക്കുന്നു. നിരവധി റോബോട്ടുകളിൽ നിന്നുള്ള ഡാറ്റ സംയോജിപ്പിക്കുന്നതിലൂടെ, മോഡലിന്റെ ശേഷി ഏകദേശം ഇരട്ടിയാക്കാനും ഒരു പുതിയ ദൃശ്യത്തിലേക്ക് സാമാന്യവൽക്കരിക്കാനും അവർക്ക് കഴിയുമെന്ന് ഗൂഗിൾ തെളിയിച്ചിട്ടുണ്ട്. വ്യത്യസ്ത റോബോട്ടുകളും പുതിയ ടാസ്ക്കുകളും ഉപയോഗിച്ച് പരീക്ഷണം തുടരുന്നതിലൂടെ, ഒരാൾക്ക് RT-1-നുള്ള പരിശീലന ഡാറ്റ വർദ്ധിപ്പിക്കാനും റോബോട്ട് സ്വഭാവം മെച്ചപ്പെടുത്താനും റോബോട്ട് പഠനത്തിന് വഴക്കമുള്ളതും അളക്കാവുന്നതുമായ സമീപനമാക്കി മാറ്റാൻ കഴിഞ്ഞേക്കും എന്നാണ് ഇതിനർത്ഥം.
ഗൂഗിൾ ഓപ്പൺ സോഴ്സ് ട്രാൻസ്ഫോർമർ ഗവേഷണം നടത്തുന്നതുപോലെ, റോബോട്ടിക്സ് സ്പെയ്സിൽ കൂടുതൽ ഗവേഷണം പ്രോത്സാഹിപ്പിക്കുന്നതിന് RT-1 ഓപ്പൺ സോഴ്സ് ആയിരിക്കും. മനുഷ്യ കേന്ദ്രീകൃത പരിതസ്ഥിതികളുടെ അനന്തമായ വ്യതിയാനങ്ങൾ കൈകാര്യം ചെയ്യാൻ കഴിയുന്ന റോബോട്ടിക് പഠന സംവിധാനങ്ങളിലേക്കുള്ള ആദ്യപടിയാണിത്.
Ercole Palmeri
മയക്കുമരുന്ന്
കളറിംഗ് വഴി മികച്ച മോട്ടോർ കഴിവുകൾ വികസിപ്പിക്കുന്നത് എഴുത്ത് പോലെയുള്ള കൂടുതൽ സങ്കീർണ്ണമായ കഴിവുകൾക്ക് കുട്ടികളെ സജ്ജമാക്കുന്നു. നിറം കൊടുക്കാൻ...
നാവിക മേഖല ഒരു യഥാർത്ഥ ആഗോള സാമ്പത്തിക ശക്തിയാണ്, അത് 150 ബില്യൺ വിപണിയിലേക്ക് നാവിഗേറ്റ് ചെയ്തു...
കഴിഞ്ഞ തിങ്കളാഴ്ച, ഫിനാൻഷ്യൽ ടൈംസ് ഓപ്പൺഎഐയുമായി ഒരു കരാർ പ്രഖ്യാപിച്ചു. FT അതിൻ്റെ ലോകോത്തര പത്രപ്രവർത്തനത്തിന് ലൈസൻസ് നൽകുന്നു…
ദശലക്ഷക്കണക്കിന് ആളുകൾ സ്ട്രീമിംഗ് സേവനങ്ങൾക്കായി പണമടയ്ക്കുന്നു, പ്രതിമാസ സബ്സ്ക്രിപ്ഷൻ ഫീസ് നൽകുന്നു. നിങ്ങൾ എന്നത് പൊതുവായ അഭിപ്രായമാണ്...