OpenAI-യുടെ GPT-3-നേക്കാൾ ശക്തമായ തിരയൽ ഉപകരണമായ LAMA മോഡൽ മെറ്റ അവതരിപ്പിക്കുന്നു

വളരെ നൂതനമായ ഒരു കമ്പനിയുടെ പങ്ക് സ്ഥിരീകരിക്കുന്ന LAMA എന്ന പേരിൽ Meta അടുത്തിടെ ഒരു പുതിയ AI ഭാഷാ ജനറേറ്റർ പുറത്തിറക്കി.

"ഗവേഷകരെ അവരുടെ പ്രവർത്തനങ്ങൾ മുന്നോട്ട് കൊണ്ടുപോകാൻ സഹായിക്കുന്നതിന് രൂപകൽപ്പന ചെയ്ത LAMA എന്ന പുതിയ, അത്യാധുനിക AI വലിയ ഭാഷാ മോഡൽ ഞങ്ങൾ ഇന്ന് പുറത്തിറക്കുന്നു," സിഇഒ മാർക്ക് സക്കർബർഗ് ഫേസ്ബുക്ക് പോസ്റ്റിൽ പറഞ്ഞു.

എന്തിന് ലാമ

വലിയ ഭാഷാ മോഡലുകൾ ടെക് ലോകത്തെ കൊടുങ്കാറ്റായി ഏറ്റെടുത്തു. അവർ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ടൂളുകളെ ശക്തിപ്പെടുത്തുന്നു ചാറ്റ് GPT മറ്റ് സംഭാഷണ മാതൃകകളും. എന്നിരുന്നാലും, ഈ ടൂളുകൾ ഉപയോഗിക്കുന്നത് കാര്യമായ അപകടസാധ്യതയുള്ളതും വിശ്വസനീയവും എന്നാൽ തെറ്റായതുമായ ക്ലെയിമുകൾ, വിഷലിപ്തമായ ഉള്ളടക്കം സൃഷ്ടിക്കൽ, AI പരിശീലന ഡാറ്റയിൽ വേരൂന്നിയ പക്ഷപാതത്തെ അനുകരിക്കൽ എന്നിവയുമായാണ് വരുന്നത്.

ഈ പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ ഗവേഷകരെ സഹായിക്കുന്നതിന്, ഫെബ്രുവരി 25 വെള്ളിയാഴ്ച, മെറ്റാ റിലീസ് പ്രഖ്യാപിച്ചു എന്ന പുതിയ വലിയ ഭാഷാ മാതൃക ലാമ (Large Language Model മെറ്റാ AI) .

എന്താണ് LAMA?

LAMA ഒരു അല്ല ചാറ്റ്ബോട്ട്, എന്നാൽ ഇത് ഒരു തിരയൽ ഉപകരണമാണ്, അത് Meta AI അനുസരിച്ച്, ഭാഷാ മോഡലുകളുമായി ബന്ധപ്പെട്ട പ്രശ്നങ്ങൾ പരിഹരിക്കും AI. LAMA പോലെയുള്ള ചെറുതും മികച്ചതുമായ മോഡലുകൾ വലിയ അളവിലുള്ള അടിസ്ഥാന സൗകര്യങ്ങളില്ലാത്ത ഗവേഷണ സമൂഹത്തിലെ മറ്റുള്ളവരെ ഈ മോഡലുകൾ പഠിക്കാൻ അനുവദിക്കുന്നു, ഈ സുപ്രധാനവും അതിവേഗം വികസിച്ചുകൊണ്ടിരിക്കുന്നതുമായ ഈ മേഖലയിലേക്കുള്ള പ്രവേശനം കൂടുതൽ ജനാധിപത്യവൽക്കരിക്കുന്നു,” മെറ്റ തന്റെ ബ്ലോഗിൽ പറഞ്ഞു. .ദ്യോഗികം .

7B മുതൽ 65B പാരാമീറ്ററുകൾ വരെയുള്ള ഭാഷാ മോഡലുകളുടെ ഒരു ശേഖരമാണ് LAMA. പബ്ലിക് ഡാറ്റാസെറ്റുകൾ ഉപയോഗിച്ച് അത്യാധുനിക മോഡലുകളെ പരിശീലിപ്പിക്കാമെന്നും ഉടമസ്ഥതയിലുള്ളതും ആക്‌സസ് ചെയ്യാനാകാത്തതുമായ ഡാറ്റാസെറ്റുകളെ ആശ്രയിക്കരുതെന്നും പറഞ്ഞു, ട്രില്യൺ കണക്കിന് ടോക്കണുകളിൽ തങ്ങളുടെ മോഡലുകളെ പരിശീലിപ്പിക്കുന്നതായി കമ്പനി പറഞ്ഞു.

ലാമ വ്യത്യസ്തനാണ്

മെറ്റയുടെ അഭിപ്രായത്തിൽ, LAMA പോലുള്ള മോഡൽ പരിശീലനത്തിന് പുതിയ ഉപയോഗ കേസുകൾ പരിശോധിക്കാനും സാധൂകരിക്കാനും പര്യവേക്ഷണം ചെയ്യാനും വളരെ കുറച്ച് കമ്പ്യൂട്ടിംഗ് പവർ മാത്രമേ ആവശ്യമുള്ളൂ. അടിസ്ഥാന ഭാഷാ മോഡലുകൾ ലേബൽ ചെയ്യാത്ത ഡാറ്റയുടെ വലിയ ബ്ലോക്കുകളിൽ പരിശീലിപ്പിക്കുന്നു, ഇത് വിവിധ ജോലികളിലേക്ക് ഇഷ്‌ടാനുസൃതമാക്കുന്നതിന് അനുയോജ്യമാക്കുന്നു.

തൻ്റെ ഗവേഷണ പ്രബന്ധത്തിൽ, മിക്ക മാനദണ്ഡങ്ങളിലും LAMA-13B ഓപ്പൺഎഐയുടെ GPT-3 (175B) യെക്കാൾ മികച്ച പ്രകടനം കാഴ്ചവെച്ചതായും LAMA-65B മികച്ച മോഡലുകളോട് മത്സരിക്കുന്നതായും മെറ്റ അഭിപ്രായപ്പെട്ടു. DeepMind-ന്റെ Chinchilla70B e Google-ൽ നിന്നുള്ള PalM-540B.

മെറ്റാ ഐ ഉൽപ്പന്നങ്ങളിലൊന്നും നിലവിൽ LAMA ഉപയോഗത്തിലില്ല, എന്നിരുന്നാലും, ഇത് ഗവേഷകർക്ക് ലഭ്യമാക്കാൻ കമ്പനിക്ക് പദ്ധതിയുണ്ട്. കമ്പനി മുമ്പ് അതിന്റെ LLM OPT-175B പുറത്തിറക്കിയിരുന്നു, എന്നാൽ LAMA അതിന്റെ ഏറ്റവും നൂതനമായ സംവിധാനമാണ്.

ഗവേഷണ ഉപയോഗ കേസുകളിൽ ശ്രദ്ധ കേന്ദ്രീകരിച്ച് വാണിജ്യേതര ലൈസൻസിന് കീഴിൽ കമ്പനി ഇത് ലഭ്യമാക്കുന്നു. ഇത് അക്കാദമിക് ഗവേഷകർക്ക് ലഭ്യമാകും; സർക്കാർ, സിവിൽ സൊസൈറ്റി, അക്കാദമിക് സംഘടനകൾ എന്നിവയുമായി ബന്ധപ്പെട്ടവർ; ലോകമെമ്പാടുമുള്ള വ്യാവസായിക ഗവേഷണ ലബോറട്ടറികളും.

Ercole Palmeri