സമീപ മാസങ്ങളിൽ, നൂതനമായ വലിയ ഭാഷാ മോഡലുകൾ പുറത്തിറക്കിയ വേഗത അതിശയിപ്പിക്കുന്നതാണ്. ഈ ലേഖനത്തിൽ, പരിശീലന രീതികൾ, പ്രകടനം, കഴിവുകൾ, പരിമിതികൾ എന്നിവയുൾപ്പെടെ GPT4 vs ChatGPT തമ്മിലുള്ള പ്രധാന സമാനതകളും വ്യത്യാസങ്ങളും ഞങ്ങൾ ഉൾപ്പെടുത്തും.
GPT4, ChatGPT എന്നിവ GPT മോഡലുകളുടെ പഴയ പതിപ്പുകളിൽ മോഡൽ ആർക്കിടെക്ചറിലെ മെച്ചപ്പെടുത്തലുകളോടെയും കൂടുതൽ സങ്കീർണ്ണമായ പരിശീലന രീതികൾ ഉപയോഗിച്ചും ഉയർന്ന പരിശീലന പാരാമീറ്ററുകൾ ഉപയോഗിച്ചും നിർമ്മിക്കുന്നു.
രണ്ട് ഡിസൈനുകളും ട്രാൻസ്ഫോർമർ ആർക്കിടെക്ചറിനെ അടിസ്ഥാനമാക്കിയുള്ളതാണ്, ഇത് ഇൻപുട്ട് സീക്വൻസുകൾ പ്രോസസ്സ് ചെയ്യുന്നതിന് ഒരു എൻകോഡറും ഔട്ട്പുട്ട് സീക്വൻസുകൾ സൃഷ്ടിക്കാൻ ഒരു ഡീകോഡറും ഉപയോഗിക്കുന്നു. എൻകോഡറും ഡീകോഡറും ഒരു മെക്കാനിസം വഴി ബന്ധിപ്പിച്ചിരിക്കുന്നു, ഇത് ഡീകോഡറിനെ ഏറ്റവും പ്രധാനപ്പെട്ട ഇൻപുട്ട് സീക്വൻസുകളിലേക്ക് കൂടുതൽ ശ്രദ്ധിക്കാൻ അനുവദിക്കുന്നു.
GPT4 സാങ്കേതിക റിപ്പോർട്ട് മോഡൽ ആർക്കിടെക്ചറിനെയും GPT4 രൂപീകരണ പ്രക്രിയയെയും കുറിച്ച് ഓപ്പൺഎഐ ചെറിയ ഉൾക്കാഴ്ച നൽകുന്നു, "competitive landscape and the safety implications of large-scale models
". GPT4 ഉം ChatGPT ഉം ഒരുപക്ഷെ സമാനമായ രീതിയിൽ പരിശീലിപ്പിച്ചിട്ടുണ്ടെന്നാണ് ഞങ്ങൾക്ക് അറിയാവുന്നത്, ഇത് GPT-2, GPT-3 എന്നിവയ്ക്ക് ഉപയോഗിക്കുന്ന പരിശീലന രീതികളിൽ നിന്ന് തികച്ചും വ്യത്യസ്തമാണ്. GPT4 നേക്കാൾ ChatGPT-നുള്ള പരിശീലന രീതികളെക്കുറിച്ച് ഞങ്ങൾക്ക് കൂടുതൽ അറിയാം, അതിനാൽ ഞങ്ങൾ അവിടെ നിന്ന് ആരംഭിക്കും.
ഡെമോ ഡാറ്റ ഉൾപ്പെടെയുള്ള ഡയലോഗ് ഡാറ്റാസെറ്റുകൾ ഉപയോഗിച്ച് ChatGPT പരിശീലിപ്പിക്കപ്പെടുന്നു, അവിടെ പ്രത്യേക അഭ്യർത്ഥനകൾക്ക് മറുപടിയായി ഒരു ചാറ്റ്ബോട്ട് അസിസ്റ്റന്റിന്റെ പ്രതീക്ഷിക്കുന്ന ഔട്ട്പുട്ട് മനുഷ്യ വ്യാഖ്യാനകർ പ്രകടമാക്കുന്നു. അഭ്യർത്ഥനകൾ നൽകുമ്പോൾ ഒന്നിലധികം പ്രതികരണങ്ങൾ സൃഷ്ടിക്കാൻ ഉപയോഗിക്കുന്ന ഒരു പോളിസി മോഡൽ നിർമ്മിക്കുന്ന, സൂപ്പർവൈസുചെയ്ത പഠനത്തോടൊപ്പം GPT3.5 ട്യൂൺ ചെയ്യാൻ ഈ ഡാറ്റ ഉപയോഗിക്കുന്നു. ഒരു റിവാർഡ് മോഡൽ പരിശീലിപ്പിക്കാൻ ഉപയോഗിക്കുന്ന, തന്നിരിക്കുന്ന പ്രോംപ്റ്റിനുള്ള പ്രതികരണങ്ങളിൽ ഏതാണ് മികച്ച ഫലം നൽകിയതെന്ന് ഹ്യൂമൻ വ്യാഖ്യാനകർ തരംതിരിക്കുന്നു. റൈൻഫോഴ്സ്മെന്റ് ലേണിംഗ് ഉപയോഗിച്ച് പോളിസി മോഡൽ ആവർത്തിച്ച് മികച്ചതാക്കാൻ റിവാർഡ് മോഡൽ ഉപയോഗിക്കുന്നു.
ChatGPT ഉപയോഗിച്ചാണ് പരിശീലിപ്പിക്കുന്നത് മാനുഷിക ഫീഡ്ബാക്കിൽ നിന്ന് ശക്തിപ്പെടുത്തൽ പഠനം (RLHF), പരിശീലന സമയത്ത് ഒരു ഭാഷാ മാതൃക മെച്ചപ്പെടുത്തുന്നതിന് മനുഷ്യ ഫീഡ്ബാക്ക് സംയോജിപ്പിക്കുന്നതിനുള്ള ഒരു മാർഗം. GPT-3 പോലുള്ള ഒരു പൊതു പരിശീലന ഡാറ്റയെ അടിസ്ഥാനമാക്കി ഒരു വാക്യത്തിലെ അടുത്ത വാക്ക് പ്രവചിക്കുന്നതിനുപകരം, ഉപയോക്താവ് അഭ്യർത്ഥിച്ച പ്രവർത്തനവുമായി വിന്യസിക്കാൻ മോഡൽ ഔട്ട്പുട്ടിനെ ഇത് അനുവദിക്കുന്നു.
GPT4 എങ്ങനെ പരിശീലിപ്പിച്ചു എന്നതിനെക്കുറിച്ചുള്ള വിശദാംശങ്ങൾ OpenAI ഇതുവരെ വെളിപ്പെടുത്തിയിട്ടില്ല. അവരുടെ സാങ്കേതിക റിപ്പോർട്ടിൽ ഉൾപ്പെടുന്നില്ല "details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar
". GPT4 പരിശീലനം ലഭിച്ച ട്രാൻസ്ഫോർമർ-സ്റ്റൈൽ ജനറേറ്റീവ് മൾട്ടിമോഡ് മോഡലാണെന്ന് നമുക്കറിയാം. പൊതുവായി ലഭ്യമായ ഡാറ്റയിലും ലൈസൻസുള്ള മൂന്നാം കക്ഷി ഡാറ്റയിലും RLHF ഉപയോഗിച്ച് നന്നായി ക്രമീകരിക്കുകയും ചെയ്യുന്നു. കൗതുകകരമെന്നു പറയട്ടെ, മോഡൽ പ്രതികരണങ്ങൾ കൂടുതൽ കൃത്യമാക്കുന്നതിനും സുരക്ഷാ ഗാർഡ്റെയിലുകൾക്ക് പുറത്തേക്ക് നീങ്ങാനുള്ള സാധ്യത കുറയ്ക്കുന്നതിനുമായി ഓപ്പൺഎഐ അവരുടെ അപ്ഡേറ്റ് ചെയ്ത RLHF സാങ്കേതികതകളെക്കുറിച്ചുള്ള വിശദാംശങ്ങൾ പങ്കിട്ടു.
ഒരു പോളിസി മോഡൽ (ചാറ്റ്ജിപിടി പോലെ) പരിശീലിപ്പിച്ചതിന് ശേഷം, പ്രതികൂല പരിശീലനത്തിൽ RLHF ഉപയോഗിക്കുന്നു, ഭാവിയിൽ അത്തരം ഉദാഹരണങ്ങൾക്കെതിരെ മോഡലിനെ കബളിപ്പിക്കാൻ ഉദ്ദേശിച്ചുള്ള ക്ഷുദ്ര ഉദാഹരണങ്ങളിൽ ഒരു മോഡലിനെ പരിശീലിപ്പിക്കുന്ന ഒരു പ്രക്രിയ. GPT4-ന്റെ കാര്യത്തിൽ, വൈരുദ്ധ്യാത്മകമായ ആവശ്യങ്ങളോടുള്ള രാഷ്ട്രീയ മാതൃകയുടെ പ്രതികരണങ്ങളെ വിദഗ്ധർ വിലയിരുത്തുന്നു. പോളിസി മോഡൽ ആവർത്തിച്ച് പരിഷ്ക്കരിക്കുന്ന അധിക റിവാർഡ് മോഡലുകളെ പരിശീലിപ്പിക്കാൻ ഈ പ്രതികരണങ്ങൾ ഉപയോഗിക്കപ്പെടുന്നു, അതിന്റെ ഫലമായി അപകടകരമോ ഒഴിവാക്കുന്നതോ കൃത്യമല്ലാത്തതോ ആയ പ്രതികരണങ്ങൾ നൽകാനുള്ള സാധ്യത കുറവാണ്.
പ്രവർത്തനക്ഷമതയുടെ കാര്യത്തിൽ, ChatGPT, GPT4 എന്നിവ വ്യത്യസ്തമായതിനേക്കാൾ സമാനമാണ്. അതിന്റെ മുൻഗാമിയെപ്പോലെ, GPT-4 ഉപയോക്താവുമായി യോജിപ്പിക്കാൻ ലക്ഷ്യമിടുന്ന ഒരു സംഭാഷണ ശൈലിയിൽ സംവദിക്കുന്നു. നിങ്ങൾക്ക് ചുവടെ കാണാൻ കഴിയുന്നതുപോലെ, വിശാലമായ ചോദ്യത്തിനുള്ള രണ്ട് മോഡലുകൾക്കിടയിലുള്ള ഉത്തരങ്ങൾ വളരെ സമാനമാണ്.
മോഡലുകൾ തമ്മിലുള്ള വ്യത്യാസം സൂക്ഷ്മമായിരിക്കുമെന്ന് OpenAI സമ്മതിക്കുകയും "ടാസ്ക്കിന്റെ സങ്കീർണ്ണത മതിയായ പരിധിയിലെത്തുമ്പോൾ വ്യത്യാസം പുറത്തുവരുന്നു" എന്ന് പ്രസ്താവിക്കുകയും ചെയ്യുന്നു. പരിശീലനത്തിനു ശേഷമുള്ള ഘട്ടത്തിൽ GPT4 ബേസ് മോഡൽ നടത്തിയ ആറ് മാസത്തെ എതിരാളി പരിശീലനം കണക്കിലെടുക്കുമ്പോൾ, ഇത് ഒരുപക്ഷേ കൃത്യമായ സ്വഭാവമാണ്.
ടെക്സ്റ്റ് മാത്രം സ്വീകരിക്കുന്ന ChatGPT-ൽ നിന്ന് വ്യത്യസ്തമായി, GPT4 ഇമേജ്, ടെക്സ്റ്റ് പ്രോംപ്റ്റുകൾ സ്വീകരിക്കുന്നു, ടെക്സ്റ്റ് പ്രതികരണങ്ങൾ നൽകുന്നു. നിർഭാഗ്യവശാൽ, ഈ എഴുത്ത് വരെ, ഇമേജ് ഇൻപുട്ടുകൾ ഉപയോഗിക്കാനുള്ള കഴിവ് ഇതുവരെ പൊതുവായി ലഭ്യമല്ല.
മുകളിൽ സൂചിപ്പിച്ചതുപോലെ, GPT-4-നെ അപേക്ഷിച്ച് (ചാറ്റ്ജിപിടി ട്യൂൺ ചെയ്തത്) GPT3.5-നുള്ള സുരക്ഷാ പ്രകടനത്തിൽ കാര്യമായ പുരോഗതി OpenAI റിപ്പോർട്ട് ചെയ്യുന്നു. എന്നിരുന്നാലും, നിലവിൽ ഇത് വ്യക്തമല്ല:
GPT4 മോഡൽ തന്നെയോ അല്ലെങ്കിൽ അധിക വൈരുദ്ധ്യമുള്ള പരിശോധനകൾ മൂലമോ ആണ്.
കൂടാതെ, മനുഷ്യർ എടുക്കുന്ന മിക്ക അക്കാദമിക്, പ്രൊഫഷണൽ പരീക്ഷകളിലും GPT4 CPT-3.5 നെ മറികടക്കുന്നു. പത്താം പെർസെൻറ്റൈലിൽ സ്കോർ ചെയ്യുന്ന GPT-4 നെ അപേക്ഷിച്ച്, യൂണിഫോം ബാർ പരീക്ഷയിൽ 90-ാമത്തെ പെർസെൻറ്റൈലിൽ GPT3.5 സ്കോർ ചെയ്യുന്നു എന്നത് ശ്രദ്ധേയമാണ്. പരമ്പരാഗത ഭാഷാ മോഡൽ ബെഞ്ച്മാർക്കുകളിലും മറ്റ് SOTA മോഡലുകളിലും (ചിലപ്പോൾ ഇടുങ്ങിയതാണെങ്കിലും) GPT10 അതിന്റെ മുൻഗാമിയെ ഗണ്യമായി മറികടക്കുന്നു.
ChatGPT, GPT4 എന്നിവയ്ക്ക് കാര്യമായ പരിമിതികളും അപകടസാധ്യതകളും ഉണ്ട്. GPT-4 സിസ്റ്റം ഷീറ്റിൽ OpenAI നടത്തുന്ന അപകടസാധ്യതകളുടെ വിശദമായ പര്യവേക്ഷണത്തിൽ നിന്നുള്ള സ്ഥിതിവിവരക്കണക്കുകൾ ഉൾപ്പെടുന്നു.
രണ്ട് മോഡലുകളുമായും ബന്ധപ്പെട്ട ചില അപകടസാധ്യതകൾ ഇവയാണ്:
ChatGPT ഉം GPT-4 ഉം ഒരേ പരിമിതികളോടും അപകടസാധ്യതകളോടും കൂടി പോരാടുമ്പോൾ, GPT-4-നായി അവയെ ലഘൂകരിക്കുന്നതിന്, വിരുദ്ധമായ നിരവധി പരിശോധനകൾ ഉൾപ്പെടെ, OpenAI പ്രത്യേക ശ്രമങ്ങൾ നടത്തി. ഇത് പ്രോത്സാഹജനകമാണെങ്കിലും, GPT-4 സിസ്റ്റം ഷീറ്റ് ആത്യന്തികമായി ChatGPT എത്രത്തോളം ദുർബലമായിരുന്നുവെന്ന് (ഒരുപക്ഷേ ഇപ്പോഴും) കാണിക്കുന്നു. ദോഷകരമായ ഉദ്ദേശിക്കാത്ത അനന്തരഫലങ്ങളുടെ കൂടുതൽ വിശദമായ വിശദീകരണത്തിന്, 4-ാം പേജിൽ ആരംഭിക്കുന്ന GPT-38 സിസ്റ്റം ഷീറ്റ് വായിക്കാൻ ഞാൻ ശുപാർശ ചെയ്യുന്നു. GPT-4 സാങ്കേതിക റിപ്പോർട്ട് .
GPT4-ന് പിന്നിലെ മോഡൽ ആർക്കിടെക്ചറിനെയും പരിശീലന രീതികളെയും കുറിച്ച് ഞങ്ങൾക്ക് കുറച്ച് അറിയാമെങ്കിലും, ChatGPT-യുടെ ഒരു പരിഷ്കൃത പതിപ്പ് ഉണ്ടെന്ന് തോന്നുന്നു. വാസ്തവത്തിൽ, നിലവിൽ GPT4 ന് ചിത്രങ്ങളും ടെക്സ്റ്റ് ഇൻപുട്ടും സ്വീകരിക്കാൻ കഴിയും, കൂടാതെ ഫലങ്ങൾ സുരക്ഷിതവും കൂടുതൽ കൃത്യവും കൂടുതൽ ക്രിയാത്മകവുമാണ്. നിർഭാഗ്യവശാൽ, ChatGPT പ്ലസ് സബ്സ്ക്രിപ്ഷന്റെ ഭാഗമായി മാത്രമേ GPT4 ലഭ്യമാകൂ എന്നതിനാൽ, അതിനായി ഞങ്ങൾ OpenAI-യുടെ വാക്ക് എടുക്കേണ്ടിവരും.
വലിയ ഭാഷാ മോഡലുകളുടെ ആവേശകരവും എന്നാൽ അതിവേഗം വികസിക്കുന്നതുമായ ഈ ലാൻഡ്സ്കേപ്പ് നാവിഗേറ്റ് ചെയ്യുമ്പോൾ ഈ മോഡലുകളുടെ പുരോഗതി, അപകടസാധ്യതകൾ, പരിമിതികൾ എന്നിവയെക്കുറിച്ച് അറിഞ്ഞിരിക്കേണ്ടത് അത്യാവശ്യമാണ്.
BlogInnovazione.it
കളറിംഗ് വഴി മികച്ച മോട്ടോർ കഴിവുകൾ വികസിപ്പിക്കുന്നത് എഴുത്ത് പോലെയുള്ള കൂടുതൽ സങ്കീർണ്ണമായ കഴിവുകൾക്ക് കുട്ടികളെ സജ്ജമാക്കുന്നു. നിറം കൊടുക്കാൻ...
നാവിക മേഖല ഒരു യഥാർത്ഥ ആഗോള സാമ്പത്തിക ശക്തിയാണ്, അത് 150 ബില്യൺ വിപണിയിലേക്ക് നാവിഗേറ്റ് ചെയ്തു...
കഴിഞ്ഞ തിങ്കളാഴ്ച, ഫിനാൻഷ്യൽ ടൈംസ് ഓപ്പൺഎഐയുമായി ഒരു കരാർ പ്രഖ്യാപിച്ചു. FT അതിൻ്റെ ലോകോത്തര പത്രപ്രവർത്തനത്തിന് ലൈസൻസ് നൽകുന്നു…
ദശലക്ഷക്കണക്കിന് ആളുകൾ സ്ട്രീമിംഗ് സേവനങ്ങൾക്കായി പണമടയ്ക്കുന്നു, പ്രതിമാസ സബ്സ്ക്രിപ്ഷൻ ഫീസ് നൽകുന്നു. നിങ്ങൾ എന്നത് പൊതുവായ അഭിപ്രായമാണ്...