Артиколи

GPT4 және ChatGPT: Біз оқыту әдістерін, өнімділігін, мүмкіндіктері мен шектеулерін талдаймыз

Жаңа генеративті тіл моделі БАҚ, білім, құқық және технологияны қоса алғанда, бүкіл индустрияны толығымен өзгертеді деп күтілуде.

Соңғы айларда инновациялық үлкен тіл үлгілерінің шығарылу жылдамдығы таң қалдырады. Бұл мақалада біз GPT4 және ChatGPT арасындағы негізгі ұқсастықтар мен айырмашылықтарды, соның ішінде оқыту әдістерін, өнімділігін, мүмкіндіктері мен шектеулерін қарастырамыз.

Мазмұны индексі

GPT4 қарсы GPT чат: Оқыту әдістерінің ұқсастығы мен айырмашылығы

GPT4 және ChatGPT үлгі архитектурасы жақсартылған, күрделірек оқыту әдістерін қолданатын және оқыту параметрлерінің көп саны бар GPT үлгілерінің ескі нұсқаларына негізделген.

Екі дизайн да кіріс реттілігін өңдеу үшін кодтағышты және шығыс тізбектерін генерациялау үшін декодерді пайдаланатын трансформатор архитектурасына негізделген. Кодер мен дешифратор механизм арқылы қосылған, ол декодерге ең маңызды кіріс реттіліктеріне көбірек назар аударуға мүмкіндік береді.

GPT4 техникалық есебі OpenAI бағдарламасы модель архитектурасы мен GPT4 қалыптастыру процесі туралы аз түсінік береді, «competitive landscape and the safety implications of large-scale models«. Біз білетін нәрсе, GPT4 және ChatGPT бірдей дайындалған болуы мүмкін, бұл GPT-2 және GPT-3 үшін қолданылатын оқыту әдістерінен айтарлықтай ерекшеленеді. Біз ChatGPT үшін оқыту әдістері туралы GPT4-ке қарағанда көбірек білеміз, сондықтан біз сол жерден бастаймыз.

GPT чат

ChatGPT диалогтық деректер жиынымен, соның ішінде адам аннотаторлары арнайы сұрауларға жауап ретінде чатбот көмекшісінің күтілетін нәтижесін көрсететін демонстрациялық деректермен оқытылады. Бұл деректер сұраулар берілген кезде бірнеше жауаптарды генерациялау үшін пайдаланылатын саясат үлгісін жасай отырып, GPT3.5 бақыланатын оқытумен реттеу үшін пайдаланылады. Содан кейін адам аннотаторлары берілген сұрауға жауаптардың қайсысы жақсы нәтиже бергенін жіктейді, ол марапат үлгісін үйрету үшін пайдаланылады. Сыйақы моделі одан кейін күшейтілген оқытуды пайдалана отырып, саясат үлгісін итеративті түрде дәл реттеу үшін пайдаланылады.

ChatGPT көмегімен оқытылады Адамның кері байланысынан оқытуды күшейту (RLHF), оқыту кезінде тілдік үлгіні жақсарту үшін адамның кері байланысын қосу тәсілі. Бұл GPT-3 сияқты жалпы оқыту деректерінің жиынтығына негізделген сөйлемдегі келесі сөзді жай ғана болжаудың орнына, үлгі шығысын пайдаланушы сұраған әрекетке сәйкестендіруге мүмкіндік береді.

GPT4

OpenAI GPT4-ті қалай үйреткені туралы мәліметтерді әлі ашқан жоқ. Олардың техникалық есебінде «details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar«. Біз білетін нәрсе - GPT4 - трансформатор стиліндегі генеративті мультимодалы үлгі. Жалпыға қолжетімді деректерде де, лицензияланған және кейін RLHF көмегімен дәл реттелген үшінші тарап деректерінде де. Бір қызығы, OpenAI модельдік жауаптарды дәлірек ету және қауіпсіздік қоршауларынан тыс ауытқу ықтималдығын азайту үшін жаңартылған RLHF әдістері туралы мәліметтермен бөлісті.

Саясат үлгісін үйреткеннен кейін (ChatGPT сияқты) RLHF бәсекелестік тренингте пайдаланылады, модельді келешекте осындай мысалдардан қорғау үшін алдауға арналған зиянды мысалдар бойынша модельді жаттықтыратын процесс. GPT4 жағдайында сарапшылар саяси модельдің қарама-қайшы талаптарға жауаптарын бағалайды. Содан кейін бұл жауаптар саясат үлгісін итеративті түрде нақтылайтын қосымша сыйақы үлгілерін үйрету үшін пайдаланылады, нәтижесінде қауіпті, жалтаратын немесе дәл емес жауаптарды беру ықтималдығы азырақ үлгі пайда болады.

GPT4 және ChatGPT өнімділігі мен мүмкіндіктері бойынша ұқсастықтары мен айырмашылықтары

Сыйымдылық

Функционалдылық тұрғысынан ChatGPT және GPT4 басқаларға қарағанда ұқсас. Алдыңғы нұсқасы сияқты, GPT-4 де пайдаланушымен сәйкестендіруге бағытталған сөйлесу стилінде өзара әрекеттеседі. Төменде көріп отырғаныңыздай, кең сұраққа арналған екі модель арасындағы жауаптар өте ұқсас.

OpenAI модельдер арасындағы айырмашылық нәзік болуы мүмкін екендігімен келіседі және «айырмашылық тапсырманың күрделілігі жеткілікті шекке жеткенде пайда болады» деп мәлімдейді. GPT4 базалық үлгісі жаттығудан кейінгі кезеңде өткен алты айлық қарсыластық жаттығуларын ескере отырып, бұл дәл сипаттама болуы мүмкін.

Тек мәтінді қабылдайтын ChatGPT-тен айырмашылығы, GPT4 мәтіндік жауаптарды қайтара отырып, кескінді де, мәтінді де қабылдайды. Осы жазу кезінде, өкінішке орай, кескін енгізулерін пайдалану мүмкіндігі әлі жалпыға қолжетімді емес.

Өнімділік

Жоғарыда айтылғандай, OpenAI GPT-4 (ChatGPT бапталған) салыстырғанда GPT3.5 үшін қауіпсіздік көрсеткіштерінің айтарлықтай жақсарғанын хабарлайды. Дегенмен, әзірге белгісіз:

тыйым салынған мазмұнға қатысты сұрауларға жауаптардың азаюы,
улы заттардың түзілуін азайту e
сезімтал тақырыптарға жауаптарды жақсарту

GPT4 үлгісінің өзіне немесе қосымша қарама-қайшы сынақтарға байланысты.

Сонымен қатар, GPT4 адам қабылдаған көптеген академиялық және кәсіби емтихандарда CPT-3.5-тен асып түседі. Атап айтқанда, GPT4 біркелкі бар емтиханында 90-шы пайыздық ұпай жинайтын GPT-3.5-пен салыстырғанда 10-шы пайыздық ұпай жинайды. GPT4 сонымен қатар дәстүрлі тіл үлгісінің эталондары мен басқа SOTA үлгілері бойынша алдыңғысынан айтарлықтай асып түседі (кейде аз болса да).

GPT4 және ChatGPT: айырмашылықтар мен шектеулерi

ChatGPT және GPT4 екеуінде де айтарлықтай шектеулер мен тәуекелдер бар. GPT-4 жүйелік парағы OpenAI жүргізген тәуекелдерді егжей-тегжейлі зерттеуден алынған түсініктерді қамтиды.

Бұл екі модельге қатысты тәуекелдердің кейбірі ғана:

галлюцинация (мағынасыз немесе нақты емес мазмұнды шығару үрдісі)
OpenAI саясаттарын бұзатын зиянды мазмұнды шығару (мысалы, өшпенділік, зорлық-зомбылыққа шақыру)
Маргиналды адамдардың стереотиптерін күшейту және жалғастыру
Алдауға арналған шынайы жалған ақпаратты жасаңыз

ChatGPT және GPT-4 бірдей шектеулермен және тәуекелдермен күресіп жатқанымен, OpenAI оларды GPT-4 үшін жеңілдету үшін көптеген қарама-қайшы сынақтарды қоса, арнайы күш-жігер жұмсады. Бұл жігерлендіретін болса да, GPT-4 жүйелік парағы сайып келгенде ChatGPT қаншалықты осал болғанын көрсетеді (мүмкін әлі де солай). Зиянды күтпеген салдарларды егжей-тегжейлі түсіндіру үшін мен GPT-4 жүйелік парағын оқуды ұсынамын, ол құжаттың 38-беттен басталады. GPT-4 техникалық есеп .

қорытынды

Біз GPT4 үлгісінің архитектурасы мен оқыту әдістері туралы аз білсек те, ChatGPT-тің нақтыланған нұсқасы бар сияқты. Шындығында, қазіргі уақытта GPT4 кескіндерді және мәтінді енгізуді қабылдай алады және нәтижелер қауіпсіз, дәлірек және креативті. Өкінішке орай, біз бұл үшін OpenAI сөзін қабылдауымыз керек, өйткені GPT4 тек ChatGPT Plus жазылымының бөлігі ретінде қолжетімді.

Бұл үлгілердің барысы, тәуекелдері мен шектеулері туралы хабардар болу өте маңызды, өйткені біз үлкен тіл үлгілерінің осы қызықты, бірақ жылдам дамып жатқан пейзажын шарлаймыз.

BlogInnovazione.it