Соңғы айларда инновациялық үлкен тіл үлгілерінің шығарылу жылдамдығы таң қалдырады. Бұл мақалада біз GPT4 және ChatGPT арасындағы негізгі ұқсастықтар мен айырмашылықтарды, соның ішінде оқыту әдістерін, өнімділігін, мүмкіндіктері мен шектеулерін қарастырамыз.
GPT4 және ChatGPT үлгі архитектурасы жақсартылған, күрделірек оқыту әдістерін қолданатын және оқыту параметрлерінің көп саны бар GPT үлгілерінің ескі нұсқаларына негізделген.
Екі дизайн да кіріс реттілігін өңдеу үшін кодтағышты және шығыс тізбектерін генерациялау үшін декодерді пайдаланатын трансформатор архитектурасына негізделген. Кодер мен дешифратор механизм арқылы қосылған, ол декодерге ең маңызды кіріс реттіліктеріне көбірек назар аударуға мүмкіндік береді.
GPT4 техникалық есебі OpenAI бағдарламасы модель архитектурасы мен GPT4 қалыптастыру процесі туралы аз түсінік береді, «competitive landscape and the safety implications of large-scale models
«. Біз білетін нәрсе, GPT4 және ChatGPT бірдей дайындалған болуы мүмкін, бұл GPT-2 және GPT-3 үшін қолданылатын оқыту әдістерінен айтарлықтай ерекшеленеді. Біз ChatGPT үшін оқыту әдістері туралы GPT4-ке қарағанда көбірек білеміз, сондықтан біз сол жерден бастаймыз.
ChatGPT диалогтық деректер жиынымен, соның ішінде адам аннотаторлары арнайы сұрауларға жауап ретінде чатбот көмекшісінің күтілетін нәтижесін көрсететін демонстрациялық деректермен оқытылады. Бұл деректер сұраулар берілген кезде бірнеше жауаптарды генерациялау үшін пайдаланылатын саясат үлгісін жасай отырып, GPT3.5 бақыланатын оқытумен реттеу үшін пайдаланылады. Содан кейін адам аннотаторлары берілген сұрауға жауаптардың қайсысы жақсы нәтиже бергенін жіктейді, ол марапат үлгісін үйрету үшін пайдаланылады. Сыйақы моделі одан кейін күшейтілген оқытуды пайдалана отырып, саясат үлгісін итеративті түрде дәл реттеу үшін пайдаланылады.
ChatGPT көмегімен оқытылады Адамның кері байланысынан оқытуды күшейту (RLHF), оқыту кезінде тілдік үлгіні жақсарту үшін адамның кері байланысын қосу тәсілі. Бұл GPT-3 сияқты жалпы оқыту деректерінің жиынтығына негізделген сөйлемдегі келесі сөзді жай ғана болжаудың орнына, үлгі шығысын пайдаланушы сұраған әрекетке сәйкестендіруге мүмкіндік береді.
OpenAI GPT4-ті қалай үйреткені туралы мәліметтерді әлі ашқан жоқ. Олардың техникалық есебінде «details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar
«. Біз білетін нәрсе - GPT4 - трансформатор стиліндегі генеративті мультимодалы үлгі. Жалпыға қолжетімді деректерде де, лицензияланған және кейін RLHF көмегімен дәл реттелген үшінші тарап деректерінде де. Бір қызығы, OpenAI модельдік жауаптарды дәлірек ету және қауіпсіздік қоршауларынан тыс ауытқу ықтималдығын азайту үшін жаңартылған RLHF әдістері туралы мәліметтермен бөлісті.
Саясат үлгісін үйреткеннен кейін (ChatGPT сияқты) RLHF бәсекелестік тренингте пайдаланылады, модельді келешекте осындай мысалдардан қорғау үшін алдауға арналған зиянды мысалдар бойынша модельді жаттықтыратын процесс. GPT4 жағдайында сарапшылар саяси модельдің қарама-қайшы талаптарға жауаптарын бағалайды. Содан кейін бұл жауаптар саясат үлгісін итеративті түрде нақтылайтын қосымша сыйақы үлгілерін үйрету үшін пайдаланылады, нәтижесінде қауіпті, жалтаратын немесе дәл емес жауаптарды беру ықтималдығы азырақ үлгі пайда болады.
Функционалдылық тұрғысынан ChatGPT және GPT4 басқаларға қарағанда ұқсас. Алдыңғы нұсқасы сияқты, GPT-4 де пайдаланушымен сәйкестендіруге бағытталған сөйлесу стилінде өзара әрекеттеседі. Төменде көріп отырғаныңыздай, кең сұраққа арналған екі модель арасындағы жауаптар өте ұқсас.
OpenAI модельдер арасындағы айырмашылық нәзік болуы мүмкін екендігімен келіседі және «айырмашылық тапсырманың күрделілігі жеткілікті шекке жеткенде пайда болады» деп мәлімдейді. GPT4 базалық үлгісі жаттығудан кейінгі кезеңде өткен алты айлық қарсыластық жаттығуларын ескере отырып, бұл дәл сипаттама болуы мүмкін.
Тек мәтінді қабылдайтын ChatGPT-тен айырмашылығы, GPT4 мәтіндік жауаптарды қайтара отырып, кескінді де, мәтінді де қабылдайды. Осы жазу кезінде, өкінішке орай, кескін енгізулерін пайдалану мүмкіндігі әлі жалпыға қолжетімді емес.
Жоғарыда айтылғандай, OpenAI GPT-4 (ChatGPT бапталған) салыстырғанда GPT3.5 үшін қауіпсіздік көрсеткіштерінің айтарлықтай жақсарғанын хабарлайды. Дегенмен, әзірге белгісіз:
GPT4 үлгісінің өзіне немесе қосымша қарама-қайшы сынақтарға байланысты.
Сонымен қатар, GPT4 адам қабылдаған көптеген академиялық және кәсіби емтихандарда CPT-3.5-тен асып түседі. Атап айтқанда, GPT4 біркелкі бар емтиханында 90-шы пайыздық ұпай жинайтын GPT-3.5-пен салыстырғанда 10-шы пайыздық ұпай жинайды. GPT4 сонымен қатар дәстүрлі тіл үлгісінің эталондары мен басқа SOTA үлгілері бойынша алдыңғысынан айтарлықтай асып түседі (кейде аз болса да).
ChatGPT және GPT4 екеуінде де айтарлықтай шектеулер мен тәуекелдер бар. GPT-4 жүйелік парағы OpenAI жүргізген тәуекелдерді егжей-тегжейлі зерттеуден алынған түсініктерді қамтиды.
Бұл екі модельге қатысты тәуекелдердің кейбірі ғана:
ChatGPT және GPT-4 бірдей шектеулермен және тәуекелдермен күресіп жатқанымен, OpenAI оларды GPT-4 үшін жеңілдету үшін көптеген қарама-қайшы сынақтарды қоса, арнайы күш-жігер жұмсады. Бұл жігерлендіретін болса да, GPT-4 жүйелік парағы сайып келгенде ChatGPT қаншалықты осал болғанын көрсетеді (мүмкін әлі де солай). Зиянды күтпеген салдарларды егжей-тегжейлі түсіндіру үшін мен GPT-4 жүйелік парағын оқуды ұсынамын, ол құжаттың 38-беттен басталады. GPT-4 техникалық есеп .
Біз GPT4 үлгісінің архитектурасы мен оқыту әдістері туралы аз білсек те, ChatGPT-тің нақтыланған нұсқасы бар сияқты. Шындығында, қазіргі уақытта GPT4 кескіндерді және мәтінді енгізуді қабылдай алады және нәтижелер қауіпсіз, дәлірек және креативті. Өкінішке орай, біз бұл үшін OpenAI сөзін қабылдауымыз керек, өйткені GPT4 тек ChatGPT Plus жазылымының бөлігі ретінде қолжетімді.
Бұл үлгілердің барысы, тәуекелдері мен шектеулері туралы хабардар болу өте маңызды, өйткені біз үлкен тіл үлгілерінің осы қызықты, бірақ жылдам дамып жатқан пейзажын шарлаймыз.
BlogInnovazione.it
Apple Vision Pro коммерциялық көру құралын пайдаланып офтальмопластика операциясы Катания емханасында жасалды…
Ұсақ моториканы бояу арқылы дамыту балаларды жазу сияқты күрделі дағдыларға дайындайды. Бояу үшін…
Әскери-теңіз секторы 150 миллиардтық нарыққа бет алған нағыз жаһандық экономикалық держава болып табылады...
Өткен дүйсенбіде Financial Times OpenAI-мен келісім туралы жариялады. FT өзінің әлемдік деңгейдегі журналистикасына лицензия береді…