Акыркы айларда инновациялык чоң тил моделдерин чыгаруунун ылдамдыгы таң калыштуу. Бул макалада биз GPT4 жана ChatGPT ортосундагы негизги окшоштуктарды жана айырмачылыктарды, анын ичинде окутуу ыкмаларын, аткарууну, мүмкүнчүлүктөрдү жана чектөөлөрдү камтыйт.
GPT4 жана ChatGPT моделдердин архитектурасын өркүндөтүп, татаал окутуу ыкмаларын колдонуу менен жана окутуу параметрлеринин көп сандагы эски версияларына негизделет.
Эки дизайн тең трансформатордун архитектурасына негизделген, ал киргизүү ырааттуулугун иштетүү үчүн коддорду жана чыгуу ырааттуулугун түзүү үчүн декодерді колдонот. Кодер жана декодер механизм аркылуу туташтырылган, бул декодерге эң маанилүү киргизүү ырааттуулугуна көбүрөөк көңүл бурууга мүмкүндүк берет.
GPT4 техникалык отчету OpenAI моделинин архитектурасы жана GPT4 түзүү процесси жөнүндө азыраак түшүнүктү сунуштайт.competitive landscape and the safety implications of large-scale models
". Биз биле турган нерсе, GPT4 жана ChatGPT окшош даярдалган, бул GPT-2 жана GPT-3 үчүн колдонулган окутуу ыкмаларынан бир топ айырма. Биз ChatGPT үчүн окутуу ыкмалары жөнүндө GPT4ке караганда көбүрөөк билебиз, ошондуктан биз ошол жерден баштайбыз.
ChatGPT диалог берилиштер топтому, анын ичинде демо маалыматтар менен үйрөтүлгөн, мында адам аннотаторлору атайын суроо-талаптарга жооп катары чатбот жардамчысынын күтүлгөн натыйжасын көрсөтөт. Бул дайындар GPT3.5ти көзөмөлдөнгөн окутуу менен тууралоо үчүн колдонулат, саясат моделин түзүүдө, ал суроо-талаптар берилгенде бир нече жоопторду түзүү үчүн колдонулат. Андан кийин адам аннотаторлору берилген суроого жооптордун кайсынысы эң жакшы натыйжаларды бергенин классификациялашат, ал сыйлык моделин окутуу үчүн колдонулат. Сыйлык модели андан кийин бекемдөөчү окутууну колдонуу менен саясат моделин кайталап тактоо үчүн колдонулат.
ChatGPT колдонуу менен үйрөтүлгөн Адамдын пикирлеринен үйрөнүүнү бекемдөө (RLHF), окутуу учурунда тил моделин жакшыртуу үчүн адам пикирлерин киргизүү жолу. Бул GPT-3 сыяктуу жалпы окутуу маалыматтарынын негизинде сүйлөмдөгү кийинки сөздү жөн эле алдын ала айтуунун ордуна, моделдин чыгуусун колдонуучу сураган аракетке дал келтирүүгө мүмкүндүк берет.
OpenAI али GPT4 кантип үйрөткөндүгү тууралуу кеңири маалымат бере элек. Алардын техникалык отчету камтылбайт "details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar
". Биз билген нерсе, GPT4 үйрөтүлгөн трансформатордук стилдеги генеративдик мультимодудук модель. Жалпыга жеткиликтүү маалыматтар боюнча да, үчүнчү тараптын маалыматтары боюнча да лицензияланган жана кийин RLHF аркылуу жакшылап жөндөө. Кызыктуусу, OpenAI моделдик жоопторду тагыраак кылуу жана коопсуздук тосмолорунан сыртка чыгып кетүү ыктымалдуулугун азайтуу үчүн жаңыланган RLHF техникалары тууралуу маалымат бөлүштү.
Саясат моделин үйрөткөндөн кийин (ChatGPT сыяктуу), RLHF атаандаштык окутууда колдонулат, бул процесс зыяндуу мисалдар боюнча моделди үйрөтөт, бул моделди келечекте мындай мисалдардан коргоо үчүн алдоо үчүн арналган. GPT4 учурда, эксперттер саясий моделдин карама-каршы талаптарга жоопторуна баа беришет. Бул жооптор саясат моделин кайталап тактоо үчүн кошумча сыйлык моделдерин үйрөтүү үчүн колдонулат, натыйжада кооптуу, качкан же так эмес жоопторду берүү ыктымалдыгы азыраак модель пайда болот.
Функционалдык жагынан, ChatGPT жана GPT4 айырмачылыктарга караганда окшош. Мурункудай эле, GPT-4 да колдонуучу менен шайкеш келүүгө багытталган сүйлөшүү стилинде өз ара аракеттенет. Төмөндө көрүп тургандай, кеңири суроого эки моделдин ортосундагы жооптор абдан окшош.
OpenAI моделдердин ортосундагы айырмачылык тымызын болушу мүмкүн экенине кошулат жана "айырма тапшырманын татаалдыгы жетиштүү чекке жеткенде пайда болот" деп айтат. GPT4 базалык модели машыгуудан кийинки этапта өткөн алты айлык атаандаштык тренингин эске алганда, бул так мүнөздөмөсү болушу мүмкүн.
Текстти гана кабыл алган ChatGPTтен айырмаланып, GPT4 сүрөттү да, текстти да кабыл алып, тексттик жоопторду кайтарат. Бул жазылган учурда, тилекке каршы, сүрөт киргизүүнү колдонуу мүмкүнчүлүгү азырынча жалпыга жеткиликтүү эмес.
Жогоруда айтылгандай, OpenAI GPT-4 менен салыштырганда GPT3.5 үчүн коопсуздук көрсөткүчтөрү кыйла жакшырганын кабарлайт (ChatGPT орнотулган). Бирок, азырынча белгисиз:
GPT4 моделинин өзүнө же кошумча карама-каршы сыноолорго байланыштуу.
Кошумчалай кетсек, GPT4 көпчүлүк адам кабыл алган академиялык жана кесиптик сынактарда CPT-3.5тен ашып кетет. Белгилей кетсек, GPT4 Uniform Bar экзаменинде 90-проценттилде балл алган GPT-3.5ке салыштырмалуу 10-проценттилде балл алган. GPT4 ошондой эле салттуу тил моделинин эталондорунда жана башка SOTA моделдеринде (кээде тар болсо да) мурункусунан алда канча ашып кетет.
ChatGPT жана GPT4 экөө тең олуттуу чектөөлөргө жана тобокелдиктерге ээ. GPT-4 тутум баракчасы OpenAI тарабынан жүргүзүлгөн тобокелдиктерди деталдуу изилдөөдөн алынган түшүнүктөрдү камтыйт.
Бул эки модель менен байланышкан тобокелдиктердин кээ бирлери:
ChatGPT жана GPT-4 бирдей чектөөлөр жана тобокелдиктер менен күрөшүп жатканда, OpenAI аларды GPT-4 үчүн жумшартуу үчүн атайын аракеттерди, анын ичинде көптөгөн карама-каршы сыноолорду жасады. Бул бекемдээрлик болсо да, GPT-4 тутум баракчасы акыры ChatGPT канчалык аялуу болгонун көрсөтөт (жана балким дагы деле). Зыяндуу күтүлбөгөн кесепеттерди кененирээк түшүндүрүү үчүн мен GPT-4 системасынын барагын окууну сунуштайм, ал 38-беттен башталат. GPT-4 техникалык отчет .
Биз GPT4 үлгүсүнүн архитектурасы жана окутуу ыкмалары жөнүндө аз билгенибиз менен, ChatGPTтин такталган версиясы бар окшойт. Чынында, учурда GPT4 сүрөттөрдү жана текст киргизүүнү кабыл алат жана натыйжалары коопсуз, так жана чыгармачыл болуп саналат. Тилекке каршы, биз OpenAIдин сөзүн кабыл алышыбыз керек, анткени GPT4 ChatGPT Plus жазылуусунун бир бөлүгү катары гана жеткиликтүү.
Бул моделдердин прогресси, тобокелдиктери жана чектөөлөрү жөнүндө кабардар болуп туруу абдан маанилүү, анткени биз чоң тил моделдеринин бул кызыктуу, бирок тез өнүгүп жаткан пейзажында багыт алабыз.
BlogInnovazione.it
Veeam тарабынан Coveware кибер опузалап инциденттерге жооп берүү кызматтарын көрсөтүүнү улантат. Coveware криминалистика жана ремедиация мүмкүнчүлүктөрүн сунуштайт ...
Болжолдуу тейлөө заводду башкарууга инновациялык жана жигердүү мамиле кылуу менен мунай жана газ секторун революция кылып жатат.…
Улуу Британиянын CMA жасалма интеллект рыногунда Big Tech жүрүм-туруму жөнүндө эскертүү берди. Ал жерде…
Имараттардын энергетикалык натыйжалуулугун жогорулатуу үчүн Европа Биримдиги тарабынан иштелип чыккан "Case Green" Декрети өзүнүн мыйзам чыгаруу процессин аяктады ...