Artiklid

GPT4 vs ChatGPT: analüüsime treeningmeetodeid, jõudlust, võimalusi ja piiranguid

Eeldatakse, et uus generatiivne keelemudel muudab täielikult terveid tööstusharusid, sealhulgas meediat, haridust, õigust ja tehnoloogiat. 

Viimastel kuudel on uuenduslike suurte keelemudelite väljalaskmise kiirus hämmastav. Selles artiklis käsitleme peamisi sarnasusi ja erinevusi GPT4 ja ChatGPT vahel, sealhulgas koolitusmeetodeid, jõudlust, võimalusi ja piiranguid.

GPT4 vs ChatGPT: Treeningmeetodite sarnasused ja erinevused

GPT4 ja ChatGPT põhinevad GPT mudelite vanematel versioonidel, millel on mudeliarhitektuuri täiustused, kasutades keerukamaid koolitusmeetodeid ja suurema arvu koolitusparameetreid.

Mõlemad konstruktsioonid põhinevad trafo arhitektuuril, mis kasutab sisendjadade töötlemiseks kodeerijat ja väljundjadade genereerimiseks dekoodrit. Kodeerija ja dekooder on omavahel ühendatud mehhanismiga, mis võimaldab dekooderil pöörata suuremat tähelepanu kõige olulisematele sisendjadadele.

GPT4 tehniline aruanne OpenAI pakub vähe ülevaadet mudeli arhitektuurist ja GPT4 moodustamise protsessist, viidates "competitive landscape and the safety implications of large-scale models“. Mida me teame, on see, et GPT4 ja ChatGPT on tõenäoliselt koolitatud sarnaselt, mis on üsna erinev GPT-2 ja GPT-3 koolitusmeetoditest. Teame ChatGPT koolitusmeetodite kohta palju rohkem kui GPT4 jaoks, seega alustame sellest.

ChatGPT

ChatGPT on koolitatud dialoogide andmekogumitega, sealhulgas demoandmetega, kus inimannotaatorid näitavad vestlusroti assistendi eeldatavat väljundit vastuseks konkreetsetele taotlustele. Neid andmeid kasutatakse GPT3.5 häälestamiseks juhendatud õppega, luues poliitikamudeli, mida kasutatakse päringu esitamisel mitme vastuse genereerimiseks. Seejärel klassifitseerivad inimannotaatorid, millised antud viipa vastused andsid parimaid tulemusi, mida kasutatakse tasumudeli koolitamiseks. Seejärel kasutatakse tasu mudelit poliitikamudeli iteratiivseks peenhäälestamiseks, kasutades tugevdavat õpet.

ChatGPT on koolitatud kasutades Inimeste tagasisidest õppimise tugevdamine (RLHF), viis inimeste tagasiside kaasamiseks keelemudeli täiustamiseks koolituse ajal. See võimaldab mudeli väljundil joonduda kasutaja nõutud tegevusega, selle asemel, et ennustada lause järgmist sõna üldiste treeningandmete (nt GPT-3) põhjal.

GPT4

OpenAI ei ole veel avaldanud üksikasju selle kohta, kuidas ta GPT4 koolitas. Nende tehniline aruanne ei sisalda "details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar“. Mida me teame, on see, et GPT4 on treenitud trafo-stiilis generatiivne mitmerežiimiline mudel. Nii avalikult kättesaadavate andmete kui ka kolmanda osapoole andmete puhul, mis on litsentsitud ja hiljem RLHF-i abil viimistletudHuvitav on see, et OpenAI jagas üksikasju oma uuendatud RLHF-tehnikate kohta, et muuta mudeli vastused täpsemaks ja vähem tõenäoline, et need triiviksid väljaspool turvapiirdeid.

Pärast poliitikamudeli väljaõpetamist (nagu ChatGPT puhul) kasutatakse RLHF-i võistleva koolituse käigus – protsessis, mis koolitab mudelit pahatahtlike näidete põhjal, mille eesmärk on petta mudelit, et kaitsta seda tulevikus selliste näidete eest. GPT4 puhul hindavad eksperdid poliitilise mudeli vastuseid vastuolulistele nõudmistele. Neid vastuseid kasutatakse seejärel täiendavate tasumudelite koolitamiseks, mis viimistlevad poliitikamudelit iteratiivselt, mille tulemuseks on mudel, mis annab vähem tõenäoliselt ohtlikke, kõrvalehoidvaid või ebatäpseid vastuseid.

GPT4 vs ChatGPT sarnasused ja erinevused jõudluse ja võimaluste osas

Mahutavus

Funktsionaalsuse poolest on ChatGPT ja GPT4 pigem sarnased kui erinevad. Sarnaselt oma eelkäijaga suhtleb GPT-4 ka vestlusstiilis, mille eesmärk on kasutajaga joonduda. Nagu allpool näete, on laia küsimuse vastused kahe mudeli vahel väga sarnased.

OpenAI nõustub, et mudelite eristamine võib olla peen ja väidab, et "erinevus ilmneb siis, kui ülesande keerukus jõuab piisava läveni". Arvestades kuus kuud kestnud võistlevat koolitust, mille GPT4 baasmudel oma koolitusjärgses faasis läbis, on see tõenäoliselt täpne iseloomustus.

Erinevalt ChatGPT-st, mis aktsepteerib ainult teksti, aktsepteerib GPT4 nii pildi- kui ka tekstiviipasid, tagastades teksti vastused. Selle kirjutamise seisuga pole pildisisendite kasutamise võimalus kahjuks veel avalikult saadaval.

Esitus

Nagu eespool mainitud, teatab OpenAI GPT4 turvalisuse märkimisväärsest paranemisest võrreldes GPT-3.5-ga (millest ChatGPT häälestati). Praegu on aga ebaselge, kas:

  • keelatud sisu päringutele vastamiste vähendamine,
  • toksiliste ainete tekke vähendamine e
  • tundlikele teemadele reageerimise parandamine

on tingitud GPT4 mudelist endast või täiendavatest vastuolulistest testidest.

Lisaks edestab GPT4 CPT-3.5 enamikus inimeste sooritatud akadeemilistes ja kutseeksamites. Märkimisväärne on see, et GPT4 saavutab Uniform Bar eksami 90. protsentiili võrreldes GPT-3.5-ga, mille hind on 10. protsentiili. GPT4 edestab oluliselt oma eelkäijat traditsiooniliste keelemudelite võrdlusaluste ja teiste SOTA mudelite osas (ehkki mõnikord napilt).

GPT4 vs ChatGPT: erinevused ja piirangudi

Nii ChatGPT-l kui ka GPT4-l on olulised piirangud ja riskid. GPT-4 süsteemileht sisaldab teadmisi nende riskide üksikasjalikust uurimisest, mille on läbi viinud OpenAI.

Need on vaid mõned riskid, mis on seotud mõlema mudeliga:

  • Hallutsinatsioonid (kalduvus toota mõttetut või faktiliselt ebatäpset sisu)
  • Looge kahjulikku sisu, mis rikub OpenAI eeskirju (nt vihakõne, vägivalla õhutamine)
  • Tugevdada ja põlistada marginaliseeritud inimeste stereotüüpe
  • Looge petmiseks mõeldud realistlikku desinformatsiooni

Kuigi ChatGPT ja GPT-4 võitlevad samade piirangute ja riskidega, on OpenAI teinud erilisi jõupingutusi, sealhulgas arvukalt vastuolulisi teste, et neid GPT-4 puhul leevendada. Kuigi see on julgustav, näitab GPT-4 süsteemileht lõpuks, kui haavatav ChatGPT oli (ja võib-olla on see siiani). Kahjulike soovimatute tagajärgede täpsema selgituse saamiseks soovitan lugeda GPT-4 süsteemilehte, mis algab leheküljel 38. GPT-4 tehniline aruanne .

järeldus

Kuigi me teame vähe GPT4 mudeliarhitektuurist ja koolitusmeetoditest, tundub, et ChatGPT on täiustatud versioon. Tegelikult on praegu GPT4 võimeline vastu võtma pilte ja tekstisisestust ning tulemused on turvalisemad, täpsemad ja loomingulisemad. Kahjuks peame OpenAI sõna võtma, kuna GPT4 on saadaval ainult ChatGPT Plusi tellimuse osana.

Nende mudelite edenemise, riskide ja piirangutega kursis hoidmine on oluline, kui navigeerime sellel põneval, kuid kiiresti areneval suurte keelemudelite maastikul.

BlogInnovazione.it

Samuti võite olla huvitatud

Innovatsiooni uudiskiri
Ärge jätke ilma kõige olulisematest uuendustest. Registreeruge, et saada neid meili teel.

Viimased artiklid

Veeam pakub lunavarale kõige põhjalikumat tuge alates kaitsest kuni reageerimise ja taastamiseni

Veeami Coveware jätkab küberväljapressimise juhtumitele reageerimise teenuste pakkumist. Coveware pakub kohtuekspertiisi ja heastamisvõimalusi…

Aprill 23 2024

Roheline ja digitaalne revolutsioon: kuidas ennustav hooldus muudab nafta- ja gaasitööstust

Ennustav hooldus muudab nafta- ja gaasisektori pöördeliseks uuendusliku ja ennetava lähenemisega tehaste juhtimisele.…

Aprill 22 2024

Ühendkuningriigi monopolivastane regulaator tõstab BigTechi häire GenAI pärast

Ühendkuningriigi CMA on väljastanud hoiatuse Big Techi käitumise kohta tehisintellekti turul. Seal…

Aprill 18 2024

Casa Green: energiarevolutsioon jätkusuutliku tuleviku nimel Itaalias

Euroopa Liidu poolt hoonete energiatõhususe suurendamiseks koostatud roheliste majade dekreet on lõpetanud oma seadusandliku protsessi…

Aprill 18 2024