raksti

GPT4 pret ChatGPT: mēs analizējam apmācības metodes, veiktspēju, iespējas un ierobežojumus

Paredzams, ka jaunais ģeneratīvās valodas modelis pilnībā pārveidos visas nozares, tostarp plašsaziņas līdzekļus, izglītību, tiesību aktus un tehnoloģijas. 

Pēdējos mēnešos inovatīvu lielo valodu modeļu izlaišanas ātrums ir pārsteidzošs. Šajā rakstā mēs apskatīsim galvenās līdzības un atšķirības starp GPT4 un ChatGPT, tostarp apmācības metodes, veiktspēju, iespējas un ierobežojumus.

GPT4 vs ChatGPT: Treniņu metožu līdzības un atšķirības

GPT4 un ChatGPT pamatā ir vecākas GPT modeļu versijas ar uzlabojumiem modeļa arhitektūrā, izmantojot sarežģītākas apmācības metodes un ar lielāku apmācības parametru skaitu.

Abu dizainu pamatā ir transformatora arhitektūra, kurā ievades secību apstrādei tiek izmantots kodētājs un izvades secību ģenerēšanai dekodētājs. Kodētājs un dekodētājs ir savienoti ar mehānismu, kas ļauj dekodētājam pievērst lielāku uzmanību nozīmīgākajām ievades sekvencēm.

GPT4 tehniskais ziņojums OpenAI piedāvā nelielu ieskatu modeļa arhitektūrā un GPT4 veidošanas procesā, atsaucoties uz "competitive landscape and the safety implications of large-scale models“. Mēs zinām, ka GPT4 un ChatGPT, iespējams, tiek apmācīti līdzīgi, kas ir diezgan liela atšķirība no GPT-2 un GPT-3 izmantotajām apmācības metodēm. Mēs zinām daudz vairāk par ChatGPT apmācības metodēm nekā GPT4, tāpēc sāksim ar to.

ChatGPT

ChatGPT ir apmācīts ar dialoga datu kopām, tostarp demonstrācijas datiem, kur cilvēku anotatori parāda sagaidāmo tērzēšanas robota palīga rezultātu, reaģējot uz konkrētiem pieprasījumiem. Šie dati tiek izmantoti, lai pielāgotu GPT3.5 ar uzraudzītu mācīšanos, izveidojot politikas modeli, kas tiek izmantots, lai ģenerētu vairākas atbildes, kad tiek sniegti pieprasījumi. Cilvēku anotatori pēc tam klasificē, kura no atbildēm uz doto uzvedni sniedza vislabākos rezultātus, ko izmanto, lai apmācītu atalgojuma modeli. Pēc tam atalgojuma modelis tiek izmantots, lai iteratīvi precizētu politikas modeli, izmantojot pastiprinošu mācīšanos.

ChatGPT ir apmācīts, izmantojot Mācīšanās no cilvēku atgriezeniskās saites pastiprināšana (RLHF), veids, kā iekļaut cilvēku atgriezenisko saiti, lai apmācības laikā uzlabotu valodas modeli. Tas ļauj modeļa izvadi saskaņot ar lietotāja pieprasīto darbību, nevis tikai paredzēt nākamo vārdu teikumā, pamatojoties uz vispārīgu apmācības datu kopumu, piemēram, GPT-3.

GPT4

OpenAI vēl nav atklājis sīkāku informāciju par to, kā tā apmācīja GPT4. Viņu tehniskajā ziņojumā nav iekļautsdetails about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar“. Mēs zinām, ka GPT4 ir apmācīts transformatora stila ģeneratīvs daudzmodu modelis. Gan uz publiski pieejamiem datiem, gan trešo pušu datiem, kas licencēti un pēc tam precizēti, izmantojot RLHFInteresanti, ka OpenAI dalījās ar informāciju par atjauninātajām RLHF metodēm, lai modeļa reakcijas būtu precīzākas un mazāka iespēja izkļūt ārpus drošības margām.

Pēc politikas modeļa apmācības (tāpat kā ChatGPT gadījumā) RLHF tiek izmantots pretrunīgā apmācībā — procesā, kurā tiek apmācīts modelis par ļaunprātīgiem piemēriem, kuru mērķis ir apmānīt modeli, lai to aizsargātu pret šādiem piemēriem nākotnē. GPT4 gadījumā eksperti izvērtē politiskā modeļa atbildes uz pretrunīgajām prasībām. Pēc tam šīs atbildes tiek izmantotas, lai apmācītu papildu atalgojuma modeļus, kas iteratīvi pilnveido politikas modeli, tādējādi iegūstot modeli, kas, visticamāk, nesniegs bīstamas, izvairīgas vai neprecīzas atbildes.

GPT4 un ChatGPT līdzības un atšķirības veiktspējas un iespēju ziņā

Jauda

Funkcionalitātes ziņā ChatGPT un GPT4 ir vairāk līdzīgi nekā atšķirīgi. Tāpat kā tā priekšgājējs, GPT-4 arī mijiedarbojas sarunvalodas stilā, kura mērķis ir saskaņot ar lietotāju. Kā redzat tālāk, atbildes starp diviem modeļiem plašam jautājumam ir ļoti līdzīgas.

OpenAI piekrīt, ka atšķirība starp modeļiem var būt smalka, un norāda, ka "atšķirība parādās, kad uzdevuma sarežģītība sasniedz pietiekamu slieksni". Ņemot vērā sešus mēnešus ilgušo pretrunīgo apmācību, ko GPT4 bāzes modelis piedzīvoja pēcapmācības fāzē, tas, iespējams, ir precīzs raksturojums.

Atšķirībā no ChatGPT, kas pieņem tikai tekstu, GPT4 pieņem gan attēlu, gan teksta uzvednes, atgriežot teksta atbildes. Diemžēl šajā rakstīšanas brīdī iespēja izmantot attēlu ievades iespējas vēl nav publiski pieejama.

Izrāde

Kā minēts iepriekš, OpenAI ziņo par ievērojamu GPT4 drošības veiktspējas uzlabojumu salīdzinājumā ar GPT-3.5 (no kura tika pielāgots ChatGPT). Tomēr pašlaik nav skaidrs, vai:

  • samazināt atbilžu skaitu uz pieprasījumiem par aizliegtu saturu,
  • toksiska satura veidošanās samazināšana, e
  • uzlabot atbildes uz jutīgām tēmām

ir saistīts ar pašu GPT4 modeli vai papildu pretrunīgiem testiem.

Turklāt GPT4 pārspēj CPT-3.5 lielākajā daļā cilvēku kārtoto akadēmisko un profesionālo eksāmenu. Konkrēti, GPT4 vērtējums ir 90. procentilē Uniform Bar eksāmenā, salīdzinot ar GPT-3.5, kura rezultāts ir 10. procentile. GPT4 arī ievērojami pārspēj savu priekšgājēju tradicionālo valodu modeļu etalonos un citos SOTA modeļos (lai gan dažkārt par šauru).

GPT4 pret ChatGPT: atšķirības un ierobežojumii

Gan ChatGPT, gan GPT4 ir būtiski ierobežojumi un riski. GPT-4 sistēmas lapa ietver ieskatus no OpenAI veiktās šo risku detalizētas izpētes.

Šie ir tikai daži no riskiem, kas saistīti ar abiem modeļiem:

  • Halucinācijas (tieksme radīt nejēdzīgu vai faktiski neprecīzu saturu)
  • Radīt kaitīgu saturu, kas pārkāpj OpenAI politikas (piemēram, naida runu, kūdīšanu uz vardarbību).
  • Pastiprināt un iemūžināt stereotipus par marginalizētiem cilvēkiem
  • Izveidojiet reālistisku dezinformāciju, kuras mērķis ir maldināt

Kamēr ChatGPT un GPT-4 cīnās ar vienādiem ierobežojumiem un riskiem, OpenAI ir pielicis īpašas pūles, tostarp daudzus pretrunīgus testus, lai tos mazinātu attiecībā uz GPT-4. Lai gan tas ir iepriecinoši, GPT-4 sistēmas lapa galu galā parāda, cik neaizsargāts bija ChatGPT (un, iespējams, joprojām ir). Lai iegūtu sīkāku skaidrojumu par kaitīgām neparedzētām sekām, iesaku izlasīt GPT-4 sistēmas lapu, kas sākas 38. lappusē. GPT-4 tehniskais ziņojums .

secinājums

Lai gan mēs maz zinām par GPT4 modeļa arhitektūru un apmācības metodēm, šķiet, ka ir pilnveidota ChatGPT versija. Patiesībā pašlaik GPT4 spēj pieņemt attēlus un teksta ievadi, un rezultāti ir drošāki, precīzāki un radošāki. Diemžēl mums būs jāpieņem OpenAI vārds, jo GPT4 ir pieejams tikai kā daļa no ChatGPT Plus abonementa.

Ir ļoti svarīgi būt informētam par šo modeļu progresu, riskiem un ierobežojumiem, jo ​​mēs pārvietojamies šajā aizraujošajā, bet strauji mainīgajā lielo valodu modeļu ainavā.

BlogInnovazione.it

Jums var būt interesē

Inovāciju biļetens
Nepalaidiet garām svarīgākās ziņas par jauninājumiem. Reģistrējieties, lai tos saņemtu pa e-pastu.

Jaunākie Raksti

Novatoriska iejaukšanās paplašinātajā realitātē ar Apple skatītāju Katānijas poliklīnikā

Katānijas poliklīnikā tika veikta oftalmoplastikas operācija, izmantojot Apple Vision Pro komerciālo skatītāju…

3 maijā 2024

Krāsojamo lapu priekšrocības bērniem — burvju pasaule visu vecumu cilvēkiem

Smalko motoriku attīstīšana, izmantojot krāsošanu, sagatavo bērnus sarežģītākām prasmēm, piemēram, rakstīšanai. Lai krāsotu…

2 maijā 2024

Nākotne ir klāt: kā kuģniecības nozare revolucionizē globālo ekonomiku

Jūras flotes nozare ir patiess globāls ekonomikas spēks, kas ir virzījies uz 150 miljardu tirgu...

1 maijā 2024

Izdevēji un OpenAI paraksta līgumus, lai regulētu mākslīgā intelekta apstrādātās informācijas plūsmu

Pagājušajā pirmdienā Financial Times paziņoja par darījumu ar OpenAI. FT licencē savu pasaules līmeņa žurnālistiku…

30 aprīlis 2024