Članki

GPT4 proti ChatGPT: Analiziramo metode usposabljanja, zmogljivost, zmogljivosti in omejitve

Novi model generativnega jezika naj bi popolnoma preoblikoval celotne industrije, vključno z mediji, izobraževanjem, pravom in tehnologijo. 

V zadnjih mesecih je hitrost, s katero so bili objavljeni inovativni veliki jezikovni modeli, osupljiva. V tem članku bomo obravnavali glavne podobnosti in razlike med GPT4 in ChatGPT, vključno z metodami usposabljanja, zmogljivostjo, zmogljivostmi in omejitvami.

GPT4 proti ChatGPT: Podobnosti in razlike v metodah usposabljanja

GPT4 in ChatGPT temeljita na starejših različicah modelov GPT z izboljšavami arhitekture modela, z uporabo bolj sofisticiranih metod usposabljanja in z večjim številom parametrov usposabljanja.

Oba dizajna temeljita na transformatorski arhitekturi, ki uporablja kodirnik za obdelavo vhodnih sekvenc in dekoder za generiranje izhodnih sekvenc. Kodirnik in dekoder sta povezana z mehanizmom, ki dekoderju omogoča, da se bolj posveti najpomembnejšim vhodnim sekvencam.

Tehnično poročilo GPT4 OpenAI ponuja malo vpogleda v arhitekturo modela in proces oblikovanja GPT4, pri čemer navaja "competitive landscape and the safety implications of large-scale models“. Kar vemo, je, da se GPT4 in ChatGPT verjetno usposabljata podobno, kar je precejšnja razlika od metod usposabljanja, uporabljenih za GPT-2 in GPT-3. O metodah usposabljanja za ChatGPT vemo veliko več kot o GPT4, zato bomo začeli tam.

ChatGPT

ChatGPT je usposobljen z dialoškimi podatkovnimi nizi, vključno s predstavitvenimi podatki, kjer človeški označevalci prikazujejo pričakovan rezultat pomočnika chatbota kot odgovor na posebne zahteve. Ti podatki se uporabljajo za prilagajanje GPT3.5 z nadzorovanim učenjem, pri čemer se ustvari model pravilnika, ki se uporablja za ustvarjanje več odgovorov, ko so podane zahteve. Človeški označevalci nato razvrstijo, kateri od odgovorov za dani poziv je dal najboljše rezultate, kar se uporabi za usposabljanje modela nagrajevanja. Model nagrajevanja se nato uporabi za iterativno natančno prilagajanje modela politike z uporabo učenja z okrepitvijo.

ChatGPT je usposobljen za uporabo Okrepitveno učenje iz človeških povratnih informacij (RLHF), način za vključitev človeških povratnih informacij za izboljšanje jezikovnega modela med usposabljanjem. To omogoča, da se izhod modela uskladi z dejavnostjo, ki jo zahteva uporabnik, namesto da samo predvideva naslednjo besedo v stavku na podlagi skupka generičnih podatkov o usposabljanju, kot je GPT-3.

GPT4

OpenAI še ni razkril podrobnosti o tem, kako je usposobil GPT4. Njihovo tehnično poročilo ne vključuje "details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar“. Kar vemo, je, da je GPT4 izurjen generativni večmodni model transformatorja. Tako na javno dostopnih podatkih kot na podatkih tretjih oseb, licenciranih in naknadno natančno nastavljenih z uporabo RLHFZanimivo je, da je OpenAI delil podrobnosti v zvezi s svojimi posodobljenimi tehnikami RLHF, da bi bili odzivi modela natančnejši in manj verjetno, da bi odnesli zunaj varnostnih zaščitnih ograj.

Po usposabljanju modela pravilnika (kot pri ChatGPT) se RLHF uporablja v kontradiktornem usposabljanju, procesu, ki uri model na zlonamernih primerih, namenjenih pretentanju modela, da se brani pred takimi primeri v prihodnosti. V primeru GPT4 strokovnjaki ocenjujejo odzive političnega modela na nasprotujoče si zahteve. Ti odzivi se nato uporabijo za usposabljanje dodatnih modelov nagrajevanja, ki iterativno izpopolnijo model pravilnika, kar ima za posledico model, za katerega je manj verjetno, da bo zagotovil nevarne, izogibajoče se ali netočne odzive.

Podobnosti in razlike med GPT4 in ChatGPT v smislu zmogljivosti in zmogljivosti

Zmogljivost

Z vidika funkcionalnosti sta si ChatGPT in GPT4 bolj podobna kot različna. Tako kot njegov predhodnik tudi GPT-4 deluje v pogovornem slogu, ki se želi uskladiti z uporabnikom. Kot lahko vidite spodaj, sta si odgovora med obema modeloma za široko vprašanje zelo podobna.

OpenAI se strinja, da je razlika med modeli lahko subtilna in navaja, da "razlika pride do izraza, ko kompleksnost naloge doseže zadosten prag". Glede na šest mesecev kontradiktornega usposabljanja, ki ga je osnovni model GPT4 opravil v fazi po usposabljanju, je to verjetno natančna karakterizacija.

Za razliko od ChatGPT, ki sprejema samo besedilo, GPT4 sprejema tako slikovne kot besedilne pozive in vrača besedilne odgovore. Od tega pisanja na žalost možnost uporabe slikovnih vnosov še ni javno dostopna.

Izvedba

Kot je navedeno zgoraj, OpenAI poroča o znatnem izboljšanju varnostne zmogljivosti za GPT4 v primerjavi z GPT-3.5 (iz katerega je bil prilagojen ChatGPT). Vendar trenutno ni jasno, ali:

  • zmanjšanje odzivov na zahteve po prepovedanih vsebinah,
  • zmanjšanje nastajanja strupenih vsebin e
  • izboljšanje odzivov na občutljive teme

so posledica samega modela GPT4 ali dodatnih protislovnih testov.

Poleg tega GPT4 prekaša CPT-3.5 pri večini akademskih in strokovnih izpitov, ki jih opravljajo ljudje. Predvsem GPT4 doseže 90. percentil na Enotnem pravosodnem izpitu v primerjavi z GPT-3.5, ki doseže 10. percentil. GPT4 prav tako bistveno prekaša svojega predhodnika pri merilih uspešnosti tradicionalnih jezikovnih modelov in drugih modelih SOTA (čeprav včasih za malo).

GPT4 proti ChatGPT: razlike in omejitvei

Tako ChatGPT kot GPT4 imata precejšnje omejitve in tveganja. Sistemski list GPT-4 vključuje vpogled v podrobno raziskavo teh tveganj, ki jo je izvedel OpenAI.

To je le nekaj tveganj, povezanih z obema modeloma:

  • Halucinacije (nagnjenost k ustvarjanju nesmiselne ali dejansko netočne vsebine)
  • Ustvariti škodljivo vsebino, ki krši pravilnike OpenAI (npr. sovražni govor, spodbujanje k nasilju)
  • Okrepite in ohranite stereotipe o marginaliziranih ljudeh
  • Ustvarite realne dezinformacije, namenjene zavajanju

Medtem ko se ChatGPT in GPT-4 borita z enakimi omejitvami in tveganji, se je OpenAI posebej potrudil, vključno s številnimi protislovnimi testi, da bi jih ublažil za GPT-4. Čeprav je to spodbudno, sistemski list GPT-4 na koncu dokazuje, kako ranljiv je bil ChatGPT (in morda še vedno je). Za podrobnejšo razlago škodljivih nenamernih posledic priporočam branje sistemskega lista GPT-4, ki se začne na 38. strani Tehnično poročilo GPT-4 .

zaključek

Čeprav vemo malo o arhitekturi modela in metodah usposabljanja za GPT4, se zdi, da obstaja izboljšana različica ChatGPT. Pravzaprav GPT4 trenutno lahko sprejema slike in vnos besedila, rezultati pa so varnejši, natančnejši in ustvarjalnejši. Na žalost bomo morali verjeti OpenAI-ju na besedo, saj je GPT4 na voljo samo kot del naročnine ChatGPT Plus.

Biti obveščen o napredku, tveganjih in omejitvah teh modelov je ključnega pomena, ko krmarimo po tej razburljivi, a hitro razvijajoči se pokrajini velikih jezikovnih modelov.

BlogInnovazione.it

Morda vas tudi zanima

Glasilo o inovacijah
Ne zamudite najpomembnejših novic o inovacijah. Prijavite se, če jih želite prejemati po e-pošti.

Nedavni članki

Založniki in OpenAI podpisujejo sporazume za urejanje pretoka informacij, ki jih obdeluje umetna inteligenca

Prejšnji ponedeljek je Financial Times objavil dogovor z OpenAI. FT licencira svoje vrhunsko novinarstvo ...

April 30 2024

Spletna plačila: Evo, kako vam storitve pretakanja omogočajo večno plačevanje

Milijoni ljudi plačujejo storitve pretakanja in plačujejo mesečne naročnine. Splošno mnenje je, da si…

April 29 2024

Veeam ponuja najobsežnejšo podporo za izsiljevalsko programsko opremo, od zaščite do odziva in obnovitve

Coveware by Veeam bo še naprej zagotavljal storitve odzivanja na incidente kibernetskega izsiljevanja. Coveware bo nudil forenziko in zmogljivosti sanacije ...

April 23 2024

Zelena in digitalna revolucija: kako predvideno vzdrževanje preoblikuje naftno in plinsko industrijo

Prediktivno vzdrževanje revolucionira sektor nafte in plina z inovativnim in proaktivnim pristopom k upravljanju obratov.…

April 22 2024