Članci

GPT4 naspram ChatGPT-a: Analiziramo metode obuke, izvedbu, mogućnosti i ograničenja

Očekuje se da će novi model generativnog jezika potpuno transformirati cijele industrije, uključujući medije, obrazovanje, pravo i tehnologiju. 

Posljednjih mjeseci, brzina kojom su objavljeni inovativni veliki jezični modeli je zapanjujuća. U ovom ćemo članku pokriti glavne sličnosti i razlike između GPT4 i ChatGPT-a, uključujući metode obuke, izvedbu, mogućnosti i ograničenja.

GPT4 u odnosu na ChatGPT: Sličnosti i razlike u metodama treninga

GPT4 i ChatGPT temelje se na starijim verzijama GPT modela s poboljšanjima arhitekture modela, korištenjem sofisticiranijih metoda obuke i s većim brojem parametara obuke.

Oba dizajna temelje se na transformatorskoj arhitekturi, koja koristi koder za obradu ulaznih sekvenci i dekoder za generiranje izlaznih sekvenci. Koder i dekoder povezani su mehanizmom koji omogućuje dekoderu da obrati više pozornosti na najznačajnije ulazne sekvence.

GPT4 tehničko izvješće OpenAI nudi malo uvida u arhitekturu modela i proces formiranja GPT4, citirajući "competitive landscape and the safety implications of large-scale models“. Ono što znamo je da se GPT4 i ChatGPT vjerojatno treniraju na sličan način, što je prilično različito od metoda obuke koje se koriste za GPT-2 i GPT-3. Znamo puno više o metodama obuke za ChatGPT nego GPT4, pa ćemo od toga početi.

ChatGPT

ChatGPT je obučen s dijaloškim skupovima podataka, uključujući demo podatke, gdje ljudski anotatori demonstriraju očekivani rezultat pomoćnika chatbota kao odgovor na specifične zahtjeve. Ovi se podaci koriste za podešavanje GPT3.5 s nadziranim učenjem, stvarajući model politike koji se koristi za generiranje višestrukih odgovora kada se zahtjevi dostave. Ljudski anotatori zatim klasificiraju koji je od odgovora za dani upit dao najbolje rezultate, što se koristi za treniranje modela nagrađivanja. Model nagrađivanja zatim se koristi za iterativno fino podešavanje modela politike korištenjem učenja s potkrepljenjem.

ChatGPT je obučen za korištenje Pojačanje Učenje iz ljudskih povratnih informacija (RLHF), način uključivanja ljudske povratne informacije za poboljšanje jezičnog modela tijekom obuke. Ovo omogućuje usklađivanje izlaza modela s aktivnošću koju korisnik traži, umjesto da samo predviđa sljedeću riječ u rečenici na temelju skupa generičkih podataka o obuci, kao što je GPT-3.

GPT4

OpenAI tek treba otkriti detalje o tome kako je trenirao GPT4. Njihovo tehničko izvješće ne uključuje "details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar“. Ono što znamo je da je GPT4 uvježbani generativni višemodni model u stilu transformatora. I na javno dostupnim podacima i na podacima trećih strana koji su licencirani i naknadno fino podešeni pomoću RLHF-aZanimljivo je da je OpenAI podijelio pojedinosti o svojim ažuriranim RLHF tehnikama kako bi odgovori modela bili točniji i manja vjerojatnost da će odlutati izvan sigurnosnih zaštitnih ograda.

Nakon obuke modela politike (kao kod ChatGPT-a), RLHF se koristi u adversarnoj obuci, procesu koji obučava model na zlonamjernim primjerima s namjerom da prevari model da ga brani od takvih primjera u budućnosti. U slučaju GPT4, stručnjaci ocjenjuju odgovore političkog modela na proturječne zahtjeve. Ti se odgovori zatim koriste za treniranje dodatnih modela nagrađivanja koji iterativno usavršavaju model politike, što rezultira modelom za koji je manje vjerojatno da će dati opasne, izbjegavajuće ili netočne odgovore.

GPT4 u odnosu na ChatGPT sličnosti i razlike u smislu izvedbe i mogućnosti

kapacitet

Što se tiče funkcionalnosti, ChatGPT i GPT4 više su slični nego različiti. Kao i njegov prethodnik, GPT-4 također komunicira u stilu razgovora koji ima za cilj uskladiti se s korisnikom. Kao što možete vidjeti u nastavku, odgovori između dvaju modela za široko pitanje vrlo su slični.

OpenAI se slaže da razlika između modela može biti suptilna i navodi da "razlika dolazi do izražaja kada složenost zadatka dosegne dovoljan prag". S obzirom na šest mjeseci kontradiktorne obuke kroz koju je osnovni model GPT4 prošao u fazi nakon obuke, ovo je vjerojatno točna karakterizacija.

Za razliku od ChatGPT-a, koji prihvaća samo tekst, GPT4 prihvaća i slikovne i tekstualne upite, vraćajući tekstualne odgovore. U trenutku pisanja ovog teksta, nažalost, mogućnost korištenja slikovnih unosa još nije javno dostupna.

Izvođenje

Kao što je gore spomenuto, OpenAI izvještava o značajnom poboljšanju sigurnosnih performansi za GPT4, u usporedbi s GPT-3.5 (na kojem je ChatGPT podešen). Međutim, trenutno nije jasno je li:

  • smanjenje odgovora na zahtjeve za zabranjenim sadržajem,
  • smanjenje stvaranja toksičnih sadržaja e
  • poboljšanje odgovora na osjetljive teme

nastaju zbog samog modela GPT4 ili dodatnih kontradiktornih testova.

Osim toga, GPT4 nadmašuje CPT-3.5 u većini akademskih i stručnih ispita koje polažu ljudi. Značajno, GPT4 postiže 90. percentil na Jedinstvenom pravosudnom ispitu u usporedbi s GPT-3.5, koji postiže 10. percentil. GPT4 također značajno nadmašuje svog prethodnika na referentnim vrijednostima tradicionalnih jezičnih modela i drugim SOTA modelima (iako ponekad tijesno).

GPT4 vs ChatGPT: razlike i ograničenjai

I ChatGPT i GPT4 imaju značajna ograničenja i rizike. Tablica GPT-4 sustava uključuje uvide iz detaljnog istraživanja tih rizika koje je proveo OpenAI.

Ovo su samo neki od rizika povezanih s oba modela:

  • Halucinacije (sklonost stvaranju besmislenog ili činjenično netočnog sadržaja)
  • Proizvoditi štetan sadržaj koji krši OpenAI pravila (npr. govor mržnje, poticanje na nasilje)
  • Pojačati i produžiti stereotipe o marginaliziranim ljudima
  • Generirati realistične dezinformacije s namjerom obmane

Dok se ChatGPT i GPT-4 bore s istim ograničenjima i rizicima, OpenAI je uložio posebne napore, uključujući brojne kontradiktorne testove, kako bi ih ublažio za GPT-4. Iako je ovo ohrabrujuće, tablica GPT-4 sustava u konačnici pokazuje koliko je ChatGPT bio ranjiv (i možda još uvijek jest). Za detaljnije objašnjenje štetnih neželjenih posljedica, preporučujem čitanje GPT-4 stranice sustava, koja počinje na stranici 38 u GPT-4 tehničko izvješće .

zaključak

Iako malo znamo o arhitekturi modela i metodama obuke iza GPT4, čini se da postoji dorađena verzija ChatGPT-a. Zapravo, trenutno GPT4 može prihvatiti slike i unos teksta, a rezultati su sigurniji, točniji i kreativniji. Nažalost, morat ćemo vjerovati OpenAI-ju na riječ jer je GPT4 dostupan samo kao dio pretplate na ChatGPT Plus.

Biti informiran o napretku, rizicima i ograničenjima ovih modela ključno je dok se krećemo ovim uzbudljivim, ali brzo razvijajućim krajolikom velikih jezičnih modela.

BlogInnovazione.it

Možda će vas zanimati

Innovation newsletter
Ne propustite najvažnije vijesti o inovacijama. Prijavite se da ih primate e-poštom.

Nedavni članci

Izdavači i OpenAI potpisuju ugovore za reguliranje protoka informacija koje obrađuje umjetna inteligencija

Prošlog ponedjeljka, Financial Times je najavio dogovor s OpenAI-jem. FT licencira svoje novinarstvo svjetske klase...

Travnja 30 2024

Online plaćanja: Evo kako vas usluge strujanja tjeraju da plaćate zauvijek

Milijuni ljudi plaćaju usluge strujanja, plaćajući mjesečne pretplate. Uvriježeno je mišljenje da ste…

Travnja 29 2024

Veeam nudi najopsežniju podršku za ransomware, od zaštite do odgovora i oporavka

Coveware by Veeam nastavit će pružati usluge odgovora na incidente cyber iznude. Coveware će ponuditi forenziku i mogućnosti sanacije...

Travnja 23 2024

Zelena i digitalna revolucija: Kako prediktivno održavanje transformira industriju nafte i plina

Prediktivno održavanje revolucionira sektor nafte i plina, s inovativnim i proaktivnim pristupom upravljanju postrojenjima.…

Travnja 22 2024