Članci

GPT4 vs ChatGPT: Analiziramo metode obuke, performanse, mogućnosti i ograničenja

Očekuje se da će novi generativni jezički model u potpunosti transformirati čitave industrije, uključujući medije, obrazovanje, pravo i tehnologiju. 

Posljednjih mjeseci, brzina kojom su objavljeni inovativni modeli velikih jezika je zapanjujuća. U ovom članku ćemo pokriti glavne sličnosti i razlike između GPT4 i ChatGPT-a, uključujući metode obuke, performanse, mogućnosti i ograničenja.

GPT4 vs Chat GPT: Sličnosti i razlike u metodama obuke

GPT4 i ChatGPT se nadograđuju na starije verzije GPT modela uz poboljšanja arhitekture modela, koristeći sofisticiranije metode obuke i sa većim brojem parametara obuke.

Oba dizajna su zasnovana na arhitekturi transformatora, koja koristi enkoder za obradu ulaznih sekvenci i dekoder za generisanje izlaznih sekvenci. Koder i dekoder su povezani mehanizmom, koji omogućava dekoderu da posveti veću pažnju najvažnijim ulaznim sekvencama.

GPT4 tehnički izvještaj OpenAI nudi malo uvida u arhitekturu modela i proces formiranja GPT4, citirajući „competitive landscape and the safety implications of large-scale models“. Ono što znamo je da su GPT4 i ChatGPT vjerovatno obučeni slično, što je prilično razlika od metoda obuke koje se koriste za GPT-2 i GPT-3. Znamo mnogo više o metodama obuke za ChatGPT nego GPT4, pa ćemo početi od toga.

Chat GPT

ChatGPT je obučen sa skupovima podataka dijaloga, uključujući demo podatke, gdje ljudski anotatori demonstriraju očekivane rezultate chatbot pomoćnika kao odgovor na specifične zahtjeve. Ovi podaci se koriste za podešavanje GPT3.5 uz nadgledano učenje, stvarajući model politike, koji se koristi za generiranje višestrukih odgovora kada se zahtjevi dostavljaju. Ljudski anotatori zatim klasifikuju koji od odgovora za dati upit je dao najbolje rezultate, što se koristi za obuku modela nagrađivanja. Model nagrađivanja se zatim koristi za iterativno fino podešavanje modela politike korištenjem učenja potkrepljenja.

ChatGPT je obučen za korištenje Učenje s pojačanjem iz povratnih informacija od ljudi (RLHF), način da se inkorporiraju ljudske povratne informacije za poboljšanje jezičkog modela tokom treninga. Ovo omogućava da se izlaz modela uskladi sa aktivnošću koju zahteva korisnik, umesto da samo predviđa sledeću reč u rečenici na osnovu generičkih podataka o obuci, kao što je GPT-3.

GPT4

OpenAI tek treba da otkrije detalje o tome kako je trenirao GPT4. Njihov tehnički izvještaj ne uključuje “details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar“. Ono što znamo je da je GPT4 obučeni generativni multimodni model u transformatorskom stilu. I na javno dostupnim podacima i na podacima trećih strana koji su licencirani i naknadno fino podešeni pomoću RLHF-aZanimljivo je da je OpenAI podijelio detalje u vezi sa svojim ažuriranim RLHF tehnikama kako bi reakcije modela bile tačnije i manje vjerovatno da će zalutati izvan sigurnosnih ograda.

Nakon obuke modela politike (kao kod ChatGPT), RLHF se koristi u adversarnoj obuci, procesu koji obučava model na zlonamjernim primjerima s ciljem da se model prevari da ga brani od takvih primjera u budućnosti. U slučaju GPT4, stručnjaci ocjenjuju odgovore političkog modela na kontradiktorne zahtjeve. Ovi odgovori se zatim koriste za obuku dodatnih modela nagrađivanja koji iterativno preciziraju model politike, što rezultira modelom za koji je manje vjerovatno da će pružiti opasne, izbjegavajuće ili netačne odgovore.

GPT4 i ChatGPT sličnosti i razlike u pogledu performansi i mogućnosti

Kapacitet

Što se tiče funkcionalnosti, ChatGPT i GPT4 su više slični nego različiti. Kao i njegov prethodnik, GPT-4 takođe komunicira u stilu razgovora koji ima za cilj da se uskladi sa korisnikom. Kao što možete vidjeti u nastavku, odgovori između dva modela za široko pitanje su vrlo slični.

OpenAI se slaže da razlika između modela može biti suptilna i navodi da „razlika dolazi do izražaja kada složenost zadatka dostigne dovoljan prag“. S obzirom na šest mjeseci suprotstavljene obuke koju je GPT4 osnovni model prošao u fazi nakon treninga, ovo je vjerovatno tačna karakterizacija.

Za razliku od ChatGPT-a, koji prihvata samo tekst, GPT4 prihvata i slikovne i tekstualne upite, vraćajući tekstualne odgovore. U trenutku pisanja ovog teksta, nažalost, mogućnost korištenja ulaznih slika još nije javno dostupna.

Performanse

Kao što je gore pomenuto, OpenAI izveštava o značajnom poboljšanju bezbednosnih performansi za GPT4, u poređenju sa GPT-3.5 (iz kojeg je ChatGPT podešen). Međutim, trenutno je nejasno da li:

  • smanjenje odgovora na zahtjeve za zabranjeni sadržaj,
  • smanjenje stvaranja toksičnih sadržaja e
  • poboljšanje odgovora na osjetljive teme

su zbog samog GPT4 modela ili dodatnih kontradiktornih testova.

Osim toga, GPT4 nadmašuje CPT-3.5 u većini akademskih i profesionalnih ispita koje polažu ljudi. Značajno je da GPT4 ima rezultate u 90. percentilu na ispitu Uniform Bar u poređenju sa GPT-3.5, koji ima rezultat u 10. percentilu. GPT4 takođe značajno nadmašuje svog prethodnika na tradicionalnim jezičkim modelima i drugim SOTA modelima (iako ponekad usko).

GPT4 vs ChatGPT: razlike i ograničenjai

I ChatGPT i GPT4 imaju značajna ograničenja i rizike. GPT-4 sistemski list uključuje uvide iz detaljnog istraživanja tih rizika koje je sproveo OpenAI.

Ovo su samo neki od rizika povezanih sa oba modela:

  • Halucinacije (sklonost stvaranju besmislenog ili činjenično netačnog sadržaja)
  • Proizvesti štetan sadržaj koji krši pravila OpenAI (npr. govor mržnje, poticanje na nasilje)
  • Pojačati i održavati stereotipe o marginaliziranim ljudima
  • Generirajte realistične dezinformacije namijenjene zavaravanju

Dok se ChatGPT i GPT-4 bore sa istim ograničenjima i rizicima, OpenAI je uložio posebne napore, uključujući brojne kontradiktorne testove, da ih ublaži za GPT-4. Iako je ovo ohrabrujuće, GPT-4 sistemska tablica na kraju pokazuje koliko je ChatGPT bio ranjiv (a možda i dalje jeste). Za detaljnije objašnjenje štetnih neželjenih posljedica, preporučujem da pročitate GPT-4 sistemski list, koji počinje na stranici 38. GPT-4 tehnički izvještaj .

zaključak

Iako malo znamo o arhitekturi modela i metodama obuke iza GPT4, čini se da postoji rafinirana verzija ChatGPT-a. Zapravo, trenutno GPT4 može prihvatiti slike i unos teksta, a rezultati su sigurniji, precizniji i kreativniji. Nažalost, moraćemo da verujemo OpenAI-ju na reč, jer je GPT4 dostupan samo kao deo ChatGPT Plus pretplate.

Ostati informisan o napretku, rizicima i ograničenjima ovih modela je od suštinskog značaja dok se krećemo ovim uzbudljivim, ali brzo evoluirajućim pejzažom velikih jezičkih modela.

BlogInnovazione.it

Možda će vas zanimati

Inovacijski bilten
Ne propustite najvažnije vijesti o inovacijama. Prijavite se da ih primate putem e-pošte.

Nedavni članak

Veeam nudi najsveobuhvatniju podršku za ransomware, od zaštite do odgovora i oporavka

Coveware od strane Veeam-a će nastaviti da pruža usluge odgovora na incidente u slučaju sajber iznude. Coveware će ponuditi mogućnosti forenzike i sanacije…

23 april 2024

Zelena i digitalna revolucija: Kako prediktivno održavanje transformira industriju nafte i plina

Prediktivno održavanje revolucionira sektor nafte i plina, s inovativnim i proaktivnim pristupom upravljanju postrojenjima.…

22 april 2024

Britanski antimonopolski regulator podigao je BigTech uzbunu zbog GenAI

UK CMA izdao je upozorenje o ponašanju Big Tech-a na tržištu umjetne inteligencije. Tamo…

18 april 2024

Casa Green: energetska revolucija za održivu budućnost u Italiji

Uredba o „zelenim kućama“, koju je formulisala Evropska unija za poboljšanje energetske efikasnosti zgrada, završila je svoj zakonodavni proces sa…

18 april 2024