Artikler

GPT4 vs ChatGPT: Vi analyserer treningsmetoder, ytelse, evner og begrensninger

Den nye generative språkmodellen forventes å totalt transformere hele bransjer, inkludert media, utdanning, juss og teknologi. 

De siste månedene er hastigheten som innovative store språkmodeller har blitt utgitt forbløffende. I denne artikkelen vil vi dekke de viktigste likhetene og forskjellene mellom GPT4 vs ChatGPT, inkludert treningsmetodene, ytelsen, mulighetene og begrensningene.

GPT4 vs ChatGPT: Likheter og forskjeller i treningsmetoder

GPT4 og ChatGPT bygger på eldre versjoner av GPT-modeller med forbedringer av modellarkitekturen, ved bruk av mer sofistikerte treningsmetoder og med et høyere antall treningsparametere.

Begge designene er basert på transformatorarkitektur, som bruker en koder for å behandle inngangssekvenser og en dekoder for å generere utgangssekvenser. Koderen og dekoderen er koblet sammen med en mekanisme som gjør at dekoderen kan være mer oppmerksom på de viktigste inngangssekvensene.

Den tekniske rapporten for GPT4 av OpenAI gir lite innsikt i modellarkitekturen og GPT4-formasjonsprosessen, med henvisning til "competitive landscape and the safety implications of large-scale models". Det vi vet er at GPT4 og ChatGPT sannsynligvis trenes på samme måte, noe som er ganske forskjell fra treningsmetodene som brukes for GPT-2 og GPT-3. Vi vet mye mer om treningsmetoder for ChatGPT enn GPT4, så vi starter der.

ChatGPT

ChatGPT er opplært med dialogdatasett, inkludert demodata, der menneskelige annotatorer demonstrerer det forventede resultatet fra en chatbot-assistent som svar på spesifikke forespørsler. Disse dataene brukes til å stille inn GPT3.5 med overvåket læring, og produserer en policymodell som brukes til å generere flere svar når forespørsler sendes. Menneskelige annotatorer klassifiserer deretter hvilke av svarene for en gitt forespørsel som ga de beste resultatene, som brukes til å trene en belønningsmodell. Belønningsmodellen brukes deretter til å iterativt finjustere policymodellen ved hjelp av forsterkende læring.

ChatGPT er trent i bruk Forsterkning Lær fra menneskelig tilbakemelding (RLHF), en måte å innlemme menneskelig tilbakemelding for å forbedre en språkmodell under trening. Dette gjør det mulig for modellutgangen å tilpasse seg aktiviteten brukeren ber om, i stedet for bare å forutsi neste ord i en setning basert på en mengde generiske treningsdata, for eksempel GPT-3.

GPT4

OpenAI har ennå ikke røpet detaljer om hvordan den trente GPT4. Deres tekniske rapport inkluderer ikke "details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar". Det vi vet er at GPT4 er en trent generativ multimodusmodell i transformatorstil. Både på offentlig tilgjengelige data og på tredjepartsdata lisensiert og deretter finjustert ved hjelp av RLHFInteressant nok delte OpenAI detaljer om deres oppdaterte RLHF-teknikker for å gjøre modellsvar mer nøyaktige og mindre sannsynlighet for å drive utenfor sikkerhetsrekkverk.

Etter å ha trent en policymodell (som med ChatGPT), brukes RLHF i motstridende trening, en prosess som trener en modell på ondsinnede eksempler som har til hensikt å lure modellen til å forsvare den mot slike eksempler i fremtiden. Når det gjelder GPT4, vurderer ekspertene den politiske modellens svar på de motstridende kravene. Disse svarene brukes deretter til å trene opp ytterligere belønningsmodeller som iterativt avgrenser policymodellen, noe som resulterer i en modell som er mindre sannsynlig å gi farlige, unnvikende eller unøyaktige svar.

GPT4 vs ChatGPT likheter og forskjeller når det gjelder ytelse og muligheter

Kapasitet

Når det gjelder funksjonalitet, er ChatGPT og GPT4 mer like enn forskjellige. I likhet med forgjengeren samhandler GPT-4 også i en samtalestil som tar sikte på å tilpasse seg brukeren. Som du kan se nedenfor, er svarene mellom de to modellene for et bredt spørsmål svært like.

OpenAI er enig i at skillet mellom modeller kan være subtilt og sier at "forskjellen kommer ut når kompleksiteten til oppgaven når en tilstrekkelig terskel". Gitt de seks månedene med kontradiktorisk trening som GPT4-basismodellen gjennomgikk i ettertreningsfasen, er dette sannsynligvis en nøyaktig karakterisering.

I motsetning til ChatGPT, som bare godtar tekst, godtar GPT4 både bilde- og tekstmeldinger, og returnerer tekstsvar. Når dette skrives, er dessverre ikke muligheten til å bruke bildeinndata offentlig tilgjengelig ennå.

Opptreden

Som nevnt ovenfor rapporterer OpenAI en betydelig forbedring i sikkerhetsytelsen for GPT4, sammenlignet med GPT-3.5 (som ChatGPT ble innstilt fra). Imidlertid er det foreløpig uklart om:

  • reduksjon av svar på forespørsler om forbudt innhold,
  • reduksjon av generering av giftig innhold e
  • forbedre svar på sensitive emner

skyldes selve GPT4-modellen eller de ekstra motstridende testene.

I tillegg overgår GPT4 CPT-3.5 i de fleste menneskelige akademiske og profesjonelle eksamener. Spesielt GPT4 skårer i 90. persentil på Uniform Bar-eksamen sammenlignet med GPT-3.5, som skårer i 10. persentil. GPT4 overgår også sin forgjenger betydelig på tradisjonelle språkmodell-benchmarks og andre SOTA-modeller (om enn noen ganger smalt).

GPT4 vs ChatGPT: forskjeller og begrensningeri

Både ChatGPT og GPT4 har betydelige begrensninger og risikoer. GPT-4-systemarket inneholder innsikt fra en detaljert utforskning av disse risikoene utført av OpenAI.

Dette er bare noen av risikoene forbundet med begge modellene:

  • Hallusinasjoner (tendensen til å produsere useriøst eller faktisk unøyaktig innhold)
  • Produser skadelig innhold som bryter OpenAI-retningslinjene (f.eks. hatytringer, oppfordring til vold)
  • Forsterke og opprettholde stereotypier av marginaliserte mennesker
  • Generer realistisk desinformasjon ment å lure

Mens ChatGPT og GPT-4 sliter med de samme begrensningene og risikoene, har OpenAI gjort en spesiell innsats, inkludert en rekke motstridende tester, for å redusere dem for GPT-4. Selv om dette er oppmuntrende, viser GPT-4-systemarket til slutt hvor sårbar ChatGPT var (og kanskje fortsatt er). For en mer detaljert forklaring av skadelige utilsiktede konsekvenser, anbefaler jeg å lese GPT-4-systemarket, som begynner på side 38 i GPT-4 teknisk rapport .

konklusjon

Selv om vi vet lite om modellarkitekturen og treningsmetodene bak GPT4, ser det ut til å være en raffinert versjon av ChatGPT. Faktisk er GPT4 for øyeblikket i stand til å akseptere bilder og tekstinndata, og resultatene er tryggere, mer nøyaktige og mer kreative. Dessverre må vi ta OpenAIs ord for det, da GPT4 kun er tilgjengelig som en del av ChatGPT Plus-abonnementet.

Å holde seg informert om fremdriften, risikoene og begrensningene til disse modellene er viktig når vi navigerer i dette spennende, men raskt utviklende landskapet av store språkmodeller.

BlogInnovazione.it

Du kan også være interessert

Nyhetsbrev for innovasjon
Ikke gå glipp av de viktigste nyhetene om innovasjon. Registrer deg for å motta dem på e-post.

Siste artikler

Britisk antitrustregulator vekker BigTech-alarm over GenAI

UK CMA har utstedt en advarsel om Big Techs oppførsel i markedet for kunstig intelligens. Der…

18 april 2024

Casa Green: energirevolusjon for en bærekraftig fremtid i Italia

"Green Houses"-dekretet, formulert av EU for å forbedre energieffektiviteten til bygninger, har avsluttet sin lovgivningsprosess med...

18 april 2024

E-handel i Italia på +27 % ifølge den nye Casaleggio Associati-rapporten

Casaleggio Associatis årlige rapport om e-handel i Italia presentert. Rapport med tittelen "AI-Commerce: the frontiers of ecommerce with Artificial Intelligence"....

17 april 2024

Strålende idé: Bandalux presenterer Airpure®, gardinen som renser luften

Resultat av konstant teknologisk innovasjon og engasjement for miljø og menneskers velvære. Bandalux presenterer Airpure®, et telt...

12 april 2024