De siste månedene er hastigheten som innovative store språkmodeller har blitt utgitt forbløffende. I denne artikkelen vil vi dekke de viktigste likhetene og forskjellene mellom GPT4 vs ChatGPT, inkludert treningsmetodene, ytelsen, mulighetene og begrensningene.
GPT4 og ChatGPT bygger på eldre versjoner av GPT-modeller med forbedringer av modellarkitekturen, ved bruk av mer sofistikerte treningsmetoder og med et høyere antall treningsparametere.
Begge designene er basert på transformatorarkitektur, som bruker en koder for å behandle inngangssekvenser og en dekoder for å generere utgangssekvenser. Koderen og dekoderen er koblet sammen med en mekanisme som gjør at dekoderen kan være mer oppmerksom på de viktigste inngangssekvensene.
Den tekniske rapporten for GPT4 av OpenAI gir lite innsikt i modellarkitekturen og GPT4-formasjonsprosessen, med henvisning til "competitive landscape and the safety implications of large-scale models
". Det vi vet er at GPT4 og ChatGPT sannsynligvis trenes på samme måte, noe som er ganske forskjell fra treningsmetodene som brukes for GPT-2 og GPT-3. Vi vet mye mer om treningsmetoder for ChatGPT enn GPT4, så vi starter der.
ChatGPT er opplært med dialogdatasett, inkludert demodata, der menneskelige annotatorer demonstrerer det forventede resultatet fra en chatbot-assistent som svar på spesifikke forespørsler. Disse dataene brukes til å stille inn GPT3.5 med overvåket læring, og produserer en policymodell som brukes til å generere flere svar når forespørsler sendes. Menneskelige annotatorer klassifiserer deretter hvilke av svarene for en gitt forespørsel som ga de beste resultatene, som brukes til å trene en belønningsmodell. Belønningsmodellen brukes deretter til å iterativt finjustere policymodellen ved hjelp av forsterkende læring.
ChatGPT er trent i bruk Forsterkning Lær fra menneskelig tilbakemelding (RLHF), en måte å innlemme menneskelig tilbakemelding for å forbedre en språkmodell under trening. Dette gjør det mulig for modellutgangen å tilpasse seg aktiviteten brukeren ber om, i stedet for bare å forutsi neste ord i en setning basert på en mengde generiske treningsdata, for eksempel GPT-3.
OpenAI har ennå ikke røpet detaljer om hvordan den trente GPT4. Deres tekniske rapport inkluderer ikke "details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar
". Det vi vet er at GPT4 er en trent generativ multimodusmodell i transformatorstil. Både på offentlig tilgjengelige data og på tredjepartsdata lisensiert og deretter finjustert ved hjelp av RLHF. Interessant nok delte OpenAI detaljer om deres oppdaterte RLHF-teknikker for å gjøre modellsvar mer nøyaktige og mindre sannsynlighet for å drive utenfor sikkerhetsrekkverk.
Etter å ha trent en policymodell (som med ChatGPT), brukes RLHF i motstridende trening, en prosess som trener en modell på ondsinnede eksempler som har til hensikt å lure modellen til å forsvare den mot slike eksempler i fremtiden. Når det gjelder GPT4, vurderer ekspertene den politiske modellens svar på de motstridende kravene. Disse svarene brukes deretter til å trene opp ytterligere belønningsmodeller som iterativt avgrenser policymodellen, noe som resulterer i en modell som er mindre sannsynlig å gi farlige, unnvikende eller unøyaktige svar.
Når det gjelder funksjonalitet, er ChatGPT og GPT4 mer like enn forskjellige. I likhet med forgjengeren samhandler GPT-4 også i en samtalestil som tar sikte på å tilpasse seg brukeren. Som du kan se nedenfor, er svarene mellom de to modellene for et bredt spørsmål svært like.
OpenAI er enig i at skillet mellom modeller kan være subtilt og sier at "forskjellen kommer ut når kompleksiteten til oppgaven når en tilstrekkelig terskel". Gitt de seks månedene med kontradiktorisk trening som GPT4-basismodellen gjennomgikk i ettertreningsfasen, er dette sannsynligvis en nøyaktig karakterisering.
I motsetning til ChatGPT, som bare godtar tekst, godtar GPT4 både bilde- og tekstmeldinger, og returnerer tekstsvar. Når dette skrives, er dessverre ikke muligheten til å bruke bildeinndata offentlig tilgjengelig ennå.
Som nevnt ovenfor rapporterer OpenAI en betydelig forbedring i sikkerhetsytelsen for GPT4, sammenlignet med GPT-3.5 (som ChatGPT ble innstilt fra). Imidlertid er det foreløpig uklart om:
skyldes selve GPT4-modellen eller de ekstra motstridende testene.
I tillegg overgår GPT4 CPT-3.5 i de fleste menneskelige akademiske og profesjonelle eksamener. Spesielt GPT4 skårer i 90. persentil på Uniform Bar-eksamen sammenlignet med GPT-3.5, som skårer i 10. persentil. GPT4 overgår også sin forgjenger betydelig på tradisjonelle språkmodell-benchmarks og andre SOTA-modeller (om enn noen ganger smalt).
Både ChatGPT og GPT4 har betydelige begrensninger og risikoer. GPT-4-systemarket inneholder innsikt fra en detaljert utforskning av disse risikoene utført av OpenAI.
Dette er bare noen av risikoene forbundet med begge modellene:
Mens ChatGPT og GPT-4 sliter med de samme begrensningene og risikoene, har OpenAI gjort en spesiell innsats, inkludert en rekke motstridende tester, for å redusere dem for GPT-4. Selv om dette er oppmuntrende, viser GPT-4-systemarket til slutt hvor sårbar ChatGPT var (og kanskje fortsatt er). For en mer detaljert forklaring av skadelige utilsiktede konsekvenser, anbefaler jeg å lese GPT-4-systemarket, som begynner på side 38 i GPT-4 teknisk rapport .
Selv om vi vet lite om modellarkitekturen og treningsmetodene bak GPT4, ser det ut til å være en raffinert versjon av ChatGPT. Faktisk er GPT4 for øyeblikket i stand til å akseptere bilder og tekstinndata, og resultatene er tryggere, mer nøyaktige og mer kreative. Dessverre må vi ta OpenAIs ord for det, da GPT4 kun er tilgjengelig som en del av ChatGPT Plus-abonnementet.
Å holde seg informert om fremdriften, risikoene og begrensningene til disse modellene er viktig når vi navigerer i dette spennende, men raskt utviklende landskapet av store språkmodeller.
BlogInnovazione.it
UK CMA har utstedt en advarsel om Big Techs oppførsel i markedet for kunstig intelligens. Der…
"Green Houses"-dekretet, formulert av EU for å forbedre energieffektiviteten til bygninger, har avsluttet sin lovgivningsprosess med...
Casaleggio Associatis årlige rapport om e-handel i Italia presentert. Rapport med tittelen "AI-Commerce: the frontiers of ecommerce with Artificial Intelligence"....
Resultat av konstant teknologisk innovasjon og engasjement for miljø og menneskers velvære. Bandalux presenterer Airpure®, et telt...