Greinar

GPT4 vs ChatGPT: Við greinum þjálfunaraðferðir, frammistöðu, getu og takmarkanir

Gert er ráð fyrir að nýja kynslóðamálslíkanið muni gjörbreyta heilum atvinnugreinum, þar á meðal fjölmiðla, menntun, lögfræði og tækni. 

Undanfarna mánuði hefur hraðinn sem nýstárleg stór tungumálalíkön hafa verið gefin út með undraverðum hætti. Í þessari grein munum við fjalla um helstu líkindi og mun á GPT4 vs ChatGPT, þar á meðal þjálfunaraðferðir, frammistöðu, getu og takmarkanir.

GPT4 vs SpjallGPT: Líkindi og munur á þjálfunaraðferðum

GPT4 og ChatGPT byggja á eldri útgáfum af GPT módelum með endurbótum á líkanaarkitektúrnum, nota flóknari þjálfunaraðferðir og með fleiri þjálfunarbreytum.

Báðar hönnunirnar eru byggðar á spenniarkitektúr, sem notar kóðara til að vinna úr inntaksröðum og afkóðara til að búa til úttaksraðir. Kóðarinn og afkóðarinn eru tengdir saman með vélbúnaði sem gerir afkóðaranum kleift að fylgjast betur með mikilvægustu inntaksröðunum.

GPT4 tækniskýrslan OpenAI veitir litla innsýn í módelarkitektúr og GPT4 myndunarferli, með því að vitna í „competitive landscape and the safety implications of large-scale models“. Það sem við vitum er að GPT4 og ChatGPT eru líklega þjálfaðir á svipaðan hátt, sem er töluverður munur frá þjálfunaraðferðunum sem notaðar eru fyrir GPT-2 og GPT-3. Við vitum miklu meira um þjálfunaraðferðir fyrir ChatGPT en GPT4, svo við byrjum þar.

SpjallGPT

ChatGPT er þjálfað með samræðugagnasöfnum, þar á meðal kynningargögnum, þar sem mannaskýrendur sýna fram á væntanlegt framtak spjallbotna aðstoðarmanns sem svar við sérstökum beiðnum. Þessi gögn eru notuð til að stilla GPT3.5 með lærdómi undir eftirliti, sem framleiðir stefnulíkan sem er notað til að búa til mörg svör þegar beiðnir eru lagðar fram. Mannlegir athugasemdaraðilar flokka síðan hver af svörunum fyrir tiltekna vísbendingu skilaði bestum árangri, sem er notað til að þjálfa verðlaunalíkan. Umbunarlíkanið er síðan notað til að fínstilla stefnulíkanið ítrekað með því að nota styrkingarnám.

ChatGPT er þjálfað með því að nota Styrking Að læra af endurgjöf manna (RLHF), leið til að innleiða endurgjöf frá mönnum til að bæta tungumálalíkan meðan á þjálfun stendur. Þetta gerir úttak líkansins kleift að samræmast virkninni sem notandinn biður um, frekar en að spá fyrir um næsta orð í setningu byggt á almennum þjálfunargögnum, eins og GPT-3.

GPT4

OpenAI hefur enn ekki gefið upp upplýsingar um hvernig það þjálfaði GPT4. Tækniskýrsla þeirra inniheldur ekki „details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar“. Það sem við vitum er að GPT4 er þjálfað spennubreyti-stíl kynslóðar fjölstillingarlíkan. Bæði um gögn sem eru aðgengileg almenningi og gögn frá þriðja aðila sem eru með leyfi og í kjölfarið fínstillt með RLHFAthyglisvert er að OpenAI deildi upplýsingum um uppfærða RLHF tækni þeirra til að gera svörun líkana nákvæmari og ólíklegri til að reka út fyrir öryggisgrind.

Eftir að hafa þjálfað stefnumódel (eins og með ChatGPT) er RLHF notað í andstæðingsþjálfun, ferli sem þjálfar líkan á illgjarn dæmum sem ætlað er að plata líkanið til að verja það gegn slíkum dæmum í framtíðinni. Í tilviki GPT4, leggja sérfræðingarnir mat á viðbrögð pólitíska líkansins við misvísandi kröfum. Þessi svör eru síðan notuð til að þjálfa fleiri umbunarlíkön sem endurbæta stefnulíkanið ítrekað, sem leiðir til líkans sem er ólíklegra til að gefa hættuleg, sniðgengin eða ónákvæm svör.

GPT4 vs ChatGPT líkt og munur hvað varðar frammistöðu og getu

Stærð

Hvað varðar virkni eru ChatGPT og GPT4 líkari en ólíkari. Eins og forveri hans hefur GPT-4 einnig samskipti í samtalstíl sem miðar að því að samræmast notandanum. Eins og þú sérð hér að neðan eru svörin á milli tveggja líkananna fyrir víðtækri spurningu mjög svipuð.

OpenAI er sammála því að greinarmunurinn á milli líkana geti verið lúmskur og segir að „munurinn komi fram þegar flókið verkefni nær nægilegum þröskuldi“. Í ljósi sex mánaða andstæðrar þjálfunar sem GPT4 grunnlíkanið gekkst undir á eftir þjálfunarfasa, er þetta líklega nákvæm lýsing.

Ólíkt ChatGPT, sem tekur aðeins við texta, samþykkir GPT4 bæði mynda- og textabeiðnir og skilar textasvör. Þegar þetta er skrifað er möguleikinn til að nota myndinntak því miður ekki enn aðgengilegur almenningi.

Frammistaða

Eins og getið er hér að ofan greinir OpenAI frá umtalsverðri framförum í öryggisafköstum fyrir GPT4, samanborið við GPT-3.5 (sem ChatGPT var stillt úr). Hins vegar er óljóst eins og er hvort:

  • fækkun svara við beiðnum um bannað efni,
  • minnkun á myndun eitraðra innihaldsefna e
  • bæta viðbrögð við viðkvæmum efnum

eru vegna GPT4 líkansins sjálfs eða viðbótarprófana sem eru misvísandi.

Að auki er GPT4 betri en CPT-3.5 í flestum mannlegum fræðilegum og faglegum prófum. Athyglisvert er að GPT4 skorar í 90. hundraðshluta á Uniform Bar prófinu samanborið við GPT-3.5, sem skorar í 10. hundraðshluta. GPT4 er einnig verulega betri en forveri sinn á hefðbundnum viðmiðum fyrir tungumálalíkön og önnur SOTA líkan (þó stundum þröngt).

GPT4 vs ChatGPT: munur og takmarkaniri

Bæði ChatGPT og GPT4 hafa verulegar takmarkanir og áhættu. GPT-4 kerfisblaðið inniheldur innsýn frá ítarlegri könnun á þeim áhættum sem framkvæmdar eru af OpenAI.

Þetta eru aðeins nokkrar af áhættunum sem tengjast báðum gerðum:

  • Ofskynjanir (tilhneigingin til að framleiða ómálefnalegt eða ónákvæmt efni)
  • Framleiða skaðlegt efni sem brýtur gegn OpenAI stefnum (t.d. hatursorðræðu, hvatning til ofbeldis)
  • Magna upp og viðhalda staðalímyndum jaðarsettra fólks
  • Búðu til raunhæfar óupplýsingar sem ætlað er að blekkja

Þó að ChatGPT og GPT-4 glími við sömu takmarkanir og áhættu, hefur OpenAI gert sérstakt viðleitni, þar á meðal fjölmörg misvísandi próf, til að draga úr þeim fyrir GPT-4. Þó að þetta sé uppörvandi sýnir GPT-4 kerfisblaðið að lokum hversu viðkvæmt ChatGPT var (og er kannski enn). Fyrir nánari útskýringu á skaðlegum óviljandi afleiðingum mæli ég með því að lesa GPT-4 kerfisblaðið, sem hefst á síðu 38 í GPT-4 tækniskýrsla .

niðurstaða

Þó að við vitum lítið um fyrirmyndararkitektúrinn og þjálfunaraðferðirnar á bak við GPT4, þá virðist vera til fáguð útgáfa af ChatGPT. Reyndar, eins og er, er GPT4 fær um að samþykkja myndir og textainnslátt og niðurstöðurnar eru öruggari, nákvæmari og skapandi. Því miður verðum við að taka orð OpenAI fyrir það, þar sem GPT4 er aðeins fáanlegt sem hluti af ChatGPT Plus áskriftinni.

Mikilvægt er að vera upplýst um framfarir, áhættur og takmarkanir þessara líkana þar sem við förum um þetta spennandi en ört vaxandi landslag stórra tungumálalíkana.

BlogInnovazione.it

Þú gætir líka haft áhuga

Nýsköpunarfréttabréf
Ekki missa af mikilvægustu fréttunum um nýsköpun. Skráðu þig til að fá þau með tölvupósti.

Nýlegar greinar

Útgefendur og OpenAI skrifa undir samninga um að stjórna flæði upplýsinga sem unnið er með gervigreind

Síðasta mánudag tilkynnti Financial Times um samning við OpenAI. FT leyfir heimsklassa blaðamennsku…

30 Apríl 2024

Greiðslur á netinu: Hér er hvernig streymisþjónusta gerir þér kleift að borga að eilífu

Milljónir manna borga fyrir streymisþjónustu og greiða mánaðarlega áskriftargjöld. Það er almenn skoðun að þú…

29 Apríl 2024

Veeam býður upp á umfangsmesta stuðninginn fyrir lausnarhugbúnað, allt frá vernd til viðbragða og bata

Coveware frá Veeam mun halda áfram að veita viðbragðsþjónustu fyrir tölvukúgun. Coveware mun bjóða upp á réttar- og úrbótamöguleika ...

23 Apríl 2024

Græn og stafræn bylting: Hvernig forspárviðhald er að umbreyta olíu- og gasiðnaðinum

Forspárviðhald er að gjörbylta olíu- og gasgeiranum, með nýstárlegri og fyrirbyggjandi nálgun við verksmiðjustjórnun.…

22 Apríl 2024