Articole

GPT4 vs ChatGPT: Analizăm metodele de antrenament, performanța, capacitățile și limitările

Noul model de limbaj generativ este de așteptat să transforme total industrii întregi, inclusiv mass-media, educație, drept și tehnologie. 

În ultimele luni, viteza cu care au fost lansate modele de limbă mari inovatoare este uluitoare. În acest articol, vom acoperi principalele asemănări și diferențe dintre GPT4 și ChatGPT, inclusiv metodele de antrenament, performanța, capacitățile și limitările.

GPT4 vs Chat GPT: Asemănări și diferențe în metodele de antrenament

GPT4 și ChatGPT se bazează pe versiuni mai vechi ale modelelor GPT, cu îmbunătățiri ale arhitecturii modelului, utilizând metode de antrenament mai sofisticate și cu un număr mai mare de parametri de antrenament.

Ambele modele se bazează pe arhitectura transformatorului, care utilizează un encoder pentru a procesa secvențele de intrare și un decodor pentru a genera secvențe de ieșire. Codificatorul și decodorul sunt conectate printr-un mecanism, care permite decodorului să acorde mai multă atenție celor mai semnificative secvențe de intrare.

Raportul tehnic GPT4 OpenAI oferă puține informații despre arhitectura modelului și procesul de formare a GPT4, citând „competitive landscape and the safety implications of large-scale models„. Ceea ce știm este că GPT4 și ChatGPT sunt probabil antrenate în mod similar, ceea ce este o diferență destul de mare față de metodele de antrenament utilizate pentru GPT-2 și GPT-3. Știm mult mai multe despre metodele de antrenament pentru ChatGPT decât GPT4, așa că vom începe de acolo.

Chat GPT

ChatGPT este antrenat cu seturi de date de dialog, inclusiv date demonstrative, în care adnotatorii umani demonstrează rezultatul așteptat al unui asistent chatbot ca răspuns la solicitări specifice. Aceste date sunt folosite pentru a regla GPT3.5 cu învățare supravegheată, producând un model de politică, care este utilizat pentru a genera răspunsuri multiple atunci când sunt furnizate solicitări. Adnotatorii umani clasifică apoi care dintre răspunsurile pentru un prompt dat a dat cele mai bune rezultate, care este folosit pentru a antrena un model de recompensă. Modelul de recompensă este apoi utilizat pentru a ajusta iterativ modelul de politică folosind învățarea prin consolidare.

ChatGPT este antrenat folosind Învățare de consolidare din feedbackul uman (RLHF), o modalitate de a încorpora feedback-ul uman pentru a îmbunătăți un model lingvistic în timpul antrenamentului. Acest lucru permite rezultatului modelului să se alinieze cu activitatea solicitată de utilizator, mai degrabă decât să prezică următorul cuvânt dintr-o propoziție pe baza unui corp de date de antrenament generice, cum ar fi GPT-3.

GPT4

OpenAI nu a divulgat încă detalii despre modul în care a antrenat GPT4. Raportul lor tehnic nu include „details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar„. Ceea ce știm este că GPT4 este un model multimod generativ în stil transformator antrenat. Atât pe datele disponibile public, cât și pe datele terților licențiate și ulterior ajustate folosind RLHFÎn mod interesant, OpenAI a împărtășit detalii cu privire la tehnicile lor actualizate RLHF pentru a face răspunsurile modelului mai precise și mai puțin probabil să se deplaseze în afara balustradelor de siguranță.

După antrenamentul unui model de politică (ca și în cazul ChatGPT), RLHF este utilizat în antrenamentul adversarial, un proces care antrenează un model pe exemple rău intenționate menite să păcălească modelul să-l apere împotriva unor astfel de exemple în viitor. În cazul GPT4, experții evaluează răspunsurile modelului politic la cererile contradictorii. Aceste răspunsuri sunt apoi folosite pentru a antrena modele de recompensă suplimentare care rafinează iterativ modelul de politică, rezultând un model care este mai puțin probabil să ofere răspunsuri periculoase, evazive sau inexacte.

GPT4 vs ChatGPT asemănări și diferențe în ceea ce privește performanța și capabilitățile

Capacitate

În ceea ce privește funcționalitatea, ChatGPT și GPT4 sunt mai asemănătoare decât diferite. La fel ca și predecesorul său, GPT-4 interacționează și într-un stil conversațional care își propune să se alinieze cu utilizatorul. După cum puteți vedea mai jos, răspunsurile dintre cele două modele pentru o întrebare amplă sunt foarte asemănătoare.

OpenAI este de acord că distincția dintre modele poate fi subtilă și afirmă că „diferența apare atunci când complexitatea sarcinii atinge un prag suficient”. Având în vedere cele șase luni de antrenament advers pe care modelul de bază GPT4 a fost supus în faza sa post-antrenament, aceasta este probabil o caracterizare precisă.

Spre deosebire de ChatGPT, care acceptă doar text, GPT4 acceptă atât mesaje de tip imagine, cât și mesaje text, returnând răspunsuri text. În momentul în care am scris acest articol, din păcate, capacitatea de a utiliza intrările de imagine nu este încă disponibilă public.

performanță

După cum sa menționat mai sus, OpenAI raportează o îmbunătățire semnificativă a performanței de securitate pentru GPT4, comparativ cu GPT-3.5 (de la care a fost reglat ChatGPT). Cu toate acestea, în prezent nu este clar dacă:

  • reducerea răspunsurilor la solicitările de conținut interzis,
  • reducerea generării de conținuturi toxice e
  • îmbunătățirea răspunsurilor la subiecte sensibile

se datorează modelului GPT4 în sine sau testelor suplimentare contradictorii.

În plus, GPT4 depășește CPT-3.5 la majoritatea examenelor academice și profesionale susținute de oameni. În special, GPT4 are scoruri în percentila 90 la examenul Bara uniformă, comparativ cu GPT-3.5, care are scoruri în percentila a 10-a. De asemenea, GPT4 depășește semnificativ predecesorul său în comparație cu modelele de limbă tradițională și alte modele SOTA (deși uneori în mod restrâns).

GPT4 vs ChatGPT: diferențe și limitării

Atât ChatGPT, cât și GPT4 au limitări și riscuri semnificative. Fișa de sistem GPT-4 include informații dintr-o explorare detaliată a acelor riscuri efectuată de OpenAI.

Acestea sunt doar câteva dintre riscurile asociate ambelor modele:

  • Halucinații (tendința de a produce conținut fără sens sau inexact din punct de vedere faptic)
  • Produceți conținut dăunător care încalcă politicile OpenAI (de exemplu, discurs instigator la ură, incitare la violență)
  • Amplifică și perpetuează stereotipurile persoanelor marginalizate
  • Generați dezinformare realistă cu scopul de a înșela

În timp ce ChatGPT și GPT-4 se luptă cu aceleași limitări și riscuri, OpenAI a depus eforturi speciale, inclusiv numeroase teste contradictorii, pentru a le atenua pentru GPT-4. Deși acest lucru este încurajator, foaia de sistem GPT-4 demonstrează în cele din urmă cât de vulnerabil a fost (și poate că încă este). Pentru o explicație mai detaliată a consecințelor dăunătoare neintenționate, vă recomand să citiți fișa de sistem GPT-4, care începe la pagina 38 a documentului. Raport tehnic GPT-4 .

concluzie

Deși știm puține despre arhitectura modelului și despre metodele de antrenament din spatele GPT4, pare să existe o versiune rafinată a ChatGPT. De fapt, în prezent GPT4 este capabil să accepte imagini și introducerea textului, iar rezultatele sunt mai sigure, mai precise și mai creative. Din păcate, va trebui să credem pe cuvânt OpenAI, deoarece GPT4 este disponibil doar ca parte a abonamentului ChatGPT Plus.

A rămâne informat cu privire la progresul, riscurile și limitările acestor modele este esențial pe măsură ce navigăm în acest peisaj interesant, dar care evoluează rapid, al modelelor mari de limbă.

BlogInnovazione.it

Ați putea fi, de asemenea, interesat

Buletin informativ de inovare
Nu rata cele mai importante știri despre inovație. Înscrieți-vă pentru a le primi pe e-mail.

Articole recente

Viitorul este aici: cum industria de transport maritim revoluționează economia globală

Sectorul naval este o adevărată putere economică globală, care a navigat către o piață de 150 de miliarde...

1 mai 2024

Editorii și OpenAI semnează acorduri pentru a reglementa fluxul de informații procesate de Inteligența Artificială

Luni trecută, Financial Times a anunțat un acord cu OpenAI. FT își licențiază jurnalismul de clasă mondială...

Aprilie 30 2024

Plăți online: Iată cum serviciile de streaming vă fac să plătiți pentru totdeauna

Milioane de oameni plătesc pentru serviciile de streaming, plătind taxe lunare de abonament. Este o părere comună că tu...

Aprilie 29 2024

Veeam oferă cel mai complet suport pentru ransomware, de la protecție la răspuns și recuperare

Coveware de la Veeam va continua să ofere servicii de răspuns la incidente de extorcare cibernetică. Coveware va oferi capacități criminalistice și de remediere...

Aprilie 23 2024