„Astăzi lansăm un nou model de limbă mare AI de ultimă oră, numit LLaMA, conceput pentru a ajuta cercetătorii să-și avanseze activitatea”, a spus CEO-ul Mark Zuckerberg într-o postare pe Facebook.
Modelele mari de limbaj au luat cu asalt lumea tehnologiei. Ele alimentează instrumente de inteligență artificială, cum ar fi Chat GPT și alte modele conversaționale. Cu toate acestea, utilizarea acestor instrumente implică riscuri semnificative, afirmații plauzibile, dar false, generând conținut toxic și mimând părtinirea înrădăcinată în datele de antrenament AI.
Pentru a ajuta cercetătorii să rezolve aceste probleme, vineri, 25 februarie, Meta a anunțat lansarea a unui nou model de limbaj mare numit LLaMA (Large Language Model Meta AI) .
LLaMA nu este un chatbot, dar este un instrument de căutare care, conform Meta ai, va rezolva probleme legate de modelele de limbaj AI. „Modelele mai mici și mai performante, cum ar fi LLaMA, permit altora din comunitatea de cercetare care nu au acces la cantități mari de infrastructură să studieze aceste modele, democratizând și mai mult accesul în acest domeniu important și în evoluție rapidă”, a spus Meta pe blogul său. oficial .
LLaMA este o colecție de modele de limbaj variind de la parametrii 7B până la 65B. Compania a spus că își antrenează modelele pe trilioane de jetoane, spunând că poate antrena modele de ultimă generație folosind seturi de date publice și nu se bazează pe seturi de date proprietare, inaccesibile.
Potrivit Meta, antrenamentul pe model precum LLaMA necesită foarte puțină putere de calcul pentru a testa, valida și explora noi cazuri de utilizare. Modelele de limbaj de bază se antrenează pe blocuri mari de date neetichetate, făcându-le ideale pentru personalizarea la diferite sarcini.
În lucrarea sa de cercetare, Meta a remarcat că LLaMA-13B a depășit performanța OpenAI GPT-3 (175B) la majoritatea benchmark-urilor și LLaMA-65B este competitiv cu modelele de top. Chinchilla70B de DeepMind e PaLM-540B de la Google.
LLaMA nu este utilizat în prezent pe niciunul dintre produsele Meta ai, cu toate acestea, compania intenționează să-l pună la dispoziția cercetătorilor. Compania și-a lansat anterior LLM OPT-175B, dar LLaMA este cel mai avansat sistem al său.
Compania îl pune la dispoziție sub o licență necomercială axată pe cazuri de utilizare în cercetare. Acesta va fi disponibil cercetătorilor academicieni; cei afiliați guvernului, societății civile și organizațiilor academice; și laboratoare de cercetare industrială din întreaga lume.
Ercole Palmeri
Coveware de la Veeam va continua să ofere servicii de răspuns la incidente de extorcare cibernetică. Coveware va oferi capacități criminalistice și de remediere...
Întreținerea predictivă revoluționează sectorul petrolului și gazelor, cu o abordare inovatoare și proactivă a managementului uzinelor...
CMA din Marea Britanie a emis un avertisment cu privire la comportamentul Big Tech pe piața inteligenței artificiale. Acolo…
Decretul „Case verzi”, formulat de Uniunea Europeană pentru creșterea eficienței energetice a clădirilor, și-a încheiat procesul legislativ cu...