“Oggi stiamo rilasciando un nuovo modello di linguaggio di grandi dimensioni AI all’avanguardia chiamato LLaMA progettato per aiutare i ricercatori a far progredire il loro lavoro”, ha dichiarato il CEO Mark Zuckerberg in un post su Facebook.
I grandi modelli linguistici hanno preso d’assalto il mondo della tecnologia. Alimentano strumenti di intelligenza artificiale, come ChatGPT e altri modelli conversazionali. Tuttavia, l’utilizzo di questi strumenti comporta un rischio significativo, dichiarazioni plausibili ma false, generare contenuti tossici e imitare il pregiudizio radicato nei dati di addestramento dell’IA.
Per aiutare i ricercatori a risolvere questi problemi, venerdi 25 febbraio, Meta ha annunciato il rilascio di un nuovo modello di linguaggio di grandi dimensioni chiamato LLaMA (Large Language Model Meta AI) .
LLaMA non è un chatbot, ma è uno strumento di ricerca che, secondo Meta ai, risolverà i problemi relativi ai modelli di linguaggio AI. “Modelli più piccoli e più performanti come LLaMA consentono ad altri nella comunità di ricerca che non hanno accesso a grandi quantità di infrastrutture di studiare questi modelli, democratizzando ulteriormente l’accesso in questo campo importante e in rapida evoluzione”, ha affermato Meta nel suo blog ufficiale .
LLaMA è una raccolta di modelli linguistici che vanno da 7B a 65B parametri. La società ha affermato di addestrare i suoi modelli su trilioni di token, affermando che è possibile addestrare modelli all’avanguardia utilizzando set di dati pubblici e non fare affidamento su set di dati proprietari e inaccessibili.
Secondo Meta, l’addestramento di modelli come LLaMA richiedono una potenza di calcolo molto bassa per testare, convalidare ed esplorare nuovi casi d’uso. I modelli linguistici di base si addestrano su grandi blocchi di dati non etichettati, e per questo ideali per la personalizzazione in base a varie attività.
Nel suo documento di ricerca, Meta ha notato che LLaMA-13B ha superato il GPT-3 (175B) di OpenAI sulla maggior parte dei benchmark e LLaMA-65B è competitivo con i migliori modelli, Chinchilla70B di DeepMind e PaLM-540B di Google.
LLaMA non è attualmente in uso su nessuno dei prodotti Meta ai, tuttavia, l’azienda ha in programma di renderlo disponibile ai ricercatori. La società aveva già lanciato il suo LLM OPT-175B, ma LLaMA è il suo sistema più avanzato.
La società lo sta rendendo disponibile con una licenza non commerciale incentrata su casi d’uso di ricerca. Sarà a disposizione dei ricercatori accademici; quelli affiliati a organizzazioni governative, della società civile e del mondo accademico; e laboratori di ricerca industriale in tutto il mondo.
Ercole Palmeri
Reply annuncia il lancio di MLFRAME Reply, un nuovo framework di intelligenza artificiale generativa per basi di conoscenza eterogenee. Ideato…
Giunge alla sua 17a edizione il Premio IMSA per le giovani startup nate dalla ricerca nell’ambito delle Università e degli…
Il Premio Zayed per la Sostenibilità è il premio globale per la sostenibilità e l'impegno umanitario degli Emirati Arabi Uniti.…
Reply, società di consulenza e system integrator a livello globale e Oracle Cloud Managed Service Provider, annuncia di aver ricevuto…
MasterZ Blockchain, aumenta il valore per il Master d’ eccellenza WEB 3.0 più grande d' Europa. Il team tutto italiano…
33 finalisti selezionati tra 5.213 candidature in 163 paesi I finalisti sostengono un'azione climatica incisiva e supportano l'accesso all'energia pulita,…
I prodotti biologici si sono evidenziati come una classe farmaceutica innovativa, rivoluzionando il campo della medicina attraverso terapie mirate. A…
L'internalizzazione delle stampanti per la produzione di metalli e polimeri negli stabilimenti di Riom, Francia e Rock Hill, Carolina del…
L'analisi dei dati senza librerie e potenziata dall'apprendimento automatico con Spectronaut ® 18 offre quantificazione e produttività delle proteine leader del settore…
Mattermost presenta un ecosistema ampliato di alleati con un'enfasi sui nuovi casi d'uso del Dipartimento della Difesa per le soluzioni…