Articoli

Meta lancia il modello LLaMA, strumento di ricerca più potente del GPT-3 di OpenAI

Meta ha recentemente rilasciato un nuovo generatore di linguaggio AI chiamato LLaMA, confermando il ruolo di azienda fortemente innovativa.

“Oggi stiamo rilasciando un nuovo modello di linguaggio di grandi dimensioni AI all’avanguardia chiamato LLaMA progettato per aiutare i ricercatori a far progredire il loro lavoro”, ha dichiarato il CEO Mark Zuckerberg in un post su Facebook.

Perchè LLaMA

I grandi modelli linguistici hanno preso d’assalto il mondo della tecnologia. Alimentano strumenti di intelligenza artificiale, come ChatGPT e altri modelli conversazionali. Tuttavia, l’utilizzo di questi strumenti comporta un rischio significativo, dichiarazioni plausibili ma false, generare contenuti tossici e imitare il pregiudizio radicato nei dati di addestramento dell’IA. 

Per aiutare i ricercatori a risolvere questi problemi, venerdi 25 febbraio, Meta  ha annunciato il rilascio di un nuovo modello di linguaggio di grandi dimensioni chiamato LLaMA (Large Language Model Meta AI) . 

Cos’è LLaMA?

LLaMA non è un chatbot, ma è uno strumento di ricerca che, secondo Meta ai, risolverà i problemi relativi ai modelli di linguaggio AI. “Modelli più piccoli e più performanti come LLaMA consentono ad altri nella comunità di ricerca che non hanno accesso a grandi quantità di infrastrutture di studiare questi modelli, democratizzando ulteriormente l’accesso in questo campo importante e in rapida evoluzione”, ha affermato Meta nel suo blog ufficiale .

LLaMA è una raccolta di modelli linguistici che vanno da 7B a 65B parametri. La società ha affermato di addestrare i suoi modelli su trilioni di token, affermando che è possibile addestrare modelli all’avanguardia utilizzando set di dati pubblici e non fare affidamento su set di dati proprietari e inaccessibili.

Articoli correlati

LLaMA è diverso

Secondo Meta, l’addestramento di modelli come LLaMA richiedono una potenza di calcolo molto bassa per testare, convalidare ed esplorare nuovi casi d’uso. I modelli linguistici di base si addestrano su grandi blocchi di dati non etichettati, e per questo ideali per la personalizzazione in base a varie attività. 

Newsletter sull’Innovazione
Non perderti le notizie più importanti sull'Innovazione. Iscriviti per riceverle via e-mail.

Nel suo documento di ricerca, Meta ha notato che LLaMA-13B ha superato il GPT-3 (175B) di OpenAI sulla maggior parte dei benchmark e LLaMA-65B è competitivo con i migliori modelli, Chinchilla70B di DeepMindPaLM-540B di Google

LLaMA non è attualmente in uso su nessuno dei prodotti Meta ai, tuttavia, l’azienda ha in programma di renderlo disponibile ai ricercatori. La società aveva già lanciato il suo LLM OPT-175B, ma LLaMA è il suo sistema più avanzato. 

La società lo sta rendendo disponibile con una licenza non commerciale incentrata su casi d’uso di ricerca. Sarà a disposizione dei ricercatori accademici; quelli affiliati a organizzazioni governative, della società civile e del mondo accademico; e laboratori di ricerca industriale in tutto il mondo.

Ercole Palmeri

Newsletter sull’Innovazione
Non perderti le notizie più importanti sull'Innovazione. Iscriviti per riceverle via e-mail.

Articoli recenti

Reply rende disponibile MLFRAME Reply un framework basato sull’Intelligenza Artificiale Generativa applicato allo sviluppo e alla condivisione della conoscenza

Reply annuncia il lancio di MLFRAME Reply, un nuovo framework di intelligenza artificiale generativa per basi di conoscenza eterogenee. Ideato…

23 Settembre 2023

Premiate le Startup più Innovative: le 10 finaliste dell’ITALIAN MASTER STARTUP AWARD (IMSA) 2023

Giunge alla sua 17a edizione il Premio IMSA per le giovani startup nate dalla ricerca nell’ambito delle Università e degli…

22 Settembre 2023

I Thought Leader in occasione del Forum per il Premio Zayed per la Sostenibilità evidenziano i percorsi per promuovere il progresso delle persone e del pianeta

Il Premio Zayed per la Sostenibilità è il premio globale per la sostenibilità e l'impegno umanitario degli Emirati Arabi Uniti.…

22 Settembre 2023

Reply ottiene 4 Oracle EMEA Cluster Partner Awards nelle categorie Innovation, Business Impact e Customer Success

Reply, società di consulenza e system integrator a livello globale e Oracle Cloud Managed Service Provider, annuncia di aver ricevuto…

19 Settembre 2023

MasterZ, il Master su Blockchain e WEB 3.0 piu grande d’Europa, lancia una nuova piattaforma dedicata all’apprendimento, alla pratica e al lavoro

MasterZ Blockchain, aumenta il valore per il Master d’ eccellenza WEB 3.0 più grande d' Europa. Il team tutto italiano…

19 Settembre 2023

Lo Zayed Sustainability Prize annuncia 33 finalisti che promuovono iniziative di sostenibilità globale

33 finalisti selezionati tra 5.213 candidature in 163 paesi I finalisti sostengono un'azione climatica incisiva e supportano l'accesso all'energia pulita,…

18 Settembre 2023

Tendenze emergenti e innovazioni nella ricerca biologica: dal banco al letto del paziente

I prodotti biologici si sono evidenziati come una classe farmaceutica innovativa, rivoluzionando il campo della medicina attraverso terapie mirate. A…

17 Settembre 2023

3D Systems semplifica la produzione e promuove l’innovazione continua mediante l’internalizzazione della produzione di piattaforme di stampa aggiuntive

L'internalizzazione delle stampanti per la produzione di metalli e polimeri negli stabilimenti di Riom, Francia e Rock Hill, Carolina del…

17 Settembre 2023

Biognosys presenta innovazioni tecnologiche e progressi scientifici per rendere il proteoma utilizzabile per la ricerca sulle scienze della vita al Congresso mondiale HUPO 2023

L'analisi dei dati senza librerie e potenziata dall'apprendimento automatico con Spectronaut ® 18 offre quantificazione e produttività delle proteine ​​leader del settore…

16 Settembre 2023

Mattermost lancia nuove partnership per favorire una maggiore innovazione e adozione nel settore pubblico

Mattermost presenta un ecosistema ampliato di alleati con un'enfasi sui nuovi casi d'uso del Dipartimento della Difesa per le soluzioni…

16 Settembre 2023