Meta lancia il modello LLaMA, strumento di ricerca più potente del GPT-3 di OpenAI

Meta ha recentemente rilasciato un nuovo generatore di linguaggio AI chiamato LLaMA, confermando il ruolo di azienda fortemente innovativa.

“Oggi stiamo rilasciando un nuovo modello di linguaggio di grandi dimensioni AI all’avanguardia chiamato LLaMA progettato per aiutare i ricercatori a far progredire il loro lavoro”, ha dichiarato il CEO Mark Zuckerberg in un post su Facebook.

Perchè LLaMA

I grandi modelli linguistici hanno preso d’assalto il mondo della tecnologia. Alimentano strumenti di intelligenza artificiale, come ChatGPT e altri modelli conversazionali. Tuttavia, l’utilizzo di questi strumenti comporta un rischio significativo, dichiarazioni plausibili ma false, generare contenuti tossici e imitare il pregiudizio radicato nei dati di addestramento dell’IA.

Per aiutare i ricercatori a risolvere questi problemi, venerdi 25 febbraio, Meta ha annunciato il rilascio di un nuovo modello di linguaggio di grandi dimensioni chiamato LLaMA (Large Language Model Meta AI) .

Cos’è LLaMA?

LLaMA non è un chatbot, ma è uno strumento di ricerca che, secondo Meta ai, risolverà i problemi relativi ai modelli di linguaggio AI. “Modelli più piccoli e più performanti come LLaMA consentono ad altri nella comunità di ricerca che non hanno accesso a grandi quantità di infrastrutture di studiare questi modelli, democratizzando ulteriormente l’accesso in questo campo importante e in rapida evoluzione”, ha affermato Meta nel suo blog ufficiale .

LLaMA è una raccolta di modelli linguistici che vanno da 7B a 65B parametri. La società ha affermato di addestrare i suoi modelli su trilioni di token, affermando che è possibile addestrare modelli all’avanguardia utilizzando set di dati pubblici e non fare affidamento su set di dati proprietari e inaccessibili.

LLaMA è diverso

Secondo Meta, l’addestramento di modelli come LLaMA richiedono una potenza di calcolo molto bassa per testare, convalidare ed esplorare nuovi casi d’uso. I modelli linguistici di base si addestrano su grandi blocchi di dati non etichettati, e per questo ideali per la personalizzazione in base a varie attività.

Nel suo documento di ricerca, Meta ha notato che LLaMA-13B ha superato il GPT-3 (175B) di OpenAI sulla maggior parte dei benchmark e LLaMA-65B è competitivo con i migliori modelli, Chinchilla70B di DeepMind e PaLM-540B di Google.

LLaMA non è attualmente in uso su nessuno dei prodotti Meta ai, tuttavia, l’azienda ha in programma di renderlo disponibile ai ricercatori. La società aveva già lanciato il suo LLM OPT-175B, ma LLaMA è il suo sistema più avanzato.

La società lo sta rendendo disponibile con una licenza non commerciale incentrata su casi d’uso di ricerca. Sarà a disposizione dei ricercatori accademici; quelli affiliati a organizzazioni governative, della società civile e del mondo accademico; e laboratori di ricerca industriale in tutto il mondo.

Ercole Palmeri

Meta lancia il modello LLaMA, strumento di ricerca più potente del GPT-3 di OpenAI

Meta ha recentemente rilasciato un nuovo generatore di linguaggio AI chiamato LLaMA, confermando il ruolo di azienda fortemente innovativa.

Perchè LLaMA

Cos’è LLaMA?

LLaMA è diverso

Seguici

Tutorial BlogInnovazione

Articoli recenti