Articles

Meta llança el model LLaMA, una eina de cerca més potent que el GPT-3 d'OpenAI

Meta ha llançat recentment un nou generador de llenguatge d'IA anomenat LLaMA, que confirma el paper d'una empresa altament innovadora.

"Avui estem llançant un nou model de llenguatge gran d'IA d'avantguarda anomenat LLaMA dissenyat per ajudar els investigadors a avançar en el seu treball", va dir el CEO Mark Zuckerberg en una publicació a Facebook.

Per què LLaMA

Els grans models lingüístics han pres el món de la tecnologia per asalto. Poden eines d'intel·ligència artificial, com ara Xat GPT i altres models de conversa. Tanmateix, l'ús d'aquestes eines comporta un risc significatiu, afirmacions plausibles però falses, generant contingut tòxic i imitant el biaix arrelat a les dades d'entrenament d'IA.

Per ajudar els investigadors a resoldre aquests problemes, el divendres 25 de febrer, Meta va anunciar el llançament d'un nou gran model de llenguatge anomenat LLaMA (Large Language Model Meta IA) .

Què és LLaMA?

LLaMA no és un xat de xat, però és una eina de cerca que, segons Meta ai, resoldrà problemes relacionats amb els models lingüístics AI. "Els models més petits i de millor rendiment com LLaMA permeten que altres persones de la comunitat investigadora que no tenen accés a grans quantitats d'infraestructura puguin estudiar aquests models, democratitzant encara més l'accés en aquest camp important i en ràpida evolució", va dir Meta al seu bloc. oficial .

LLaMA és una col·lecció de models lingüístics que van des dels paràmetres 7B fins a 65B. La companyia va dir que entrena els seus models amb bilions de fitxes, dient que pot entrenar models d'avantguarda utilitzant conjunts de dades públics i no dependre de conjunts de dades propietaris i inaccessibles.

LLaMA és diferent

Segons Meta, la formació de models com LLaMA requereix molt poca potència informàtica per provar, validar i explorar nous casos d'ús. Els models bàsics de llenguatge s'entrenen en grans blocs de dades sense etiquetar, el que els fa ideals per personalitzar-los a diverses tasques.

En el seu treball de recerca, Meta va assenyalar que LLaMA-13B va superar el GPT-3 (175B) d'OpenAI en la majoria de punts de referència i que LLaMA-65B és competitiu amb els millors models. Chinchilla70B de DeepMind e PaLM-540B de Google.

Actualment, LLaMA no s'utilitza en cap dels productes Meta ai, però, la companyia té previst posar-lo a disposició dels investigadors. L'empresa ja havia llançat el seu LLM OPT-175B, però LLaMA és el seu sistema més avançat.

L'empresa el posa a disposició sota una llicència no comercial centrada en casos d'ús de recerca. Estarà a disposició dels investigadors acadèmics; els afiliats al govern, la societat civil i les organitzacions acadèmiques; i laboratoris d'investigació industrial d'arreu del món.

Ercole Palmeri