Articles

Meta llança el model LLaMA, una eina de cerca més potent que el GPT-3 d'OpenAI

Meta ha llançat recentment un nou generador de llenguatge d'IA anomenat LLaMA, que confirma el paper d'una empresa altament innovadora.

"Avui estem llançant un nou model de llenguatge gran d'IA d'avantguarda anomenat LLaMA dissenyat per ajudar els investigadors a avançar en el seu treball", va dir el CEO Mark Zuckerberg en una publicació a Facebook.

Per què LLaMA

Els grans models lingüístics han pres el món de la tecnologia per asalto. Poden eines d'intel·ligència artificial, com ara Xat GPT i altres models de conversa. Tanmateix, l'ús d'aquestes eines comporta un risc significatiu, afirmacions plausibles però falses, generant contingut tòxic i imitant el biaix arrelat a les dades d'entrenament d'IA. 

Per ajudar els investigadors a resoldre aquests problemes, el divendres 25 de febrer, Meta  va anunciar el llançament d'un nou gran model de llenguatge anomenat LLaMA (Large Language Model Meta IA) . 

Què és LLaMA?

LLaMA no és un xat de xat, però és una eina de cerca que, segons Meta ai, resoldrà problemes relacionats amb els models lingüístics AI. "Els models més petits i de millor rendiment com LLaMA permeten que altres persones de la comunitat investigadora que no tenen accés a grans quantitats d'infraestructura puguin estudiar aquests models, democratitzant encara més l'accés en aquest camp important i en ràpida evolució", va dir Meta al seu bloc. oficial .

LLaMA és una col·lecció de models lingüístics que van des dels paràmetres 7B fins a 65B. La companyia va dir que entrena els seus models amb bilions de fitxes, dient que pot entrenar models d'avantguarda utilitzant conjunts de dades públics i no dependre de conjunts de dades propietaris i inaccessibles.

LLaMA és diferent

Segons Meta, la formació de models com LLaMA requereix molt poca potència informàtica per provar, validar i explorar nous casos d'ús. Els models bàsics de llenguatge s'entrenen en grans blocs de dades sense etiquetar, el que els fa ideals per personalitzar-los a diverses tasques. 

Butlletí d'innovació
No et perdis les notícies més importants sobre innovació. Registra't per rebre'ls per correu electrònic.

En el seu treball de recerca, Meta va assenyalar que LLaMA-13B va superar el GPT-3 (175B) d'OpenAI en la majoria de punts de referència i que LLaMA-65B és competitiu amb els millors models. Chinchilla70B de DeepMindPaLM-540B de Google

Actualment, LLaMA no s'utilitza en cap dels productes Meta ai, però, la companyia té previst posar-lo a disposició dels investigadors. L'empresa ja havia llançat el seu LLM OPT-175B, però LLaMA és el seu sistema més avançat. 

L'empresa el posa a disposició sota una llicència no comercial centrada en casos d'ús de recerca. Estarà a disposició dels investigadors acadèmics; els afiliats al govern, la societat civil i les organitzacions acadèmiques; i laboratoris d'investigació industrial d'arreu del món.

Ercole Palmeri

Butlletí d'innovació
No et perdis les notícies més importants sobre innovació. Registra't per rebre'ls per correu electrònic.

Articles recents

Els avantatges de les pàgines per pintar per a nens: un món de màgia per a totes les edats

El desenvolupament de la motricitat fina a través del color prepara els nens per a habilitats més complexes com escriure. Per acolorir...

2 maig 2024

El futur és aquí: com la indústria naviliera està revolucionant l'economia global

El sector naval és una veritable potència econòmica mundial, que ha navegat cap a un mercat de 150 milions...

1 maig 2024

Els editors i OpenAI signen acords per regular el flux d'informació processada per la Intel·ligència Artificial

Dilluns passat, el Financial Times va anunciar un acord amb OpenAI. FT autoritza el seu periodisme de classe mundial...

30 2024 abril

Pagaments en línia: aquí teniu com els serveis de streaming us fan pagar per sempre

Milions de persones paguen per serveis de streaming, pagant quotes de subscripció mensuals. És l'opinió comuna que tu...

29 2024 abril