"Hoxe lanzamos un novo modelo de linguaxe de IA de vangarda chamado LLaMA, deseñado para axudar aos investigadores a avanzar no seu traballo", dixo o CEO Mark Zuckerberg nunha publicación de Facebook.
Os grandes modelos lingüísticos tomaron o mundo da tecnoloxía por asalto. Eles alimentan ferramentas de intelixencia artificial, como Chat GPT e outros modelos conversacionais. Non obstante, o uso destas ferramentas supón un risco significativo, afirmacións plausibles pero falsas, xerando contido tóxico e imitando sesgos arraigados nos datos de adestramento da IA.
Para axudar aos investigadores a resolver estes problemas, o venres 25 de febreiro, Meta anunciou o lanzamento dun novo gran modelo lingüístico chamado LLaMA (Large Language Model Meta AI) .
LLaMA non é un chatbot, pero é unha ferramenta de busca que, segundo Meta ai, resolverá problemas relacionados cos modelos lingüísticos AI. "Modelos máis pequenos e de mellor rendemento como LLaMA permiten que outros da comunidade investigadora que non teñen acceso a grandes cantidades de infraestrutura poidan estudar estes modelos, democratizando aínda máis o acceso a este campo importante e en rápida evolución", dixo Meta no seu blog. Oficial .
LLaMA é unha colección de modelos lingüísticos que van desde os parámetros 7B ata 65B. A compañía dixo que adestra os seus modelos en billóns de tokens, dicindo que pode adestrar modelos de vangarda usando conxuntos de datos públicos e non depender de conxuntos de datos propietarios e inaccesibles.
Segundo Meta, o adestramento de modelos como LLaMA require moi pouca potencia informática para probar, validar e explorar novos casos de uso. Os modelos básicos de linguaxe adestran en grandes bloques de datos sen etiquetar, o que os fai ideais para a personalización de varias tarefas.
No seu traballo de investigación, Meta sinalou que o LLaMA-13B superou ao GPT-3 (175B) de OpenAI na maioría dos benchmarks e que o LLaMA-65B é competitivo cos modelos principais. Chinchilla70B de DeepMind e PaLM-540B de Google.
LLaMA non está en uso actualmente en ningún dos produtos Meta ai, con todo, a compañía ten plans para poñelo a disposición dos investigadores. A compañía xa lanzara o seu LLM OPT-175B, pero LLaMA é o seu sistema máis avanzado.
A compañía pona dispoñible baixo unha licenza non comercial centrada en casos de uso de investigación. Estará a disposición dos investigadores académicos; os afiliados ao goberno, sociedade civil e organizacións académicas; e laboratorios de investigación industrial de todo o mundo.
Ercole Palmeri
O sector naval é unha verdadeira potencia económica mundial, que navega cara a un mercado de 150 millóns...
O pasado luns, o Financial Times anunciou un acordo con OpenAI. FT licencia o seu xornalismo de clase mundial...
Millóns de persoas pagan por servizos de streaming, pagando taxas de subscrición mensuais. É unha opinión común que vostede...
Coveware by Veeam continuará ofrecendo servizos de resposta a incidentes de extorsión cibernética. Coveware ofrecerá capacidades forenses e de remediación...