Artigos

Meta lanza o modelo LLaMA, unha ferramenta de busca máis potente que o GPT-3 de OpenAI

Meta lanzou recentemente un novo xerador de linguaxe AI chamado LLaMA, que confirma o papel dunha empresa altamente innovadora.

"Hoxe lanzamos un novo modelo de linguaxe de IA de vangarda chamado LLaMA, deseñado para axudar aos investigadores a avanzar no seu traballo", dixo o CEO Mark Zuckerberg nunha publicación de Facebook.

Por que LLaMA

Os grandes modelos lingüísticos tomaron o mundo da tecnoloxía por asalto. Eles alimentan ferramentas de intelixencia artificial, como Chat GPT e outros modelos conversacionais. Non obstante, o uso destas ferramentas supón un risco significativo, afirmacións plausibles pero falsas, xerando contido tóxico e imitando sesgos arraigados nos datos de adestramento da IA.

Para axudar aos investigadores a resolver estes problemas, o venres 25 de febreiro, Meta anunciou o lanzamento dun novo gran modelo lingüístico chamado LLaMA (Large Language Model Meta AI) .

Que é LLaMA?

LLaMA non é un chatbot, pero é unha ferramenta de busca que, segundo Meta ai, resolverá problemas relacionados cos modelos lingüísticos AI. "Modelos máis pequenos e de mellor rendemento como LLaMA permiten que outros da comunidade investigadora que non teñen acceso a grandes cantidades de infraestrutura poidan estudar estes modelos, democratizando aínda máis o acceso a este campo importante e en rápida evolución", dixo Meta no seu blog. Oficial .

LLaMA é unha colección de modelos lingüísticos que van desde os parámetros 7B ata 65B. A compañía dixo que adestra os seus modelos en billóns de tokens, dicindo que pode adestrar modelos de vangarda usando conxuntos de datos públicos e non depender de conxuntos de datos propietarios e inaccesibles.

LLaMA é diferente

Segundo Meta, o adestramento de modelos como LLaMA require moi pouca potencia informática para probar, validar e explorar novos casos de uso. Os modelos básicos de linguaxe adestran en grandes bloques de datos sen etiquetar, o que os fai ideais para a personalización de varias tarefas.

No seu traballo de investigación, Meta sinalou que o LLaMA-13B superou ao GPT-3 (175B) de OpenAI na maioría dos benchmarks e que o LLaMA-65B é competitivo cos modelos principais. Chinchilla70B de DeepMind e PaLM-540B de Google.

LLaMA non está en uso actualmente en ningún dos produtos Meta ai, con todo, a compañía ten plans para poñelo a disposición dos investigadores. A compañía xa lanzara o seu LLM OPT-175B, pero LLaMA é o seu sistema máis avanzado.

A compañía pona dispoñible baixo unha licenza non comercial centrada en casos de uso de investigación. Estará a disposición dos investigadores académicos; os afiliados ao goberno, sociedade civil e organizacións académicas; e laboratorios de investigación industrial de todo o mundo.

Ercole Palmeri

tags: chat gptFacebookintelixencia artificiallarge language modelsLLMmeta

25 de febreiro de 2023 ás 10:55

seguinte Creando unha aplicación CRUD con Laravel e Vue.js »

Anterior « Google Photos presenta o 'borrador máxico' para dispositivos que non sexan Pixel

Artigos recentes

Artigos

O futuro está aquí: como a industria do transporte marítimo está revolucionando a economía global

O sector naval é unha verdadeira potencia económica mundial, que navega cara a un mercado de 150 millóns...

1 maio 2024

Artigos

Editores e OpenAI asinan acordos para regular o fluxo de información procesada pola Intelixencia Artificial

O pasado luns, o Financial Times anunciou un acordo con OpenAI. FT licencia o seu xornalismo de clase mundial...

Abril 30 2024

Artigos

Pagos en liña: aquí tes como os servizos de streaming che fan pagar para sempre

Millóns de persoas pagan por servizos de streaming, pagando taxas de subscrición mensuais. É unha opinión común que vostede...

Abril 29 2024

Comunicati Stampa

Veeam ofrece o soporte máis completo para ransomware, desde a protección ata a resposta e a recuperación

Coveware by Veeam continuará ofrecendo servizos de resposta a incidentes de extorsión cibernética. Coveware ofrecerá capacidades forenses e de remediación...

Abril 23 2024