“Hoje estamos lançando um novo modelo de linguagem grande de IA de ponta chamado LLaMA, projetado para ajudar os pesquisadores a avançar em seu trabalho”, disse o CEO Mark Zuckerberg em um post no Facebook.
Modelos de linguagem grande tomaram o mundo da tecnologia como uma tempestade. Eles alimentam ferramentas de inteligência artificial, como ChatGPT e outros modelos de conversação. No entanto, o uso dessas ferramentas apresenta riscos significativos, alegações plausíveis, mas falsas, geração de conteúdo tóxico e imitação de viés enraizado nos dados de treinamento de IA.
Para ajudar os pesquisadores a resolver esses problemas, na sexta-feira, 25 de fevereiro, Meta anunciou o lançamento de um novo modelo de linguagem grande chamado LLaMA (Large Language Model Meta IA) .
LLaMA não é um chatbot, mas é uma ferramenta de busca que, segundo Meta ai, resolverá problemas relacionados a modelos de linguagem AI. “Modelos menores e de melhor desempenho, como o LLaMA, permitem que outros na comunidade de pesquisa que não têm acesso a grandes quantidades de infraestrutura estudem esses modelos, democratizando ainda mais o acesso a esse campo importante e em rápida evolução”, disse Meta em seu blog. oficial .
LLaMA é uma coleção de modelos de linguagem que variam de 7B a 65B de parâmetros. A empresa disse que treina seus modelos em trilhões de tokens, dizendo que pode treinar modelos de ponta usando conjuntos de dados públicos e não depender de conjuntos de dados proprietários e inacessíveis.
De acordo com a Meta, o treinamento de modelo como o LLaMA requer muito pouco poder de computação para testar, validar e explorar novos casos de uso. Os modelos básicos de linguagem são treinados em grandes blocos de dados não rotulados, tornando-os ideais para personalização de várias tarefas.
Em seu trabalho de pesquisa, Meta observou que o LLaMA-13B superou o GPT-3 (175B) da OpenAI na maioria dos benchmarks e o LLaMA-65B é competitivo com os modelos de topo, Chinchilla70B por DeepMind e PaLM-540B do Google.
Atualmente, o LLaMA não está em uso em nenhum dos produtos Meta AI, no entanto, a empresa planeja disponibilizá-lo aos pesquisadores. A empresa já havia lançado seu LLM OPT-175B, mas o LLaMA é seu sistema mais avançado.
A empresa está disponibilizando sob uma licença não comercial focada em casos de uso de pesquisa. Estará disponível para pesquisadores acadêmicos; os filiados ao governo, sociedade civil e organizações acadêmicas; e laboratórios de pesquisa industrial em todo o mundo.
Ercole Palmeri
A manutenção preditiva está revolucionando o setor de petróleo e gás, com uma abordagem inovadora e proativa para o gerenciamento de plantas.…
A CMA do Reino Unido emitiu um alerta sobre o comportamento da Big Tech no mercado de inteligência artificial. Lá…
O Decreto "Case Green", formulado pela União Europeia para melhorar a eficiência energética dos edifícios, concluiu o seu processo legislativo com…
Apresentado o relatório anual da Casaleggio Associati sobre comércio eletrônico na Itália. Relatório intitulado “AI-Commerce: as fronteiras do comércio eletrônico com inteligência artificial”.…