bienes

Meta lanza el modelo LLaMA, una herramienta de búsqueda más potente que la GPT-3 de OpenAI

Meta ha lanzado recientemente un nuevo generador de lenguaje de IA llamado LLaMA, lo que confirma el papel de una empresa altamente innovadora.

“Hoy estamos lanzando un nuevo modelo de lenguaje grande de IA de vanguardia llamado LLaMA diseñado para ayudar a los investigadores a avanzar en su trabajo”, dijo el director ejecutivo Mark Zuckerberg en una publicación de Facebook.

¿Por qué LLaMA?

Los grandes modelos lingüísticos han conquistado el mundo de la tecnología. Impulsan herramientas de inteligencia artificial, como ChatGPT y otros modelos conversacionales. Sin embargo, el uso de estas herramientas conlleva un riesgo significativo, afirmaciones plausibles pero falsas, genera contenido tóxico e imita el sesgo arraigado en los datos de entrenamiento de IA.

Para ayudar a los investigadores a resolver estos problemas, el viernes 25 de febrero Meta anunció el lanzamiento de un nuevo modelo de lenguaje grande llamado LLAMA (Large Language Model Meta IA) .

¿Qué es LLaMA?

LLaMA no es un chatterbot, pero es una herramienta de búsqueda que, según Meta ai, resolverá problemas relacionados con los modelos de lenguaje AI. “Modelos más pequeños y de mejor rendimiento como LLaMA permiten que otros en la comunidad de investigación que no tienen acceso a grandes cantidades de infraestructura estudien estos modelos, democratizando aún más el acceso en este campo importante y en rápida evolución”, dijo Meta en su blog. oficial .

LLaMA es una colección de modelos de lenguaje que van desde los parámetros 7B a 65B. La compañía dijo que entrena sus modelos en billones de tokens, diciendo que puede entrenar modelos de vanguardia utilizando conjuntos de datos públicos y no depender de conjuntos de datos propietarios e inaccesibles.

LLaMA es diferente

Según Meta, el entrenamiento de modelos como LLaMA requiere muy poca potencia informática para probar, validar y explorar nuevos casos de uso. Los modelos de lenguaje básico se entrenan en grandes bloques de datos sin etiquetar, lo que los hace ideales para la personalización de varias tareas.

En su artículo de investigación, Meta señaló que LLaMA-13B superó al GPT-3 (175B) de OpenAI en la mayoría de los puntos de referencia y que LLaMA-65B es competitivo con los mejores modelos. Chinchilla70B de DeepMind e PaLM-540B de Google.

LLaMA no está actualmente en uso en ninguno de los productos Meta ai, sin embargo, la compañía tiene planes de ponerlo a disposición de los investigadores. La compañía ya había lanzado su LLM OPT-175B, pero LLaMA es su sistema más avanzado.

La compañía lo pone a disposición bajo una licencia no comercial enfocada en casos de uso de investigación. Estará disponible para investigadores académicos; aquellos afiliados a organizaciones gubernamentales, de la sociedad civil y académicas; y laboratorios de investigación industrial de todo el mundo.

Ercole Palmeri

Tags: chat gptFacebookinteligencia artificiallarge language modelsLLMmeta

25 de febrero de 2023 10:55 am

Después Crear una aplicación CRUD con Laravel y Vue.js »

anterior « Google Photos presenta el "borrador mágico" en dispositivos que no son Pixel

Artículos recientes

bienes

El regulador antimonopolio del Reino Unido hace sonar la alarma de las BigTech sobre GenAI

La CMA del Reino Unido ha emitido una advertencia sobre el comportamiento de las Big Tech en el mercado de la inteligencia artificial. Allá…

Abril 18 2024

Comunicados de prensa

Casa Green: revolución energética para un futuro sostenible en Italia

El Decreto "Invernaderos", formulado por la Unión Europea para mejorar la eficiencia energética de los edificios, ha concluido su trámite legislativo con…

Abril 18 2024

bienes

El comercio electrónico en Italia crece un +27% según el nuevo informe de Casaleggio Associati

Presentado el informe anual de Casaleggio Associati sobre el comercio electrónico en Italia. Informe titulado “AI-Commerce: las fronteras del Ecommerce con Inteligencia Artificial”.…

Abril 17 2024

bienes

Idea brillante: Bandalux presenta Airpure®, la cortina que purifica el aire

Resultado de la constante innovación tecnológica y el compromiso con el medio ambiente y el bienestar de las personas. Bandalux presenta Airpure®, una tienda de campaña…

Abril 12 2024

Meta lanza el modelo LLaMA, una herramienta de búsqueda más potente que la GPT-3 de OpenAI

Meta ha lanzado recientemente un nuevo generador de lenguaje de IA llamado LLaMA, lo que confirma el papel de una empresa altamente innovadora.

¿Por qué LLaMA?

¿Qué es LLaMA?

LLaMA es diferente

Artículos recientes

El regulador antimonopolio del Reino Unido hace sonar la alarma de las BigTech sobre GenAI

Casa Green: revolución energética para un futuro sostenible en Italia

El comercio electrónico en Italia crece un +27% según el nuevo informe de Casaleggio Associati

Idea brillante: Bandalux presenta Airpure®, la cortina que purifica el aire

Artículos recientes

Etiqueta