“Hoy estamos lanzando un nuevo modelo de lenguaje grande de IA de vanguardia llamado LLaMA diseñado para ayudar a los investigadores a avanzar en su trabajo”, dijo el director ejecutivo Mark Zuckerberg en una publicación de Facebook.
Los grandes modelos lingüísticos han conquistado el mundo de la tecnología. Impulsan herramientas de inteligencia artificial, como ChatGPT y otros modelos conversacionales. Sin embargo, el uso de estas herramientas conlleva un riesgo significativo, afirmaciones plausibles pero falsas, genera contenido tóxico e imita el sesgo arraigado en los datos de entrenamiento de IA.
Para ayudar a los investigadores a resolver estos problemas, el viernes 25 de febrero Meta anunció el lanzamiento de un nuevo modelo de lenguaje grande llamado LLAMA (Large Language Model Meta IA) .
LLaMA no es un chatterbot, pero es una herramienta de búsqueda que, según Meta ai, resolverá problemas relacionados con los modelos de lenguaje AI. “Modelos más pequeños y de mejor rendimiento como LLaMA permiten que otros en la comunidad de investigación que no tienen acceso a grandes cantidades de infraestructura estudien estos modelos, democratizando aún más el acceso en este campo importante y en rápida evolución”, dijo Meta en su blog. oficial .
LLaMA es una colección de modelos de lenguaje que van desde los parámetros 7B a 65B. La compañía dijo que entrena sus modelos en billones de tokens, diciendo que puede entrenar modelos de vanguardia utilizando conjuntos de datos públicos y no depender de conjuntos de datos propietarios e inaccesibles.
Según Meta, el entrenamiento de modelos como LLaMA requiere muy poca potencia informática para probar, validar y explorar nuevos casos de uso. Los modelos de lenguaje básico se entrenan en grandes bloques de datos sin etiquetar, lo que los hace ideales para la personalización de varias tareas.
En su artículo de investigación, Meta señaló que LLaMA-13B superó al GPT-3 (175B) de OpenAI en la mayoría de los puntos de referencia y que LLaMA-65B es competitivo con los mejores modelos. Chinchilla70B de DeepMind e PaLM-540B de Google.
LLaMA no está actualmente en uso en ninguno de los productos Meta ai, sin embargo, la compañía tiene planes de ponerlo a disposición de los investigadores. La compañía ya había lanzado su LLM OPT-175B, pero LLaMA es su sistema más avanzado.
La compañía lo pone a disposición bajo una licencia no comercial enfocada en casos de uso de investigación. Estará disponible para investigadores académicos; aquellos afiliados a organizaciones gubernamentales, de la sociedad civil y académicas; y laboratorios de investigación industrial de todo el mundo.
Ercole Palmeri
La CMA del Reino Unido ha emitido una advertencia sobre el comportamiento de las Big Tech en el mercado de la inteligencia artificial. Allá…
El Decreto "Invernaderos", formulado por la Unión Europea para mejorar la eficiencia energética de los edificios, ha concluido su trámite legislativo con…
Presentado el informe anual de Casaleggio Associati sobre el comercio electrónico en Italia. Informe titulado “AI-Commerce: las fronteras del Ecommerce con Inteligencia Artificial”.…
Resultado de la constante innovación tecnológica y el compromiso con el medio ambiente y el bienestar de las personas. Bandalux presenta Airpure®, una tienda de campaña…