Статті

Meta запускає модель LLaMA, більш потужний інструмент пошуку, ніж GPT-3 OpenAI

Meta нещодавно випустила новий генератор мови ШІ під назвою LLaMA, підтверджуючи роль високоінноваційної компанії.

«Сьогодні ми випускаємо нову передову велику мовну модель штучного інтелекту під назвою LLaMA, розроблену для того, щоб допомогти дослідникам просувати свою роботу», — заявив генеральний директор Марк Цукерберг у дописі на Facebook.

Чому LLaMA

Великі мовні моделі штурмом захопили світ технологій. Вони живлять інструменти штучного інтелекту, такі як ChatGPT та інші розмовні моделі. Однак використання цих інструментів пов’язане зі значним ризиком, правдоподібними, але неправдивими твердженнями, створенням токсичного вмісту та імітацією упередженості, яка ґрунтується на даних навчання ШІ.

Щоб допомогти дослідникам вирішити ці проблеми, у п’ятницю, 25 лютого, Meta оголосив про випуск нової великої мовної моделі під назвою LlaMA (Large Language Model Мета ШІ) .

Що таке LLaMA?

LLaMA не є Chatbot, але це інструмент пошуку, який, згідно з Meta ai, вирішуватиме проблеми, пов’язані з мовними моделями AI. «Менші, ефективніші моделі, такі як LLaMA, дозволяють іншим дослідникам, які не мають доступу до великої кількості інфраструктури, вивчати ці моделі, ще більше демократизуючи доступ у цій важливій галузі, що швидко розвивається», — сказав Мета у своєму блозі. офіційний .

LLaMA — це набір мовних моделей із параметрами від 7B до 65B. Компанія заявила, що навчає свої моделі на трильйонах токенів, кажучи, що вона може навчати найсучасніші моделі, використовуючи загальнодоступні набори даних, а не покладатися на закриті, недоступні набори даних.

LLaMA відрізняється

Відповідно до Meta, навчання моделей, як-от LLaMA, потребує дуже мало обчислювальної потужності для тестування, перевірки та дослідження нових випадків використання. Базові мовні моделі тренуються на великих блоках немаркованих даних, що робить їх ідеальними для налаштування під різні завдання.

У своїй дослідницькій статті Мета зазначив, що LLaMA-13B перевершує GPT-3 OpenAI (175B) за більшістю тестів, а LLaMA-65B є конкурентоспроможною з топовими моделями, Chinchilla70B від DeepMind e PaLM-540B від Google.

LLaMA наразі не використовується в жодному з продуктів Meta ai, однак компанія планує зробити його доступним для дослідників. Раніше компанія випустила свою LLM OPT-175B, але LLaMA є її найдосконалішою системою.

Компанія робить його доступним за некомерційною ліцензією, зосередженою на дослідницьких випадках використання. Він буде доступний для академічних дослідників; ті, хто пов'язаний з урядом, громадянським суспільством і науковими організаціями; та промислові дослідницькі лабораторії по всьому світу.

Ercole Palmeri