«Сьогодні ми випускаємо нову передову велику мовну модель штучного інтелекту під назвою LLaMA, розроблену для того, щоб допомогти дослідникам просувати свою роботу», — заявив генеральний директор Марк Цукерберг у дописі на Facebook.
Великі мовні моделі штурмом захопили світ технологій. Вони живлять інструменти штучного інтелекту, такі як ChatGPT та інші розмовні моделі. Однак використання цих інструментів пов’язане зі значним ризиком, правдоподібними, але неправдивими твердженнями, створенням токсичного вмісту та імітацією упередженості, яка ґрунтується на даних навчання ШІ.
Щоб допомогти дослідникам вирішити ці проблеми, у п’ятницю, 25 лютого, Meta оголосив про випуск нової великої мовної моделі під назвою LlaMA (Large Language Model Мета ШІ) .
LLaMA не є Chatbot, але це інструмент пошуку, який, згідно з Meta ai, вирішуватиме проблеми, пов’язані з мовними моделями AI. «Менші, ефективніші моделі, такі як LLaMA, дозволяють іншим дослідникам, які не мають доступу до великої кількості інфраструктури, вивчати ці моделі, ще більше демократизуючи доступ у цій важливій галузі, що швидко розвивається», — сказав Мета у своєму блозі. офіційний .
LLaMA — це набір мовних моделей із параметрами від 7B до 65B. Компанія заявила, що навчає свої моделі на трильйонах токенів, кажучи, що вона може навчати найсучасніші моделі, використовуючи загальнодоступні набори даних, а не покладатися на закриті, недоступні набори даних.
Відповідно до Meta, навчання моделей, як-от LLaMA, потребує дуже мало обчислювальної потужності для тестування, перевірки та дослідження нових випадків використання. Базові мовні моделі тренуються на великих блоках немаркованих даних, що робить їх ідеальними для налаштування під різні завдання.
У своїй дослідницькій статті Мета зазначив, що LLaMA-13B перевершує GPT-3 OpenAI (175B) за більшістю тестів, а LLaMA-65B є конкурентоспроможною з топовими моделями, Chinchilla70B від DeepMind e PaLM-540B від Google.
LLaMA наразі не використовується в жодному з продуктів Meta ai, однак компанія планує зробити його доступним для дослідників. Раніше компанія випустила свою LLM OPT-175B, але LLaMA є її найдосконалішою системою.
Компанія робить його доступним за некомерційною ліцензією, зосередженою на дослідницьких випадках використання. Він буде доступний для академічних дослідників; ті, хто пов'язаний з урядом, громадянським суспільством і науковими організаціями; та промислові дослідницькі лабораторії по всьому світу.
Ercole Palmeri
Coveware від Veeam продовжить надавати послуги реагування на інциденти кібервимагання. Coveware запропонує криміналістику та можливості відновлення…
Прогнозне технічне обслуговування революціонізує нафтогазовий сектор завдяки інноваційному та проактивному підходу до управління заводом.…
CMA Великобританії випустило попередження щодо поведінки Big Tech на ринку штучного інтелекту. Там…
Указ «Case Green», розроблений Європейським Союзом для підвищення енергоефективності будівель, завершив свій законодавчий процес з…