Штучний інтелект

BLOOM: відкрита революція в області штучного інтелекту

Сучасні великі моделі ШІ потребують величезних обчислювальних ресурсів для навчання.

Нейронна мережа, що складається з мільярдів або навіть мільярдів параметрів, потребує ресурсів у десятки мільйонів євро.
З такими величезними витратами єдині актори, здатні побудувати та навчити чудову модель штучного інтелекту, — це транснаціональні компанії.

Вартість досліджень штучного інтелекту як перешкода входу

З такими характеристиками вартість досліджень ШІ є перешкодою для входу.
За останні кілька років ми стали свідками поширення менших і менш складних моделей, однак далеких від великих лінгвістичних моделей LLM.

БЛУМ і відкрита революція

В останні роки ми спостерігаємо поворот. Наприклад, Meta випустила OPT-175B (Open Pretrained Transformer), мовну модель, навчену загальнодоступними наборами даних і доступну для дослідників у «квазі» відкритому режимі.
Але новиною цього моменту є випуск BLOOM LM від BigScience.

BLOOM — це багатомовна модель відкритого доступу, яка містить 176 мільярдів параметрів і навчалася протягом 3,5 місяців на 384 графічних процесорах A100–80 ГБ.
Контрольна точка BLOOM займає 330 ГБ дискового простору, тому запустити цю модель на настільному комп’ютері здається неможливим.
Однак для запуску цієї моделі на вашому комп’ютері вам просто потрібно достатньо місця на диску та принаймні 16 ГБ оперативної пам’яті.

Інноваційний бюлетень
Не пропустіть найважливіші новини про інновації. Підпишіться, щоб отримувати їх електронною поштою.

BLOOM – це спільне зусилля понад 1.000 науковців.
Важливо, щоб така широка багатомовна модель була відкрито доступна для всіх.

Архітектура BLOOM

BLOOM є причинно-наслідковою модельною мовою, що означає, що її було навчено як предиктор наступного токена.
Було показано, що ця, здавалося б, проста стратегія передбачення наступної лексеми в реченні на основі набору попередніх лексем захоплює певний ступінь міркування для великих мовних моделей.
Це дозволяє BLOOM та подібним моделям з’єднувати кілька понять у реченні та мати можливість розв’язувати нетривіальні проблеми, такі як арифметика, переклад і програмування з достатньою точністю.
BLOOM використовує архітектуру Transformer, яка складається з вхідного рівня вбудовування, 70 блоків Transformer і рівня моделювання вихідної мови, як показано на наступному малюнку.

Стаття взята з Post of Luca Sambucci, якщо ви хочете прочитатиНовини.AI

Інноваційний бюлетень
Не пропустіть найважливіші новини про інновації. Підпишіться, щоб отримувати їх електронною поштою.

Останні статті

Видавці та OpenAI підписують угоди щодо регулювання потоку інформації, яка обробляється штучним інтелектом

Минулого понеділка Financial Times оголосила про угоду з OpenAI. FT ліцензує свою журналістику світового рівня…

Квітень 30 2024

Онлайн-платежі: ось як потокові послуги змушують вас платити вічно

Мільйони людей оплачують потокові послуги, сплачуючи щомісячну абонентську плату. Поширена думка, що ви…

Квітень 29 2024

Veeam пропонує найповнішу підтримку програм-вимагачів, від захисту до реагування та відновлення

Coveware від Veeam продовжить надавати послуги реагування на інциденти кібервимагання. Coveware запропонує криміналістику та можливості відновлення…

Квітень 23 2024

Зелена та цифрова революція: як прогнозне технічне обслуговування трансформує нафтову та газову промисловість

Прогнозне технічне обслуговування революціонізує нафтогазовий сектор завдяки інноваційному та проактивному підходу до управління заводом.…

Квітень 22 2024

Читайте Innovation своєю мовою

Інноваційний бюлетень
Не пропустіть найважливіші новини про інновації. Підпишіться, щоб отримувати їх електронною поштою.

Слідуйте за нами