Вештачка интелигенција

БЛУМ: отворена револуција у вештачкој интелигенцији

Садашњим великим АИ моделима су потребни огромни рачунарски ресурси за обуку.

Неуронска мрежа састављена од милијарди или чак милијарди параметара захтева ресурсе вредне десетине милиона евра.
Уз тако импозантне трошкове, једини актери способни да створе и обуче велики модел вештачке интелигенције су мултинационалне компаније.

Цена истраживања АИ као препрека уласку

Са овим карактеристикама, трошкови истраживања АИ представљају баријеру за улазак.
Током последњих неколико година били смо сведоци пролиферације мањих и мање сложених модела, иако далеко од великих ЛЛМ језичких модела.

БЛООМ и отворена револуција

Последњих година смо сведоци преокрета тренда. На пример, Мета издање ОПТ-175Б (Опен Претраинед Трансформер), лингвистичког модела обученог са јавним скуповима података и стављеног на располагање истраживачима у „скоро“ отвореном режиму.
Али вест у овом тренутку је издање БЛООМ ЛМ од стране БигСциенце.

БЛООМ је вишејезични модел отвореног приступа који садржи 176 милијарди параметара и обучен је 3,5 месеца на 384 А100–80ГБ ГПУ-а.
БЛООМ контролна тачка заузима 330 ГБ простора на диску, тако да је немогуће покренути овај модел на десктоп рачунару.
Међутим, потребно вам је само довољно простора на диску и најмање 16 ГБ РАМ-а да бисте покренули овај модел на рачунару.

Иновациони билтен
Не пропустите најважније вести о иновацијама. Пријавите се да их примате путем е-поште.

БЛООМ је заједнички напор више од 1.000 научника.
Важно је да тако широк вишејезични модел буде отворено доступан свима.

БЛООМ архитектура

БЛООМ је каузални модел језика, што значи да је обучен као предиктор следећег токена.
Показало се да ова наизглед једноставна стратегија предвиђања следеће лексеме у реченици, заснована на скупу претходних лексема, обухвата одређени степен моћи закључивања за велике језичке моделе.
Ово омогућава БЛООМ-у и сличним моделима да повежу више концепата у реченици и буду у стању да реше нетривијалне проблеме као што су аритметика, превод и програмирање са разумном тачношћу.
БЛООМ користи Трансформер архитектуру која се састоји од улазног слоја за уграђивање, 70 Трансформер блокова и слоја за моделирање излазног језика, као што је приказано на следећој слици.

Чланак преузет из Пост оф Luca Sambucci, ако желите да прочитатеНевс.АИ

Иновациони билтен
Не пропустите најважније вести о иновацијама. Пријавите се да их примате путем е-поште.

Недавни чланци

Предности бојанка за децу - свет магије за све узрасте

Развијање финих моторичких вештина кроз бојење припрема децу за сложеније вештине попут писања. Боји…

КСНУМКС Мај КСНУМКС

Будућност је ту: Како бродарска индустрија револуционише глобалну економију

Поморски сектор је права глобална економска сила, која је кренула ка тржишту од 150 милијарди...

КСНУМКС Мај КСНУМКС

Издавачи и ОпенАИ потписују уговоре за регулисање протока информација које обрађује вештачка интелигенција

Прошлог понедељка, Финанциал Тимес је објавио договор са ОпенАИ. ФТ лиценцира своје новинарство светске класе…

КСНУМКС април КСНУМКС

Онлине плаћања: Ево како вас услуге стримовања чине да плаћате заувек

Милиони људи плаћају услуге стриминга, плаћајући месечне претплате. Увријежено је мишљење да сте…

КСНУМКС април КСНУМКС

Прочитајте Иновације на свом језику

Иновациони билтен
Не пропустите најважније вести о иновацијама. Пријавите се да их примате путем е-поште.

Пратите нас