BLOOM: y chwyldro agored mewn deallusrwydd artiffisial

Mae modelau AI mawr heddiw angen adnoddau cyfrifiadurol enfawr i hyfforddi.

Mae rhwydwaith niwral sy'n cynnwys biliynau neu hyd yn oed biliynau o baramedrau angen adnoddau yn y degau o filiynau o Ewros.
Gyda chostau mor enfawr, yr unig actorion sy'n gallu adeiladu a hyfforddi model gwych o ddeallusrwydd artiffisial yw'r cwmnïau rhyngwladol.

Cost ymchwil AI fel rhwystr i fynediad

Gyda'r nodweddion hyn, mae cost ymchwil AI yn rhwystr i fynediad.
Dros y blynyddoedd diwethaf rydym wedi gweld toreth o fodelau llai a llai cymhleth, pa mor bell bynnag oddi wrth y modelau ieithyddol LLM mawr.

BLOOM a'r chwyldro agored

Yn ystod y blynyddoedd diwethaf rydym wedi gweld newid. Er enghraifft, mae Meta yn rhyddhau OPT-175B (Open Pretrained Transformer), model iaith sydd wedi'i hyfforddi gyda setiau data cyhoeddus ac sydd ar gael i ymchwilwyr mewn modd agored “lled”.
Ond y newyddion am y foment yw rhyddhau BLOOM LM gan BigScience.

Mae BLOOM yn fodel iaith amlieithog mynediad agored sy'n cynnwys 176 biliwn o baramedrau ac sydd wedi'i hyfforddi am 3,5 mis ar 384 GPU A100-80 GB.
Mae pwynt gwirio BLOOM yn cymryd 330GB o ofod disg, felly mae'n ymddangos yn amhosibl rhedeg y model hwn ar gyfrifiadur bwrdd gwaith.
Fodd bynnag, dim ond digon o le ar y ddisg sydd ei angen arnoch, ac o leiaf 16GB o RAM i redeg y model hwn ar eich cyfrifiadur.

Mae BLOOM yn ymdrech gydweithredol o dros 1.000 o wyddonwyr.
Mae’n bwysig bod model amlieithog mor eang ar gael yn agored i bawb.

pensaernïaeth BLODAU

Mae BLOOM yn fodel iaith achosol, sy'n golygu ei bod wedi'i hyfforddi fel rhagfynegydd o'r tocyn nesaf.
Dangoswyd bod y strategaeth ymddangosiadol syml hon o ragfynegi’r tocyn nesaf mewn brawddeg, yn seiliedig ar set o docynnau blaenorol, yn dal rhywfaint o rym rhesymu ar gyfer modelau iaith mawr.
Mae hyn yn caniatáu i BLOOM a modelau tebyg gysylltu cysyniadau lluosog mewn brawddeg ac i allu datrys problemau nad ydynt yn ddibwys fel rhifyddeg, cyfieithu a rhaglennu gyda chywirdeb gweddol.
Mae BLOOM yn defnyddio pensaernïaeth Transformer sy'n cynnwys haen fewnosod mewnbwn, 70 bloc Transformer, a haen modelu iaith allbwn, fel y dangosir yn y ffigur canlynol.

Erthygl a dynnwyd o'r Post o Luca Sambucci, os ydych am ddarllen yNewyddion.AI