makala

Meta yazindua muundo wa LLaMA, zana yenye nguvu zaidi ya utafutaji kuliko GPT-3 ya OpenAI

Hivi majuzi Meta imetoa jenereta mpya ya lugha ya AI inayoitwa LLaMA, ikithibitisha jukumu la kampuni yenye ubunifu wa hali ya juu.

"Leo tunatoa modeli mpya ya kisasa ya AI ya lugha inayoitwa LLaMA iliyoundwa kusaidia watafiti kuendeleza kazi zao," Mkurugenzi Mtendaji Mkuu Mark Zuckerberg alisema katika chapisho la Facebook.

Kwa nini LLaMA

Miundo ya lugha kubwa imechukua ulimwengu wa teknolojia kwa dhoruba. Wanaendesha zana za akili za bandia, kama vile GumzoGPT na mifano mingine ya mazungumzo. Hata hivyo, kutumia zana hizi huja na hatari kubwa, madai yanayokubalika lakini ya uwongo, kuzalisha maudhui yenye sumu, na kuiga upendeleo unaotokana na data ya mafunzo ya AI.

Ili kuwasaidia watafiti kutatua matatizo haya, Ijumaa, Februari 25, Meta alitangaza kutolewa ya mtindo mpya wa lugha kubwa unaoitwa LLaMA (Large Language Model Meta AI) .

LLaMA ni nini?

LLaMA sio a chatbot, lakini ni zana ya utafutaji ambayo, kulingana na Meta ai, itasuluhisha matatizo yanayohusiana na mifano ya lugha AI. "Miundo ndogo, inayofanya vizuri zaidi kama LLaMA inawaruhusu wengine katika jumuiya ya watafiti ambao hawana uwezo wa kufikia kiasi kikubwa cha miundombinu kujifunza mifano hii, na kuongeza demokrasia katika nyanja hii muhimu na inayoendelea kwa kasi," Meta alisema katika blogu yake. rasmi .

LLaMA ni mkusanyiko wa modeli za lugha kuanzia 7B hadi 65B vigezo. Kampuni hiyo ilisema inafunza mifano yake juu ya matrilioni ya ishara, ikisema inaweza kutoa mafunzo kwa mifano ya kisasa kwa kutumia hifadhidata za umma na sio kutegemea hifadhidata za wamiliki, zisizoweza kufikiwa.

LLaMA ni tofauti

Kulingana na Meta, mafunzo ya mfano kama LLaMA yanahitaji nguvu kidogo sana ya kompyuta ili kujaribu, kuhalalisha, na kuchunguza kesi mpya za utumiaji. Miundo ya lugha ya msingi hufunzwa kwenye vizuizi vikubwa vya data isiyo na lebo, na kuzifanya ziwe bora kwa ajili ya kubinafsisha kazi mbalimbali.

Katika karatasi yake ya utafiti, Meta alibaini kuwa LLaMA-13B ilifanya vyema zaidi OpenAI's GPT-3 (175B) kwenye vigezo vingi na LLaMA-65B inashindana na mifano ya juu, Chinchilla70B na DeepMind e PaLM-540B kutoka Google.

LLaMA haitumiki kwa sasa kwenye bidhaa zozote za Meta ai, hata hivyo, kampuni ina mipango ya kuifanya ipatikane kwa watafiti. Kampuni hiyo tayari ilikuwa imezindua LLM OPT-175B yake, lakini LLaMA ndio mfumo wake wa hali ya juu zaidi.

Kampuni inaifanya ipatikane chini ya leseni isiyo ya kibiashara inayolenga kesi za utumiaji wa utafiti. Itakuwa inapatikana kwa watafiti wa kitaaluma; wale wanaohusishwa na serikali, mashirika ya kiraia na mashirika ya kitaaluma; na maabara za utafiti wa viwanda duniani kote.

Ercole Palmeri