makala

Meta yazindua muundo wa LLaMA, zana yenye nguvu zaidi ya utafutaji kuliko GPT-3 ya OpenAI

Hivi majuzi Meta imetoa jenereta mpya ya lugha ya AI inayoitwa LLaMA, ikithibitisha jukumu la kampuni yenye ubunifu wa hali ya juu.

"Leo tunatoa modeli mpya ya kisasa ya AI ya lugha inayoitwa LLaMA iliyoundwa kusaidia watafiti kuendeleza kazi zao," Mkurugenzi Mtendaji Mkuu Mark Zuckerberg alisema katika chapisho la Facebook.

Kwa nini LLaMA

Miundo ya lugha kubwa imechukua ulimwengu wa teknolojia kwa dhoruba. Wanaendesha zana za akili za bandia, kama vile GumzoGPT na mifano mingine ya mazungumzo. Hata hivyo, kutumia zana hizi huja na hatari kubwa, madai yanayokubalika lakini ya uwongo, kuzalisha maudhui yenye sumu, na kuiga upendeleo unaotokana na data ya mafunzo ya AI. 

Ili kuwasaidia watafiti kutatua matatizo haya, Ijumaa, Februari 25, Meta  alitangaza kutolewa ya mtindo mpya wa lugha kubwa unaoitwa LLaMA (Large Language Model Meta AI) . 

LLaMA ni nini?

LLaMA sio a chatbot, lakini ni zana ya utafutaji ambayo, kulingana na Meta ai, itasuluhisha matatizo yanayohusiana na mifano ya lugha AI. "Miundo ndogo, inayofanya vizuri zaidi kama LLaMA inawaruhusu wengine katika jumuiya ya watafiti ambao hawana uwezo wa kufikia kiasi kikubwa cha miundombinu kujifunza mifano hii, na kuongeza demokrasia katika nyanja hii muhimu na inayoendelea kwa kasi," Meta alisema katika blogu yake. rasmi .

LLaMA ni mkusanyiko wa modeli za lugha kuanzia 7B hadi 65B vigezo. Kampuni hiyo ilisema inafunza mifano yake juu ya matrilioni ya ishara, ikisema inaweza kutoa mafunzo kwa mifano ya kisasa kwa kutumia hifadhidata za umma na sio kutegemea hifadhidata za wamiliki, zisizoweza kufikiwa.

LLaMA ni tofauti

Kulingana na Meta, mafunzo ya mfano kama LLaMA yanahitaji nguvu kidogo sana ya kompyuta ili kujaribu, kuhalalisha, na kuchunguza kesi mpya za utumiaji. Miundo ya lugha ya msingi hufunzwa kwenye vizuizi vikubwa vya data isiyo na lebo, na kuzifanya ziwe bora kwa ajili ya kubinafsisha kazi mbalimbali. 

Jarida la uvumbuzi
Usikose habari muhimu zaidi kuhusu uvumbuzi. Jisajili ili kuzipokea kwa barua pepe.

Katika karatasi yake ya utafiti, Meta alibaini kuwa LLaMA-13B ilifanya vyema zaidi OpenAI's GPT-3 (175B) kwenye vigezo vingi na LLaMA-65B inashindana na mifano ya juu, Chinchilla70B na DeepMindPaLM-540B kutoka Google

LLaMA haitumiki kwa sasa kwenye bidhaa zozote za Meta ai, hata hivyo, kampuni ina mipango ya kuifanya ipatikane kwa watafiti. Kampuni hiyo tayari ilikuwa imezindua LLM OPT-175B yake, lakini LLaMA ndio mfumo wake wa hali ya juu zaidi. 

Kampuni inaifanya ipatikane chini ya leseni isiyo ya kibiashara inayolenga kesi za utumiaji wa utafiti. Itakuwa inapatikana kwa watafiti wa kitaaluma; wale wanaohusishwa na serikali, mashirika ya kiraia na mashirika ya kitaaluma; na maabara za utafiti wa viwanda duniani kote.

Ercole Palmeri

Jarida la uvumbuzi
Usikose habari muhimu zaidi kuhusu uvumbuzi. Jisajili ili kuzipokea kwa barua pepe.

Makala ya hivi karibuni

Wakati Ujao Upo Hapa: Jinsi Sekta ya Usafirishaji Inavyofanya Mapinduzi katika Uchumi wa Kimataifa

Sekta ya majini ni nguvu ya kweli ya kiuchumi duniani, ambayo imepitia kwenye soko la bilioni 150 ...

1 Mei 2024

Wachapishaji na OpenAI hutia saini mikataba ya kudhibiti mtiririko wa taarifa zinazochakatwa na Intelligence Artificial Intelligence

Jumatatu iliyopita, Financial Times ilitangaza makubaliano na OpenAI. FT inatoa leseni kwa uandishi wake wa habari wa kiwango cha kimataifa…

Aprili 30 2024

Malipo ya Mtandaoni: Hivi Ndivyo Huduma za Utiririshaji Hukufanya Ulipe Milele

Mamilioni ya watu hulipia huduma za utiririshaji, kulipa ada za usajili za kila mwezi. Ni maoni ya kawaida kwamba wewe…

Aprili 29 2024

Veeam inaangazia usaidizi wa kina zaidi wa ransomware, kutoka kwa ulinzi hadi majibu na uokoaji

Coveware by Veeam itaendelea kutoa huduma za kukabiliana na matukio ya ulaghai mtandaoni. Coveware itatoa uwezo wa uchunguzi na urekebishaji…

Aprili 23 2024