Artiklid

Meta toob turule mudeli LLaMA, võimsama otsingutööriista kui OpenAI GPT-3

Meta andis hiljuti välja uue AI keelegeneraatori nimega LLaMA, mis kinnitab väga uuendusliku ettevõtte rolli.

"Täna avaldame uue tipptasemel AI suure keelemudeli nimega LLaMA, mis on loodud selleks, et aidata teadlastel oma tööd edendada," ütles tegevjuht Mark Zuckerberg Facebooki postituses.

Miks LLaMA

Suured keelemudelid on tehnikamaailma tormiliselt vallutanud. Nad toidavad tehisintellekti tööriistu, nagu ChatGPT ja muud vestlusmudelid. Nende tööriistade kasutamisega kaasneb aga märkimisväärne risk, usutavad, kuid valed väited, mürgise sisu tekitamine ja tehisintellekti koolitusandmetes juurdunud eelarvamuste jäljendamine. 

Et aidata teadlastel neid probleeme lahendada, on reedel, 25. veebruaril Meta  teatas vabastamisest uue suure keelemudeli nimega LLAMA (Large Language Model Meta AI) . 

Mis on LLaMA?

LLaMA ei ole a chatbot, kuid see on otsingutööriist, mis Meta ai sõnul lahendab keelemudelitega seotud probleeme AI. "Väiksemad ja paremini toimivad mudelid, nagu LLaMA, võimaldavad teistel teadlaskonna liikmetel, kellel puudub juurdepääs suurele hulgale infrastruktuurile, neid mudeleid uurida, demokratiseerides juurdepääsu selles olulises ja kiiresti arenevas valdkonnas," ütles Meta oma ajaveebis. ametnik .

LLaMA on keelemudelite kogum, mille parameetrid ulatuvad 7B kuni 65B. Ettevõte ütles, et koolitab oma mudeleid triljonite žetoonide põhjal, öeldes, et suudab tipptasemel mudeleid koolitada avalike andmekogumite abil, mitte tugineda patenteeritud, ligipääsmatutele andmekogumitele.

LLaMA on erinev

Meta sõnul nõuab mudelikoolitus nagu LLaMA väga vähe arvutusvõimsust uute kasutusjuhtude testimiseks, kinnitamiseks ja uurimiseks. Põhilised keelemudelid treenivad suurtel märgistamata andmete plokkidel, mistõttu on need ideaalsed erinevate ülesannete jaoks kohandamiseks. 

Innovatsiooni uudiskiri
Ärge jätke ilma kõige olulisematest uuendustest. Registreeruge, et saada neid meili teel.

Oma uurimistöös märkis Meta, et LLaMA-13B edestas OpenAI GPT-3 (175B) enamiku võrdlusnäitajate puhul ja LLaMA-65B on tippmudelitega konkurentsivõimeline, Chinchilla70B firmalt DeepMindPaLM-540B Google'ilt

LLaMA ei ole praegu ühegi Meta ai toote puhul kasutusel, kuid ettevõte kavatseb selle teadlastele kättesaadavaks teha. Ettevõte oli juba oma LLM OPT-175B turule toonud, kuid LLaMA on selle kõige arenenum süsteem. 

Ettevõte teeb selle kättesaadavaks mitteärilise litsentsi alusel, mis keskendub uurimistööle. See on kättesaadav akadeemilistele teadlastele; valitsuse, kodanikuühiskonna ja akadeemiliste organisatsioonidega seotud isikud; ja tööstusuuringute laborid üle maailma.

Ercole Palmeri

Innovatsiooni uudiskiri
Ärge jätke ilma kõige olulisematest uuendustest. Registreeruge, et saada neid meili teel.

Viimased artiklid

Smart Lock Market: avaldatud turu-uuringute aruanne

Mõiste Smart Lock Market viitab tootmist, levitamist ja kasutamist ümbritsevale tööstusele ja ökosüsteemile…

Märtsil 27 2024

Mis on disainimustrid: miks neid kasutada, klassifikatsioon, plussid ja miinused

Tarkvaratehnikas on disainimustrid optimaalsed lahendused probleemidele, mis tarkvara kujundamisel tavaliselt esinevad. Ma olen nagu…

Märtsil 26 2024

Tööstusliku märgistuse tehnoloogiline areng

Tööstuslik märgistus on lai mõiste, mis hõlmab mitmeid tehnikaid, mida kasutatakse püsivate märkide loomiseks ...

Märtsil 25 2024

VBA-ga kirjutatud Exceli makrode näited

Järgmised lihtsad Exceli makronäited on kirjutatud VBA-ga hinnanguline lugemisaeg: 3 minutit Näide…

Märtsil 25 2024