tovar

Meta spúšťa model LLaMA, výkonnejší vyhľadávací nástroj ako OpenAI GPT-3

Meta nedávno vydala nový jazykový generátor AI s názvom LLaMA, ktorý potvrdzuje úlohu vysoko inovatívnej spoločnosti.

„Dnes vydávame nový, špičkový model veľkého jazyka AI s názvom LLaMA, ktorý je navrhnutý tak, aby pomohol výskumníkom napredovať v ich práci,“ uviedol generálny riaditeľ Mark Zuckerberg v príspevku na Facebooku.

Prečo LLaMA

Veľké jazykové modely vzali technologický svet útokom. Poháňajú nástroje umelej inteligencie, ako napr ChatGPT a iné konverzačné modely. Používanie týchto nástrojov však prináša značné riziko, pravdepodobné, ale nepravdivé tvrdenia, generovanie toxického obsahu a napodobňovanie zaujatosti zakorenené v údajoch o tréningu AI. 

Aby vedci pomohli vyriešiť tieto problémy, v piatok 25. februára Meta  oznámil vydanie nového veľkého jazykového modelu tzv LLaMA (Large Language Model Meta AI) . 

čo je LLaMA?

LLaMA nie je a Chatbot, ale je to vyhľadávací nástroj, ktorý podľa Meta ai vyrieši problémy súvisiace s jazykovými modelmi AI. „Menšie a výkonnejšie modely, ako je LLaMA, umožňujú ostatným vo výskumnej komunite, ktorí nemajú prístup k veľkému množstvu infraštruktúry, študovať tieto modely, čím ďalej demokratizujú prístup v tejto dôležitej a rýchlo sa rozvíjajúcej oblasti,“ uviedol Meta na svojom blogu. úradník .

LLaMA je zbierka jazykových modelov s parametrami 7B až 65B. Spoločnosť uviedla, že trénuje svoje modely na biliónoch tokenov, pričom uviedla, že môže trénovať špičkové modely pomocou verejných súborov údajov a nespoliehať sa na vlastné, neprístupné súbory údajov.

LLaMA je iná

Podľa Meta, modelové školenie, ako je LLaMA, vyžaduje veľmi malý výpočtový výkon na testovanie, overovanie a skúmanie nových prípadov použitia. Základné jazykové modely trénujú na veľkých blokoch neoznačených údajov, vďaka čomu sú ideálne na prispôsobenie rôznym úlohám. 

Inovačný bulletin
Nenechajte si ujsť najdôležitejšie novinky o inováciách. Prihláste sa na ich odber e-mailom.

Meta vo svojom výskumnom dokumente poznamenal, že LLaMA-13B prekonala OpenAI GPT-3 (175B) vo väčšine benchmarkov a LLaMA-65B je konkurencieschopná so špičkovými modelmi, Chinchilla70B od DeepMindPaLM-540B od spoločnosti Google

LLaMA sa v súčasnosti nepoužíva na žiadnom z produktov Meta ai, spoločnosť však plánuje sprístupniť ho výskumníkom. Spoločnosť už predtým uviedla na trh svoj LLM OPT-175B, ale LLaMA je jej najpokročilejší systém. 

Spoločnosť ho sprístupňuje na základe nekomerčnej licencie zameranej na prípady použitia vo výskume. Bude k dispozícii akademickým výskumníkom; tých, ktorí sú pridružení k vláde, občianskej spoločnosti a akademickým organizáciám; a priemyselné výskumné laboratóriá po celom svete.

Ercole Palmeri

Inovačný bulletin
Nenechajte si ujsť najdôležitejšie novinky o inováciách. Prihláste sa na ich odber e-mailom.

Nedávne články

Online platby: Takto budete vďaka streamovacím službám platiť navždy

Milióny ľudí platia za streamovacie služby a platia mesačné predplatné. Je bežný názor, že si…

Apríla 29 2024

Veeam ponúka najkomplexnejšiu podporu pre ransomvér, od ochrany až po reakciu a obnovu

Coveware od Veeam bude aj naďalej poskytovať služby reakcie na incidenty v oblasti kybernetického vydierania. Coveware ponúkne forenzné a sanačné schopnosti…

Apríla 23 2024

Zelená a digitálna revolúcia: Ako prediktívna údržba transformuje ropný a plynárenský priemysel

Prediktívna údržba prináša revolúciu v ropnom a plynárenskom sektore s inovatívnym a proaktívnym prístupom k riadeniu závodu.…

Apríla 22 2024

Britský protimonopolný regulátor vyvoláva poplach BigTech v súvislosti s GenAI

Britská CMA vydala varovanie pred správaním Big Tech na trhu s umelou inteligenciou. tam…

Apríla 18 2024