Artikulo

Inilunsad ng Meta ang modelong LLaMA, isang mas makapangyarihang tool sa paghahanap kaysa sa GPT-3 ng OpenAI

Ang Meta ay naglabas kamakailan ng bagong AI language generator na tinatawag na LLaMA, na nagpapatunay sa papel ng isang lubos na makabagong kumpanya.

"Ngayon ay naglalabas kami ng isang bagong modelo ng malaking wika ng AI na tinatawag na LLaMA na idinisenyo upang tulungan ang mga mananaliksik na isulong ang kanilang trabaho," sabi ng CEO na si Mark Zuckerberg sa isang post sa Facebook.

Bakit LLaMA

Sinalakay ng malalaking modelo ng wika ang mundo ng teknolohiya. Pinapagana nila ang mga tool sa artificial intelligence, tulad ng Chat GPT at iba pang mga modelo ng pakikipag-usap. Gayunpaman, ang paggamit sa mga tool na ito ay may malaking panganib, kapani-paniwala ngunit maling mga pag-aangkin, pagbuo ng nakakalason na nilalaman, at paggaya ng bias na nakaugat sa data ng pagsasanay sa AI.

Upang matulungan ang mga mananaliksik na malutas ang mga problemang ito, sa Biyernes, Pebrero 25, Meta inihayag ang pagpapalabas ng isang bagong modelo ng malaking wika na tinatawag na LLaMA (Large Language Model Meta AI) .

Ano ang LLaMA?

Ang LLaMA ay hindi isang chatbot, ngunit ito ay isang tool sa paghahanap na, ayon sa Meta ai, ay malulutas ang mga problemang nauugnay sa mga modelo ng wika AI. "Ang mga mas maliit, mas mahusay na gumaganap na mga modelo tulad ng LLaMA ay nagbibigay-daan sa iba sa komunidad ng pananaliksik na walang access sa malaking halaga ng imprastraktura na pag-aralan ang mga modelong ito, higit pang democratizing access sa mahalaga at mabilis na umuusbong na larangan na ito," sabi ni Meta sa kanyang blog opisyal .

Ang LLaMA ay isang koleksyon ng mga modelo ng wika mula 7B hanggang 65B na mga parameter. Sinabi ng kumpanya na sinasanay nito ang mga modelo nito sa trilyong-trilyong mga token, na nagsasabing maaari nitong sanayin ang mga cutting-edge na modelo gamit ang mga pampublikong dataset at hindi umaasa sa pagmamay-ari, hindi naa-access na mga dataset.

Iba ang LLaMA

Ayon sa Meta, ang pagsasanay sa modelo tulad ng LLaMA ay nangangailangan ng napakakaunting kapangyarihan sa pag-compute upang subukan, patunayan, at tuklasin ang mga bagong kaso ng paggamit. Ang mga pangunahing modelo ng wika ay nagsasanay sa malalaking bloke ng walang label na data, na ginagawang perpekto ang mga ito para sa pag-customize sa iba't ibang gawain.

Sa kanyang papel sa pananaliksik, sinabi ni Meta na ang LLaMA-13B ay nalampasan ang OpenAI's GPT-3 (175B) sa karamihan ng mga benchmark at ang LLaMA-65B ay nakikipagkumpitensya sa mga nangungunang modelo, Chinchilla70B ng DeepMind e PaLM-540B mula sa Google.

Ang LLaMA ay kasalukuyang hindi ginagamit sa alinman sa mga produkto ng Meta ai, gayunpaman, ang kumpanya ay may mga plano na gawin itong magagamit sa mga mananaliksik. Nauna nang inilunsad ng kumpanya ang LLM OPT-175B nito, ngunit ang LLaMA ang pinaka-advanced na sistema nito.

Ginagawa itong available ng kumpanya sa ilalim ng isang non-commercial na lisensya na nakatuon sa mga kaso ng paggamit ng pananaliksik. Ito ay magagamit sa mga akademikong mananaliksik; ang mga kaanib sa pamahalaan, lipunang sibil at mga organisasyong pang-akademiko; at mga laboratoryo ng pananaliksik sa industriya sa buong mundo.

Ercole Palmeri

Tags: chat gptfacebookartipisyal na katalinuhanlarge language modelsLLMmeta

Pebrero 25, 2023 10:55 am

susunod Paglikha ng CRUD App gamit ang Laravel at Vue.js »

nakaraan « Ipinakilala ng Google Photos ang "magic eraser" sa mga hindi Pixel na device

Kamakailang Mga Artikulo

Artikulo

Pumirma ang mga publisher at OpenAI ng mga kasunduan para i-regulate ang daloy ng impormasyong pinoproseso ng Artificial Intelligence

Noong nakaraang Lunes, inihayag ng Financial Times ang isang deal sa OpenAI. Nilisensyahan ng FT ang world-class na pamamahayag nito...

Abril 30 2024

Artikulo

Mga Online na Pagbabayad: Narito Kung Paano Ka Binabayaran ng Mga Serbisyo ng Streaming Magpakailanman

Milyun-milyong tao ang nagbabayad para sa mga serbisyo ng streaming, na nagbabayad ng buwanang bayad sa subscription. Karaniwang opinyon na ikaw ay…

Abril 29 2024

Mag-sign up

Itinatampok ng Veeam ang pinakakomprehensibong suporta para sa ransomware, mula sa proteksyon hanggang sa pagtugon at pagbawi

Ang Coveware ng Veeam ay patuloy na magbibigay ng mga serbisyo sa pagtugon sa insidente ng cyber extortion. Mag-aalok ang Coveware ng mga kakayahan sa forensics at remediation...

Abril 23 2024

Artikulo

Green and Digital Revolution: Kung Paano Binabago ng Predictive Maintenance ang Industriya ng Langis at Gas

Binabago ng predictive maintenance ang sektor ng langis at gas, na may makabago at proactive na diskarte sa pamamahala ng halaman.…

Abril 22 2024