Artikler

Meta lancerer LLaMA-modellen, et mere kraftfuldt søgeværktøj end OpenAI's GPT-3

Meta har for nylig udgivet en ny AI-sproggenerator kaldet LLaMA, der bekræfter rollen som en meget innovativ virksomhed.

"I dag udgiver vi en ny, banebrydende AI-storsprogmodel kaldet LLaMA designet til at hjælpe forskere med at fremme deres arbejde," sagde CEO Mark Zuckerberg i et Facebook-opslag.

Hvorfor LLaMA

Store sprogmodeller har taget teknologiverdenen med storm. De driver kunstig intelligens værktøjer, som f.eks ChatGPT og andre samtalemodeller. Men brugen af ​​disse værktøjer medfører betydelige risici, plausible, men falske påstande, genererer giftigt indhold og efterligner bias forankret i AI-træningsdata. 

For at hjælpe forskere med at løse disse problemer, fredag ​​den 25. februar, blev Meta  annoncerede udgivelsen af en ny stor sprogmodel kaldet LLaMA (Large Language Model Meta AI) . 

Hvad er LLaMA?

LLaMA er ikke en chatbot, men det er et søgeværktøj, der ifølge Meta ai skal løse problemer relateret til sprogmodeller AI. "Mindre, bedre ydende modeller som LLaMA giver andre i forskningsmiljøet, der mangler adgang til store mængder infrastruktur, mulighed for at studere disse modeller, hvilket yderligere demokratiserer adgangen i dette vigtige og hurtigt udviklende felt," sagde Meta i sin blog officielle .

LLaMA er en samling af sprogmodeller, der spænder fra 7B til 65B parametre. Virksomheden sagde, at det træner sine modeller på billioner af tokens og sagde, at det kan træne banebrydende modeller ved hjælp af offentlige datasæt og ikke stole på proprietære, utilgængelige datasæt.

LLaMA er anderledes

Ifølge Meta kræver modeltræning som LLaMA meget lidt computerkraft for at teste, validere og udforske nye use cases. Grundlæggende sprogmodeller træner på store blokke af umærkede data, hvilket gør dem ideelle til tilpasning til forskellige opgaver. 

Nyhedsbrev om innovation
Gå ikke glip af de vigtigste nyheder om innovation. Tilmeld dig for at modtage dem via e-mail.

I sit forskningspapir bemærkede Meta, at LLaMA-13B klarede sig bedre end OpenAI's GPT-3 (175B) på de fleste benchmarks, og LLaMA-65B er konkurrencedygtig med topmodeller, Chinchilla70B fra DeepMindPaLM-540B fra Google

LLaMA er i øjeblikket ikke i brug på nogen af ​​Meta ai-produkterne, men virksomheden har planer om at gøre det tilgængeligt for forskere. Virksomheden havde tidligere lanceret sin LLM OPT-175B, men LLaMA er dets mest avancerede system. 

Virksomheden gør det tilgængeligt under en ikke-kommerciel licens med fokus på forskningsbrug. Det vil være tilgængeligt for akademiske forskere; dem, der er tilknyttet regeringen, civilsamfundet og akademiske organisationer; og industrielle forskningslaboratorier rundt om i verden.

Ercole Palmeri

Nyhedsbrev om innovation
Gå ikke glip af de vigtigste nyheder om innovation. Tilmeld dig for at modtage dem via e-mail.

Seneste artikler

Fremtiden er her: Hvordan shippingindustrien revolutionerer den globale økonomi

Flådesektoren er en sand global økonomisk magt, som har navigeret mod et 150 milliarder marked...

1 maj 2024

Udgivere og OpenAI underskriver aftaler for at regulere strømmen af ​​information, der behandles af kunstig intelligens

Sidste mandag offentliggjorde Financial Times en aftale med OpenAI. FT licenserer sin verdensklasses journalistik...

30 April 2024

Onlinebetalinger: Her er hvordan streamingtjenester får dig til at betale for evigt

Millioner af mennesker betaler for streamingtjenester og betaler månedlige abonnementsgebyrer. Det er almindelig opfattelse, at du...

29 April 2024

Veeam har den mest omfattende support til ransomware, fra beskyttelse til respons og gendannelse

Coveware by Veeam vil fortsætte med at levere responstjenester til cyberafpresning. Coveware vil tilbyde kriminaltekniske og afhjælpende funktioner...

23 April 2024