Artikelen

Meta lanceert het LLaMA-model, een krachtigere zoektool dan OpenAI's GPT-3

Meta heeft onlangs een nieuwe AI-taalgenerator uitgebracht, LLaMA genaamd, die de rol van een zeer innovatief bedrijf bevestigt.

"Vandaag brengen we een nieuw, geavanceerd AI-groottaalmodel uit, LLaMA genaamd, dat is ontworpen om onderzoekers te helpen hun werk vooruit te helpen", zei CEO Mark Zuckerberg in een Facebook-bericht.

Waarom LLaMA

Grote taalmodellen hebben de technische wereld stormenderhand veroverd. Ze voeden hulpmiddelen voor kunstmatige intelligentie, zoals ChatGPT en andere gespreksmodellen. Het gebruik van deze tools brengt echter aanzienlijke risico's met zich mee, plausibele maar valse claims, het genereren van giftige inhoud en het nabootsen van vooringenomenheid die is geworteld in AI-trainingsgegevens. 

Om onderzoekers te helpen deze problemen op te lossen, houdt Meta  kondigde de vrijlating aan van een nieuw groot taalmodel genaamd LLaMA (Large Language Model Meta-AI) . 

Wat is LLaMA?

LLaMA is geen Chatbot, maar het is een zoekhulpmiddel dat volgens Meta ai problemen met taalmodellen zal oplossen AI. "Kleinere, beter presterende modellen zoals LLaMA stellen anderen in de onderzoeksgemeenschap die geen toegang hebben tot grote hoeveelheden infrastructuur in staat om deze modellen te bestuderen, waardoor de toegang in dit belangrijke en snel evoluerende veld verder wordt gedemocratiseerd", zei Meta in zijn blog officieel .

LLaMA is een verzameling taalmodellen variërend van 7B tot 65B parameters. Het bedrijf zei dat het zijn modellen traint op biljoenen tokens, en zegt dat het geavanceerde modellen kan trainen met behulp van openbare datasets en niet kan vertrouwen op eigen, ontoegankelijke datasets.

LLaMA is anders

Volgens Meta vereist modeltraining zoals LLaMA heel weinig rekenkracht om nieuwe use-cases te testen, te valideren en te verkennen. Basistaalmodellen trainen op grote blokken niet-gelabelde gegevens, waardoor ze ideaal zijn voor aanpassing aan verschillende taken. 

Innovatie nieuwsbrief
Mis het belangrijkste nieuws over innovatie niet. Meld u aan om ze per e-mail te ontvangen.

In zijn onderzoekspaper merkte Meta op dat LLaMA-13B beter presteerde dan OpenAI's GPT-3 (175B) op de meeste benchmarks en dat LLaMA-65B concurrerend is met topmodellen. Chinchilla70B van DeepMindPaLM-540B van Google

LLaMA wordt momenteel niet gebruikt op een van de Meta ai-producten, maar het bedrijf heeft plannen om het beschikbaar te maken voor onderzoekers. Het bedrijf had eerder zijn LLM OPT-175B gelanceerd, maar LLaMA is het meest geavanceerde systeem. 

Het bedrijf stelt het beschikbaar onder een niet-commerciële licentie die is gericht op gebruiksscenario's voor onderzoek. Het zal beschikbaar zijn voor academische onderzoekers; degenen die zijn aangesloten bij de overheid, het maatschappelijk middenveld en academische organisaties; en industriële onderzoekslaboratoria over de hele wereld.

Ercole Palmeri

Innovatie nieuwsbrief
Mis het belangrijkste nieuws over innovatie niet. Meld u aan om ze per e-mail te ontvangen.

Recente artikelen

De toekomst is hier: hoe de scheepvaartindustrie een revolutie teweegbrengt in de wereldeconomie

De marinesector is een echte mondiale economische macht, die is genavigeerd naar een markt van 150 miljard...

1 mei 2024

Uitgevers en OpenAI ondertekenen overeenkomsten om de informatiestroom die door kunstmatige intelligentie wordt verwerkt, te reguleren

Afgelopen maandag maakte de Financial Times een deal met OpenAI bekend. FT geeft licenties voor haar journalistiek van wereldklasse...

April 30 2024

Online betalingen: hier is hoe streamingdiensten u voor altijd laten betalen

Miljoenen mensen betalen voor streamingdiensten en betalen maandelijkse abonnementskosten. De algemene mening is dat je…

April 29 2024

Veeam biedt de meest uitgebreide ondersteuning voor ransomware, van bescherming tot respons en herstel

Coveware by Veeam zal responsdiensten op het gebied van cyberafpersingsincidenten blijven leveren. Coveware zal forensische en herstelmogelijkheden bieden...

April 23 2024