"Vandaag brengen we een nieuw, geavanceerd AI-groottaalmodel uit, LLaMA genaamd, dat is ontworpen om onderzoekers te helpen hun werk vooruit te helpen", zei CEO Mark Zuckerberg in een Facebook-bericht.
Grote taalmodellen hebben de technische wereld stormenderhand veroverd. Ze voeden hulpmiddelen voor kunstmatige intelligentie, zoals ChatGPT en andere gespreksmodellen. Het gebruik van deze tools brengt echter aanzienlijke risico's met zich mee, plausibele maar valse claims, het genereren van giftige inhoud en het nabootsen van vooringenomenheid die is geworteld in AI-trainingsgegevens.
Om onderzoekers te helpen deze problemen op te lossen, houdt Meta kondigde de vrijlating aan van een nieuw groot taalmodel genaamd LLaMA (Large Language Model Meta-AI) .
LLaMA is geen Chatbot, maar het is een zoekhulpmiddel dat volgens Meta ai problemen met taalmodellen zal oplossen AI. "Kleinere, beter presterende modellen zoals LLaMA stellen anderen in de onderzoeksgemeenschap die geen toegang hebben tot grote hoeveelheden infrastructuur in staat om deze modellen te bestuderen, waardoor de toegang in dit belangrijke en snel evoluerende veld verder wordt gedemocratiseerd", zei Meta in zijn blog officieel .
LLaMA is een verzameling taalmodellen variërend van 7B tot 65B parameters. Het bedrijf zei dat het zijn modellen traint op biljoenen tokens, en zegt dat het geavanceerde modellen kan trainen met behulp van openbare datasets en niet kan vertrouwen op eigen, ontoegankelijke datasets.
Volgens Meta vereist modeltraining zoals LLaMA heel weinig rekenkracht om nieuwe use-cases te testen, te valideren en te verkennen. Basistaalmodellen trainen op grote blokken niet-gelabelde gegevens, waardoor ze ideaal zijn voor aanpassing aan verschillende taken.
In zijn onderzoekspaper merkte Meta op dat LLaMA-13B beter presteerde dan OpenAI's GPT-3 (175B) op de meeste benchmarks en dat LLaMA-65B concurrerend is met topmodellen. Chinchilla70B van DeepMind e PaLM-540B van Google.
LLaMA wordt momenteel niet gebruikt op een van de Meta ai-producten, maar het bedrijf heeft plannen om het beschikbaar te maken voor onderzoekers. Het bedrijf had eerder zijn LLM OPT-175B gelanceerd, maar LLaMA is het meest geavanceerde systeem.
Het bedrijf stelt het beschikbaar onder een niet-commerciële licentie die is gericht op gebruiksscenario's voor onderzoek. Het zal beschikbaar zijn voor academische onderzoekers; degenen die zijn aangesloten bij de overheid, het maatschappelijk middenveld en academische organisaties; en industriële onderzoekslaboratoria over de hele wereld.
Ercole Palmeri
De marinesector is een echte mondiale economische macht, die is genavigeerd naar een markt van 150 miljard...
Afgelopen maandag maakte de Financial Times een deal met OpenAI bekend. FT geeft licenties voor haar journalistiek van wereldklasse...
Miljoenen mensen betalen voor streamingdiensten en betalen maandelijkse abonnementskosten. De algemene mening is dat je…
Coveware by Veeam zal responsdiensten op het gebied van cyberafpersingsincidenten blijven leveren. Coveware zal forensische en herstelmogelijkheden bieden...