«Бүгін біз зерттеушілерге жұмысын ілгерілетуге көмектесу үшін жасалған LLaMA деп аталатын жаңа, озық AI үлкен тіл үлгісін шығарамыз», - деді бас директор Марк Цукерберг Facebook-тегі жазбасында.
Үлкен тіл үлгілері технологиялық әлемді жаулап алды. Олар жасанды интеллект құралдарын қуаттайды, мысалы GPT чат және басқа да сөйлесу үлгілері. Дегенмен, бұл құралдарды пайдалану айтарлықтай тәуекелмен, ақылға қонымды, бірақ жалған шағымдармен, улы мазмұнды тудыратын және AI жаттығуларының деректеріне негізделген қиғаштықты имитациялаумен бірге келеді.
Зерттеушілерге осы мәселелерді шешуге көмектесу үшін 25 ақпан, жұма күні Мета шығарылғанын жариялады деп аталатын жаңа үлкен тіл үлгісінің LLaMA (Large Language Model Мета AI) .
LLaMA а емес chatbot, бірақ бұл Meta ai бойынша тіл үлгілеріне қатысты мәселелерді шешетін іздеу құралы AI. «LLaMA сияқты кішірек, жақсырақ жұмыс істейтін модельдер үлкен көлемдегі инфрақұрылымға қол жеткізе алмайтын зерттеу қоғамдастығындағы басқа адамдарға осы модельдерді зерттеуге мүмкіндік береді, бұл маңызды және тез дамып келе жатқан салада қолжетімділікті одан әрі демократияландырады», - деді Мета өз блогында. ресми .
LLaMA — 7В-ден 65В-ға дейінгі параметрлерді қамтитын тіл үлгілерінің жинағы. Компания өзінің үлгілерін триллиондаған таңбалауыштарға үйрететінін айтты, ол жалпыға қолжетімді деректер жиынын пайдаланып озық үлгілерді үйрете алады және меншікті, қол жетімсіз деректер жиынына сенбейді.
Meta мәліметтері бойынша, LLaMA сияқты модельді оқыту жаңа пайдалану жағдайларын сынау, тексеру және зерттеу үшін өте аз есептеу қуатын қажет етеді. Негізгі тіл үлгілері таңбаланбаған деректердің үлкен блоктарында жаттығады, бұл оларды әртүрлі тапсырмаларға теңшеу үшін тамаша етеді.
Мета өзінің зерттеу мақаласында LLaMA-13B OpenAI-дің GPT-3 (175B) көптеген стандарттарынан асып түсетінін және LLaMA-65B үздік модельдермен бәсекеге қабілетті екенін атап өтті. DeepMind ұсынған Chinchilla70B e Google ұсынған PaLM-540B.
LLaMA қазіргі уақытта Meta ai өнімдерінде қолданылмайды, дегенмен компания оны зерттеушілерге қолжетімді етуді жоспарлап отыр. Компания LLM OPT-175B шығарған болатын, бірақ LLaMA - оның ең жетілдірілген жүйесі.
Компания оны зерттеуді пайдалану жағдайларына бағытталған коммерциялық емес лицензия бойынша қолжетімді етеді. Ол академиялық зерттеушілерге қолжетімді болады; үкіметпен, азаматтық қоғаммен және академиялық ұйымдармен үлестес тұлғалар; және дүние жүзіндегі өнеркәсіптік зерттеу зертханалары.
Ercole Palmeri
Ұлыбританияның CMA жасанды интеллект нарығындағы Big Tech әрекеті туралы ескерту жасады. Ана жерде…
Ғимараттардың энергия тиімділігін арттыру үшін Еуропалық Одақ тұжырымдаған «Жасыл үйлер» жарлығы өзінің заң шығару процесін аяқтады ...
Casaleggio Associati компаниясының Италиядағы электрондық коммерция туралы жылдық есебі ұсынылды. «AI-Commerce: жасанды интеллектпен электрондық коммерцияның шекаралары» деп аталатын есеп.…
Тұрақты технологиялық инновациялар мен қоршаған орта мен адамдардың әл-ауқатына деген ұмтылыстың нәтижесі. Bandalux Airpure® шатырын ұсынады…