مارک زاکربرگ، مدیرعامل این شرکت در یک پست فیس بوک گفت: «امروز ما یک مدل زبان بزرگ هوش مصنوعی جدید به نام LLaMA را منتشر می کنیم که برای کمک به محققان در پیشبرد کارشان طراحی شده است.
مدلهای بزرگ زبان، دنیای فناوری را در طوفان فرو بردهاند. آنها ابزارهای هوش مصنوعی مانند GPT چت و سایر مدل های مکالمه با این حال، استفاده از این ابزارها با ریسک قابل توجه، ادعاهای قابل قبول اما نادرست، تولید محتوای سمی و تقلید سوگیری ریشه در داده های آموزشی هوش مصنوعی همراه است.
برای کمک به محققان در حل این مشکلات، در روز جمعه، 25 فوریه، متا انتشار را اعلام کرد یک مدل زبان بزرگ جدید به نام LLaMA (Large Language Model هوش مصنوعی متا) .
LLaMA یک نیست chatbot، اما یک ابزار جستجو است که به گفته Meta ai، مشکلات مربوط به مدل های زبان را حل می کند AI. متا در وبلاگ خود گفت: "مدل های کوچکتر و عملکرد بهتر مانند LLaMA به دیگران در جامعه تحقیقاتی که به مقادیر زیادی زیرساخت دسترسی ندارند اجازه می دهد تا این مدل ها را مطالعه کنند و دسترسی به این حوزه مهم و به سرعت در حال تحول را دموکراتیزه کنند." رسمی .
LLaMA مجموعه ای از مدل های زبان است که از پارامترهای 7B تا 65B متغیر است. این شرکت گفت که مدلهای خود را با تریلیونها توکن آموزش میدهد و میگوید که میتواند مدلهای پیشرفته را با استفاده از مجموعه دادههای عمومی آموزش دهد و به مجموعه دادههای اختصاصی و غیرقابل دسترسی متکی نیست.
به گفته متا، آموزش مدل مانند LLaMA به قدرت محاسباتی بسیار کمی برای آزمایش، اعتبارسنجی و کشف موارد استفاده جدید نیاز دارد. مدلهای زبان پایه بر روی بلوکهای بزرگی از دادههای بدون برچسب آموزش میبینند که آنها را برای سفارشیسازی کارهای مختلف ایدهآل میکند.
متا در مقاله تحقیقاتی خود اشاره کرد که LLaMA-13B در اکثر معیارها از GPT-3 (175B) OpenAI بهتر عمل کرد و LLaMA-65B با مدل های برتر قابل رقابت است. Chinchilla70B توسط DeepMind e PalM-540B از Google.
LLaMA در حال حاضر در هیچ یک از محصولات Meta ai استفاده نمی شود، با این حال، این شرکت برنامه هایی برای در دسترس قرار دادن آن در اختیار محققان دارد. این شرکت قبلا LLM OPT-175B خود را راه اندازی کرده بود، اما LLaMA پیشرفته ترین سیستم آن است.
این شرکت آن را تحت یک مجوز غیرتجاری متمرکز بر موارد استفاده تحقیقاتی در دسترس قرار می دهد. در اختیار محققان دانشگاهی قرار خواهد گرفت. وابستگان به دولت، جامعه مدنی و سازمان های دانشگاهی؛ و آزمایشگاه های تحقیقات صنعتی در سراسر جهان.
Ercole Palmeri
اصطلاح بازار قفل هوشمند به صنعت و اکوسیستم پیرامون تولید، توزیع و استفاده…
در مهندسی نرم افزار، الگوهای طراحی راه حل های بهینه برای مشکلاتی هستند که معمولا در طراحی نرم افزار رخ می دهند. من می گفتم…
علامت گذاری صنعتی یک اصطلاح گسترده است که شامل چندین تکنیک است که برای ایجاد علائم دائمی روی سطح…
نمونه های ساده ماکرو اکسل زیر با استفاده از زمان خواندن تخمینی VBA نوشته شده است: 3 دقیقه مثال…