مقالات

متا مدل LLaMA را راه‌اندازی می‌کند، ابزار جستجوی قدرتمندتری نسبت به GPT-3 OpenAI

متا اخیراً یک سازنده زبان هوش مصنوعی جدید به نام LLaMA منتشر کرده است که نقش یک شرکت بسیار نوآور را تأیید می کند.

مارک زاکربرگ، مدیرعامل این شرکت در یک پست فیس بوک گفت: «امروز ما یک مدل زبان بزرگ هوش مصنوعی جدید به نام LLaMA را منتشر می کنیم که برای کمک به محققان در پیشبرد کارشان طراحی شده است.

چرا LLaMA

مدل‌های بزرگ زبان، دنیای فناوری را در طوفان فرو برده‌اند. آنها ابزارهای هوش مصنوعی مانند GPT چت و سایر مدل های مکالمه با این حال، استفاده از این ابزارها با ریسک قابل توجه، ادعاهای قابل قبول اما نادرست، تولید محتوای سمی و تقلید سوگیری ریشه در داده های آموزشی هوش مصنوعی همراه است.

برای کمک به محققان در حل این مشکلات، در روز جمعه، 25 فوریه، متا انتشار را اعلام کرد یک مدل زبان بزرگ جدید به نام LLaMA (Large Language Model هوش مصنوعی متا) .

LLaMA چیست؟

LLaMA یک نیست chatbot، اما یک ابزار جستجو است که به گفته Meta ai، مشکلات مربوط به مدل های زبان را حل می کند AI. متا در وبلاگ خود گفت: "مدل های کوچکتر و عملکرد بهتر مانند LLaMA به دیگران در جامعه تحقیقاتی که به مقادیر زیادی زیرساخت دسترسی ندارند اجازه می دهد تا این مدل ها را مطالعه کنند و دسترسی به این حوزه مهم و به سرعت در حال تحول را دموکراتیزه کنند." رسمی .

LLaMA مجموعه ای از مدل های زبان است که از پارامترهای 7B تا 65B متغیر است. این شرکت گفت که مدل‌های خود را با تریلیون‌ها توکن آموزش می‌دهد و می‌گوید که می‌تواند مدل‌های پیشرفته را با استفاده از مجموعه داده‌های عمومی آموزش دهد و به مجموعه داده‌های اختصاصی و غیرقابل دسترسی متکی نیست.

LLaMA متفاوت است

به گفته متا، آموزش مدل مانند LLaMA به قدرت محاسباتی بسیار کمی برای آزمایش، اعتبارسنجی و کشف موارد استفاده جدید نیاز دارد. مدل‌های زبان پایه بر روی بلوک‌های بزرگی از داده‌های بدون برچسب آموزش می‌بینند که آنها را برای سفارشی‌سازی کارهای مختلف ایده‌آل می‌کند.

متا در مقاله تحقیقاتی خود اشاره کرد که LLaMA-13B در اکثر معیارها از GPT-3 (175B) OpenAI بهتر عمل کرد و LLaMA-65B با مدل های برتر قابل رقابت است. Chinchilla70B توسط DeepMind e PalM-540B از Google.

LLaMA در حال حاضر در هیچ یک از محصولات Meta ai استفاده نمی شود، با این حال، این شرکت برنامه هایی برای در دسترس قرار دادن آن در اختیار محققان دارد. این شرکت قبلا LLM OPT-175B خود را راه اندازی کرده بود، اما LLaMA پیشرفته ترین سیستم آن است.

این شرکت آن را تحت یک مجوز غیرتجاری متمرکز بر موارد استفاده تحقیقاتی در دسترس قرار می دهد. در اختیار محققان دانشگاهی قرار خواهد گرفت. وابستگان به دولت، جامعه مدنی و سازمان های دانشگاهی؛ و آزمایشگاه های تحقیقات صنعتی در سراسر جهان.

Ercole Palmeri