مقالات

متا مدل LLaMA را راه‌اندازی می‌کند، ابزار جستجوی قدرتمندتری نسبت به GPT-3 OpenAI

متا اخیراً یک سازنده زبان هوش مصنوعی جدید به نام LLaMA منتشر کرده است که نقش یک شرکت بسیار نوآور را تأیید می کند.

مارک زاکربرگ، مدیرعامل این شرکت در یک پست فیس بوک گفت: «امروز ما یک مدل زبان بزرگ هوش مصنوعی جدید به نام LLaMA را منتشر می کنیم که برای کمک به محققان در پیشبرد کارشان طراحی شده است.

چرا LLaMA

مدل‌های بزرگ زبان، دنیای فناوری را در طوفان فرو برده‌اند. آنها ابزارهای هوش مصنوعی مانند GPT چت و سایر مدل های مکالمه با این حال، استفاده از این ابزارها با ریسک قابل توجه، ادعاهای قابل قبول اما نادرست، تولید محتوای سمی و تقلید سوگیری ریشه در داده های آموزشی هوش مصنوعی همراه است. 

برای کمک به محققان در حل این مشکلات، در روز جمعه، 25 فوریه، متا  انتشار را اعلام کرد یک مدل زبان بزرگ جدید به نام LLaMA (Large Language Model هوش مصنوعی متا) . 

LLaMA چیست؟

LLaMA یک نیست chatbot، اما یک ابزار جستجو است که به گفته Meta ai، مشکلات مربوط به مدل های زبان را حل می کند AI. متا در وبلاگ خود گفت: "مدل های کوچکتر و عملکرد بهتر مانند LLaMA به دیگران در جامعه تحقیقاتی که به مقادیر زیادی زیرساخت دسترسی ندارند اجازه می دهد تا این مدل ها را مطالعه کنند و دسترسی به این حوزه مهم و به سرعت در حال تحول را دموکراتیزه کنند." رسمی .

LLaMA مجموعه ای از مدل های زبان است که از پارامترهای 7B تا 65B متغیر است. این شرکت گفت که مدل‌های خود را با تریلیون‌ها توکن آموزش می‌دهد و می‌گوید که می‌تواند مدل‌های پیشرفته را با استفاده از مجموعه داده‌های عمومی آموزش دهد و به مجموعه داده‌های اختصاصی و غیرقابل دسترسی متکی نیست.

LLaMA متفاوت است

به گفته متا، آموزش مدل مانند LLaMA به قدرت محاسباتی بسیار کمی برای آزمایش، اعتبارسنجی و کشف موارد استفاده جدید نیاز دارد. مدل‌های زبان پایه بر روی بلوک‌های بزرگی از داده‌های بدون برچسب آموزش می‌بینند که آنها را برای سفارشی‌سازی کارهای مختلف ایده‌آل می‌کند. 

خبرنامه نوآوری
مهم ترین اخبار نوآوری را از دست ندهید. برای دریافت آنها از طریق ایمیل ثبت نام کنید.

متا در مقاله تحقیقاتی خود اشاره کرد که LLaMA-13B در اکثر معیارها از GPT-3 (175B) OpenAI بهتر عمل کرد و LLaMA-65B با مدل های برتر قابل رقابت است. Chinchilla70B توسط DeepMindPalM-540B از Google

LLaMA در حال حاضر در هیچ یک از محصولات Meta ai استفاده نمی شود، با این حال، این شرکت برنامه هایی برای در دسترس قرار دادن آن در اختیار محققان دارد. این شرکت قبلا LLM OPT-175B خود را راه اندازی کرده بود، اما LLaMA پیشرفته ترین سیستم آن است. 

این شرکت آن را تحت یک مجوز غیرتجاری متمرکز بر موارد استفاده تحقیقاتی در دسترس قرار می دهد. در اختیار محققان دانشگاهی قرار خواهد گرفت. وابستگان به دولت، جامعه مدنی و سازمان های دانشگاهی؛ و آزمایشگاه های تحقیقات صنعتی در سراسر جهان.

Ercole Palmeri

خبرنامه نوآوری
مهم ترین اخبار نوآوری را از دست ندهید. برای دریافت آنها از طریق ایمیل ثبت نام کنید.

مقالات اخیر

Smart Lock Market: گزارش تحقیقات بازار منتشر شد

اصطلاح بازار قفل هوشمند به صنعت و اکوسیستم پیرامون تولید، توزیع و استفاده…

مارس 27 2024

الگوهای طراحی چیست: چرا از آنها استفاده کنیم، طبقه بندی، جوانب مثبت و منفی

در مهندسی نرم افزار، الگوهای طراحی راه حل های بهینه برای مشکلاتی هستند که معمولا در طراحی نرم افزار رخ می دهند. من می گفتم…

مارس 26 2024

تکامل تکنولوژیکی علامت گذاری صنعتی

علامت گذاری صنعتی یک اصطلاح گسترده است که شامل چندین تکنیک است که برای ایجاد علائم دائمی روی سطح…

مارس 25 2024

نمونه هایی از ماکروهای Excel نوشته شده با VBA

نمونه های ساده ماکرو اکسل زیر با استفاده از زمان خواندن تخمینی VBA نوشته شده است: 3 دقیقه مثال…

مارس 25 2024

نوآوری را به زبان خود بخوانید

خبرنامه نوآوری
مهم ترین اخبار نوآوری را از دست ندهید. برای دریافت آنها از طریق ایمیل ثبت نام کنید.

ما را دنبال کنید