مقالات

متا مدل LLaMA را راه‌اندازی می‌کند، ابزار جستجوی قدرتمندتری نسبت به GPT-3 OpenAI

متا اخیراً یک سازنده زبان هوش مصنوعی جدید به نام LLaMA منتشر کرده است که نقش یک شرکت بسیار نوآور را تأیید می کند.

مارک زاکربرگ، مدیرعامل این شرکت در یک پست فیس بوک گفت: «امروز ما یک مدل زبان بزرگ هوش مصنوعی جدید به نام LLaMA را منتشر می کنیم که برای کمک به محققان در پیشبرد کارشان طراحی شده است.

چرا LLaMA

مدل‌های بزرگ زبان، دنیای فناوری را در طوفان فرو برده‌اند. آنها ابزارهای هوش مصنوعی مانند GPT چت و سایر مدل های مکالمه با این حال، استفاده از این ابزارها با ریسک قابل توجه، ادعاهای قابل قبول اما نادرست، تولید محتوای سمی و تقلید سوگیری ریشه در داده های آموزشی هوش مصنوعی همراه است. 

برای کمک به محققان در حل این مشکلات، در روز جمعه، 25 فوریه، متا  انتشار را اعلام کرد یک مدل زبان بزرگ جدید به نام LLaMA (Large Language Model هوش مصنوعی متا) . 

LLaMA چیست؟

LLaMA یک نیست chatbot، اما یک ابزار جستجو است که به گفته Meta ai، مشکلات مربوط به مدل های زبان را حل می کند AI. متا در وبلاگ خود گفت: "مدل های کوچکتر و عملکرد بهتر مانند LLaMA به دیگران در جامعه تحقیقاتی که به مقادیر زیادی زیرساخت دسترسی ندارند اجازه می دهد تا این مدل ها را مطالعه کنند و دسترسی به این حوزه مهم و به سرعت در حال تحول را دموکراتیزه کنند." رسمی .

LLaMA مجموعه ای از مدل های زبان است که از پارامترهای 7B تا 65B متغیر است. این شرکت گفت که مدل‌های خود را با تریلیون‌ها توکن آموزش می‌دهد و می‌گوید که می‌تواند مدل‌های پیشرفته را با استفاده از مجموعه داده‌های عمومی آموزش دهد و به مجموعه داده‌های اختصاصی و غیرقابل دسترسی متکی نیست.

LLaMA متفاوت است

به گفته متا، آموزش مدل مانند LLaMA به قدرت محاسباتی بسیار کمی برای آزمایش، اعتبارسنجی و کشف موارد استفاده جدید نیاز دارد. مدل‌های زبان پایه بر روی بلوک‌های بزرگی از داده‌های بدون برچسب آموزش می‌بینند که آنها را برای سفارشی‌سازی کارهای مختلف ایده‌آل می‌کند. 

خبرنامه نوآوری
مهم ترین اخبار نوآوری را از دست ندهید. برای دریافت آنها از طریق ایمیل ثبت نام کنید.

متا در مقاله تحقیقاتی خود اشاره کرد که LLaMA-13B در اکثر معیارها از GPT-3 (175B) OpenAI بهتر عمل کرد و LLaMA-65B با مدل های برتر قابل رقابت است. Chinchilla70B توسط DeepMindPalM-540B از Google

LLaMA در حال حاضر در هیچ یک از محصولات Meta ai استفاده نمی شود، با این حال، این شرکت برنامه هایی برای در دسترس قرار دادن آن در اختیار محققان دارد. این شرکت قبلا LLM OPT-175B خود را راه اندازی کرده بود، اما LLaMA پیشرفته ترین سیستم آن است. 

این شرکت آن را تحت یک مجوز غیرتجاری متمرکز بر موارد استفاده تحقیقاتی در دسترس قرار می دهد. در اختیار محققان دانشگاهی قرار خواهد گرفت. وابستگان به دولت، جامعه مدنی و سازمان های دانشگاهی؛ و آزمایشگاه های تحقیقات صنعتی در سراسر جهان.

Ercole Palmeri

خبرنامه نوآوری
مهم ترین اخبار نوآوری را از دست ندهید. برای دریافت آنها از طریق ایمیل ثبت نام کنید.

مقالات اخیر

آینده اینجاست: چگونه صنعت کشتیرانی اقتصاد جهانی را متحول می کند

بخش دریایی یک قدرت واقعی اقتصادی جهانی است که به سمت یک بازار 150 میلیاردی حرکت کرده است.

1 می 2024

ناشران و OpenAI توافق نامه هایی را برای تنظیم جریان اطلاعات پردازش شده توسط هوش مصنوعی امضا می کنند.

دوشنبه گذشته، فایننشال تایمز از قراردادی با OpenAI خبر داد. FT مجوز روزنامه نگاری در سطح جهانی خود را صادر می کند…

آوریل 30 2024

پرداخت های آنلاین: در اینجا نحوه پرداخت خدمات جریانی شما را برای همیشه توضیح می دهد

میلیون‌ها نفر برای خدمات استریم پرداخت می‌کنند و هزینه اشتراک ماهانه می‌پردازند. این عقیده رایج است که شما…

آوریل 29 2024

Veeam دارای جامع ترین پشتیبانی از باج افزار، از محافظت تا پاسخ و بازیابی است

Coveware توسط Veeam به ارائه خدمات پاسخگویی به حوادث اخاذی سایبری ادامه خواهد داد. Coveware قابلیت‌های پزشکی قانونی و اصلاحی را ارائه می‌دهد…

آوریل 23 2024

نوآوری را به زبان خود بخوانید

خبرنامه نوآوری
مهم ترین اخبار نوآوری را از دست ندهید. برای دریافت آنها از طریق ایمیل ثبت نام کنید.

ما را دنبال کنید