مقالات

مایکروسافت از یک مدل هوش مصنوعی رونمایی کرد که محتوای تصویر را تشخیص می‌دهد و مشکلات بصری را برطرف می‌کند

مدل جدید AI Kosmos-1 یک Multimodal است Large Language Model (MLLM)، قادر است نه تنها به نشانه های زبانی، بلکه به نشانه های بصری پاسخ دهد و بنابراین به جلسات پرسش و پاسخ بهتر پاسخ می دهد.

هوش مصنوعی چندوجهی (MLLM) می‌تواند کلید توسعه هوش عمومی مصنوعی باشد، فناوری که در آینده می‌تواند جایگزین انسان در هر کار یا کار فکری شود.

Kosmos-1 چیست

Kosmos-1 یک مدل چندوجهی است که توسط محققان مایکروسافت توسعه یافته است. دوشنبه گذشته به عنوان مدلی با قابلیت زیر رونمایی شد:

  • محتوای تصاویر را بخوانید،
  • حل پازل های بصری،
  • تشخیص متن در تصاویر،
  • در تست های هوش بصری امتیاز خوبی کسب کنید
  • دستورالعمل های داده شده به زبان طبیعی را درک کنید.

توسعههوش مصنوعی چندوجهی به عنوان یک گام مهم در جهت ایجاد یک هوش عمومی مصنوعی (AGI) که قادر به انجام وظایف عمومی در سطح انسانی است، دیده می شود.

زبان تمام چیزی نیست که شما نیاز دارید: همسو کردن ادراک با مدل های زبان

محققان در مقاله آکادمیک خود می نویسند: "به عنوان بخشی اساسی از هوش، ادراک چندوجهی برای دستیابی به هوش عمومی مصنوعی از نظر کسب دانش و جاسازی در دنیای واقعی یک ضرورت است." زبان تمام چیزی نیست که شما نیاز دارید: همسو کردن ادراک با مدل زبان.

مدل Kosmos-1 می تواند تصاویر را تجزیه و تحلیل کند و به سؤالات مربوط به آنها پاسخ دهد، متن را از یک تصویر بخواند، برای عکس ها شرح بنویسد و بین 22 تا 26 درصد در آزمون هوش بصری، مانند نمونه های تصویری در Kosmos-1، امتیاز کسب کند. مطالعه.

خبرنامه نوآوری
مهم ترین اخبار نوآوری را از دست ندهید. برای دریافت آنها از طریق ایمیل ثبت نام کنید.

AGI برای OpenAI

OpenAI، شریک تجاری کلیدی مایکروسافت در هوش مصنوعی، AGI را به عنوان تمرکز اصلی خود قرار داده است. به نظر می رسد Kosmos-1 یک ابتکار انحصاری مایکروسافت بدون کمک OpenAI باشد.

BlogInnovazione.it

خبرنامه نوآوری
مهم ترین اخبار نوآوری را از دست ندهید. برای دریافت آنها از طریق ایمیل ثبت نام کنید.

مقالات اخیر

ناشران و OpenAI توافق نامه هایی را برای تنظیم جریان اطلاعات پردازش شده توسط هوش مصنوعی امضا می کنند.

دوشنبه گذشته، فایننشال تایمز از قراردادی با OpenAI خبر داد. FT مجوز روزنامه نگاری در سطح جهانی خود را صادر می کند…

آوریل 30 2024

پرداخت های آنلاین: در اینجا نحوه پرداخت خدمات جریانی شما را برای همیشه توضیح می دهد

میلیون‌ها نفر برای خدمات استریم پرداخت می‌کنند و هزینه اشتراک ماهانه می‌پردازند. این عقیده رایج است که شما…

آوریل 29 2024

Veeam دارای جامع ترین پشتیبانی از باج افزار، از محافظت تا پاسخ و بازیابی است

Coveware توسط Veeam به ارائه خدمات پاسخگویی به حوادث اخاذی سایبری ادامه خواهد داد. Coveware قابلیت‌های پزشکی قانونی و اصلاحی را ارائه می‌دهد…

آوریل 23 2024

انقلاب سبز و دیجیتال: چگونه تعمیر و نگهداری پیش‌بینی‌کننده صنعت نفت و گاز را متحول می‌کند

تعمیر و نگهداری پیش بینی شده با رویکردی نوآورانه و پیشگیرانه برای مدیریت کارخانه، بخش نفت و گاز را متحول می کند.…

آوریل 22 2024

نوآوری را به زبان خود بخوانید

خبرنامه نوآوری
مهم ترین اخبار نوآوری را از دست ندهید. برای دریافت آنها از طریق ایمیل ثبت نام کنید.

ما را دنبال کنید