บทความ

Microsoft เปิดตัวโมเดล AI ที่จดจำเนื้อหารูปภาพและแก้ไขปัญหาด้านภาพ

AI Kosmos-1 รุ่นใหม่เป็นแบบมัลติโมดัล Large Language Model (MLLM) สามารถตอบสนองได้ไม่เพียงแต่ต่อสัญญาณทางภาษาเท่านั้น แต่ยังรวมถึงสัญญาณภาพด้วย ดังนั้นจึงตอบสนองต่อช่วงคำถามและคำตอบได้ดีขึ้น

ปัญญาประดิษฐ์หลายรูปแบบ (MLLM) อาจเป็นกุญแจสำคัญในการพัฒนาปัญญาประดิษฐ์ทั่วไป ซึ่งเป็นเทคโนโลยีที่สามารถแทนที่มนุษย์ในอนาคตในงานทางปัญญาหรืองานใดๆ ก็ได้

Kosmos-1 คืออะไร

Kosmos-1 เป็นโมเดลหลายรูปแบบที่พัฒนาโดยนักวิจัยของ Microsoft เมื่อวันจันทร์ที่ผ่านมา ได้มีการเปิดตัวโมเดลที่สามารถ:

  • อ่านเนื้อหาของภาพ
  • ไขปริศนาภาพ
  • จดจำข้อความในรูปภาพ
  • ทำคะแนนได้ดีในการทดสอบ IQ การมองเห็น
  • เข้าใจคำแนะนำที่ให้ไว้ในภาษาธรรมชาติ

การพัฒนาของปัญญาประดิษฐ์ หลายรูปแบบถูกมองว่าเป็นขั้นตอนสำคัญต่อการสร้างปัญญาประดิษฐ์ทั่วไป (AGI) ที่สามารถปฏิบัติงานทั่วไปในระดับมนุษย์ได้

ภาษาไม่ใช่ทั้งหมดที่คุณต้องการ: การจัดแนวการรับรู้ด้วยโมเดลภาษา

“ในฐานะที่เป็นส่วนพื้นฐานของความฉลาด การรับรู้หลายรูปแบบเป็นสิ่งจำเป็นในการบรรลุปัญญาประดิษฐ์ทั่วไป ในแง่ของการได้มาซึ่งความรู้และการฝังตัวในโลกแห่งความเป็นจริง” นักวิจัยเขียนในเอกสารวิชาการของพวกเขา ภาษาไม่ใช่ทั้งหมดที่คุณต้องการ: การจัดแนวการรับรู้ด้วยรูปแบบภาษา.

แบบจำลอง Kosmos-1 สามารถวิเคราะห์ภาพและตอบคำถามเกี่ยวกับภาพ อ่านข้อความจากภาพ เขียนคำบรรยายสำหรับภาพ และทำคะแนนระหว่าง 22 ถึง 26 เปอร์เซ็นต์ในการทดสอบ IQ ภาพ เช่นที่แสดงในตัวอย่างภาพใน Kosmos-1 ศึกษา.

จดหมายข่าวนวัตกรรม
อย่าพลาดข่าวสารที่สำคัญที่สุดเกี่ยวกับนวัตกรรม ลงทะเบียนเพื่อรับพวกเขาทางอีเมล

AGI สำหรับ OpenAI

OpenAI ซึ่งเป็นพันธมิตรทางธุรกิจที่สำคัญของ Microsoft ในด้านปัญญาประดิษฐ์ ได้กำหนดให้ AGI เป็นเป้าหมายหลัก Kosmos-1 ดูเหมือนจะเป็นความคิดริเริ่มพิเศษของ Microsoft โดยไม่ได้รับความช่วยเหลือจาก OpenAI

BlogInnovazione.it

จดหมายข่าวนวัตกรรม
อย่าพลาดข่าวสารที่สำคัญที่สุดเกี่ยวกับนวัตกรรม ลงทะเบียนเพื่อรับพวกเขาทางอีเมล

บทความล่าสุด

อนาคตอยู่ที่นี่: อุตสาหกรรมการขนส่งกำลังปฏิวัติเศรษฐกิจโลกอย่างไร

ภาคกองทัพเรือเป็นมหาอำนาจทางเศรษฐกิจระดับโลกอย่างแท้จริง ซึ่งได้มุ่งหน้าสู่ตลาดมูลค่า 150 พันล้าน...

1 2024 พ.ค.

ผู้จัดพิมพ์และ OpenAI ลงนามข้อตกลงเพื่อควบคุมการไหลของข้อมูลที่ประมวลผลโดยปัญญาประดิษฐ์

เมื่อวันจันทร์ที่แล้ว Financial Times ได้ประกาศข้อตกลงกับ OpenAI FT อนุญาติให้ทำข่าวระดับโลก...

30 2024 เมษายน

การชำระเงินออนไลน์: นี่คือวิธีที่บริการสตรีมมิ่งทำให้คุณชำระเงินตลอดไป

ผู้คนนับล้านชำระค่าบริการสตรีมมิ่ง โดยจ่ายค่าธรรมเนียมการสมัครสมาชิกรายเดือน เป็นความเห็นทั่วไปที่คุณ...

29 2024 เมษายน

Veeam มีการสนับสนุนแรนซัมแวร์ที่ครอบคลุมที่สุด ตั้งแต่การป้องกันไปจนถึงการตอบสนองและการกู้คืน

Coveware by Veeam จะยังคงให้บริการตอบสนองต่อเหตุการณ์การขู่กรรโชกทางไซเบอร์ต่อไป Coveware จะนำเสนอความสามารถในการนิติเวชและการแก้ไข...

23 2024 เมษายน

อ่านนวัตกรรมในภาษาของคุณ

จดหมายข่าวนวัตกรรม
อย่าพลาดข่าวสารที่สำคัญที่สุดเกี่ยวกับนวัตกรรม ลงทะเบียนเพื่อรับพวกเขาทางอีเมล

ติดตามเรา