用品

微軟推出了一種識別圖像內容並修復視覺問題的人工智能模型

AI Kosmos-1 的新型號是多式聯運 Large Language Model (MLLM),不僅能夠響應語言提示,還能響應視覺提示,因此能夠更好地響應問答環節。

多模式人工智能 (MLLM) 可能是通用人工智能發展的關鍵,這種技術在未來可以在任何智力任務或工作中取代人類。

什麼是 Kosmos-1

Kosmos-1 是微軟研究人員開發的多模態模型。 上週一,它作為一款能夠:

  • 閱讀圖像的內容,
  • 解決視覺難題,
  • 識別圖像中的文字,
  • 在視覺智商測試中取得好成績
  • 理解以自然語言給出的指令。

的發展人工智能 多模式被視為創建能夠執行一般人類任務的通用人工智能 (AGI) 的關鍵一步。

語言不是你所需要的全部:將感知與語言模型相結合

研究人員在他們的學術論文中寫道:“作為智能的基本組成部分,多模態感知是實現人工智能的必要條件,就知識獲取和現實世界嵌入而言,” 語言不是你所需要的全部:將感知與語言模型相結合.

Kosmos-1 模型可以分析圖像並回答有關它們的問題,從圖像中讀取文本,為圖像編寫標題,並在視覺智商測試中得分在 22% 到 26% 之間,如 Kosmos-1 中的視覺示例所示學習。

創新通訊
不要錯過有關創新的最重要新聞。 註冊以通過電子郵件接收它們。

OpenAI 通用人工智能

微軟在人工智能領域的主要業務合作夥伴 OpenAI 已將 AGI 作為其主要關注點。 Kosmos-1 似乎是微軟的獨家倡議,沒有 OpenAI 的幫助。

BlogInnovazione.it

創新通訊
不要錯過有關創新的最重要新聞。 註冊以通過電子郵件接收它們。

最近的文章

英國反壟斷監管機構對 GenAI 向 BigTech 發出警報

英國 CMA 對大型科技公司在人工智慧市場的行為發出了警告。那裡…

18月2024

Casa Green:義大利永續未來的能源革命

歐盟為提高建築物能源效率而製定的「綠色案例」法令已結束立法程序…

18月2024

根據新的 Casaleggio Associati 報告,義大利電子商務成長了 27%

Casaleggio Associati 發布了義大利電子商務年度報告。題為「人工智慧商務:人工智慧電子商務的前沿」的報告...

17月2024

絕妙點子:Bandalux 推出 Airpure®,淨化空氣的窗簾

不斷技術創新以及對環境和人民福祉的承諾的結果。 Bandalux 推出 Airpure®,一款帳篷…

12月2024