多模式人工智能 (MLLM) 可能是通用人工智能发展的关键,这种技术在未来可以在任何智力任务或工作中取代人类。
Kosmos-1 是微软研究人员开发的多模态模型。 上周一,它作为一款能够:
的发展人工智能 多模式被视为创建能够执行一般人类任务的通用人工智能 (AGI) 的关键一步。
研究人员在他们的学术论文中写道:“作为智能的基本组成部分,多模态感知是实现人工智能的必要条件,就知识获取和现实世界嵌入而言,” 语言不是你所需要的全部:将感知与语言模型相结合.
Kosmos-1 模型可以分析图像并回答有关它们的问题,从图像中读取文本,为图像编写标题,并在视觉智商测试中得分在 22% 到 26% 之间,如 Kosmos-1 中的视觉示例所示学习。
微软在人工智能领域的主要业务合作伙伴 OpenAI 已将 AGI 作为其主要关注点。 Kosmos-1 似乎是微软的独家倡议,没有 OpenAI 的帮助。
BlogInnovazione.it