グッズ

Microsoftが画像コンテンツを認識して視覚的な問題を修正するAIモデルを発表

新型AI Kosmos-1はマルチモーダル Large Language Model (MLLM)、言語的な手がかりだけでなく視覚的な手がかりにも反応できるため、質疑応答のセッションによりよく反応します。

マルチモーダル人工知能 (MLLM) は、汎用人工知能 (AI) の開発の鍵となる可能性があります。この技術は、将来、知的作業や作業において人間に取って代わる可能性があります。

Kosmos-1とは

Kosmos-1 は、Microsoft の研究者によって開発されたマルチモーダル モデルです。 先週の月曜日に、次のことができるモデルとして発表されました。

  • 画像の内容を読んで、
  • ビジュアルパズルを解いて、
  • 画像内のテキストを認識し、
  • ビジュアルIQテストで高得点
  • 自然言語で与えられた指示を理解する。

の開発人工知能 マルチモーダルは、一般的な人間レベルのタスクを実行できる汎用人工知能 (AGI) を作成するための重要なステップと見なされています。

必要なのは言語だけではない: 認識を言語モデルに合わせる

「知能の基本的な部分であるマルチモーダルな知覚は、知識の獲得と現実世界への埋め込みという点で、汎用人工知能を達成するために必要です」と研究者は学術論文に書いています。 必要なのは言語だけではない: 認識を言語モデルに合わせる.

Kosmos-1 モデルは、画像を分析してそれらに関する質問に答え、画像からテキストを読み取り、画像のキャプションを書き、Kosmos-22 の視覚的な例で示されているように、視覚的 IQ テストで 26 ~ 1% のスコアを獲得できます。勉強。

イノベーションニュースレター
イノベーションに関する最も重要なニュースをお見逃しなく。 メールで受け取るにはサインアップしてください。

OpenAIのAGI

Microsoft の人工知能における主要なビジネス パートナーである OpenAI は、AGI を主要な焦点として設定しています。 Kosmos-1 は、OpenAI の支援を受けていない Microsoft の独占的なイニシアチブのようです。

BlogInnovazione.it

イノベーションニュースレター
イノベーションに関する最も重要なニュースをお見逃しなく。 メールで受け取るにはサインアップしてください。

最近の記事

子供のためのぬり絵の利点 - すべての年齢層のための魔法の世界

ぬり絵を通じて細かい運動能力を発達させることで、子供たちは書くなどのより複雑なスキルを習得できるようになります。色…

2月2024

未来はここにあります: 海運業界が世界経済をどのように変革しているか

海軍部門は真の世界経済大国であり、150 億市場に向けて舵を切り続けています...

1月2024

パブリッシャーと OpenAI が人工知能によって処理される情報の流れを規制する契約に署名

先週の月曜日、フィナンシャル・タイムズ紙はOpenAIとの契約を発表した。 FT は世界クラスのジャーナリズムにライセンスを供与しています…

4月30 2024

オンライン支払い: ストリーミング サービスで永久に支払いができる仕組みをご紹介します

何百万人もの人々がストリーミング サービスに月額料金を払っています。あなたは…というのが一般的な意見です。

4月29 2024

あなたの言語でイノベーションを読む

イノベーションニュースレター
イノベーションに関する最も重要なニュースをお見逃しなく。 メールで受け取るにはサインアップしてください。

Seguici