マルチモーダル人工知能 (MLLM) は、汎用人工知能 (AI) の開発の鍵となる可能性があります。この技術は、将来、知的作業や作業において人間に取って代わる可能性があります。
Kosmos-1 は、Microsoft の研究者によって開発されたマルチモーダル モデルです。 先週の月曜日に、次のことができるモデルとして発表されました。
の開発人工知能 マルチモーダルは、一般的な人間レベルのタスクを実行できる汎用人工知能 (AGI) を作成するための重要なステップと見なされています。
「知能の基本的な部分であるマルチモーダルな知覚は、知識の獲得と現実世界への埋め込みという点で、汎用人工知能を達成するために必要です」と研究者は学術論文に書いています。 必要なのは言語だけではない: 認識を言語モデルに合わせる.
Kosmos-1 モデルは、画像を分析してそれらに関する質問に答え、画像からテキストを読み取り、画像のキャプションを書き、Kosmos-22 の視覚的な例で示されているように、視覚的 IQ テストで 26 ~ 1% のスコアを獲得できます。勉強。
Microsoft の人工知能における主要なビジネス パートナーである OpenAI は、AGI を主要な焦点として設定しています。 Kosmos-1 は、OpenAI の支援を受けていない Microsoft の独占的なイニシアチブのようです。
BlogInnovazione.it
先週の月曜日、フィナンシャル・タイムズ紙はOpenAIとの契約を発表した。 FT は世界クラスのジャーナリズムにライセンスを供与しています…
何百万人もの人々がストリーミング サービスに月額料金を払っています。あなたは…というのが一般的な意見です。