Microsoft ha presentato un modello di intelligenza artificiale che riconosce il contenuto delle immagini e risolve i problemi visivi

Il nuovo modello di AI Microsoft Kosmos-1 è un Multimodal Large Language Model (MLLM).
Kosmos-1 è in grado di rispondere non solo a segnali linguistici, ma anche a segnali visivi, e quindi di rispondere meglio a sessioni di domanda e risposta.
Estimated reading time: 2 minuti
Microsoft Kosmos-1 è un modello di Intelligenza Artificiale Multimodale, cioè una tecnologia che integra e interpreta contemporaneamente diversi tipi di dati. L’intelligenza artificiale multimodale (MLLM) potrebbe essere la chiave per lo sviluppo dell’intelligenza artificiale generale, una tecnologia che in futuro potrebbe sostituire gli esseri umani in qualsiasi compito o lavoro intellettuale.
Cos’è Kosmos-1
Microsoft Kosmos-1 è un modello multimodale sviluppato dai ricercatori Microsoft. Lunedi scorso, è stato presentato, come un modello in grado di:
- leggere il contenuto delle immagini,
- risolvere enigmi visivi,
- riconoscere il testo nelle immagini,
- ottenere buoni punteggi nei test del QI visivo
- comprendere le istruzioni fornite in linguaggio naturale.
Lo sviluppo dell’Intelligenza Artificiale multimodale è visto come un passo cruciale verso la creazione di un’intelligenza generale artificiale (AGI) in grado di svolgere compiti generali a livello umano.
Language Is Not All You Need: Aligning Perception with Language Models
“Essendo una parte fondamentale dell’intelligenza, la percezione multimodale è una necessità per raggiungere l’intelligenza generale artificiale, in termini di acquisizione di conoscenza e radicamento nel mondo reale”, scrivono i ricercatori nel loro documento accademico, Language Is Not All You Need: Aligning Perception with Language Model.
Il modello Kosmos-1 può analizzare le immagini e rispondere a domande su di esse, leggere il testo da un’immagine, scrivere didascalie per le immagini e ottenere un punteggio compreso tra il 22 e il 26 percento in un test del QI visivo, come dimostrato negli esempi visivi nello studio Kosmos-1.
AGI per OpenAI
OpenAI, partner aziendale chiave di Microsoft nel campo dell’intelligenza artificiale, ha fissato l’AGI come obiettivo principale. Microsoft Kosmos-1 sembra essere un’iniziativa esclusiva di Microsoft, senza l’assistenza di OpenAI.
BlogInnovazione.it