Microsoft ha presentato un modello di intelligenza artificiale che riconosce il contenuto delle immagini e risolve i problemi visivi

Il nuovo modello di AI Kosmos-1 è un Multimodal Large Language Model (MLLM), in grado di rispondere non solo a segnali linguistici, ma anche a segnali visivi, e quindi di rispondere meglio a sessioni di domanda e risposta.
L’intelligenza artificiale multimodale (MLLM) potrebbe essere la chiave per lo sviluppo dell’intelligenza artificiale generale, una tecnologia che in futuro potrebbe sostituire gli esseri umani in qualsiasi compito o lavoro intellettuale.
Cos’è Kosmos-1
Kosmos-1 è un modello multimodale sviluppato dai ricercatori Microsoft. Lunedi scorso, è stato presentato, come un modello in grado di:
- leggere il contenuto delle immagini,
- risolvere enigmi visivi,
- riconoscere il testo nelle immagini,
- ottenere buoni punteggi nei test del QI visivo
- comprendere le istruzioni fornite in linguaggio naturale.
Lo sviluppo dell’Intelligenza Artificiale multimodale è visto come un passo cruciale verso la creazione di un’intelligenza generale artificiale (AGI) in grado di svolgere compiti generali a livello umano.
Language Is Not All You Need: Aligning Perception with Language Models
“Essendo una parte fondamentale dell’intelligenza, la percezione multimodale è una necessità per raggiungere l’intelligenza generale artificiale, in termini di acquisizione di conoscenza e radicamento nel mondo reale”, scrivono i ricercatori nel loro documento accademico, Language Is Not All You Need: Aligning Perception with Language Model.
Il modello Kosmos-1 può analizzare le immagini e rispondere a domande su di esse, leggere il testo da un’immagine, scrivere didascalie per le immagini e ottenere un punteggio compreso tra il 22 e il 26 percento in un test del QI visivo, come dimostrato negli esempi visivi nello studio Kosmos-1.
AGI per OpenAI
OpenAI, partner aziendale chiave di Microsoft nel campo dell’intelligenza artificiale, ha fissato l’AGI come obiettivo principale. Kosmos-1 sembra essere un’iniziativa esclusiva di Microsoft, senza l’assistenza di OpenAI.
BlogInnovazione.it
Newsletter sull’Innovazione
Puoi cancellarti in ogni momento. Leggi la nostra Privacy Policy.