Articoli

Microsoft ha presentato un modello di intelligenza artificiale che riconosce il contenuto delle immagini e risolve i problemi visivi

Il nuovo modello di AI Kosmos-1 è un Multimodal Large Language Model (MLLM), in grado di rispondere non solo a segnali linguistici, ma anche a segnali visivi, e quindi di rispondere meglio a sessioni di domanda e risposta.

L’intelligenza artificiale multimodale (MLLM) potrebbe essere la chiave per lo sviluppo dell’intelligenza artificiale generale, una tecnologia che in futuro potrebbe sostituire gli esseri umani in qualsiasi compito o lavoro intellettuale.

Cos’è Kosmos-1

Kosmos-1 è un modello multimodale sviluppato dai ricercatori Microsoft. Lunedi scorso, è stato presentato, come un modello in grado di:

  • leggere il contenuto delle immagini,
  • risolvere enigmi visivi,
  • riconoscere il testo nelle immagini,
  • ottenere buoni punteggi nei test del QI visivo
  • comprendere le istruzioni fornite in linguaggio naturale.

Lo sviluppo dell’Intelligenza Artificiale multimodale è visto come un passo cruciale verso la creazione di un’intelligenza generale artificiale (AGI) in grado di svolgere compiti generali a livello umano.

Language Is Not All You Need: Aligning Perception with Language Models

“Essendo una parte fondamentale dell’intelligenza, la percezione multimodale è una necessità per raggiungere l’intelligenza generale artificiale, in termini di acquisizione di conoscenza e radicamento nel mondo reale”, scrivono i ricercatori nel loro documento accademico, Language Is Not All You Need: Aligning Perception with Language Model.

Articoli correlati

Il modello Kosmos-1 può analizzare le immagini e rispondere a domande su di esse, leggere il testo da un’immagine, scrivere didascalie per le immagini e ottenere un punteggio compreso tra il 22 e il 26 percento in un test del QI visivo, come dimostrato negli esempi visivi nello studio Kosmos-1.

Newsletter sull’Innovazione
Non perderti le notizie più importanti sull'Innovazione. Iscriviti per riceverle via e-mail.

AGI per OpenAI

OpenAI, partner aziendale chiave di Microsoft nel campo dell’intelligenza artificiale, ha fissato l’AGI come obiettivo principale. Kosmos-1 sembra essere un’iniziativa esclusiva di Microsoft, senza l’assistenza di OpenAI.

BlogInnovazione.it

Newsletter sull’Innovazione
Non perderti le notizie più importanti sull'Innovazione. Iscriviti per riceverle via e-mail.

Articoli recenti

Amazon lancia nuovi corsi di formazione gratuiti sull’intelligenza artificiale generativa

L'iniziativa "AI Ready" di Amazon, offre lezioni online per sviluppatori e altri professionisti tecnici, nonché per studenti delle scuole superiori…

29 Novembre 2023

Cos’è l’intelligenza artificiale generativa: come funziona, vantaggi e pericoli

L’intelligenza artificiale generativa è l’argomento di discussione tecnologico più caldo del 2023. Cos’è l’intelligenza artificiale generativa, come funziona e di…

28 Novembre 2023

Rainbow, la soluzione di telefonia e collaborazione basata su cloud di Alcatel-Lucent Enterprise, ottiene la prestigiosa certificazione CSPN da ANSSI

Alcatel-Lucent Enterprise è orgogliosa di annunciare che la sua piattaforma di collaborazione, Rainbow™ by Alcatel-Lucent Enterprise ha ottenuto la Certificazione…

28 Novembre 2023

BYD arriva a quota 6 milioni di veicoli a nuova energia prodotti

BYD ha centrato un risultato storico: sei milioni di veicoli a nuova energia usciti dalla catena di montaggio dello stabilimento…

28 Novembre 2023

Veracode rivoluziona la sicurezza cloud-native con un duo dinamico: DAST Essentials e Veracode GitHub App

Il leader della sicurezza nell'ambito dei software intelligenti presenta una difesa unificata contro le minacce dalla programmazione al cloud in…

28 Novembre 2023

Il software di finanza autonoma di HighRadius riceve il sesto brevetto IA per la funzionalità di acquisizione di dati da documenti

HighRadius ha creato oltre 25 brevetti registrati e in corso di registrazione; quello più recente è stato concesso per modelli…

28 Novembre 2023

Reply si aggiudica due AWS Partner Awards 2023: System Integrator Partner of the Year EMEA e Energy and Utilities Partner of the Year Global

Reply è stata premiata come System Integration Partner of the Year EMEA e Industry Partner of the Year Energy and…

28 Novembre 2023

Dialogare con Luigi Einaudi oggi è possibile, grazie all’intelligenza artificiale

Fondazione Einaudi, Fondazione Compagnia di San Paolo e Reply insieme per rendere l’eredità culturale di Luigi Einaudi accessibile a tutti.…

28 Novembre 2023

bp sceglie AssetWise Lifecycle Information Management e AssetWise Reliability come standard per la gestione delle informazioni e l’integrità degli asset

Per un approccio a livello aziendale alla gestione delle informazioni sugli asset in parallelo con la gestione dell'integrità strutturale e…

27 Novembre 2023

Innovazioni basate sull’intelligenza artificiale all’#RSNA23 che consentono agli operatori sanitari di concentrarsi sulla cura dei pazienti

Le nuove innovazioni aiutano gli ospedali e i sistemi sanitari a fornire costantemente ai pazienti cure accessibili e di alta…

26 Novembre 2023