Articoli

Microsoft ha presentato un modello di intelligenza artificiale che riconosce il contenuto delle immagini e risolve i problemi visivi

Il nuovo modello di AI Kosmos-1 è un Multimodal Large Language Model (MLLM), in grado di rispondere non solo a segnali linguistici, ma anche a segnali visivi, e quindi di rispondere meglio a sessioni di domanda e risposta.

L’intelligenza artificiale multimodale (MLLM) potrebbe essere la chiave per lo sviluppo dell’intelligenza artificiale generale, una tecnologia che in futuro potrebbe sostituire gli esseri umani in qualsiasi compito o lavoro intellettuale.

Cos’è Kosmos-1

Kosmos-1 è un modello multimodale sviluppato dai ricercatori Microsoft. Lunedi scorso, è stato presentato, come un modello in grado di:

  • leggere il contenuto delle immagini,
  • risolvere enigmi visivi,
  • riconoscere il testo nelle immagini,
  • ottenere buoni punteggi nei test del QI visivo
  • comprendere le istruzioni fornite in linguaggio naturale.

Lo sviluppo dell’Intelligenza Artificiale multimodale è visto come un passo cruciale verso la creazione di un’intelligenza generale artificiale (AGI) in grado di svolgere compiti generali a livello umano.

Language Is Not All You Need: Aligning Perception with Language Models

“Essendo una parte fondamentale dell’intelligenza, la percezione multimodale è una necessità per raggiungere l’intelligenza generale artificiale, in termini di acquisizione di conoscenza e radicamento nel mondo reale”, scrivono i ricercatori nel loro documento accademico, Language Is Not All You Need: Aligning Perception with Language Model.

Il modello Kosmos-1 può analizzare le immagini e rispondere a domande su di esse, leggere il testo da un’immagine, scrivere didascalie per le immagini e ottenere un punteggio compreso tra il 22 e il 26 percento in un test del QI visivo, come dimostrato negli esempi visivi nello studio Kosmos-1.

Newsletter sull’Innovazione
Non perderti le notizie più importanti sull'Innovazione. Iscriviti per riceverle via e-mail.

AGI per OpenAI

OpenAI, partner aziendale chiave di Microsoft nel campo dell’intelligenza artificiale, ha fissato l’AGI come obiettivo principale. Kosmos-1 sembra essere un’iniziativa esclusiva di Microsoft, senza l’assistenza di OpenAI.

BlogInnovazione.it

Newsletter sull’Innovazione
Non perderti le notizie più importanti sull'Innovazione. Iscriviti per riceverle via e-mail.

Articoli recenti

Come usare le visualizzazioni e il layout in PowerPoint

Microsoft PowerPoint fornisce diversi tipi di strumenti per rendere le presentazioni fruibili, interattive e adatte a diversi scopi. Gli strumenti…

20 Maggio 2024

Apprendimento automatico: confronto tra Random Forest e albero decisionale

Nel mondo del machine learning, sia gli algoritmi random forest che decision tree svolgono un ruolo fondamentale nella categorizzazione e…

17 Maggio 2024

Come migliorare le presentazioni Power Point, consigli utili

Esistono molti suggerimenti e trucchi per fare ottime presentazioni. L'obiettivo di queste regola è di migliorare l'efficacia, la scorrevolezza di…

16 Maggio 2024

È ancora la velocità la leva nello sviluppo dei prodotti, secondo il report di Protolabs

Pubblicato il rapporto "Protolabs Product Development Outlook". Esamina le modalità in cui oggi vengono portati i nuovi prodotti sul mercato.…

16 Maggio 2024

I quattro pilastri della Sostenibilità

Il termine sostenibilità è oramai molto usato per indicare programmi, iniziative e azioni finalizzate alla preservazione di una particolare risorsa.…

15 Maggio 2024

Come consolidare i dati in Excel

Una qualsiasi operazione aziendale produce moltissimi dati, anche in forme diverse. Inserire manualmente questi dati da un foglio Excel a…

14 Maggio 2024

Analisi trimestrale Cisco Talos: mail aziendali nel mirino dei criminali Manifatturiero, Istruzione e Sanità i settori più colpiti

La compromissione delle mail aziendali sono aumentate nei primi tre mesi del 2024 più del doppio rispetto all’ultimo trimestre del…

14 Maggio 2024

Principio di segregazione dell’interfaccia (ISP), quarto principio S.O.L.I.D.

Il principio di segregazione dell'interfaccia è uno dei cinque principi SOLID della progettazione orientata agli oggetti. Una classe dovrebbe avere…

14 Maggio 2024

Leggi Innovazione nella tua Lingua

Newsletter sull’Innovazione
Non perderti le notizie più importanti sull'Innovazione. Iscriviti per riceverle via e-mail.

Seguici