Članki

Microsoft je predstavil model AI, ki prepozna slikovno vsebino in odpravi vizualne težave

Novi model AI Kosmos-1 je multimodalen Large Language Model (MLLM), ki se lahko odzovejo ne le na jezikovne namige, ampak tudi na vizualne namige, in se zato bolje odzivajo na seje vprašanj in odgovorov.

Multimodalna umetna inteligenca (MLLM) bi lahko bila ključ do razvoja umetne splošne inteligence, tehnologije, ki bi lahko v prihodnosti nadomestila človeka pri kateri koli intelektualni nalogi ali delu.

Kaj je Kosmos-1

Kosmos-1 je multimodalni model, ki so ga razvili Microsoftovi raziskovalci. Prejšnji ponedeljek je bil predstavljen kot model, ki lahko:

  • preberite vsebino slik,
  • reševanje vizualnih ugank,
  • prepozna besedilo na slikah,
  • dosegli dobre rezultate na testih vizualnega IQ
  • razumeti navodila v naravnem jeziku.

RazvojUmetna inteligenca multimodalnost velja za ključni korak k ustvarjanju umetne splošne inteligence (AGI), ki je sposobna izvajati splošne naloge na ravni človeka.

Jezik ni vse, kar potrebujete: Usklajevanje zaznavanja z jezikovnimi modeli

"Ker je temeljni del inteligence, je multimodalno zaznavanje nujno za doseganje umetne splošne inteligence v smislu pridobivanja znanja in vgradnje v resnični svet," pišejo raziskovalci v svojem akademskem članku, Jezik ni vse, kar potrebujete: Usklajevanje zaznavanja z jezikovnim modelom.

Model Kosmos-1 lahko analizira slike in odgovarja na vprašanja o njih, bere besedilo s slike, piše napise za slike in doseže med 22 in 26 odstotki pri vizualnem IQ testu, kot je prikazano v vizualnih primerih v Kosmos-1 študija.

Glasilo o inovacijah
Ne zamudite najpomembnejših novic o inovacijah. Prijavite se, če jih želite prejemati po e-pošti.

AGI za OpenAI

OpenAI, Microsoftov ključni poslovni partner na področju umetne inteligence, je postavil AGI kot svoj glavni fokus. Zdi se, da je Kosmos-1 ekskluzivna pobuda Microsofta, brez pomoči OpenAI.

BlogInnovazione.it

Glasilo o inovacijah
Ne zamudite najpomembnejših novic o inovacijah. Prijavite se, če jih želite prejemati po e-pošti.

Nedavni članki

Britanski protimonopolni regulator sproži alarm BigTech zaradi GenAI

Britanski CMA je izdal opozorilo glede obnašanja Big Tech na trgu umetne inteligence. tam …

April 18 2024

Casa Green: energetska revolucija za trajnostno prihodnost v Italiji

Odlok "Case Green", ki ga je oblikovala Evropska unija za povečanje energetske učinkovitosti stavb, je zaključil svoj zakonodajni postopek z ...

April 18 2024

Po novem poročilu podjetja Casaleggio Associati e-trgovina v Italiji pri +27 %

Predstavljeno letno poročilo Casaleggio Associati o e-trgovini v Italiji. Poročilo z naslovom "AI-Commerce: the frontiers of E-Commerce with Artificial Intelligence"....

April 17 2024

Briljantna ideja: Bandalux predstavlja Airpure®, zaveso, ki čisti zrak

Rezultat stalnih tehnoloških inovacij in zavezanosti okolju in blaginji ljudi. Bandalux predstavlja Airpure®, šotor…

April 12 2024