Članki

Microsoft je predstavil model AI, ki prepozna slikovno vsebino in odpravi vizualne težave

Novi model AI Kosmos-1 je multimodalen Large Language Model (MLLM), ki se lahko odzovejo ne le na jezikovne namige, ampak tudi na vizualne namige, in se zato bolje odzivajo na seje vprašanj in odgovorov.

Multimodalna umetna inteligenca (MLLM) bi lahko bila ključ do razvoja umetne splošne inteligence, tehnologije, ki bi lahko v prihodnosti nadomestila človeka pri kateri koli intelektualni nalogi ali delu.

Kaj je Kosmos-1

Kosmos-1 je multimodalni model, ki so ga razvili Microsoftovi raziskovalci. Prejšnji ponedeljek je bil predstavljen kot model, ki lahko:

  • preberite vsebino slik,
  • reševanje vizualnih ugank,
  • prepozna besedilo na slikah,
  • dosegli dobre rezultate na testih vizualnega IQ
  • razumeti navodila v naravnem jeziku.

RazvojUmetna inteligenca multimodalnost velja za ključni korak k ustvarjanju umetne splošne inteligence (AGI), ki je sposobna izvajati splošne naloge na ravni človeka.

Jezik ni vse, kar potrebujete: Usklajevanje zaznavanja z jezikovnimi modeli

"Ker je temeljni del inteligence, je multimodalno zaznavanje nujno za doseganje umetne splošne inteligence v smislu pridobivanja znanja in vgradnje v resnični svet," pišejo raziskovalci v svojem akademskem članku, Jezik ni vse, kar potrebujete: Usklajevanje zaznavanja z jezikovnim modelom.

Model Kosmos-1 lahko analizira slike in odgovarja na vprašanja o njih, bere besedilo s slike, piše napise za slike in doseže med 22 in 26 odstotki pri vizualnem IQ testu, kot je prikazano v vizualnih primerih v Kosmos-1 študija.

Glasilo o inovacijah
Ne zamudite najpomembnejših novic o inovacijah. Prijavite se, če jih želite prejemati po e-pošti.

AGI za OpenAI

OpenAI, Microsoftov ključni poslovni partner na področju umetne inteligence, je postavil AGI kot svoj glavni fokus. Zdi se, da je Kosmos-1 ekskluzivna pobuda Microsofta, brez pomoči OpenAI.

BlogInnovazione.it

Glasilo o inovacijah
Ne zamudite najpomembnejših novic o inovacijah. Prijavite se, če jih želite prejemati po e-pošti.

Nedavni članki

Založniki in OpenAI podpisujejo sporazume za urejanje pretoka informacij, ki jih obdeluje umetna inteligenca

Prejšnji ponedeljek je Financial Times objavil dogovor z OpenAI. FT licencira svoje vrhunsko novinarstvo ...

April 30 2024

Spletna plačila: Evo, kako vam storitve pretakanja omogočajo večno plačevanje

Milijoni ljudi plačujejo storitve pretakanja in plačujejo mesečne naročnine. Splošno mnenje je, da si…

April 29 2024

Veeam ponuja najobsežnejšo podporo za izsiljevalsko programsko opremo, od zaščite do odziva in obnovitve

Coveware by Veeam bo še naprej zagotavljal storitve odzivanja na incidente kibernetskega izsiljevanja. Coveware bo nudil forenziko in zmogljivosti sanacije ...

April 23 2024

Zelena in digitalna revolucija: kako predvideno vzdrževanje preoblikuje naftno in plinsko industrijo

Prediktivno vzdrževanje revolucionira sektor nafte in plina z inovativnim in proaktivnim pristopom k upravljanju obratov.…

April 22 2024