Членове

Microsoft представи AI модел, който разпознава съдържанието на изображението и коригира визуални проблеми

Новият модел на AI Kosmos-1 е мултимодален Large Language Model (MLLM), способни да реагират не само на езикови знаци, но и на визуални знаци, и следователно да реагират по-добре на сесии с въпроси и отговори.

Мултимодалният изкуствен интелект (MLLM) може да бъде ключът към развитието на изкуствен общ интелект, технология, която в бъдеще може да замени хората във всяка интелектуална задача или работа.

Какво е Космос-1

Kosmos-1 е мултимодален модел, разработен от изследователи на Microsoft. Миналия понеделник той беше представен като модел, способен на:

  • прочетете съдържанието на изображенията,
  • решаване на визуални пъзели,
  • разпознават текст в изображения,
  • постигнете добри резултати на тестовете за визуално IQ
  • разбират инструкции, дадени на естествен език.

Развитието наИзкуствен интелект мултимодалният се разглежда като решаваща стъпка към създаването на изкуствен общ интелект (AGI), способен да изпълнява общи задачи на човешко ниво.

Езикът не е всичко, от което се нуждаете: Съгласуване на възприятието с езиковите модели

„Като основна част от интелигентността, мултимодалното възприятие е необходимост за постигане на изкуствен общ интелект по отношение на придобиване на знания и вграждане в реалния свят“, пишат изследователите в своята академична статия, Езикът не е всичко, от което се нуждаете: Съгласуване на възприятието с езиковия модел.

Моделът Kosmos-1 може да анализира изображения и да отговаря на въпроси за тях, да чете текст от изображение, да пише надписи за изображения и да получава между 22 и 26 процента на визуален IQ тест, както е демонстрирано във визуалните примери в Kosmos-1 проучване.

Иновационен бюлетин
Не пропускайте най-важните новини за иновациите. Регистрирайте се, за да ги получавате по имейл.

AGI за OpenAI

OpenAI, ключовият бизнес партньор на Microsoft в областта на изкуствения интелект, постави AGI като свой основен фокус. Kosmos-1 изглежда е изключителна инициатива на Microsoft, без помощта на OpenAI.

BlogInnovazione.it

Иновационен бюлетин
Не пропускайте най-важните новини за иновациите. Регистрирайте се, за да ги получавате по имейл.

Последни статии

Иновативна намеса в добавената реалност с Apple Viewer в поликлиниката в Катания

Операция по офталмопластика с помощта на търговския зрител Apple Vision Pro беше извършена в поликлиниката в Катания...

3 май 2024

Предимствата на страниците за оцветяване за деца - свят на магия за всички възрасти

Развитието на фини двигателни умения чрез оцветяване подготвя децата за по-сложни умения като писане. Оцветявам…

2 май 2024

Бъдещето е тук: Как корабната индустрия революционизира глобалната икономика

Военноморският сектор е истинска световна икономическа сила, която се е насочила към пазар от 150 милиарда...

1 май 2024

Издателите и OpenAI подписват споразумения за регулиране на потока от информация, обработвана от изкуствения интелект

Миналия понеделник Financial Times обяви сделка с OpenAI. FT лицензира своята журналистика от световна класа...

30 април 2024

Прочетете Иновация на вашия език

Иновационен бюлетин
Не пропускайте най-важните новини за иновациите. Регистрирайте се, за да ги получавате по имейл.

Следвайте ни