Kecerdasan buatan multimodal (MLLM) bisa menjadi kunci pengembangan kecerdasan umum buatan, sebuah teknologi yang di masa depan dapat menggantikan manusia dalam tugas atau pekerjaan intelektual apa pun.
Kosmos-1 adalah model multimodal yang dikembangkan oleh peneliti Microsoft. Senin lalu, diluncurkan sebagai model yang mampu:
PerkembanganKecerdasan Buatan multimodal dipandang sebagai langkah penting untuk menciptakan kecerdasan umum buatan (AGI) yang mampu melakukan tugas tingkat manusia secara umum.
“Menjadi bagian mendasar dari kecerdasan, persepsi multimodal adalah kebutuhan untuk mencapai kecerdasan umum buatan, dalam hal perolehan pengetahuan dan penanaman dunia nyata,” tulis para peneliti dalam makalah akademis mereka, Bahasa Bukan Semua yang Anda Butuhkan: Menyelaraskan Persepsi dengan Model Bahasa.
Model Kosmos-1 dapat menganalisis gambar dan menjawab pertanyaan tentangnya, membaca teks dari gambar, menulis keterangan untuk gambar, dan skor antara 22 dan 26 persen pada tes IQ visual, seperti yang ditunjukkan dalam contoh visual di Kosmos-1 belajar.
OpenAI, mitra bisnis utama Microsoft dalam kecerdasan buatan, telah menetapkan AGI sebagai fokus utamanya. Kosmos-1 tampaknya merupakan inisiatif eksklusif Microsoft, tanpa bantuan OpenAI.
BlogInnovazione.it
Operasi oftalmoplasti menggunakan penampil komersial Apple Vision Pro dilakukan di Poliklinik Catania…
Mengembangkan keterampilan motorik halus melalui mewarnai mempersiapkan anak untuk keterampilan yang lebih kompleks seperti menulis. Mewarnai…
Sektor angkatan laut adalah kekuatan ekonomi global sejati, yang telah menuju pasar 150 miliar...
Senin lalu, Financial Times mengumumkan kesepakatan dengan OpenAI. FT melisensikan jurnalisme kelas dunianya…