Artikel

Meta meluncurkan model LLaMA, alat pencarian yang lebih kuat daripada GPT-3 OpenAI

Meta baru-baru ini merilis generator bahasa AI baru yang disebut LLaMA, yang menegaskan peran perusahaan yang sangat inovatif.

"Hari ini kami merilis model bahasa besar AI mutakhir yang disebut LLaMA yang dirancang untuk membantu para peneliti memajukan pekerjaan mereka," kata CEO Mark Zuckerberg dalam sebuah posting Facebook.

Mengapa LLaMA

Model bahasa besar telah menggemparkan dunia teknologi. Mereka menggerakkan alat kecerdasan buatan, seperti ChatGPT dan model percakapan lainnya. Namun, menggunakan alat ini memiliki risiko yang signifikan, klaim yang masuk akal tetapi salah, menghasilkan konten beracun, dan meniru bias yang berakar pada data pelatihan AI. 

Untuk membantu peneliti memecahkan masalah tersebut, pada hari Jumat tanggal 25 Februari Meta  mengumumkan rilis dari model bahasa besar baru yang disebut LLaMA (Large Language Model Meta AI) . 

Apa itu LLaMA?

LLaMA bukan a ChatBot, tetapi itu adalah alat pencarian yang, menurut Meta ai, akan menyelesaikan masalah yang berkaitan dengan model bahasa AI. “Model yang lebih kecil dan berkinerja lebih baik seperti LLaMA memungkinkan orang lain dalam komunitas riset yang tidak memiliki akses ke infrastruktur dalam jumlah besar untuk mempelajari model ini, semakin mendemokratisasi akses di bidang yang penting dan berkembang pesat ini,” kata Meta di blognya. resmi .

LLaMA adalah kumpulan model bahasa mulai dari parameter 7B hingga 65B. Perusahaan tersebut mengatakan bahwa mereka melatih modelnya pada triliunan token, mengatakan bahwa mereka dapat melatih model mutakhir menggunakan kumpulan data publik dan tidak bergantung pada kumpulan data eksklusif yang tidak dapat diakses.

LLaMA berbeda

Menurut Meta, pelatihan model seperti LLaMA membutuhkan daya komputasi yang sangat kecil untuk menguji, memvalidasi, dan mengeksplorasi kasus penggunaan baru. Model bahasa dasar melatih blok besar data tanpa label, menjadikannya ideal untuk penyesuaian berbagai tugas. 

Buletin inovasi
Jangan lewatkan berita terpenting tentang inovasi. Daftar untuk menerimanya melalui email.

Dalam makalah penelitiannya, Meta mencatat bahwa LLaMA-13B mengungguli OpenAI GPT-3 (175B) pada sebagian besar benchmark dan LLaMA-65B bersaing dengan model teratas, Chinchilla70B oleh DeepMindPaLM-540B dari Google

LLaMA saat ini tidak digunakan pada salah satu produk Meta ai, namun perusahaan memiliki rencana untuk menyediakannya bagi para peneliti. Perusahaan sebelumnya telah meluncurkan LLM OPT-175B, tetapi LLaMA adalah sistem yang paling canggih. 

Perusahaan membuatnya tersedia di bawah lisensi non-komersial yang berfokus pada kasus penggunaan penelitian. Ini akan tersedia untuk peneliti akademik; mereka yang berafiliasi dengan pemerintah, masyarakat sipil dan organisasi akademik; dan laboratorium penelitian industri di seluruh dunia.

Ercole Palmeri

Buletin inovasi
Jangan lewatkan berita terpenting tentang inovasi. Daftar untuk menerimanya melalui email.

Artikel Terbaru

Intervensi inovatif dalam Augmented Reality, dengan penampil Apple di Poliklinik Catania

Operasi oftalmoplasti menggunakan penampil komersial Apple Vision Pro dilakukan di Poliklinik Catania…

3 Mei 2024

Manfaat Halaman Mewarnai untuk Anak - dunia keajaiban untuk segala usia

Mengembangkan keterampilan motorik halus melalui mewarnai mempersiapkan anak untuk keterampilan yang lebih kompleks seperti menulis. Mewarnai…

2 Mei 2024

Masa Depan Ada di Sini: Bagaimana Industri Perkapalan Merevolusi Perekonomian Global

Sektor angkatan laut adalah kekuatan ekonomi global sejati, yang telah menuju pasar 150 miliar...

1 Mei 2024

Penerbit dan OpenAI menandatangani perjanjian untuk mengatur aliran informasi yang diproses oleh Kecerdasan Buatan

Senin lalu, Financial Times mengumumkan kesepakatan dengan OpenAI. FT melisensikan jurnalisme kelas dunianya…

April 30 2024