Artikel

Meta meluncurkan model LLaMA, alat pencarian yang lebih kuat daripada GPT-3 OpenAI

Meta baru-baru ini merilis generator bahasa AI baru yang disebut LLaMA, yang menegaskan peran perusahaan yang sangat inovatif.

"Hari ini kami merilis model bahasa besar AI mutakhir yang disebut LLaMA yang dirancang untuk membantu para peneliti memajukan pekerjaan mereka," kata CEO Mark Zuckerberg dalam sebuah posting Facebook.

Mengapa LLaMA

Model bahasa besar telah menggemparkan dunia teknologi. Mereka menggerakkan alat kecerdasan buatan, seperti ChatGPT dan model percakapan lainnya. Namun, menggunakan alat ini memiliki risiko yang signifikan, klaim yang masuk akal tetapi salah, menghasilkan konten beracun, dan meniru bias yang berakar pada data pelatihan AI.

Untuk membantu peneliti memecahkan masalah tersebut, pada hari Jumat tanggal 25 Februari Meta mengumumkan rilis dari model bahasa besar baru yang disebut LLaMA (Large Language Model Meta AI) .

Apa itu LLaMA?

LLaMA bukan a ChatBot, tetapi itu adalah alat pencarian yang, menurut Meta ai, akan menyelesaikan masalah yang berkaitan dengan model bahasa AI. “Model yang lebih kecil dan berkinerja lebih baik seperti LLaMA memungkinkan orang lain dalam komunitas riset yang tidak memiliki akses ke infrastruktur dalam jumlah besar untuk mempelajari model ini, semakin mendemokratisasi akses di bidang yang penting dan berkembang pesat ini,” kata Meta di blognya. resmi .

LLaMA adalah kumpulan model bahasa mulai dari parameter 7B hingga 65B. Perusahaan tersebut mengatakan bahwa mereka melatih modelnya pada triliunan token, mengatakan bahwa mereka dapat melatih model mutakhir menggunakan kumpulan data publik dan tidak bergantung pada kumpulan data eksklusif yang tidak dapat diakses.

LLaMA berbeda

Menurut Meta, pelatihan model seperti LLaMA membutuhkan daya komputasi yang sangat kecil untuk menguji, memvalidasi, dan mengeksplorasi kasus penggunaan baru. Model bahasa dasar melatih blok besar data tanpa label, menjadikannya ideal untuk penyesuaian berbagai tugas.

Dalam makalah penelitiannya, Meta mencatat bahwa LLaMA-13B mengungguli OpenAI GPT-3 (175B) pada sebagian besar benchmark dan LLaMA-65B bersaing dengan model teratas, Chinchilla70B oleh DeepMind e PaLM-540B dari Google.

LLaMA saat ini tidak digunakan pada salah satu produk Meta ai, namun perusahaan memiliki rencana untuk menyediakannya bagi para peneliti. Perusahaan sebelumnya telah meluncurkan LLM OPT-175B, tetapi LLaMA adalah sistem yang paling canggih.

Perusahaan membuatnya tersedia di bawah lisensi non-komersial yang berfokus pada kasus penggunaan penelitian. Ini akan tersedia untuk peneliti akademik; mereka yang berafiliasi dengan pemerintah, masyarakat sipil dan organisasi akademik; dan laboratorium penelitian industri di seluruh dunia.

Ercole Palmeri