लेख

Meta ने LLaMA मॉडेल लाँच केले, जे OpenAI च्या GPT-3 पेक्षा अधिक शक्तिशाली शोध साधन आहे

Meta ने अलीकडेच LLaMA नावाचा एक नवीन AI भाषा जनरेटर जारी केला आहे, जो अत्यंत नाविन्यपूर्ण कंपनीच्या भूमिकेची पुष्टी करतो.

“आज आम्ही संशोधकांना त्यांचे कार्य पुढे नेण्यास मदत करण्यासाठी डिझाइन केलेले LLaMA नावाचे एक नवीन, अत्याधुनिक AI मोठ्या भाषेचे मॉडेल जारी करत आहोत,” असे सीईओ मार्क झुकरबर्ग यांनी फेसबुक पोस्टमध्ये म्हटले आहे.

का LLaMA

मोठ्या भाषेच्या मॉडेल्सनी तंत्रज्ञान जगाला वादळात घेतले आहे. ते कृत्रिम बुद्धिमत्ता साधने उर्जा देतात, जसे की चॅटजीपीटी आणि इतर संभाषण मॉडेल. तथापि, या साधनांचा वापर करताना महत्त्वपूर्ण जोखीम, वाजवी परंतु खोटे दावे, विषारी सामग्री निर्माण करणे आणि AI प्रशिक्षण डेटामध्ये मूळ असलेल्या पूर्वाग्रहाची नक्कल करणे येते.

या समस्यांचे निराकरण करण्यासाठी संशोधकांना मदत करण्यासाठी शुक्रवार, 25 फेब्रुवारी रोजी मेटा प्रकाशनाची घोषणा केली नावाच्या नवीन मोठ्या भाषेच्या मॉडेलचे लामा (Large Language Model मेटा AI) .

LLaMA म्हणजे काय?

LLaMA नाही चॅटबॉट, परंतु हे एक शोध साधन आहे जे, Meta ai नुसार, भाषा मॉडेलशी संबंधित समस्या सोडवेल AI. "एलएलएएमए सारखे लहान, चांगले कार्यप्रदर्शन करणारे मॉडेल संशोधन समुदायातील इतरांना या मॉडेल्सचा अभ्यास करण्यास परवानगी देतात ज्यांना मोठ्या प्रमाणात पायाभूत सुविधा उपलब्ध नाहीत, या महत्त्वपूर्ण आणि वेगाने विकसित होत असलेल्या क्षेत्रात प्रवेशाचे लोकशाहीकरण करणे," मेटा यांनी त्यांच्या ब्लॉगमध्ये म्हटले आहे. अधिकृत .

LLaMA हा 7B ते 65B पॅरामीटर्सच्या भाषेच्या मॉडेलचा संग्रह आहे. कंपनीने म्हटले आहे की ते ट्रिलियन टोकन्सवर आपले मॉडेल प्रशिक्षित करते, ते सार्वजनिक डेटासेट वापरून अत्याधुनिक मॉडेल्सना प्रशिक्षण देऊ शकते आणि मालकीच्या, दुर्गम डेटासेटवर अवलंबून राहू शकत नाही.

LLaMA वेगळे आहे

मेटाच्या मते, LLaMA सारख्या मॉडेल प्रशिक्षणाला नवीन वापर प्रकरणांची चाचणी, प्रमाणीकरण आणि अन्वेषण करण्यासाठी फारच कमी संगणकीय शक्ती आवश्यक आहे. बेसिक लँग्वेज मॉडेल्स लेबल न केलेल्या डेटाच्या मोठ्या ब्लॉक्सवर प्रशिक्षित होतात, ज्यामुळे ते विविध कार्यांसाठी सानुकूलित करण्यासाठी आदर्श बनतात.

त्यांच्या संशोधन पेपरमध्ये, मेटाने नमूद केले की LLaMA-13B ने बहुतेक बेंचमार्कवर OpenAI च्या GPT-3 (175B) ला मागे टाकले आहे आणि LLaMA-65B शीर्ष मॉडेलसह स्पर्धात्मक आहे, DeepMind द्वारे Chinchilla70B e Google कडून PaLM-540B.

LLaMA सध्या कोणत्याही Meta ai उत्पादनांवर वापरात नाही, तथापि, कंपनीने ते संशोधकांना उपलब्ध करून देण्याची योजना आखली आहे. कंपनीने आधीच तिची LLM OPT-175B लाँच केली आहे, परंतु LLaMA ही तिची सर्वात प्रगत प्रणाली आहे.

संशोधन वापर प्रकरणांवर लक्ष केंद्रित करून कंपनी गैर-व्यावसायिक परवान्याअंतर्गत ते उपलब्ध करून देत आहे. ते शैक्षणिक संशोधकांसाठी उपलब्ध असेल; सरकार, नागरी समाज आणि शैक्षणिक संस्थांशी संलग्न असलेले; आणि जगभरातील औद्योगिक संशोधन प्रयोगशाळा.

Ercole Palmeri