लेख

Meta ने LLaMA मॉडेल लाँच केले, जे OpenAI च्या GPT-3 पेक्षा अधिक शक्तिशाली शोध साधन आहे

Meta ने अलीकडेच LLaMA नावाचा एक नवीन AI भाषा जनरेटर जारी केला आहे, जो अत्यंत नाविन्यपूर्ण कंपनीच्या भूमिकेची पुष्टी करतो.

“आज आम्ही संशोधकांना त्यांचे कार्य पुढे नेण्यास मदत करण्यासाठी डिझाइन केलेले LLaMA नावाचे एक नवीन, अत्याधुनिक AI मोठ्या भाषेचे मॉडेल जारी करत आहोत,” असे सीईओ मार्क झुकरबर्ग यांनी फेसबुक पोस्टमध्ये म्हटले आहे.

का LLaMA

मोठ्या भाषेच्या मॉडेल्सनी तंत्रज्ञान जगाला वादळात घेतले आहे. ते कृत्रिम बुद्धिमत्ता साधने उर्जा देतात, जसे की चॅटजीपीटी आणि इतर संभाषण मॉडेल. तथापि, या साधनांचा वापर करताना महत्त्वपूर्ण जोखीम, वाजवी परंतु खोटे दावे, विषारी सामग्री निर्माण करणे आणि AI प्रशिक्षण डेटामध्ये मूळ असलेल्या पूर्वाग्रहाची नक्कल करणे येते. 

या समस्यांचे निराकरण करण्यासाठी संशोधकांना मदत करण्यासाठी शुक्रवार, 25 फेब्रुवारी रोजी मेटा  प्रकाशनाची घोषणा केली नावाच्या नवीन मोठ्या भाषेच्या मॉडेलचे लामा (Large Language Model मेटा AI) . 

LLaMA म्हणजे काय?

LLaMA नाही चॅटबॉट, परंतु हे एक शोध साधन आहे जे, Meta ai नुसार, भाषा मॉडेलशी संबंधित समस्या सोडवेल AI. "एलएलएएमए सारखे लहान, चांगले कार्यप्रदर्शन करणारे मॉडेल संशोधन समुदायातील इतरांना या मॉडेल्सचा अभ्यास करण्यास परवानगी देतात ज्यांना मोठ्या प्रमाणात पायाभूत सुविधा उपलब्ध नाहीत, या महत्त्वपूर्ण आणि वेगाने विकसित होत असलेल्या क्षेत्रात प्रवेशाचे लोकशाहीकरण करणे," मेटा यांनी त्यांच्या ब्लॉगमध्ये म्हटले आहे. अधिकृत .

LLaMA हा 7B ते 65B पॅरामीटर्सच्या भाषेच्या मॉडेलचा संग्रह आहे. कंपनीने म्हटले आहे की ते ट्रिलियन टोकन्सवर आपले मॉडेल प्रशिक्षित करते, ते सार्वजनिक डेटासेट वापरून अत्याधुनिक मॉडेल्सना प्रशिक्षण देऊ शकते आणि मालकीच्या, दुर्गम डेटासेटवर अवलंबून राहू शकत नाही.

LLaMA वेगळे आहे

मेटाच्या मते, LLaMA सारख्या मॉडेल प्रशिक्षणाला नवीन वापर प्रकरणांची चाचणी, प्रमाणीकरण आणि अन्वेषण करण्यासाठी फारच कमी संगणकीय शक्ती आवश्यक आहे. बेसिक लँग्वेज मॉडेल्स लेबल न केलेल्या डेटाच्या मोठ्या ब्लॉक्सवर प्रशिक्षित होतात, ज्यामुळे ते विविध कार्यांसाठी सानुकूलित करण्यासाठी आदर्श बनतात. 

इनोव्हेशन वृत्तपत्र
नवोपक्रमावरील सर्वात महत्त्वाच्या बातम्या चुकवू नका. त्यांना ईमेलद्वारे प्राप्त करण्यासाठी साइन अप करा.

त्यांच्या संशोधन पेपरमध्ये, मेटाने नमूद केले की LLaMA-13B ने बहुतेक बेंचमार्कवर OpenAI च्या GPT-3 (175B) ला मागे टाकले आहे आणि LLaMA-65B शीर्ष मॉडेलसह स्पर्धात्मक आहे, DeepMind द्वारे Chinchilla70BGoogle कडून PaLM-540B

LLaMA सध्या कोणत्याही Meta ai उत्पादनांवर वापरात नाही, तथापि, कंपनीने ते संशोधकांना उपलब्ध करून देण्याची योजना आखली आहे. कंपनीने आधीच तिची LLM OPT-175B लाँच केली आहे, परंतु LLaMA ही तिची सर्वात प्रगत प्रणाली आहे. 

संशोधन वापर प्रकरणांवर लक्ष केंद्रित करून कंपनी गैर-व्यावसायिक परवान्याअंतर्गत ते उपलब्ध करून देत आहे. ते शैक्षणिक संशोधकांसाठी उपलब्ध असेल; सरकार, नागरी समाज आणि शैक्षणिक संस्थांशी संलग्न असलेले; आणि जगभरातील औद्योगिक संशोधन प्रयोगशाळा.

Ercole Palmeri

इनोव्हेशन वृत्तपत्र
नवोपक्रमावरील सर्वात महत्त्वाच्या बातम्या चुकवू नका. त्यांना ईमेलद्वारे प्राप्त करण्यासाठी साइन अप करा.

अलीकडील लेख

भविष्य येथे आहे: शिपिंग उद्योग जागतिक अर्थव्यवस्थेत कशी क्रांती घडवत आहे

नौदल क्षेत्र ही एक खरी जागतिक आर्थिक शक्ती आहे, ज्याने 150 अब्जांच्या बाजारपेठेकडे नेव्हिगेट केले आहे...

1 मे 2024

आर्टिफिशियल इंटेलिजन्सद्वारे प्रक्रिया केलेल्या माहितीच्या प्रवाहाचे नियमन करण्यासाठी प्रकाशक आणि OpenAI करारांवर स्वाक्षरी करतात

गेल्या सोमवारी, फायनान्शिअल टाईम्सने OpenAI सह करार जाहीर केला. FT ने त्याच्या जागतिक दर्जाच्या पत्रकारितेचा परवाना…

30 एप्रिल 2024

ऑनलाइन पेमेंट: स्ट्रीमिंग सेवा तुम्हाला कायमचे पैसे कसे देतात ते येथे आहे

लाखो लोक स्ट्रीमिंग सेवांसाठी पैसे देतात, मासिक सदस्यता शुल्क भरतात. असे सामान्य मत आहे की आपण…

29 एप्रिल 2024

Veeam मध्ये रॅन्समवेअरसाठी सर्वात व्यापक समर्थन, संरक्षणापासून प्रतिसाद आणि पुनर्प्राप्तीपर्यंत वैशिष्ट्ये आहेत

Veeam द्वारे Coveware सायबर खंडणी घटना प्रतिसाद सेवा प्रदान करणे सुरू ठेवेल. Coveware फॉरेन्सिक आणि उपाय क्षमता प्रदान करेल…

23 एप्रिल 2024

तुमच्या भाषेत इनोव्हेशन वाचा

इनोव्हेशन वृत्तपत्र
नवोपक्रमावरील सर्वात महत्त्वाच्या बातम्या चुकवू नका. त्यांना ईमेलद्वारे प्राप्त करण्यासाठी साइन अप करा.

आमचे अनुसरण करा