في الأشهر الأخيرة ، كانت السرعة التي تم بها إصدار نماذج لغوية كبيرة ومبتكرة مذهلة. في هذه المقالة ، سنغطي أوجه التشابه والاختلاف الرئيسية بين GPT4 و ChatGPT ، بما في ذلك أساليب التدريب والأداء والقدرات والقيود.
يعتمد GPT4 و ChatGPT على الإصدارات القديمة من نماذج GPT مع تحسينات على بنية النموذج ، واستخدام أساليب تدريب أكثر تعقيدًا ، وعدد أكبر من معلمات التدريب.
يعتمد كلا التصميمين على بنية المحولات ، والتي تستخدم مشفرًا لمعالجة تسلسلات الإدخال وجهاز فك التشفير لتوليد تسلسلات الإخراج. يتم توصيل المشفر ومفكك التشفير بواسطة آلية تسمح لوحدة فك التشفير بإيلاء اهتمام أكبر لتسلسلات المدخلات الأكثر أهمية.
التقرير الفني لـ GPT4 يقدم OpenAI نظرة ثاقبة قليلة حول بنية النموذج وعملية تكوين GPT4 ، مستشهداً بـ "competitive landscape and the safety implications of large-scale models
". ما نعرفه هو أنه من المحتمل أن يتم تدريب GPT4 و ChatGPT بشكل مشابه ، وهو ما يختلف تمامًا عن طرق التدريب المستخدمة في GPT-2 و GPT-3. نحن نعرف الكثير عن طرق التدريب لـ ChatGPT أكثر من GPT4 ، لذلك سنبدأ من هناك.
يتم تدريب ChatGPT باستخدام مجموعات بيانات الحوار ، بما في ذلك البيانات التجريبية ، حيث يُظهر المعلقون البشريون المخرجات المتوقعة من مساعد chatbot استجابة لطلبات محددة. تُستخدم هذه البيانات لضبط GPT3.5 مع التعلم الخاضع للإشراف ، وإنتاج نموذج سياسة يُستخدم لإنشاء استجابات متعددة عند تقديم الطلبات. ثم يصنف المعلقون من البشر أيًا من الردود لموجه معين أسفر عن أفضل النتائج ، والتي تُستخدم لتدريب نموذج المكافأة. ثم يتم استخدام نموذج المكافأة بشكل متكرر لضبط نموذج السياسة باستخدام التعلم المعزز.
يتم تدريب ChatGPT باستخدام ملفات التعزيز التعلم من ردود الفعل البشرية (RLHF) ، وهي طريقة لدمج التعليقات البشرية لتحسين نموذج اللغة أثناء التدريب. يسمح هذا لمخرجات النموذج بالتوافق مع النشاط الذي يطلبه المستخدم ، بدلاً من مجرد توقع الكلمة التالية في جملة بناءً على مجموعة من بيانات التدريب العامة ، مثل GPT-3.
لم تكشف OpenAI حتى الآن عن تفاصيل حول كيفية تدريبها لـ GPT4. لا يتضمن تقريرهم الفني "details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar
". ما نعرفه هو أن GPT4 عبارة عن نموذج توليدي متعدد الأوضاع على غرار المحولات. سواء على البيانات المتاحة للجمهور أو على بيانات الطرف الثالث المرخصة والتي تم ضبطها لاحقًا باستخدام RLHF. ومن المثير للاهتمام ، أن شركة OpenAI شاركت تفاصيل تتعلق بتقنيات RLHF المحدثة لجعل استجابات النموذج أكثر دقة وأقل عرضة للانحراف خارج حواجز السلامة.
بعد تدريب نموذج السياسة (كما هو الحال مع ChatGPT) ، يتم استخدام RLHF في التدريب العدائي ، وهي عملية تدرب نموذجًا على أمثلة ضارة تهدف إلى خداع النموذج للدفاع عنه ضد مثل هذه الأمثلة في المستقبل. في حالة GPT4 ، يقوم الخبراء بتقييم استجابات النموذج السياسي للمطالب المتناقضة. تُستخدم هذه الردود بعد ذلك لتدريب نماذج المكافآت الإضافية التي تعمل بشكل متكرر على تحسين نموذج السياسة ، مما يؤدي إلى نموذج أقل احتمالًا لتقديم استجابات خطيرة أو مراوغة أو غير دقيقة.
من حيث الوظائف ، فإن ChatGPT و GPT4 أكثر تشابهًا من الاختلاف. مثل سابقتها ، يتفاعل GPT-4 أيضًا بأسلوب محادثة يهدف إلى التوافق مع المستخدم. كما ترى أدناه ، فإن الإجابات بين النموذجين على سؤال واسع متشابهة جدًا.
توافق OpenAI على أن التمييز بين النماذج يمكن أن يكون دقيقًا وتنص على أن "الاختلاف يظهر عندما يصل تعقيد المهمة إلى حد كافٍ". بالنظر إلى ستة أشهر من التدريب العدائي الذي خضع له نموذج GPT4 الأساسي في مرحلة ما بعد التدريب ، فمن المحتمل أن يكون هذا توصيفًا دقيقًا.
على عكس ChatGPT ، الذي لا يقبل سوى النص ، يقبل GPT4 كلاً من مطالبات الصور والنص ، ويعيد الردود النصية. حتى كتابة هذه السطور ، للأسف ، لم تكن القدرة على استخدام مدخلات الصور متاحة للجمهور بعد.
كما ذكرنا أعلاه ، أبلغت شركة OpenAI عن تحسن كبير في أداء الأمان لـ GPT4 ، مقارنة بـ GPT-3.5 (الذي تم ضبط ChatGPT منه). ومع ذلك ، فمن غير الواضح حاليًا ما إذا كان:
ترجع إلى طراز GPT4 نفسه أو الاختبارات الإضافية المتناقضة.
بالإضافة إلى ذلك ، يتفوق GPT4 على CPT-3.5 في معظم الاختبارات الأكاديمية والمهنية التي يتخذها الإنسان. والجدير بالذكر أن نتائج GPT4 في النسبة المئوية التسعين في امتحان Uniform Bar مقارنةً بـ GPT-90 ، والتي سجلت في النسبة المئوية العاشرة. تتفوق GPT3.5 أيضًا بشكل كبير على سابقتها في معايير نموذج اللغة التقليدية ونماذج SOTA الأخرى (وإن كان ذلك في بعض الأحيان بشكل ضيق).
لكل من ChatGPT و GPT4 قيود ومخاطر كبيرة. تتضمن ورقة نظام GPT-4 رؤى من استكشاف مفصل لتلك المخاطر أجرته شركة OpenAI.
هذه ليست سوى بعض المخاطر المرتبطة بكلا النموذجين:
بينما يواجه كل من ChatGPT و GPT-4 نفس القيود والمخاطر ، بذلت OpenAI جهودًا خاصة ، بما في ذلك العديد من الاختبارات المتناقضة ، للتخفيف من حدتها بالنسبة لـ GPT-4. في حين أن هذا أمر مشجع ، توضح ورقة نظام GPT-4 في النهاية مدى ضعف ChatGPT (وربما لا يزال). للحصول على شرح أكثر تفصيلاً للعواقب الضارة غير المقصودة ، أوصي بقراءة ورقة نظام GPT-4 ، والتي تبدأ في الصفحة 38 من تقرير فني GPT-4 .
بينما لا نعرف سوى القليل عن بنية النموذج وطرق التدريب وراء GPT4 ، يبدو أن هناك نسخة منقحة من ChatGPT. في الواقع ، تستطيع GPT4 حاليًا قبول الصور وإدخال النص ، والنتائج أكثر أمانًا ودقة وإبداعًا. لسوء الحظ ، سيتعين علينا أن نأخذ كلمة OpenAI لذلك ، لأن GPT4 متاح فقط كجزء من اشتراك ChatGPT Plus.
يعد البقاء على اطلاع بشأن التقدم والمخاطر والقيود الخاصة بهذه النماذج أمرًا ضروريًا لأننا نتنقل في هذا المشهد المثير ولكنه سريع التطور لنماذج اللغات الكبيرة.
BlogInnovazione.it
أصدرت هيئة أسواق المال في المملكة المتحدة تحذيرًا بشأن سلوك شركات التكنولوجيا الكبرى في سوق الذكاء الاصطناعي. هناك…
اختتم مرسوم "البيوت الخضراء"، الذي صاغه الاتحاد الأوروبي لتعزيز كفاءة استخدام الطاقة في المباني، عمليته التشريعية مع…
عرض التقرير السنوي لشركة Casaleggio Associati حول التجارة الإلكترونية في إيطاليا. تقرير بعنوان "التجارة بالذكاء الاصطناعي: حدود التجارة الإلكترونية مع الذكاء الاصطناعي"....
نتيجة الابتكار التكنولوجي المستمر والالتزام بالبيئة ورفاهية الناس. باندالوكس تقدم Airpure®، خيمة...