بضائع

GPT4 مقابل ChatGPT: نقوم بتحليل طرق التدريب والأداء والقدرات والقيود

من المتوقع أن يؤدي نموذج اللغة التوليدية الجديد إلى تغيير كامل في الصناعات بأكملها ، بما في ذلك الإعلام والتعليم والقانون والتكنولوجيا.

في الأشهر الأخيرة ، كانت السرعة التي تم بها إصدار نماذج لغوية كبيرة ومبتكرة مذهلة. في هذه المقالة ، سنغطي أوجه التشابه والاختلاف الرئيسية بين GPT4 و ChatGPT ، بما في ذلك أساليب التدريب والأداء والقدرات والقيود.

فهرس المحتويات

GPT4 مقابل شات جي بي تي: أوجه التشابه والاختلاف في أساليب التدريب

يعتمد GPT4 و ChatGPT على الإصدارات القديمة من نماذج GPT مع تحسينات على بنية النموذج ، واستخدام أساليب تدريب أكثر تعقيدًا ، وعدد أكبر من معلمات التدريب.

يعتمد كلا التصميمين على بنية المحولات ، والتي تستخدم مشفرًا لمعالجة تسلسلات الإدخال وجهاز فك التشفير لتوليد تسلسلات الإخراج. يتم توصيل المشفر ومفكك التشفير بواسطة آلية تسمح لوحدة فك التشفير بإيلاء اهتمام أكبر لتسلسلات المدخلات الأكثر أهمية.

التقرير الفني لـ GPT4 يقدم OpenAI نظرة ثاقبة قليلة حول بنية النموذج وعملية تكوين GPT4 ، مستشهداً بـ "competitive landscape and the safety implications of large-scale models". ما نعرفه هو أنه من المحتمل أن يتم تدريب GPT4 و ChatGPT بشكل مشابه ، وهو ما يختلف تمامًا عن طرق التدريب المستخدمة في GPT-2 و GPT-3. نحن نعرف الكثير عن طرق التدريب لـ ChatGPT أكثر من GPT4 ، لذلك سنبدأ من هناك.

شات جي بي تي

يتم تدريب ChatGPT باستخدام مجموعات بيانات الحوار ، بما في ذلك البيانات التجريبية ، حيث يُظهر المعلقون البشريون المخرجات المتوقعة من مساعد chatbot استجابة لطلبات محددة. تُستخدم هذه البيانات لضبط GPT3.5 مع التعلم الخاضع للإشراف ، وإنتاج نموذج سياسة يُستخدم لإنشاء استجابات متعددة عند تقديم الطلبات. ثم يصنف المعلقون من البشر أيًا من الردود لموجه معين أسفر عن أفضل النتائج ، والتي تُستخدم لتدريب نموذج المكافأة. ثم يتم استخدام نموذج المكافأة بشكل متكرر لضبط نموذج السياسة باستخدام التعلم المعزز.

يتم تدريب ChatGPT باستخدام ملفات التعزيز التعلم من ردود الفعل البشرية (RLHF) ، وهي طريقة لدمج التعليقات البشرية لتحسين نموذج اللغة أثناء التدريب. يسمح هذا لمخرجات النموذج بالتوافق مع النشاط الذي يطلبه المستخدم ، بدلاً من مجرد توقع الكلمة التالية في جملة بناءً على مجموعة من بيانات التدريب العامة ، مثل GPT-3.

GPT4

لم تكشف OpenAI حتى الآن عن تفاصيل حول كيفية تدريبها لـ GPT4. لا يتضمن تقريرهم الفني "details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar". ما نعرفه هو أن GPT4 عبارة عن نموذج توليدي متعدد الأوضاع على غرار المحولات. سواء على البيانات المتاحة للجمهور أو على بيانات الطرف الثالث المرخصة والتي تم ضبطها لاحقًا باستخدام RLHF. ومن المثير للاهتمام ، أن شركة OpenAI شاركت تفاصيل تتعلق بتقنيات RLHF المحدثة لجعل استجابات النموذج أكثر دقة وأقل عرضة للانحراف خارج حواجز السلامة.

بعد تدريب نموذج السياسة (كما هو الحال مع ChatGPT) ، يتم استخدام RLHF في التدريب العدائي ، وهي عملية تدرب نموذجًا على أمثلة ضارة تهدف إلى خداع النموذج للدفاع عنه ضد مثل هذه الأمثلة في المستقبل. في حالة GPT4 ، يقوم الخبراء بتقييم استجابات النموذج السياسي للمطالب المتناقضة. تُستخدم هذه الردود بعد ذلك لتدريب نماذج المكافآت الإضافية التي تعمل بشكل متكرر على تحسين نموذج السياسة ، مما يؤدي إلى نموذج أقل احتمالًا لتقديم استجابات خطيرة أو مراوغة أو غير دقيقة.

أوجه التشابه والاختلاف بين GPT4 و ChatGPT من حيث الأداء والقدرات

قدرة

من حيث الوظائف ، فإن ChatGPT و GPT4 أكثر تشابهًا من الاختلاف. مثل سابقتها ، يتفاعل GPT-4 أيضًا بأسلوب محادثة يهدف إلى التوافق مع المستخدم. كما ترى أدناه ، فإن الإجابات بين النموذجين على سؤال واسع متشابهة جدًا.

توافق OpenAI على أن التمييز بين النماذج يمكن أن يكون دقيقًا وتنص على أن "الاختلاف يظهر عندما يصل تعقيد المهمة إلى حد كافٍ". بالنظر إلى ستة أشهر من التدريب العدائي الذي خضع له نموذج GPT4 الأساسي في مرحلة ما بعد التدريب ، فمن المحتمل أن يكون هذا توصيفًا دقيقًا.

على عكس ChatGPT ، الذي لا يقبل سوى النص ، يقبل GPT4 كلاً من مطالبات الصور والنص ، ويعيد الردود النصية. حتى كتابة هذه السطور ، للأسف ، لم تكن القدرة على استخدام مدخلات الصور متاحة للجمهور بعد.

أداء

كما ذكرنا أعلاه ، أبلغت شركة OpenAI عن تحسن كبير في أداء الأمان لـ GPT4 ، مقارنة بـ GPT-3.5 (الذي تم ضبط ChatGPT منه). ومع ذلك ، فمن غير الواضح حاليًا ما إذا كان:

تقليل الاستجابات لطلبات المحتوى المحظور ،
الحد من توليد المحتويات السامة ه
تحسين الاستجابات للمواضيع الحساسة

ترجع إلى طراز GPT4 نفسه أو الاختبارات الإضافية المتناقضة.

بالإضافة إلى ذلك ، يتفوق GPT4 على CPT-3.5 في معظم الاختبارات الأكاديمية والمهنية التي يتخذها الإنسان. والجدير بالذكر أن نتائج GPT4 في النسبة المئوية التسعين في امتحان Uniform Bar مقارنةً بـ GPT-90 ، والتي سجلت في النسبة المئوية العاشرة. تتفوق GPT3.5 أيضًا بشكل كبير على سابقتها في معايير نموذج اللغة التقليدية ونماذج SOTA الأخرى (وإن كان ذلك في بعض الأحيان بشكل ضيق).

GPT4 مقابل ChatGPT: الاختلافات والقيودi

لكل من ChatGPT و GPT4 قيود ومخاطر كبيرة. تتضمن ورقة نظام GPT-4 رؤى من استكشاف مفصل لتلك المخاطر أجرته شركة OpenAI.

هذه ليست سوى بعض المخاطر المرتبطة بكلا النموذجين:

الهلوسة (الميل إلى إنتاج محتوى غير منطقي أو غير دقيق من الناحية الواقعية)
إنتاج محتوى ضار ينتهك سياسات OpenAI (مثل الكلام الذي يحض على الكراهية والتحريض على العنف)
تضخيم الصور النمطية للمهمشين وإدامتها
توليد معلومات مضللة واقعية تهدف إلى الخداع

بينما يواجه كل من ChatGPT و GPT-4 نفس القيود والمخاطر ، بذلت OpenAI جهودًا خاصة ، بما في ذلك العديد من الاختبارات المتناقضة ، للتخفيف من حدتها بالنسبة لـ GPT-4. في حين أن هذا أمر مشجع ، توضح ورقة نظام GPT-4 في النهاية مدى ضعف ChatGPT (وربما لا يزال). للحصول على شرح أكثر تفصيلاً للعواقب الضارة غير المقصودة ، أوصي بقراءة ورقة نظام GPT-4 ، والتي تبدأ في الصفحة 38 من تقرير فني GPT-4 .

استنتاج

بينما لا نعرف سوى القليل عن بنية النموذج وطرق التدريب وراء GPT4 ، يبدو أن هناك نسخة منقحة من ChatGPT. في الواقع ، تستطيع GPT4 حاليًا قبول الصور وإدخال النص ، والنتائج أكثر أمانًا ودقة وإبداعًا. لسوء الحظ ، سيتعين علينا أن نأخذ كلمة OpenAI لذلك ، لأن GPT4 متاح فقط كجزء من اشتراك ChatGPT Plus.

يعد البقاء على اطلاع بشأن التقدم والمخاطر والقيود الخاصة بهذه النماذج أمرًا ضروريًا لأننا نتنقل في هذا المشهد المثير ولكنه سريع التطور لنماذج اللغات الكبيرة.

BlogInnovazione.it

ويمكن أيضا أن يثير اهتمامك

الوسوم (تاج): chatbotالدردشةالذكاء الاصطناعيتعلم آلة

21 مارس 2023 5:52 مساءً

التالي انتخب Peroni Nastro Azzurro 0.0٪ أفضل منتج لعام 2023 في فئة صفر كحول »

سابق «استهلاك الطاقة في الفورمولا 1: عكس الميدالية

المقالات الأخيرة

بضائع

منظم مكافحة الاحتكار في المملكة المتحدة يثير إنذار BigTech بشأن GenAI

أصدرت هيئة أسواق المال في المملكة المتحدة تحذيرًا بشأن سلوك شركات التكنولوجيا الكبرى في سوق الذكاء الاصطناعي. هناك…

أبريل 18 2024

كومونيكاتي ستامبا

كازا جرين: ثورة الطاقة من أجل مستقبل مستدام في إيطاليا

اختتم مرسوم "البيوت الخضراء"، الذي صاغه الاتحاد الأوروبي لتعزيز كفاءة استخدام الطاقة في المباني، عمليته التشريعية مع…

أبريل 18 2024

بضائع

التجارة الإلكترونية في إيطاليا بنسبة +27% وفقًا للتقرير الجديد الصادر عن Casaleggio Associati

عرض التقرير السنوي لشركة Casaleggio Associati حول التجارة الإلكترونية في إيطاليا. تقرير بعنوان "التجارة بالذكاء الاصطناعي: حدود التجارة الإلكترونية مع الذكاء الاصطناعي"....

أبريل 17 2024

بضائع

فكرة رائعة: تقدم باندالوكس Airpure®، الستارة التي تنقي الهواء

نتيجة الابتكار التكنولوجي المستمر والالتزام بالبيئة ورفاهية الناس. باندالوكس تقدم Airpure®، خيمة...

أبريل 12 2024

GPT4 مقابل ChatGPT: نقوم بتحليل طرق التدريب والأداء والقدرات والقيود

من المتوقع أن يؤدي نموذج اللغة التوليدية الجديد إلى تغيير كامل في الصناعات بأكملها ، بما في ذلك الإعلام والتعليم والقانون والتكنولوجيا.

GPT4 مقابل شات جي بي تي: أوجه التشابه والاختلاف في أساليب التدريب

شات جي بي تي

GPT4

أوجه التشابه والاختلاف بين GPT4 و ChatGPT من حيث الأداء والقدرات

قدرة

أداء

GPT4 مقابل ChatGPT: الاختلافات والقيودi

استنتاج

ويمكن أيضا أن يثير اهتمامك

المقالات الأخيرة

منظم مكافحة الاحتكار في المملكة المتحدة يثير إنذار BigTech بشأن GenAI

كازا جرين: ثورة الطاقة من أجل مستقبل مستدام في إيطاليا

التجارة الإلكترونية في إيطاليا بنسبة +27% وفقًا للتقرير الجديد الصادر عن Casaleggio Associati

فكرة رائعة: تقدم باندالوكس Airpure®، الستارة التي تنقي الهواء

المقالات الأخيرة

بطاقة