บทความ

GPT4 กับ ChatGPT: เราวิเคราะห์วิธีการฝึกอบรม ประสิทธิภาพ ความสามารถ และข้อจำกัดต่างๆ

รูปแบบภาษากำเนิดใหม่คาดว่าจะเปลี่ยนอุตสาหกรรมทั้งหมด รวมทั้งสื่อ การศึกษา กฎหมาย และเทคโนโลยี 

ในช่วงไม่กี่เดือนที่ผ่านมา ความเร็วของโมเดลภาษาขนาดใหญ่ที่เป็นนวัตกรรมใหม่ได้รับการปล่อยตัวออกมาอย่างน่าประหลาดใจ ในบทความนี้ เราจะกล่าวถึงความเหมือนและความแตกต่างหลักๆ ระหว่าง GPT4 กับ ChatGPT รวมถึงวิธีการฝึกอบรม ประสิทธิภาพ ความสามารถ และข้อจำกัดต่างๆ

GPT4 เทียบกับ ChatGPT: ความเหมือนและความแตกต่างของวิธีการฝึกอบรม

GPT4 และ ChatGPT สร้างบนโมเดล GPT เวอร์ชันเก่า โดยมีการปรับปรุงสถาปัตยกรรมโมเดล ใช้วิธีการฝึกอบรมที่ซับซ้อนมากขึ้น และพารามิเตอร์การฝึกอบรมจำนวนมากขึ้น

การออกแบบทั้งสองขึ้นอยู่กับสถาปัตยกรรมของหม้อแปลงซึ่งใช้ตัวเข้ารหัสเพื่อประมวลผลลำดับอินพุตและตัวถอดรหัสเพื่อสร้างลำดับเอาต์พุต ตัวเข้ารหัสและตัวถอดรหัสเชื่อมต่อกันด้วยกลไก ซึ่งช่วยให้ตัวถอดรหัสสามารถใส่ใจกับลำดับอินพุตที่สำคัญที่สุดได้มากขึ้น

รายงานทางเทคนิค GPT4 ของ OpenAI ให้ข้อมูลเชิงลึกเล็กน้อยเกี่ยวกับสถาปัตยกรรมแบบจำลองและกระบวนการสร้าง GPT4 โดยอ้างถึง "competitive landscape and the safety implications of large-scale models“. สิ่งที่เรารู้ก็คือ GPT4 และ ChatGPT อาจได้รับการฝึกอบรมในทำนองเดียวกัน ซึ่งค่อนข้างแตกต่างจากวิธีการฝึกอบรมที่ใช้กับ GPT-2 และ GPT-3 เรารู้มากเกี่ยวกับวิธีการฝึกอบรมสำหรับ ChatGPT มากกว่า GPT4 ดังนั้นเราจะเริ่มที่นั่น

ChatGPT

ChatGPT ได้รับการฝึกอบรมด้วยชุดข้อมูลการสนทนา ซึ่งรวมถึงข้อมูลสาธิต โดยที่ตัวเพิ่มความคิดเห็นของมนุษย์จะแสดงผลลัพธ์ที่คาดหวังของผู้ช่วยแชทบอทเพื่อตอบสนองคำขอเฉพาะ ข้อมูลนี้ใช้เพื่อปรับแต่ง GPT3.5 ด้วยการเรียนรู้แบบมีผู้สอน สร้างโมเดลนโยบายซึ่งใช้เพื่อสร้างการตอบสนองหลายรายการเมื่อมีการร้องขอ จากนั้นคนเขียนคำอธิบายประกอบจะจัดประเภทว่าคำตอบใดสำหรับข้อความแจ้งที่กำหนดซึ่งให้ผลลัพธ์ที่ดีที่สุด ซึ่งใช้ในการฝึกโมเดลการให้รางวัล จากนั้นโมเดลรางวัลจะถูกใช้เพื่อปรับแต่งโมเดลนโยบายอย่างละเอียดซ้ำๆ โดยใช้การเรียนรู้แบบเสริมแรง

ChatGPT ได้รับการฝึกอบรมโดยใช้ การเรียนรู้การเสริมแรงจากความคิดเห็นของมนุษย์ (RLHF) วิธีการรวมความคิดเห็นของมนุษย์เพื่อปรับปรุงรูปแบบภาษาในระหว่างการฝึกอบรม ซึ่งช่วยให้เอาต์พุตของโมเดลสอดคล้องกับกิจกรรมที่ผู้ใช้ร้องขอ แทนที่จะเป็นเพียงการคาดคะเนคำถัดไปในประโยคตามเนื้อหาของข้อมูลการฝึกอบรมทั่วไป เช่น GPT-3

GPT4

OpenAI ยังไม่ได้เปิดเผยรายละเอียดเกี่ยวกับวิธีการฝึกฝน GPT4 รายงานทางเทคนิคของพวกเขาไม่รวมถึง “details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar“. สิ่งที่เรารู้คือ GPT4 เป็นโมเดลมัลติโหมดกำเนิดแบบหม้อแปลงที่ผ่านการฝึกอบรม ทั้งในข้อมูลที่เปิดเผยต่อสาธารณะและข้อมูลของบุคคลที่สามที่ได้รับอนุญาตและปรับแต่งในภายหลังโดยใช้ RLHFที่น่าสนใจคือ OpenAI ได้แชร์รายละเอียดเกี่ยวกับเทคนิค RLHF ที่อัปเดตเพื่อให้การตอบสนองของโมเดลมีความแม่นยำมากขึ้นและมีโอกาสน้อยที่จะลอยออกนอกรั้วกั้น

หลังจากฝึกโมเดลนโยบาย (เช่นเดียวกับ ChatGPT) แล้ว RLHF จะถูกใช้ในการฝึกอบรมฝ่ายตรงข้าม ซึ่งเป็นกระบวนการที่ฝึกโมเดลเกี่ยวกับตัวอย่างที่เป็นอันตรายซึ่งตั้งใจหลอกให้โมเดลปกป้องโมเดลดังกล่าวจากตัวอย่างดังกล่าวในอนาคต ในกรณีของ GPT4 ผู้เชี่ยวชาญประเมินการตอบสนองของแบบจำลองทางการเมืองต่อความต้องการที่ขัดแย้งกัน คำตอบเหล่านี้จะถูกนำไปใช้ในการฝึกแบบจำลองการให้รางวัลเพิ่มเติมซึ่งจะปรับแต่งแบบจำลองนโยบายซ้ำๆ ส่งผลให้แบบจำลองนั้นมีโอกาสน้อยที่จะให้การตอบสนองที่เป็นอันตราย หลบเลี่ยง หรือไม่ถูกต้อง

GPT4 กับ ChatGPT ความเหมือนและความแตกต่างในแง่ของประสิทธิภาพและความสามารถ

ความจุ

ในแง่ของการทำงาน ChatGPT และ GPT4 มีความคล้ายคลึงกันมากกว่าที่แตกต่างกัน เช่นเดียวกับรุ่นก่อนหน้า GPT-4 ยังโต้ตอบในรูปแบบการสนทนาที่มุ่งให้สอดคล้องกับผู้ใช้ ดังที่คุณเห็นด้านล่าง คำตอบระหว่างสองรูปแบบสำหรับคำถามแบบกว้างๆ จะคล้ายกันมาก

OpenAI ตกลงว่าความแตกต่างระหว่างโมเดลอาจมีความละเอียดอ่อนและระบุว่า "ความแตกต่างจะเกิดขึ้นเมื่อความซับซ้อนของงานถึงเกณฑ์ที่เพียงพอ" เมื่อพิจารณาถึงหกเดือนของการฝึกปรปักษ์ที่โมเดลพื้นฐาน GPT4 ดำเนินการในช่วงหลังการฝึก นี่น่าจะเป็นลักษณะเฉพาะที่ถูกต้อง

ซึ่งแตกต่างจาก ChatGPT ซึ่งยอมรับเฉพาะข้อความเท่านั้น GPT4 ยอมรับทั้งภาพและข้อความพร้อมต์ โดยส่งคืนข้อความตอบกลับ ในขณะที่เขียนบทความนี้ โชคไม่ดีที่ความสามารถในการใช้อินพุตรูปภาพยังไม่เปิดเผยต่อสาธารณะ

เพรสตาซิโอเน

ตามที่กล่าวไว้ข้างต้น OpenAI รายงานการปรับปรุงประสิทธิภาพการรักษาความปลอดภัยที่สำคัญสำหรับ GPT4 เมื่อเทียบกับ GPT-3.5 (จากที่ปรับ ChatGPT) อย่างไรก็ตาม ขณะนี้ยังไม่ชัดเจนว่า:

  • การลดการตอบสนองต่อคำขอเนื้อหาต้องห้าม
  • การลดการสร้างสารพิษ e
  • ปรับปรุงการตอบสนองต่อหัวข้อที่ละเอียดอ่อน

เป็นเพราะรุ่น GPT4 เองหรือการทดสอบที่ขัดแย้งกันเพิ่มเติม

นอกจากนี้ GPT4 ยังมีประสิทธิภาพดีกว่า CPT-3.5 ในการสอบวัดผลทางวิชาการและวิชาชีพส่วนใหญ่ที่ดำเนินการโดยมนุษย์ โดยเฉพาะอย่างยิ่ง GPT4 ได้คะแนนในเปอร์เซ็นไทล์ที่ 90 ในการสอบ Uniform Bar เทียบกับ GPT-3.5 ซึ่งได้คะแนนในเปอร์เซ็นไทล์ที่ 10 นอกจากนี้ GPT4 ยังมีประสิทธิภาพดีกว่ารุ่นก่อนหน้าอย่างมากในด้านเกณฑ์มาตรฐานของโมเดลภาษาดั้งเดิมและโมเดล SOTA อื่นๆ (แม้ว่าบางครั้งจะแคบลงก็ตาม)

GPT4 กับ ChatGPT: ความแตกต่างและข้อจำกัดi

ทั้ง ChatGPT และ GPT4 มีข้อจำกัดและความเสี่ยงที่สำคัญ เอกสารระบบ GPT-4 มีข้อมูลเชิงลึกจากการสำรวจความเสี่ยงเหล่านั้นอย่างละเอียดซึ่งดำเนินการโดย OpenAI

นี่เป็นเพียงความเสี่ยงบางส่วนที่เกี่ยวข้องกับทั้งสองรุ่น:

  • อาการประสาทหลอน (แนวโน้มที่จะสร้างเนื้อหาที่ไร้สาระหรือไม่ถูกต้องตามความเป็นจริง)
  • ผลิตเนื้อหาที่เป็นอันตรายซึ่งละเมิดนโยบายของ OpenAI (เช่น คำพูดแสดงความเกลียดชัง การยุยงให้เกิดความรุนแรง)
  • ขยายและขยายขอบเขตแบบแผนของคนชายขอบ
  • สร้างข้อมูลบิดเบือนที่เหมือนจริงโดยมีจุดประสงค์เพื่อหลอกลวง

ในขณะที่ ChatGPT และ GPT-4 เผชิญกับข้อจำกัดและความเสี่ยงที่เหมือนกัน OpenAI ได้ใช้ความพยายามเป็นพิเศษ รวมถึงการทดสอบที่ขัดแย้งกันจำนวนมาก เพื่อบรรเทาสิ่งเหล่านี้สำหรับ GPT-4 แม้ว่าสิ่งนี้จะน่าสนับสนุน แต่แผ่นงานระบบ GPT-4 แสดงให้เห็นว่า ChatGPT มีช่องโหว่ในท้ายที่สุด (และอาจยังคงมีอยู่) สำหรับคำอธิบายโดยละเอียดเพิ่มเติมเกี่ยวกับผลที่เป็นอันตรายโดยไม่ได้ตั้งใจ เราขอแนะนำให้อ่านเอกสารข้อมูลระบบ GPT-4 ซึ่งจะเริ่มต้นที่หน้า 38 ของ รายงานทางเทคนิค GPT-4 .

ข้อสรุป

แม้ว่าเราจะรู้เพียงเล็กน้อยเกี่ยวกับสถาปัตยกรรมโมเดลและวิธีการฝึกอบรมเบื้องหลัง GPT4 แต่ดูเหมือนว่าจะมี ChatGPT เวอร์ชันปรับปรุง อันที่จริง ปัจจุบัน GPT4 สามารถรับรูปภาพและการป้อนข้อความได้ และผลลัพธ์ที่ได้ก็ปลอดภัยกว่า แม่นยำกว่า และสร้างสรรค์กว่า น่าเสียดายที่เราจะต้องทำตามคำพูดของ OpenAI เนื่องจาก GPT4 มีให้ใช้งานเป็นส่วนหนึ่งของการสมัครสมาชิก ChatGPT Plus เท่านั้น

การรับทราบข้อมูลเกี่ยวกับความคืบหน้า ความเสี่ยง และข้อจำกัดของโมเดลเหล่านี้เป็นสิ่งสำคัญในขณะที่เราสำรวจภูมิทัศน์ของโมเดลภาษาขนาดใหญ่ที่น่าตื่นเต้นแต่พัฒนาไปอย่างรวดเร็ว

BlogInnovazione.it

คุณอาจจะสนใจ

จดหมายข่าวนวัตกรรม
อย่าพลาดข่าวสารที่สำคัญที่สุดเกี่ยวกับนวัตกรรม ลงทะเบียนเพื่อรับพวกเขาทางอีเมล

บทความล่าสุด

อนาคตอยู่ที่นี่: อุตสาหกรรมการขนส่งกำลังปฏิวัติเศรษฐกิจโลกอย่างไร

ภาคกองทัพเรือเป็นมหาอำนาจทางเศรษฐกิจระดับโลกอย่างแท้จริง ซึ่งได้มุ่งหน้าสู่ตลาดมูลค่า 150 พันล้าน...

1 2024 พ.ค.

ผู้จัดพิมพ์และ OpenAI ลงนามข้อตกลงเพื่อควบคุมการไหลของข้อมูลที่ประมวลผลโดยปัญญาประดิษฐ์

เมื่อวันจันทร์ที่แล้ว Financial Times ได้ประกาศข้อตกลงกับ OpenAI FT อนุญาติให้ทำข่าวระดับโลก...

30 2024 เมษายน

การชำระเงินออนไลน์: นี่คือวิธีที่บริการสตรีมมิ่งทำให้คุณชำระเงินตลอดไป

ผู้คนนับล้านชำระค่าบริการสตรีมมิ่ง โดยจ่ายค่าธรรมเนียมการสมัครสมาชิกรายเดือน เป็นความเห็นทั่วไปที่คุณ...

29 2024 เมษายน

Veeam มีการสนับสนุนแรนซัมแวร์ที่ครอบคลุมที่สุด ตั้งแต่การป้องกันไปจนถึงการตอบสนองและการกู้คืน

Coveware by Veeam จะยังคงให้บริการตอบสนองต่อเหตุการณ์การขู่กรรโชกทางไซเบอร์ต่อไป Coveware จะนำเสนอความสามารถในการนิติเวชและการแก้ไข...

23 2024 เมษายน

อ่านนวัตกรรมในภาษาของคุณ

จดหมายข่าวนวัตกรรม
อย่าพลาดข่าวสารที่สำคัญที่สุดเกี่ยวกับนวัตกรรม ลงทะเบียนเพื่อรับพวกเขาทางอีเมล

ติดตามเรา