บทความ

Meta เปิดตัวโมเดล LLaMA ซึ่งเป็นเครื่องมือค้นหาที่มีประสิทธิภาพมากกว่า GPT-3 ของ OpenAI

Meta เพิ่งเปิดตัวเครื่องมือสร้างภาษา AI ตัวใหม่ชื่อ LLaMA ซึ่งยืนยันบทบาทของบริษัทที่มีนวัตกรรมสูง

“วันนี้ เรากำลังเปิดตัวโมเดลภาษาขนาดใหญ่ของ AI ที่ล้ำสมัยที่เรียกว่า LLaMA ซึ่งออกแบบมาเพื่อช่วยให้นักวิจัยพัฒนางานของพวกเขา” Mark Zuckerberg ซีอีโอกล่าวในโพสต์ Facebook

ทำไม LLaMA

แบบจำลองภาษาขนาดใหญ่ได้ทำให้โลกของเทคโนโลยีเกิดพายุ พวกเขาขับเคลื่อนเครื่องมือปัญญาประดิษฐ์เช่น ChatGPT และรูปแบบการสนทนาอื่นๆ อย่างไรก็ตาม การใช้เครื่องมือเหล่านี้มีความเสี่ยงสูง มีการกล่าวอ้างที่น่าเชื่อถือแต่เป็นเท็จ สร้างเนื้อหาที่เป็นพิษ และเลียนแบบอคติที่มีรากเหง้ามาจากข้อมูลการฝึกอบรม AI

เพื่อช่วยนักวิจัยแก้ปัญหาเหล่านี้ ในวันศุกร์ที่ 25 กุมภาพันธ์ Meta ประกาศเปิดตัว ของรูปแบบภาษาใหม่ขนาดใหญ่ที่เรียกว่า ลามะ (Large Language Model เมตาเอไอ) .

LLaMA คืออะไร?

LLaMA ไม่ใช่ chatbotแต่เป็นเครื่องมือค้นหาที่ตาม Meta ai จะแก้ปัญหาที่เกี่ยวข้องกับโมเดลภาษา AI. “โมเดลที่เล็กกว่าและมีประสิทธิภาพดีกว่าเช่น LLaMA ช่วยให้ผู้อื่นในชุมชนการวิจัยที่ไม่สามารถเข้าถึงโครงสร้างพื้นฐานจำนวนมากเพื่อศึกษาโมเดลเหล่านี้ได้ ทำให้การเข้าถึงเป็นประชาธิปไตยมากขึ้นในสาขาที่สำคัญและมีการพัฒนาอย่างรวดเร็วนี้” Meta กล่าวในบล็อกของเขา เป็นทางการ .

LLaMA คือชุดของโมเดลภาษาตั้งแต่พารามิเตอร์ 7B ถึง 65B บริษัทกล่าวว่ากำลังฝึกโมเดลของตนบนโทเค็นหลายล้านล้านโทเค็น โดยกล่าวว่าสามารถฝึกโมเดลที่ทันสมัยโดยใช้ชุดข้อมูลสาธารณะและไม่ต้องพึ่งพาชุดข้อมูลที่เป็นกรรมสิทธิ์และไม่สามารถเข้าถึงได้

LLaMA แตกต่างออกไป

จากข้อมูลของ Meta การฝึกโมเดลเช่น LLaMA ต้องการพลังการประมวลผลเพียงเล็กน้อยในการทดสอบ ตรวจสอบความถูกต้อง และสำรวจกรณีการใช้งานใหม่ๆ โมเดลภาษาพื้นฐานฝึกบนบล็อกข้อมูลขนาดใหญ่ที่ไม่มีป้ายกำกับ ทำให้เหมาะสำหรับการปรับแต่งตามงานต่างๆ

ในรายงานการวิจัยของเขา Meta ตั้งข้อสังเกตว่า LLaMA-13B มีประสิทธิภาพเหนือกว่า GPT-3 (175B) ของ OpenAI ในการวัดประสิทธิภาพส่วนใหญ่ และ LLaMA-65B สามารถแข่งขันกับรุ่นชั้นนำได้ Chinchilla70B โดย DeepMind e PaLM-540B จาก Google.

ปัจจุบัน LLaMA ยังไม่ได้ใช้งานกับผลิตภัณฑ์ Meta ai ใดๆ อย่างไรก็ตาม บริษัทมีแผนที่จะให้บริการแก่นักวิจัย บริษัทเคยเปิดตัว LLM OPT-175B มาก่อน แต่ LLaMA เป็นระบบที่ทันสมัยที่สุด

บริษัทกำลังให้บริการภายใต้ใบอนุญาตที่ไม่ใช่เชิงพาณิชย์ซึ่งมุ่งเน้นไปที่กรณีการใช้งานการวิจัย จะมีให้สำหรับนักวิจัยทางวิชาการ ผู้ที่สังกัดภาครัฐ ภาคประชาสังคม และองค์กรทางวิชาการ และห้องปฏิบัติการวิจัยทางอุตสาหกรรมทั่วโลก

Ercole Palmeri