บทความ

Meta เปิดตัวโมเดล LLaMA ซึ่งเป็นเครื่องมือค้นหาที่มีประสิทธิภาพมากกว่า GPT-3 ของ OpenAI

Meta เพิ่งเปิดตัวเครื่องมือสร้างภาษา AI ตัวใหม่ชื่อ LLaMA ซึ่งยืนยันบทบาทของบริษัทที่มีนวัตกรรมสูง

“วันนี้ เรากำลังเปิดตัวโมเดลภาษาขนาดใหญ่ของ AI ที่ล้ำสมัยที่เรียกว่า LLaMA ซึ่งออกแบบมาเพื่อช่วยให้นักวิจัยพัฒนางานของพวกเขา” Mark Zuckerberg ซีอีโอกล่าวในโพสต์ Facebook

ทำไม LLaMA

แบบจำลองภาษาขนาดใหญ่ได้ทำให้โลกของเทคโนโลยีเกิดพายุ พวกเขาขับเคลื่อนเครื่องมือปัญญาประดิษฐ์เช่น ChatGPT และรูปแบบการสนทนาอื่นๆ อย่างไรก็ตาม การใช้เครื่องมือเหล่านี้มีความเสี่ยงสูง มีการกล่าวอ้างที่น่าเชื่อถือแต่เป็นเท็จ สร้างเนื้อหาที่เป็นพิษ และเลียนแบบอคติที่มีรากเหง้ามาจากข้อมูลการฝึกอบรม AI 

เพื่อช่วยนักวิจัยแก้ปัญหาเหล่านี้ ในวันศุกร์ที่ 25 กุมภาพันธ์ Meta  ประกาศเปิดตัว ของรูปแบบภาษาใหม่ขนาดใหญ่ที่เรียกว่า ลามะ (Large Language Model เมตาเอไอ) . 

LLaMA คืออะไร?

LLaMA ไม่ใช่ chatbotแต่เป็นเครื่องมือค้นหาที่ตาม Meta ai จะแก้ปัญหาที่เกี่ยวข้องกับโมเดลภาษา AI. “โมเดลที่เล็กกว่าและมีประสิทธิภาพดีกว่าเช่น LLaMA ช่วยให้ผู้อื่นในชุมชนการวิจัยที่ไม่สามารถเข้าถึงโครงสร้างพื้นฐานจำนวนมากเพื่อศึกษาโมเดลเหล่านี้ได้ ทำให้การเข้าถึงเป็นประชาธิปไตยมากขึ้นในสาขาที่สำคัญและมีการพัฒนาอย่างรวดเร็วนี้” Meta กล่าวในบล็อกของเขา เป็นทางการ .

LLaMA คือชุดของโมเดลภาษาตั้งแต่พารามิเตอร์ 7B ถึง 65B บริษัทกล่าวว่ากำลังฝึกโมเดลของตนบนโทเค็นหลายล้านล้านโทเค็น โดยกล่าวว่าสามารถฝึกโมเดลที่ทันสมัยโดยใช้ชุดข้อมูลสาธารณะและไม่ต้องพึ่งพาชุดข้อมูลที่เป็นกรรมสิทธิ์และไม่สามารถเข้าถึงได้

LLaMA แตกต่างออกไป

จากข้อมูลของ Meta การฝึกโมเดลเช่น LLaMA ต้องการพลังการประมวลผลเพียงเล็กน้อยในการทดสอบ ตรวจสอบความถูกต้อง และสำรวจกรณีการใช้งานใหม่ๆ โมเดลภาษาพื้นฐานฝึกบนบล็อกข้อมูลขนาดใหญ่ที่ไม่มีป้ายกำกับ ทำให้เหมาะสำหรับการปรับแต่งตามงานต่างๆ 

จดหมายข่าวนวัตกรรม
อย่าพลาดข่าวสารที่สำคัญที่สุดเกี่ยวกับนวัตกรรม ลงทะเบียนเพื่อรับพวกเขาทางอีเมล

ในรายงานการวิจัยของเขา Meta ตั้งข้อสังเกตว่า LLaMA-13B มีประสิทธิภาพเหนือกว่า GPT-3 (175B) ของ OpenAI ในการวัดประสิทธิภาพส่วนใหญ่ และ LLaMA-65B สามารถแข่งขันกับรุ่นชั้นนำได้ Chinchilla70B โดย DeepMindPaLM-540B จาก Google

ปัจจุบัน LLaMA ยังไม่ได้ใช้งานกับผลิตภัณฑ์ Meta ai ใดๆ อย่างไรก็ตาม บริษัทมีแผนที่จะให้บริการแก่นักวิจัย บริษัทเคยเปิดตัว LLM OPT-175B มาก่อน แต่ LLaMA เป็นระบบที่ทันสมัยที่สุด 

บริษัทกำลังให้บริการภายใต้ใบอนุญาตที่ไม่ใช่เชิงพาณิชย์ซึ่งมุ่งเน้นไปที่กรณีการใช้งานการวิจัย จะมีให้สำหรับนักวิจัยทางวิชาการ ผู้ที่สังกัดภาครัฐ ภาคประชาสังคม และองค์กรทางวิชาการ และห้องปฏิบัติการวิจัยทางอุตสาหกรรมทั่วโลก

Ercole Palmeri

จดหมายข่าวนวัตกรรม
อย่าพลาดข่าวสารที่สำคัญที่สุดเกี่ยวกับนวัตกรรม ลงทะเบียนเพื่อรับพวกเขาทางอีเมล

บทความล่าสุด

Veeam มีการสนับสนุนแรนซัมแวร์ที่ครอบคลุมที่สุด ตั้งแต่การป้องกันไปจนถึงการตอบสนองและการกู้คืน

Coveware by Veeam จะยังคงให้บริการตอบสนองต่อเหตุการณ์การขู่กรรโชกทางไซเบอร์ต่อไป Coveware จะนำเสนอความสามารถในการนิติเวชและการแก้ไข...

23 2024 เมษายน

การปฏิวัติสีเขียวและดิจิทัล: การบำรุงรักษาเชิงคาดการณ์กำลังเปลี่ยนแปลงอุตสาหกรรมน้ำมันและก๊าซอย่างไร

การบำรุงรักษาเชิงคาดการณ์กำลังปฏิวัติภาคส่วนน้ำมันและก๊าซ ด้วยแนวทางเชิงรุกและนวัตกรรมในการจัดการโรงงาน...

22 2024 เมษายน

หน่วยงานกำกับดูแลการต่อต้านการผูกขาดของสหราชอาณาจักรส่งสัญญาณเตือน BigTech เกี่ยวกับ GenAI

UK CMA ได้ออกคำเตือนเกี่ยวกับพฤติกรรมของ Big Tech ในตลาดปัญญาประดิษฐ์ ที่นั่น…

18 2024 เมษายน

Casa Green: การปฏิวัติพลังงานเพื่ออนาคตที่ยั่งยืนในอิตาลี

พระราชกฤษฎีกา "บ้านสีเขียว" ซึ่งกำหนดโดยสหภาพยุโรปเพื่อปรับปรุงประสิทธิภาพการใช้พลังงานของอาคารได้สรุปกระบวนการทางกฎหมายด้วย...

18 2024 เมษายน

อ่านนวัตกรรมในภาษาของคุณ

จดหมายข่าวนวัตกรรม
อย่าพลาดข่าวสารที่สำคัญที่สุดเกี่ยวกับนวัตกรรม ลงทะเบียนเพื่อรับพวกเขาทางอีเมล

ติดตามเรา