用品

Meta 推出 LLaMA 模型,比 OpenAI 的 GPT-3 更強大的搜索工具

Meta 最近發布了一款名為 LLaMA 的新型 AI 語言生成器,證實了其高度創新公司的作用。

“今天我們發布了一種新的、尖端的人工智能大型語言模型,稱為 LLaMA,旨在幫助研究人員推進他們的工作,”首席執行官馬克扎克伯格在 Facebook 的帖子中說。

為什麼選擇美洲駝

大語言模型席捲了科技界。 它們為人工智能工具提供動力,例如 ChatGPT 和其他會話模型。 然而,使用這些工具會帶來巨大的風險、似是而非的虛假聲明、產生有毒內容以及模仿 AI 訓練數據中根深蒂固的偏見。 

為了幫助研究人員解決這些問題,25 月 XNUMX 日星期五,Meta  宣布發布 一個新的大型語言模型稱為 駱駝(Large Language Model 元人工智慧) . 

什麼是美洲駝?

LLaMA 不是 聊天機器人,但根據 Meta ai 的說法,它是一種搜索工具,將解決與語言模型相關的問題 AI. “像 LLaMA 這樣更小、性能更好的模型允許研究社區中無法訪問大量基礎設施的其他人來研究這些模型,進一步使這個重要且快速發展的領域的訪問民主化,”Meta 在他的博客中說 官方 .

LLaMA 是 7B 到 65B 參數的語言模型的集合。 該公司表示,它在數万億個代幣上訓練其模型,並表示它可以使用公共數據集訓練尖端模型,而不依賴於專有的、無法訪問的數據集。

LLaMA 是不同的

根據 Meta 的說法,像 LLaMA 這樣的模型訓練需要很少的計算能力來測試、驗證和探索新的用例。 基本語言模型在大塊未標記數據上進行訓練,使其成為定制各種任務的理想選擇。 

創新通訊
不要錯過有關創新的最重要新聞。 註冊以通過電子郵件接收它們。

Meta 在他的研究論文中指出,LLaMA-13B 在大多數基準測試中都優於 OpenAI 的 GPT-3 (175B),而 LLaMA-65B 與頂級模型具有競爭力, DeepMind 的 Chinchilla70B來自 Google 的 PaLM-540B

LLaMA 目前未在任何 Meta ai 產品上使用,但是,該公司計劃將其提供給研究人員。 該公司此前推出了 LLM OPT-175B,但 LLaMA 是其最先進的系統。 

該公司根據專注於研究用例的非商業許可提供它。 它將提供給學術研究人員; 隸屬於政府、民間社會和學術組織的機構; 和世界各地的工業研究實驗室。

Ercole Palmeri

創新通訊
不要錯過有關創新的最重要新聞。 註冊以通過電子郵件接收它們。

最近的文章

Veeam 為勒索軟體提供最全面的支持,從保護到回應和恢復

Veeam 的 Coveware 將繼續提供網路勒索事件回應服務。 Coveware 將提供取證和修復功能…

23月2024

綠色與數位革命:預測性維護如何改變石油和天然氣產業

預測性維護正在透過創新和主動的工廠管理方法徹底改變石油和天然氣行業。

22月2024

英國反壟斷監管機構對 GenAI 向 BigTech 發出警報

英國 CMA 對大型科技公司在人工智慧市場的行為發出了警告。那裡…

18月2024

Casa Green:義大利永續未來的能源革命

歐盟為提高建築物能源效率而製定的「綠色案例」法令已結束立法程序…

18月2024