“今天我們發布了一種新的、尖端的人工智能大型語言模型,稱為 LLaMA,旨在幫助研究人員推進他們的工作,”首席執行官馬克扎克伯格在 Facebook 的帖子中說。
大語言模型席捲了科技界。 它們為人工智能工具提供動力,例如 ChatGPT 和其他會話模型。 然而,使用這些工具會帶來巨大的風險、似是而非的虛假聲明、產生有毒內容以及模仿 AI 訓練數據中根深蒂固的偏見。
為了幫助研究人員解決這些問題,25 月 XNUMX 日星期五,Meta 宣布發布 一個新的大型語言模型稱為 駱駝(Large Language Model 元人工智慧) .
LLaMA 不是 聊天機器人,但根據 Meta ai 的說法,它是一種搜索工具,將解決與語言模型相關的問題 AI. “像 LLaMA 這樣更小、性能更好的模型允許研究社區中無法訪問大量基礎設施的其他人來研究這些模型,進一步使這個重要且快速發展的領域的訪問民主化,”Meta 在他的博客中說 官方 .
LLaMA 是 7B 到 65B 參數的語言模型的集合。 該公司表示,它在數万億個代幣上訓練其模型,並表示它可以使用公共數據集訓練尖端模型,而不依賴於專有的、無法訪問的數據集。
根據 Meta 的說法,像 LLaMA 這樣的模型訓練需要很少的計算能力來測試、驗證和探索新的用例。 基本語言模型在大塊未標記數據上進行訓練,使其成為定制各種任務的理想選擇。
Meta 在他的研究論文中指出,LLaMA-13B 在大多數基準測試中都優於 OpenAI 的 GPT-3 (175B),而 LLaMA-65B 與頂級模型具有競爭力, DeepMind 的 Chinchilla70B e 來自 Google 的 PaLM-540B.
LLaMA 目前未在任何 Meta ai 產品上使用,但是,該公司計劃將其提供給研究人員。 該公司此前推出了 LLM OPT-175B,但 LLaMA 是其最先進的系統。
該公司根據專注於研究用例的非商業許可提供它。 它將提供給學術研究人員; 隸屬於政府、民間社會和學術組織的機構; 和世界各地的工業研究實驗室。
Ercole Palmeri