人工智能

BLOOM:人工智能的公開革命

今天的大型人工智能模型需要大量的計算資源來訓練。

一個由數十億甚至數十億參數組成的神經網絡需要數千萬歐元的資源。
憑藉如此巨大的成本,能夠建立和訓練一個偉大的人工智能模型的唯一參與者是跨國公司。

人工智能研究成本成為進入壁壘

有了這些特點,人工智能研究的成本就構成了進入壁壘。
在過去的幾年裡,我們目睹了更小、更簡單的模型的激增,但與大型 LLM 語言模型相去甚遠。

BLOOM 和開放革命

近年來,我們看到了轉機。 例如,Meta 發布的 OPT-175B(Open Pretrained Transformer),一種使用公共數據集訓練的語言模型,並以“準”開放模式提供給研究人員。
但此刻的消息是 BigScience 發布了 BLOOM LM。

BLOOM 是一個開放訪問的多語言語言模型,包含 176 億個參數,並已在 3,5 個 A384–100 GB GPU 上訓練了 80 個月。
一個 BLOOM 檢查點佔用 330GB 的磁盤空間,因此在台式計算機上運行這個模型似乎是不可能的。
但是,您只需要足夠的磁盤空間和至少 16GB 的 RAM 即可在您的計算機上運行此模型。

創新通訊
不要錯過有關創新的最重要新聞。 註冊以通過電子郵件接收它們。

BLOOM 是 1.000 多名科學家的共同努力。
如此廣泛的多語言模型對所有人開放是很重要的。

BLOOM 架構

BLOOM 是一種因果模型語言,這意味著它已被訓練為下一個標記的預測器。
這種基於一組先前標記來預測句子中下一個標記的看似簡單的策略已被證明可以為大型語言模型捕獲一定程度的推理能力。
這使得 BLOOM 和類似模型能夠在一個句子中連接多個概念,並能夠以相當準確的方式解決算術、翻譯和編程等重要問題。
BLOOM 使用由一個輸入嵌入層、70 個 Transformer 塊和一個輸出語言建模層組成的 Transformer 架構,如下圖所示。

文章摘自 Luca Sambucci, 如果你想閱讀新聞.AI

創新通訊
不要錯過有關創新的最重要新聞。 註冊以通過電子郵件接收它們。

最近的文章

出版商與 OpenAI 簽署協議以規範人工智慧處理的資訊流

上週一,英國《金融時報》宣布與 OpenAI 達成協議。英國《金融時報》授予其世界級新聞報道許可…

30月2024

線上支付:串流服務如何讓您永遠付款

數百萬人為串流媒體服務付費,每月支付訂閱費用。人們普遍認為您...

29月2024

Veeam 為勒索軟體提供最全面的支持,從保護到回應和恢復

Veeam 的 Coveware 將繼續提供網路勒索事件回應服務。 Coveware 將提供取證和修復功能…

23月2024

綠色與數位革命:預測性維護如何改變石油和天然氣產業

預測性維護正在透過創新和主動的工廠管理方法徹底改變石油和天然氣行業。

22月2024