信息

機器學習的類型

機器學習(自動學習)一詞是指屬於人工智能世界的一組機制。 機器學習分為三種類型:監督學習、無監督學習和強化學習。

這些機制使智能機器可以隨著時間的推移提高其功能和性能,通過自動學習經驗來執行某些任務,並隨著時間的推移越來越提高其性能。 

一個例子是 AlphaGo, 為圍棋遊戲開發的機器學習軟件 DeepMind. AlpaGo 是第一個能夠在飛機上擊敗遊戲中的人類大師的軟件 戈班 標準尺寸(19 × 19)。 AlphaGo 軟件通過觀察圍棋玩家在不同遊戲中的數百萬步棋進行訓練,並讓機器與自己對戰,結果它能夠擊敗被認為是該遊戲世界上最好的棋手。

現在讓我們進入機器學習的三個主要類別。

監督學習

系統接收根據所需輸出標記的示例。 也就是說,對指示機器有用的數據集是由代表由輸入數據組成的真實情況的元素組成的”功能“從輸出數據”目標”。 參考文章的例子 什麼是機器學習,它是關於什麼以及它的目標,訓練的準備是有監督的,因為我們有個別的路線案例,每個案例都指定了特徵(車輛、路線)和目標(旅行時間)。 數據集通常要復雜得多,示例極其有限且具有指導意義,目的是簡化對監督機器學習的理解。

這種類型的案例允許算法研究路線和車輛類型的基礎,可能是旅行時間。 監督機器學習中有兩種類型的問題:

  1. 回歸:當目標由一個連續變量組成時,即一個量,一個數;
  2. 分類:當目標可以由一個類或類別表示時。

重新考慮高速公路路線的例子,我們可以說它是一種回歸。 如果目標包括以下評估:如果不到一小時,則快,如果在 1 到 XNUMX 小時之間放慢,如果超過兩小時,則非常慢。 在這種情況下,這將是一個分類問題。

無監督學習

沒有標記的數據,系統從輸入開始,必須在數據中找到結構。 我們實際上沒有目標,只有輸入數據。 好像在示例中我們只有路線和車輛數據,但沒有行程時間數據。

在這種方法中,算法必須通過尋找數據中的隱藏結構來識別類別。 可用於無監督方法的主要工具是 集群關聯規則.

創新通訊
不要錯過有關創新的最重要新聞。 註冊以通過電子郵件接收它們。

強化學習

系統接收來自環境的輸入並採取行動。 系統嘗試採取行動以獲得獎勵。 系統將嘗試根據周圍環境的狀態執行優化獎勵的操作。 

獎勵系統是通過一個組件實現的,稱為 代理人. 代理決定對環境執行的操作,並從中接收到一個 裡康彭薩 和可能的關於環境狀態的信息,作為所採取的行動的結果。

例如,如果我們想到一個專門用於國際象棋遊戲的系統,代理是決定移動的組件,環境是遊戲本身。 由於代理的每一步移動,遊戲狀態都會發生變化(理解為當前情況、所有棋子的位置,也是對手移動的結果),接收到作為吃掉對手棋子的反饋,因此旨在作為對移動的獎勵。 通過這種方式,代理學習和教育自己。

結論

因此很明顯,機器學習類型之間的選擇取決於上下文。 也就是說,方法的類型是根據可用數據和歷史的可能性來選擇的,該歷史包括對每個案例的情況(輸入)和結果(輸出)的描述。 因此,對於這種類型的數據集,您可以繼續使用監督方法。

另一方面,如果你不可能先驗地知道輸出數據(目標),或者你想發現新的目標,那麼有必要識別輸入數據之間的聯繫,以發現從未經歷過的情況。歷史,或者面對一個不斷發展和反應的環境的學習。 在這種情況下,有必要選擇無監督或強化技術。

Ercole Palmeri: 創新上癮


創新通訊
不要錯過有關創新的最重要新聞。 註冊以通過電子郵件接收它們。

最近的文章

出版商與 OpenAI 簽署協議以規範人工智慧處理的資訊流

上週一,英國《金融時報》宣布與 OpenAI 達成協議。英國《金融時報》授予其世界級新聞報道許可…

30月2024

線上支付:串流服務如何讓您永遠付款

數百萬人為串流媒體服務付費,每月支付訂閱費用。人們普遍認為您...

29月2024

Veeam 為勒索軟體提供最全面的支持,從保護到回應和恢復

Veeam 的 Coveware 將繼續提供網路勒索事件回應服務。 Coveware 將提供取證和修復功能…

23月2024

綠色與數位革命:預測性維護如何改變石油和天然氣產業

預測性維護正在透過創新和主動的工廠管理方法徹底改變石油和天然氣行業。

22月2024