在繼續之前,我建議您閱讀三篇短文,其中您會發現一些 defi尼尼西亞:
由於我們將使用 Python,如果您的 PC 上還沒有它,請繼續閱讀 如何在 Microsoft Windows 上安裝 Python
對於多元線性回歸,我們還將使用 scikit學習,因為它非常靈活,使我們在簡單線性回歸示例.
然後我們將提供可用的方法 適合 培訓和方法 預測 用於預測。 我們也將再次使用該課程 線性回歸.
還有功能 回歸 我們將根據我們將提供的參數構建一個測試數據集。 這樣,基本結構就可以進行線性回歸了。 我們會回憶起 回歸 利用 Python 的多重賦值特性,如下:
x, y = make_regression (n_samples = 500, n_features = 5, noise = 10)
因此數據集將具有以下特徵:500 個值,按 5 個特徵組織,我們添加了噪聲,誤差差為 10,以免使數據集看起來過於規則。
現在讓我們將數據集分為對訓練有用的部分和對測試有用的部分。 我們可以考慮 80 個樣本用於測試,其餘樣本用於訓練。 為此,我們使用函數 訓練測試分割 它將兩個列表分開 x e y in x_train, 火車 e x_測試, y_測試
從sklearn.model_selection導入train_test_split
x_train, x_test, y_train, y_test = train_test_split (x, y, test_size = 80)
結果我們將有
((420, 5), (80, 5), (420,), (80,))
現在我們繼續進行回歸,它以與簡單線性回歸完全類似的方式發生,但沒有 重塑 因為在這種情況下 回歸.
從 sklearn.linear_model 導入線性回歸
模型 = 線性回歸 ()
model.fit (x_train, y_train)
下面我們有回歸的計算參數,以及係數和截距
model.coef_ 採用以下值
數組([90.65, 23.45, 66.43, 42.54, 24.35])
model.intercept_ 採用以下值
-0.4564
使用經過訓練的模型,我們可以對測試數據進行預測並使用一些指標對其進行評估:
預測 = model.predict (x_test)
mean_absolute_error(y_test,預測)
6.964857
re_score(y_test,預測)
0.9876
儘管我們將數據用於教育目的,但結果表明我們的模型有效。 他受過教育,能夠做出預測,並且還記錄了 R 平方度量的值,幾乎達到了最高水平。
Ercole Palmeri: 創新上癮