Prije nego što nastavite, preporučujem vam da pročitate tri kratka članka, gdje ćete ih pronaći nekoliko definacije:
Pošto ćemo koristiti Python, ako ga još nemate na svom računaru, čitajte dalje Kako instalirati Python na Microsoft Windows
Za višestruku linearnu regresiju također ćemo koristiti scikit-learn, budući da je izuzetno fleksibilan, čini sve validnim ono što smo vidjeli uprimjer jednostavne linearne regresije.
Tada ćemo metodu imati na raspolaganju odgovarati za obuku i metodu predvidjeti za predviđanje. Također ćemo ponovo koristiti čas Linearna regresija.
Također sa funkcijom make_regression napravićemo testni skup podataka na osnovu parametara koje ćemo obezbediti. Na ovaj način osnovna struktura je spremna za linearnu regresiju. Podsjetit ćemo na make_regression koristeći prednosti višestrukog dodjeljivanja karakteristika Pythona, kako slijedi:
x, y = make_regression (n_uzoraka = 500, n_features = 5, buka = 10)
Dakle, skup podataka će imati sljedeće karakteristike: 500 vrijednosti, organiziranih u 5 karakteristika, a mi dodajemo šum, razliku greške od 10 kako skup podataka ne bi izgledao previše regularan.
Podijelimo sada skup podataka na dio koji je koristan za obuku i dio koristan za testiranje. Mogli bismo smisliti 80 uzoraka za testiranje, a ostatak za obuku. Za to koristimo funkciju train_test_split koji dijeli dvije liste x e y in x_train, y_train e x_test, y_test
iz sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split (x, y, test_size = 80)
kao rezultat ćemo imati
((420, 5), (80, 5), (420,), (80,))
Sada prelazimo na regresiju koja se odvija na potpuno analogan način jednostavnoj linearnoj regresiji, ali bez preoblikovati jer u ovom slučaju make_regression.
iz sklearn.linear_model import LinearRegression
model = Linearna regresija ()
model.fit (x_train, y_train)
U nastavku imamo izračunate parametre za regresiju, zajedno sa koeficijentima i presjekom
model.coef_ uzima sljedeću vrijednost
niz ([90.65, 23.45, 66.43, 42.54, 24.35])
model.intercept_ uzima sljedeću vrijednost
-0.4564
Sa obučenim modelom možemo napraviti predviđanje na testnim podacima i procijeniti ga pomoću nekih metrika:
predviđanje = model.predict (x_test)
srednja_apsolutna_greška (y_test, prognoza)
6.964857
re_score (y_test, prognoza)
0.9876
Iako smo podatke koristili u obrazovne svrhe, rezultati pokazuju da naš model funkcionira. Obrazovan je, sposoban je za predviđanje, a također je zabilježio vrijednost za R-kvadrat metriku na praktično maksimalnom nivou.
Ercole Palmeri: Ovisnik o inovacijama
Coveware od strane Veeam-a će nastaviti da pruža usluge odgovora na incidente u slučaju sajber iznude. Coveware će ponuditi mogućnosti forenzike i sanacije…
Prediktivno održavanje revolucionira sektor nafte i plina, s inovativnim i proaktivnim pristupom upravljanju postrojenjima.…
UK CMA izdao je upozorenje o ponašanju Big Tech-a na tržištu umjetne inteligencije. Tamo…
Uredba o „zelenim kućama“, koju je formulisala Evropska unija za poboljšanje energetske efikasnosti zgrada, završila je svoj zakonodavni proces sa…