oktatói

Gépi tanulási algoritmusok osztályozása: Lineáris regresszió, osztályozás és klaszterezés

A Machine Learning nagyban hasonlít a matematikai optimalizáláshoz, amely módszereket, elméleteket és alkalmazási területeket biztosít. 

A gépi tanulást úgy kell megfogalmazni, hogy egy veszteségfunkció "minimalizálási problémája" legyen egy adott példakészlettel szemben (edzőkészlet). Ez a szolgáltatás kifejezi az eltérést a képzett modell által előre jelzett értékek és az egyes példapéldányok várható értékei között. 

A végső cél az, hogy megtanítsa a modellnek a képességét arra, hogy helyesen tudja megjósolni azokat a példányokat, amelyek nem szerepelnek az edzéskészletben.

Az a módszer, amely szerint az algoritmusok különböző kategóriái megkülönböztethetők, az egy bizonyos rendszertől elvárt kimenet típusa. gépi tanulás

A fő kategóriák között találunk:

  • La besorolás: a bemenetek két vagy több osztályra oszlanak, és a tanulási rendszernek olyan modellt kell készítenie, amely képes egy vagy több osztályt kiosztani a bemenetek számára rendelkezésre álló osztályok között.Az ilyen típusú feladatokat általában felügyelt tanulási technikákkal kezelik. 

    A besorolás egy példája egy vagy több címke hozzárendelése a képhez a benne található tárgyak vagy tárgyak alapján;

  • La regresszió: fogalmi szempontból hasonló a besoroláshoz azzal a különbséggel, hogy a kimenetnek folyamatos és nem diszkrét tartománya van.Általában felügyelt tanulással irányítják. 

    A regresszió egy példája a jelenet mélységének becslése a képétől színes kép formájában. 

    Valójában a kérdéses output területe gyakorlatilag végtelen, és nem korlátozódik egy bizonyos különálló lehetőségkészletre;

  • Il csoportosítás: hol van az adatkészlet csoportokra oszlik, amelyek azonban a besorolástól eltérően, előre nem ismertek.Az ebbe a kategóriába tartozó problémák természete általában felügyelet nélküli tanulási feladatokat tesz őket.
Egyszerű lineáris regressziós modell

A lineáris regresszió ama valós értékek becslésére használt széles körben használt modell, például:

  • házak költsége,
  • hívások száma,
  • egy főre eső teljes eladás,

és követi a folyamatos változók kritériumát:

  • négyzetméter,
  • előfizetés egy folyószámlára,
  • a személy oktatása

Lineáris regresszió esetén a független változók és a függő változók közötti viszonyt egy olyan vonalon követik, amely általában a két változó közötti kapcsolatot ábrázolja.

Az illesztési vonalat regressziós vonalnak nevezzük, és Y = a * X + b típusú lineáris egyenlettel ábrázoljuk.

A képlet az adatok interpolálásán alapul, hogy két vagy több tulajdonságot egymással társítson. Amikor megad egy bemeneti karakterisztikát az algoritmusnak, akkor a regresszió adja vissza a másik karakterisztikát.

Több lineáris regressziós modell

Ha egynél több független változónk van, akkor többszörös lineáris regresszióról beszélünk, feltételezve egy következő modellt:


y=b0 + B1x1 + B2x2 +… + Bnxn

  • y az értékekre adott válasz, azaz a modell által megjósolt eredményt képviseli;
  • b0 a lehallgatás, vagyis y értéke x-néli mindegyik nulla;
  • az első jellemző b1 x együtthatója1;
  • még egy szolgáltatás bn x együtthatójan;
  • x1,x2,…, Xn a modell független változói.

Alapvetően az egyenlet magyarázza a folyamatos függő változó (y) és két vagy több független változó (x1, x2, x3…) viszonyt. 

Például, ha egy autó szén-dioxid-kibocsátását (az y függő változót) szeretnénk becsülni, figyelembe véve a motor teljesítményét, a hengerek számát és az üzemanyag-fogyasztást. Ez utóbbi tényezők az x2, x1 és x2 független változók. A bi állandók valós számok, és a modell becsült regressziós együtthatóinak nevezzük: Y a folyamatos függõ változó, azaz b3, b0 x1, b1 x2 stb. Összege. y valós szám lesz.

A többszörös regressziós analízis olyan módszer, amellyel azonosíthatók a független változók egy függő változóra gyakorolt ​​hatása.

Ha megértjük, hogyan változik a függő változó, ahogy a független változók változnak, akkor megjósolhatjuk a változások hatásait vagy hatásait a valós helyzetekben.

Többszörös lineáris regresszió alkalmazásával meg lehet érteni, hogy a vérnyomás hogyan változik, amikor a testtömeg-index változik, olyan tényezők figyelembevételével, mint az életkor, nem, stb., Így feltételezve, hogy mi történhet.

Többszörös regresszióval becsléseket szerezhetünk az árak alakulásáról, például az olaj vagy az arany jövőbeli trendjéről.

Végül, a többszörös lineáris regresszió nagyobb érdeklődést mutat a gépi tanulás és a mesterséges intelligencia területén, mivel ez lehetővé teszi a végrehajtó tanulási modellek megszerzését még az elemzendő rekordok nagy száma esetén is.

Logisztikus regressziós modell

A logisztikus regresszió egy statisztikai eszköz, amelynek célja a binomiális eredmény modellezése egy vagy több magyarázó változóval.

Általában bináris problémákra használják, ahol csak két osztály létezik, például igen vagy nem, 0 vagy 1, férfi vagy nő stb.

Ilyen módon lehet leírni az adatokat, és meg lehet magyarázni a binárisan függő változó és egy vagy több független nominális vagy ordinális változó kapcsolatát.

Az eredményt egy logisztikus függvény használatával határozzuk meg, amely megbecsüli a valószínűséget, majd defia kapott valószínűségi értékhez legközelebbi osztályt (pozitív vagy negatív) fejezi be.

A logisztikus regressziót a. Családjának osztályozási módszerének tekinthetjük felügyelt tanulási algoritmusok.

Statisztikai módszerekkel a logisztikus regresszió lehetővé teszi olyan eredmény létrehozását, amely valójában annak valószínűségét képviseli, hogy egy adott bemeneti érték egy adott osztályhoz tartozik.

A binomiális logisztikus regressziós problémák esetén P valószínűsége annak, hogy a kimenet tartozik egy osztályhoz, míg a másikhoz az 1-P osztály tartozik (ahol P 0 és 1 közötti szám, mert valószínűséget fejez ki).

A binomiális logisztikus regresszió jól működik minden olyan esetben, amikor a változó, amelyet megpróbálunk megjósolni, bináris, vagyis csak két értéket vehet fel: az 1. érték a pozitív osztályt, vagy a 0. érték a negatív osztályt képviseli.

Példák a logisztikus regresszióval megoldandó problémákra:

  • az e-mail spam vagy sem;
  • az online vásárlás csalárd vagy nem, a vásárlási feltételeket értékelve;
  • a betegnek a sugár megítélésével tört törés van.

Logisztikus regresszióval prediktív elemzést végezhetünk, megmérve az előrejelezni kívánt (függő változó) és egy vagy több független változó, azaz a karakterisztika kapcsolatát. A valószínűség becslését logisztikai függvényen végzik.

A valószínűségeket később bináris értékekké alakítják, és annak érdekében, hogy a jóslat valódi legyen, ezt az eredményt hozzá kell rendelni ahhoz az osztályhoz, amelyhez tartozik, annak alapján, hogy közel áll-e magához az osztályhoz.

Például, ha a logisztikai függvény alkalmazása 0,85-t ad vissza, akkor ez azt jelenti, hogy az input pozitív osztályt generált az 1. osztályhoz rendelésével. Fordítva, ha olyan értéket kapott, mint például 0,4 vagy általánosabban <0,5 ..

Innovációs hírlevél
Ne maradjon le az innovációval kapcsolatos legfontosabb hírekről. Regisztráljon, hogy megkapja őket e-mailben.

A logisztikus regresszió a logisztikai függvényt használja a bemeneti értékek osztályozásának értékelésére.

A logisztikai függvény, amelyet szigmoidnak is nevezünk, egy görbe, amely tetszőleges számú valós értéket képes felvenni és 0 és 1 közötti értékre térképezni, a szélsőségek kivételével. A funkció:

hol van:

  • e: a természetes logaritmusok bázisa (Euler-szám vagy excel függvény exp ())
  • b0 + b1 * x: az a tényleges numerikus érték, amelyet átalakítani kíván.

A logisztikai regresszióhoz használt reprezentáció

A logisztikus regresszió egy egyenletet reprezentációként használ, hasonlóan a lineáris regresszióhoz

A bemeneti értékeket (x) lineárisan kombináljuk súlyok vagy együtthatók segítségével, hogy megjósoljuk a kimeneti értéket (y). A legfontosabb különbség a lineáris regresszióhoz képest az, hogy a modellezett kimeneti érték nem bináris érték, hanem bináris érték (0 vagy 1).

Íme egy példa a logisztikai regressziós egyenletre:

y = e^(b0 + b1 * x) / (1 + e^(b0 + b1 * x))

Hol:

  • y a függő változó, azaz a becsült érték;
  • b0 a polarizációs vagy elfogási kifejezés;
  • b1 az egyszeri bemeneti érték (x) együtthatója.

A bemeneti adatok minden oszlopához tartozik egy b együttható (állandó valós érték), amelyet meg kell tanulni az edzési adatokból.

A modell tényleges ábrázolása, amelyet a memóriában vagy egy fájlban tárolhat, az egyenlet együtthatói (béta vagy b érték).

A logisztikus regresszió előrejelzi a valószínűségeket (műszaki tartomány)

A logisztikus regresszió modellezi az alapértelmezett osztály valószínűségét.

Tegyük fel például, hogy az emberek nemét férfi vagy nő nemként modellezzük magasságuk alapján, az elsõ osztály férfiak lehet, és a logisztikus regressziós modellt úgy lehet megírni, hogy valószínûsége, hogy férfi az adott személy magassága, vagy annál több. formálisan:

P (nem = férfi | magasság)

Másképp leírva modellezzük annak valószínűségét, hogy egy bemenet (X) a pre osztályba tartozikdefinite (Y = 1), felírhatjuk így:

P(X) = P(Y = 1 | X)

A valószínűségi predikciót bináris értékekké (0 vagy 1) kell átalakítani a valószínűség-előrejelzés tényleges elkészítése érdekében.

A logisztikus regresszió egy lineáris módszer, de a predikciókat a logisztikai függvény segítségével transzformáljuk. Ennek az a következménye, hogy a predikciókat már nem érthetjük meg a bemenetek lineáris kombinációjaként, például lineáris regresszióval, például felülről folytatva a modell kifejezhető:

p(X) = e ^ (b0 + b1 * X) / (1 + e ^ (b0 + b1 * X))

Most megváltoztathatjuk az egyenletet az alábbiak szerint. Ennek megfordításához folytathatjuk az egyik oldalról az e eltávolítását, a másik oldalra egy természetes logaritmus hozzáadásával.

ln (p (X) / 1 - p (X)) = b0 + b1 * X

Ily módon megkapjuk azt a tényt, hogy a jobb oldalon lévő output kiszámítása ismét lineáris (csakúgy, mint a lineáris regresszió), és a bal oldali bemenet az alapértelmezett osztály valószínűségének logaritmusa.

A valószínűségeket az esemény valószínűségének hányadosaként számolják el, ha nincs esemény valószínűsége, pl. 0,8 / (1-0,8), amelynek eredménye 4. Tehát inkább írhatnánk:

ln (esély) = b0 + b1 * X

Mivel a valószínűségeket log-transzformáljuk, ezt bal oldali log-odds-oknak vagy probitnek nevezzük.

Visszaadhatjuk az exponenst jobbra, és így írhatjuk:

valószínűség = e ^ (b0 + b1 * X)

Mindez segít megértenünk, hogy a modell valóban a bemenetek lineáris kombinációja, de ez a lineáris kombináció az előosztály logó valószínűségére utal.definita.

A logisztikus regressziós modell megtanulása

A logisztikus regressziós algoritmus koefficienseit (béta vagy b értéke) a tanulási szakaszban becsüljük meg. Ehhez a maximális valószínűség becslését használjuk.

A maximális valószínűség becslése egy tanulási algoritmus, amelyet számos gépi tanulási algoritmus használ. A modellből származó együtthatók az 1-hez nagyon közeli értéket (pl. férfi) jósolnak az óvodás osztály számáradefinite és a 0-hoz nagyon közeli érték (pl. nő) a másik osztály esetében. A logisztikus regresszió maximális valószínűsége egy olyan eljárás, amelynek során olyan együtthatók értékeit keresik (Béta vagy ob értékek), amelyek minimalizálják a modell által előre jelzett valószínűségek hibáját az adatokhoz képest (pl. 1. valószínűség, ha az adat az elsődleges osztály). .

Minimalizáló algoritmust használunk az edzési adatok legjobb koefficiens értékeinek optimalizálására. Ezt gyakran a gyakorlatban valósítják meg egy hatékony numerikus optimalizálási algoritmus segítségével.

Ercole Palmeri


Innovációs hírlevél
Ne maradjon le az innovációval kapcsolatos legfontosabb hírekről. Regisztráljon, hogy megkapja őket e-mailben.

Friss cikkek

Innovatív beavatkozás a kiterjesztett valóságba, egy Apple nézővel a Catania Poliklinikán

Szemplasztikai műtétet végeztek az Apple Vision Pro reklámmegjelenítővel a Catania Poliklinikán…

Május 3 2024

A színező oldalak előnyei gyerekeknek – a varázslatok világa minden korosztály számára

A finom motoros készségek színezéssel történő fejlesztése felkészíti a gyerekeket olyan összetettebb készségekre, mint az írás. Kiszínezni…

Május 2 2024

A jövő itt van: Hogyan forradalmasítja a hajózási ágazat a globális gazdaságot

A haditengerészeti szektor igazi világgazdasági hatalom, amely egy 150 milliárdos piac felé navigált...

Május 1 2024

A kiadók és az OpenAI megállapodásokat írnak alá a mesterséges intelligencia által feldolgozott információáramlás szabályozására

Múlt hétfőn a Financial Times bejelentette, hogy megállapodást köt az OpenAI-val. Az FT engedélyezi világszínvonalú újságírását…

30 április 2024