tutorial

Klasifikasi Algoritma Pembelajaran Mesin: Garis Langgar, Klasifikasi lan Kluster

Mesin Pembelajaran nduweni persamaan sing apik karo optimasi matematika, sing nyedhiyakake metode, teori lan domain aplikasi. 

Pembelajaran mesin dirumusake minangka "masalah minimisasi" fungsi kerugian marang conto conto tartamtu (set latihan). Fitur iki nyatakake bedhane ing antarane nilai sing diprediksi dening model sing dilatih lan nilai sing samesthine kanggo saben conto. 

Tujuan utama yaiku mulangake model kemampuan kanggo prédhiksi kanthi bener babagan kedadeyan sing ora kasedhiya ing set latihan.

Cara sing bisa mbedakake macem-macem kategori algoritma yaiku jinis output sing dikarepake saka sistem tartamtu. learning machine

Ing antarane kategori utama sing ditemokake:

  • La klasifikasi: input kasebut dipérang dadi loro utawa luwih kelas lan sistem belajar kudu ngasilake modhél sing mampu menehi kelas siji utawa luwih ing antarane sing kasedhiya kanggo input.Tugas jinis iki biasane ditrapake kanthi nggunakake teknik belajar sing diawasi. 

    Tuladha conto klasifikasi yaiku tugas siji utawa luwih label menyang gambar adhedhasar obyek utawa subjek sing ana;

  • La regresi: konsep sing padha karo klasifikasi karo bedane yen output nduweni domain terus-terusan lan ora diskret.Biasane dikelola kanthi sinau sing diawasi. 

    Conto regresi yaiku prakiraan jeru adegan saka perwakilane ing wujud gambar warna. 

    Kasunyatane, domain output sing ana watese tanpa wates, lan ora winates karo kemungkinan diskret tartamtu;

  • Il clustering: wonten pundi sakumpulan data dipérang dadi klompok-klompok sing, ora kaya klasifikasi, ora dingerteni dadi prioritas.Sifat masalah sing kalebu ing kategori iki biasane ndadekake tugas belajar sing ora dilatih.
Model regresi linear prasaja

Regresi linear yaikumodel sing digunakake digunakake kanggo ngira nilai nyata kayata:

  • biaya omah,
  • nomer telpon,
  • total dodolan saben wong,

lan ndherekake kriteria variabel terus:

  • meter persegi,
  • lengganan menyang akun saiki,
  • pendhidhikan saka wong kasebut

Ing regresi linear, hubungan antara variabel mandhiri lan variabel gumantung diterusake liwat garis sing biasane nggambarake hubungan antarane loro variabel.

Garis pas dikenal minangka garis regresi lan dituduhake kanthi rumus linier saka jinis Y = a * X + b.

Formula kasebut adhedhasar data interpolasi kanggo nggandhengake loro utawa luwih karakteristik. Yen sampeyan menehi algoritma minangka ciri input, regresi ngasilake karakteristik liyane.

Model regresi linear kaping pirang-pirang

Yen duwe variabel luwih saka siji, banjur kita ujar pirang-pirang regresi linear, kanthi model kaya ing ngisor iki:


y=b0 + b1x1 + b2x2 +… + Bnxn

  • y yaiku tanggapan tumrap nilai, yaiku nuduhake asil sing diprediksi dening model
  • b0 yaiku nyegat, yaiku nilai y nalika xi kabeh padha karo 0;
  • karakteristik pertama b1 iku koefisien x1;
  • pa fitur liyane bn iku koefisien xn;
  • x1,x2,…, Xn yaiku variabel mandiri model kasebut.

Sejatine rumus kasebut nerangake hubungan antara variabel gumantung (y) lan loro utawa luwih variabel mandiri (x1, x2, x3 ...). 

Contone, yen kita pengin ngira polusi CO2 saka mobil (gumantung variabel y) ngelingi kekuwatan mesin, jumlah silinder lan konsumsi bahan bakar. Faktor terakhir iki yaiku variabel mandiri x1, x2 lan x3. Konstanta bi iku nomer nyata lan diarani koefisien regresi model sing dikira-kira. Y yaiku variabel gumantung terus, i.e. dadi jumlah b0, b1 x1, b2 x2, lsp. y bakal dadi nomer nyata.

Analisis regresi kaping minangka metode sing digunakake kanggo ngerteni pengaruh variabel mandiri kanthi variabel sing gumantung.

Ngerti kepiye owah-owahan variabel gumantung minangka owah-owahan variabel bebas ngidini kita prédhiksi efek utawa dampak saka owah-owahan ing kahanan nyata.

Nganggo pirang-pirang regresi linear bisa dimengerteni kepiye tekanan getih nalika indeks massa awak ngganti faktor kayata umur, jinis, lan sapiturute, mula bisa ngira apa sing bisa kedadeyan.

Kanthi regresi macem-macem, kita bisa ngira babagan rega rega, kayata tren minyak utawa emas.

Pungkasan, pirang-pirang regresi linier narik kawigaten luwih akeh babagan sinau babagan mesin lan intelijen buatan amarga ngidini entuk model sinau sing ana ing kasus sing akeh kanggo dianalisa.

Model Regresi Logistik

Regresi logistik minangka alat statistik sing tujuan kanggo ngasilake model binomial kanthi variabel siji utawa luwih panjelasan.

Umumé digunakake kanggo masalah binar, sing ana mung rong kelas, kayata Ya utawa Ora, 0 utawa 1, lanang utawa wadon etc ...

Kanthi cara iki, bisa nggambarake data lan nerangake hubungan antara variabel gumantung binar lan variabel nominal utawa ordinal mandiri.

Asil ditemtokake thanks kanggo nggunakake fungsi logistik, kang ngira kemungkinan lan banjur defiends kelas paling cedhak (positif utawa negatif) kanggo nilai probabilitas dijupuk.

Kita bisa nimbang regresi logistik minangka metode kulawarga algoritma belajar sing diawasi.

Nganggo cara statistik, regresi logistik ngidini ngasilake asil sing, sejatine nggambarake kemungkinan nilai input sing diwenehake dadi kelas sing diwenehake.

Ing masalah regresi logistik binomial, kemungkinan output dadi siji kelas bakal P, sauntara kalebu ing kelas 1-P liyane (ing endi P minangka nomer 0 lan 1 amarga nuduhake kemungkinan).

Regresi logistik binomial kanthi becik ing kabeh kasus sing variabel sing kita coba prédhiksi yaiku binar, yaiku, bisa njupuk rong nilai mung: nilai 1 sing makili kelas positif, utawa nilai 0 sing makili kelas negatif.

Conto masalah sing bisa diatasi kanthi regresi logistik yaiku:

  • e-mail minangka spam utawa ora;
  • tuku online ngapusi utawa ora, ngevaluasi kahanan tuku;
  • pasien duwe fraktur kanthi ngevaluasi radii.

Kanthi regresi logistik, kita bisa nganakake analisa prediksi, ngukur hubungan antarane apa sing arep diprediksi (variabel gumantung) lan variabel siji utawa luwih, i.e. Prakiraan kemungkinan ditindakake liwat fungsi logistik.

Kemungkinan kasebut banjur diowahi dadi nilai binar, lan supaya ramalan nyata, asil iki diwenehake menyang kelas sing diduweni, adhedhasar apa sing cedhak karo kelas kasebut dhewe.

Contone, yen aplikasi fungsi logistik ngasilake 0,85, tegese tegese input ngasilake kelas positif kanthi milih menyang kelas 1. Kosok baline yen entuk nilai kayata 0,4 utawa luwih umume <0,5 ..

newsletter inovasi
Aja kantun warta paling penting babagan inovasi. Mlebu kanggo nampa wong-wong mau liwat email.

Regresi logistik nggunakake fungsi logistik kanggo ngevaluasi klasifikasi nilai input.

Fungsi logistik, uga diarani sigmoid, yaiku kurva sing bisa ngetrapake angka nyata lan map ing Nilai antara 0 lan 1, ora kalebu ekstrem. Fungsi kasebut yaiku:

pundi:

  • e: dasar logaritma alami (cacahe Euler, utawa exp excel function ())
  • b0 + b1 * x: yaiku angka angka nyata sing pengin diowahi.

Perwakilan sing digunakake kanggo regresi logistik

Regresi logistik nggunakake persamaan minangka perwakilan, meh padha karo regresi linear

Nilai input (x) digabungake kanthi linear kanthi nggunakake bobot utawa nilai koefisien, kanggo prédhiksi nilai output (y). Bentenane utama saka regresi linear yaiku nilai output model yaiku nilai binar (0 utawa 1) tinimbang nilai angka.

Iki minangka conto rumus regresi logistik:

y = e^(b0 + b1 * x) / (1 + e^(b0 + b1 * x))

Pundi:

  • y iku variabel gumantung, i.e. nilai sing diprediksi;
  • b0 yaiku polarisasi utawa istilah nyegat;
  • b1 minangka koefisien kanggo nilai input siji (x).

Saben kolom data input duwe koefisien b (kekekalan nyata) sing kudu sinau saka data pelatihan.

Perwakilan nyata model sing bakal sampeyan simpen ing memori utawa file minangka koefisien ing persamaan (beta utawa nilai b).

Regresi logistik prédhiksi kemungkinan (kisaran teknis)

Model regresi logistik kemungkinan kemungkinan kelas standar.

Minangka conto, ayo nganggep kita modhule jinis kelamin wong lanang utawa wadon wiwit dhuwur, kelas siji bisa dadi pria, lan model regresi logistik bisa ditulis minangka kemungkinan wong lanang diwenehi umur dhuwur, utawa liya-liyane. kanthi resmi:

P (jinis = lanang | dhuwur)

Ditulis cara liyane, kita modeling kemungkinan sing input (X) belongs kanggo kelas wisdefinite (Y = 1), kita bisa nulis minangka:

P(X) = P(Y = 1 | X)

Prediksi probabilitas kudu diowahi dadi nilai binar (0 utawa 1) supaya bisa nggawe ramalan kemungkinan.

Regresi logistik minangka metode linier, nanging ramalan diganti kanthi fungsi logistik. Dampak iki yaiku, kita ora bisa ngerti ramalan minangka kombinasi input linear kaya kita bisa karo regresi linear, umpamane, terus saka ndhuwur, model kasebut bisa diandharake kaya:

p(X) = e ^ (b0 + b1 * X) / (1 + e ^ (b0 + b1 * X))

Saiki kita bisa mbalikke rumus kasebut kaya ing ngisor iki. Kanggo mbalikke, kita bisa nerusake kanthi ngilangi e ing sisih liyane kanthi nambah logaritma alami ing sisih liya.

ln (p (X) / 1 - p (X)) = b0 + b1 * X

Kanthi cara iki, kita nyathet yen komputasi output ing sisih tengen dadi linear maneh (kaya regresi linear), lan input ing sisih kiwa minangka logaritma kemungkinan kelas standar.

Kemungkinan diitung minangka rasio kemungkinan acara sing dipérang kanthi kemungkinan ora ana kedadeyan, kayata. 0,8 / (1-0,8) sing asil yaiku 4. Dadi kita bisa nulis:

ln (rintangan) = b0 + b1 * X

Amarga kemungkinan ngalami owah-owahan log, kita nyebat log-rintangan utawa sisih kiwa.

Kita bisa ngasilake eksponen ing sisih tengen lan nulis minangka:

kemungkinan = e ^ (b0 + b1 * X)

Kabeh iki mbantu kita ngerti manawa model kasebut isih minangka kombinasi linear saka input, nanging kombinasi linear iki nuduhake probabilitas log saka kelas pra.definita.

Sinau model regresi logistik

Koefisien (nilai beta utawa b) algoritma regresi logistik diitung ing tahap sinau. Kanggo nindakake iki, kita nggunakake prakiraan kemungkinan maksimum.

Estimasi kemungkinan maksimum yaiku algoritma pembelajaran sing digunakake dening sawetara algoritma pembelajaran mesin. Koefisien sing diasilake saka model prédhiksi nilai sing cedhak banget karo 1 (contone, Lanang) kanggo kelas pra.definite lan nilai banget cedhak 0 (contone wadon) kanggo kelas liyane. Kemungkinan maksimum kanggo regresi logistik minangka prosedur nemokake nilai kanggo koefisien (Nilai Beta utawa ob) sing nyilikake kesalahan ing kemungkinan sing diprediksi dening model relatif marang sing ana ing data (contone, kemungkinan 1 yen data minangka kelas primer) .

Kita bakal nggunakake algoritma minimalisasi kanggo ngoptimalake nilai koefisien paling apik kanggo data latihan. Iki asring ditrapake praktik nggunakake algoritma optimisasi angka efisien.

Ercole Palmeri


newsletter inovasi
Aja kantun warta paling penting babagan inovasi. Mlebu kanggo nampa wong-wong mau liwat email.

Artikel anyar

Penerbit lan OpenAI menehi tandha persetujuan kanggo ngatur aliran informasi sing diproses dening Artificial Intelligence

Senin kepungkur, Financial Times ngumumake kesepakatan karo OpenAI. FT menehi lisensi jurnalisme kelas donya…

30 April 2024

Pembayaran Online: Mangkene Kepiye Layanan Streaming Nggawe Sampeyan Mbayar Selawase

Mayuta-yuta wong mbayar layanan streaming, mbayar biaya langganan saben wulan. Umume pendapat yen sampeyan…

29 April 2024

Veeam nduweni dhukungan paling lengkap kanggo ransomware, saka proteksi nganti respon lan pemulihan

Coveware dening Veeam bakal terus nyedhiyakake layanan respon insiden pemerasan cyber. Coveware bakal nawakake kemampuan forensik lan remediasi…

23 April 2024

Revolusi Ijo lan Digital: Kepiye Pangopènan Prediktif Ngowahi Industri Minyak & Gas

Pangopènan prediktif ngrevolusi sektor minyak & gas, kanthi pendekatan inovatif lan proaktif kanggo manajemen pabrik.…

22 April 2024