tutorial

Classificació dels algorismes d'aprenentatge de màquines: regressió lineal, classificació i agrupació

L’aprenentatge automàtic té grans similituds amb l’optimització matemàtica, que proporciona mètodes, teories i dominis d’aplicació. 

L’aprenentatge automàtic es formula com a “problemes de minimització” d’una funció de pèrdua davant d’un conjunt d’exemples determinat (conjunt d’entrenament). Aquesta funció expressa la discrepància entre els valors predits pel model que s’està entrenant i els valors esperats per a cada instància d’exemple. 

L’objectiu final és ensenyar al model la capacitat de predir correctament en un conjunt d’instàncies no presents al conjunt d’entrenament.

Un mètode segons el qual és possible distingir diferents categories d'algorisme és el tipus de sortida que s'espera d'un determinat sistema de màquina d'aprenentatge

Entre les principals categories trobem:

  • La classificació: les entrades es divideixen en dues o més classes i el sistema d’aprenentatge ha de produir un model capaç d’assignar una o més classes entre les que hi ha disponibles.Aquest tipus de tasques se solen abordar mitjançant tècniques d’aprenentatge supervisat. 

    Un exemple de classificació és l'assignació d'una o més etiquetes a una imatge basada en els objectes o subjectes continguts en ella;

  • La regressió: conceptualment similar a la classificació amb la diferència que la sortida té un domini continu i no discret.Generalment es gestiona amb aprenentatge dirigit. 

    Un exemple de regressió és l'estimació de la profunditat d'una escena a partir de la seva representació en forma d'imatge en color. 

    De fet, el domini de la sortida en qüestió és pràcticament infinit i no es limita a un determinat conjunt discret de possibilitats;

  • Il agrupament: on és un conjunt de dades es divideix en grups que, però, a diferència de la classificació, no es coneixen a priori.La naturalesa dels problemes pertanyents a aquesta categoria els fa normalment tasques d'aprenentatge no supervisades.
Model de regressió lineal simple

La regressió lineal és ammodel àmpliament utilitzat per estimar valors reals com:

  • cost de les cases,
  • nombre de trucades,
  • vendes totals per persona,

i segueix el criteri de les variables contínues:

  • metres quadrats,
  • subscripció a un compte corrent,
  • educació de la persona

En regressió lineal, se segueix una relació entre variables independents i variables dependents mitjançant una línia que normalment representa la relació entre les dues variables.

La línia d'ajustament es coneix com a línia de regressió i es representa amb una equació lineal del tipus Y = a * X + b.

La fórmula es basa en interpolar dades per associar dues o més característiques entre si. Quan dónes a l'algorisme una característica d'entrada, la regressió retorna l'altra característica.

Model de regressió lineal múltiple

Quan tenim més d'una variable independent, es parla de regressió lineal múltiple, assumint un model com el següent:


y=b0 + b1x1 + b2x2 + ... + Bnxn

  • y és la resposta als valors, és a dir, representa el resultat previst pel model;
  • b0 és l’intercepció, és a dir el valor de y quan xi tots són iguals a 0;
  • la primera característica b1 és el coeficient de x1;
  • una altra característica bn és el coeficient de xn;
  • x1,x2, ..., Xn són les variables independents del model.

A la pràctica, l'equació explica la relació entre una variable depenent contínua (y) i dues o més variables independents (x1, x2, x3 ...). 

Per exemple, si volíem estimar l’emissió de CO2 d’un cotxe (variable dependent y) tenint en compte la potència del motor, el nombre de cilindres i el consum de combustible. Aquests últims factors són les variables independents x1, x2 i x3. Les constants bi són nombres reals i s’anomenen coeficients de regressió estimats del model.Y és la variable depenent contínua, és a dir, és la suma de b0, b1 x1, b2 x2, etc. i serà un nombre real.

L’anàlisi de regressió múltiple és un mètode utilitzat per identificar l’efecte que les variables independents tenen sobre una variable dependent.

Comprendre com canvia la variable dependent a mesura que canvien les variables independents ens permet predir els efectes o els impactes dels canvis en situacions reals.

Utilitzant una regressió lineal múltiple, és possible comprendre com canvia la pressió arterial a mesura que canvia l’índex de massa corporal considerant factors com l’edat, el sexe, etc., assumint així què podria passar.

Amb una regressió múltiple, podem obtenir estimacions sobre tendències de preus, com ara la tendència futura del petroli o l’or.

Finalment, la regressió lineal múltiple està trobant un major interès en el camp de l'aprenentatge automàtic i la intel·ligència artificial, ja que permet obtenir models d'aprenentatge de rendiment fins i tot en el cas d'un gran nombre de registres a analitzar.

Model de regressió logística

La regressió logística és una eina estadística que pretén modelar un resultat binomial amb una o més variables explicatives.

Generalment s’utilitza per a problemes binaris, on només hi ha dues classes, per exemple Sí o No, 0 o 1, masculí o femení, etc.

D’aquesta manera és possible descriure les dades i explicar la relació entre una variable depenent binària i una o més variables nominals o ordinals independents.

El resultat es determina gràcies a l'ús d'una funció logística, que estima una probabilitat i després defiacaba la classe més propera (positiva o negativa) al valor de probabilitat obtingut.

Es pot considerar la regressió logística com un mètode per classificar la família de Algorismes d’aprenentatge supervisat.

Mitjançant mètodes estadístics, la regressió logística permet generar un resultat que, de fet, representa una probabilitat que un determinat valor d'entrada pertanyi a una classe determinada.

En problemes de regressió logística binòmica, la probabilitat que la sortida pertanyi a una classe sigui P, mentre que pertany a l'altra classe 1-P (on P és un nombre entre 0 i 1 perquè expressa una probabilitat).

La regressió logística binomina funciona bé en tots aquells casos en què la variable que estem tractant de predir és binària, és a dir, només pot prendre dos valors: el valor 1 que representa la classe positiva o el valor 0 que representa la classe negativa.

Exemples de problemes que es poden solucionar mitjançant la regressió logística són:

  • un correu electrònic és spam o no;
  • una compra en línia és fraudulenta o no, avaluant les condicions de compra;
  • un pacient presenta una fractura, avaluant-ne els radis.

Amb la regressió logística podem fer anàlisis predictius, mesurant la relació entre allò que volem predir (variable dependent) i una o més variables independents, és a dir, característiques. L’estimació de probabilitats es fa mitjançant una funció logística.

Les probabilitats es transformen posteriorment en valors binaris i, per tal de fer real la predicció, aquest resultat s’assigna a la classe a la qual pertany, en funció de si està o no a prop de la classe en si.

Per exemple, si l'aplicació de la funció logística retorna 0,85, vol dir que l'entrada ha generat una classe positiva assignant-la a la classe 1. Viceversa si hagués obtingut un valor com 0,4 o més generalment <0,5 ..

Butlletí d'innovació
No et perdis les notícies més importants sobre innovació. Registra't per rebre'ls per correu electrònic.

La regressió logística utilitza la funció logística per avaluar la classificació dels valors d’entrada.

La funció logística, també anomenada sigmoide, és una corba capaç de prendre qualsevol nombre de valor real i mapar-lo fins a un valor entre 0 i 1, excepte els extrems. La funció és:

on és:

  • e: base dels logaritmes naturals (el nombre d'Euler, o la funció excel exp ())
  • b0 + b1 * x: és el valor numèric real que voleu transformar.

Representació utilitzada per a la regressió logística

La regressió logística utilitza una equació com a representació, com la regressió lineal

Els valors d’entrada (x) es combinen linealment amb peses o valors de coeficients, per predir un valor de sortida (y). Una diferència clau respecte a la regressió lineal és que el valor de sortida modelat és un valor binari (0 o 1) més que un valor numèric.

A continuació, es mostra un exemple d'equació de regressió logística:

y = e^(b0 + b1 * x) / (1 + e^(b0 + b1 * x))

on:

  • y és la variable dependent, és a dir, el valor previst;
  • b0 és el terme de polarització o interceptació;
  • b1 és el coeficient per al valor d'entrada únic (x).

Cada columna de les dades d’entrada té un coeficient b associat (un valor real constant) que s’ha d’aprendre de les dades de formació.

La representació real del model que emmagatzemareu a la memòria o a un fitxer són els coeficients de l’equació (el valor beta o b).

La regressió logística prediu probabilitats (abast tècnic)

La regressió logística modelitza la probabilitat de la classe predeterminada.

Com a exemple, suposem que estem modelant el sexe de les persones com a masculí o femení des de la seva alçada, la primera classe podria ser masculina i el model de regressió logística es podria escriure com la probabilitat de ser masculí donat l'alçada d'una persona o més. formalment:

P (sexe = masculí | alçada)

Escrit d'una altra manera, estem modelant la probabilitat que una entrada (X) pertanyi a la classe predefinit (Y = 1), podem escriure-ho com:

P(X) = P(Y = 1 | X)

La predicció de probabilitats s’ha de transformar en valors binaris (0 o 1) per tal de fer realment una predicció de probabilitat.

La regressió logística és un mètode lineal, però les prediccions es transformen mitjançant la funció logística. L’impacte d’això és que ja no podem entendre les prediccions com una combinació lineal d’entrades com podem amb regressió lineal, per exemple, continuant des de dalt, el model es pot expressar com:

p(X) = e ^ (b0 + b1 * X) / (1 + e ^ (b0 + b1 * X))

Ara podem invertir l’equació de la manera següent. Per revertir-la, podem procedir eliminant l'e per un costat afegint un logaritme natural a l'altre costat.

ln (p (X) / 1 - p (X)) = b0 + b1 * X

D’aquesta manera s’obté que el càlcul de la sortida a la dreta és de nou lineal (igual que la regressió lineal), i l’entrada a l’esquerra és un logaritme de la probabilitat de la classe predeterminada.

Les probabilitats es calculen com una proporció de la probabilitat de l'esdeveniment dividida per la probabilitat que no hi hagi cap esdeveniment, per exemple. 0,8 / (1-0,8) el resultat és 4. Per tant, podríem escriure:

ln (probabilitats) = b0 + b1 * X

Com que les probabilitats es transformen en registre, anomenem a aquest log-odds o probit de registre esquerre.

Podem tornar l’exponent a la dreta i escriure’l com a:

probabilitat = e ^ (b0 + b1 * X)

Tot això ens ajuda a entendre que, de fet, el model encara és una combinació lineal de les entrades, però que aquesta combinació lineal es refereix a les probabilitats logarítmiques de la classe prèvia.definita.

Aprenentatge del model de regressió logística

Els coeficients (valors beta o b) de l’algoritme de regressió logística s’estimen a la fase d’aprenentatge. Per fer-ho, utilitzem la màxima estimació de probabilitats.

L'estimació de màxima probabilitat és un algorisme d'aprenentatge utilitzat per diversos algorismes d'aprenentatge automàtic. Els coeficients resultants del model prediuen un valor molt proper a 1 (per exemple, masculí) per a la classe d'educació infantildefinit i un valor molt proper a 0 (per exemple, femení) per a l'altra classe. La màxima probabilitat de regressió logística és un procediment per trobar valors per a coeficients (valors beta o ob) que minimitzin l'error en les probabilitats previstes pel model en relació amb les de les dades (per exemple, probabilitat 1 si les dades són la classe primària) .

Utilitzarem un algorisme de minimització per optimitzar els millors valors de coeficients per a les dades de formació. Sovint s’implementa a la pràctica mitjançant un algorisme d’optimització numèrica eficient.

Ercole Palmeri


Butlletí d'innovació
No et perdis les notícies més importants sobre innovació. Registra't per rebre'ls per correu electrònic.

Articles recents

Els avantatges de les pàgines per pintar per a nens: un món de màgia per a totes les edats

El desenvolupament de la motricitat fina a través del color prepara els nens per a habilitats més complexes com escriure. Per acolorir...

2 maig 2024

El futur és aquí: com la indústria naviliera està revolucionant l'economia global

El sector naval és una veritable potència econòmica mundial, que ha navegat cap a un mercat de 150 milions...

1 maig 2024

Els editors i OpenAI signen acords per regular el flux d'informació processada per la Intel·ligència Artificial

Dilluns passat, el Financial Times va anunciar un acord amb OpenAI. FT autoritza el seu periodisme de classe mundial...

30 2024 abril

Pagaments en línia: aquí teniu com els serveis de streaming us fan pagar per sempre

Milions de persones paguen per serveis de streaming, pagant quotes de subscripció mensuals. És l'opinió comuna que tu...

29 2024 abril