Tutorial

Clasificación dos algoritmos de aprendizaxe de máquinas: regresión lineal, clasificación e agrupación

Machine Learning ten grandes semellanzas coa optimización matemática, que proporciona métodos, teorías e dominios de aplicacións. 

A aprendizaxe máquina fórmase como "problemas de minimización" dunha función de perda fronte a un conxunto de exemplos dado (conxunto de adestramento) Esta característica expresa a discrepancia entre os valores previstos polo modelo que se está a formar e os valores esperados para cada instancia de exemplo. 

O obxectivo final é ensinarlle ao modelo a capacidade de predicción correcta nun conxunto de casos non presentes no conxunto de adestramento.

Un método segundo o cal é posible distinguir diferentes categorías de algoritmos é o tipo de saída esperada dun determinado sistema de aprendizaxe de máquina

Entre as principais categorías atopamos:

  • La clasificación: as entradas divídense en dúas ou máis clases e o sistema de aprendizaxe debe producir un modelo capaz de asignar unha ou varias clases entre as dispoñibles para unha entrada.Este tipo de tarefas son normalmente dirixidas empregando técnicas de aprendizaxe supervisada. 

    Un exemplo de clasificación é a asignación dunha ou varias etiquetas a unha imaxe baseada nos obxectos ou suxeitos contidos nela;

  • La regresión: conceptualmente similar á clasificación coa diferenza de que a saída ten un dominio continuo e non discreto.Xeralmente xestiona con aprendizaxe supervisada. 

    Un exemplo de regresión é a estimación da profundidade dunha escena a partir da súa representación en forma de imaxe en cor. 

    De feito, o dominio da saída en cuestión é practicamente infinito e non se limita a un determinado conxunto de posibilidades;

  • Il agrupamento: onde está un conxunto de datos divídese en grupos que, sen embargo, a diferenza da clasificación, non se coñecen a priori.A propia natureza dos problemas pertencentes a esta categoría normalmente convérteos en tarefas de aprendizaxe non supervisadas.
Modelo de regresión lineal simple

A regresión lineal é ammodelo amplamente empregado para estimar valores reais como:

  • custo das casas,
  • número de chamadas,
  • vendas totais por persoa,

e segue o criterio de variables continuas:

  • metros cadrados,
  • subscrición a unha conta actual,
  • educación da persoa

En regresión lineal, séguese unha relación entre variables independentes e variables dependentes a través dunha liña que normalmente representa a relación entre as dúas variables.

A liña de axuste coñécese como liña de regresión e represéntase por unha ecuación lineal do tipo Y = a * X + b.

A fórmula baséase en interpolar datos para asociar dúas ou máis características entre si. Cando dás ao algoritmo unha característica de entrada, a regresión devolve a outra característica.

Modelo de regresión lineal múltiple

Cando temos máis dunha variable independente, falamos de regresión lineal múltiple, asumindo un modelo como o seguinte:


y=b0 + b1x1 + b2x2 + ... + Bnxn

  • y é a resposta aos valores, é dicir, representa o resultado previsto polo modelo;
  • b0 é o intercepto, ese é o valor de y cando xi todos eles son iguais a 0;
  • a primeira característica b1 é o coeficiente de x1;
  • outra característica bn é o coeficiente de xn;
  • x1,x2, ..., Xn son as variables independentes do modelo.

Basicamente a ecuación explica a relación entre unha variable dependente continua (y) e dúas ou máis variables independentes (x1, x2, x3 ...). 

Por exemplo, se quixemos estimar a emisión de CO2 dun coche (variable dependente y) tendo en conta a potencia do motor, o número de cilindros e o consumo de combustible. Estes últimos factores son as variables independentes x1, x2 e x3. As constantes bi son números reais e denomínanse coeficientes de regresión estimados do modelo.Y é a variable dependente continua, é dicir, a suma de b0, b1 x1, b2 x2, etc. será un número real.

A análise de regresión múltiple é un método usado para identificar o efecto que as variables independentes teñen sobre unha variable dependente.

Comprender como cambia a variable dependente mentres cambian as variables independentes permítenos predecir os efectos ou impactos dos cambios en situacións reais.

Usando unha regresión lineal múltiple é posible comprender como cambia a presión arterial a medida que cambia o índice de masa corporal considerando factores como a idade, o sexo, etc., asumindo así o que podería suceder.

Con regresión múltiple podemos obter estimacións sobre tendencias de prezos, como a tendencia futura do petróleo ou do ouro.

Finalmente, a regresión lineal múltiple está a atopar un maior interese no campo da aprendizaxe automática e da intelixencia artificial xa que permite obter modelos de aprendizaxe de rendemento incluso no caso de analizar un gran número de rexistros.

Modelo de regresión loxística

A regresión loxística é unha ferramenta estatística que pretende modelar un resultado binomial cunha ou varias variables explicativas.

Úsase xeralmente para problemas binarios, onde só hai dúas clases, por exemplo Si ou Non, 0 ou 1, masculino ou feminino, etc.

Deste xeito é posible describir os datos e explicar a relación entre unha variable dependente binaria e unha ou varias variables independentes nominais ou ordinais.

O resultado determínase grazas ao uso dunha función loxística, que estima unha probabilidade e despois defiremata a clase máis próxima (positiva ou negativa) ao valor de probabilidade obtido.

Podemos considerar a regresión loxística como un método de clasificación da familia algoritmos de aprendizaxe supervisada.

Usando métodos estatísticos, a regresión loxística permite xerar un resultado que, de feito, representa unha probabilidade de que un determinado valor de entrada pertenza a unha clase dada.

En problemas de regresión loxística binomial, a probabilidade de que a saída pertenza a unha clase será P, mentres que esta pertence á outra clase 1-P (onde P é un número entre 0 e 1 porque expresa unha probabilidade).

A regresión loxística binominal funciona ben en todos aqueles casos en que a variable que intentamos predicir é binaria, é dicir, só pode asumir dous valores: o valor 1 que representa a clase positiva ou o valor 0 que representa a clase negativa.

Exemplos de problemas que se poden resolver mediante a regresión loxística son:

  • un correo electrónico é spam ou non;
  • a compra en liña é fraudulenta ou non, avaliando as condicións de compra;
  • un paciente ten unha fractura avaliando os radios.

Con regresión loxística podemos facer análises predictivas, medindo a relación entre o que queremos predicir (variable dependente) e unha ou varias variables independentes, é dicir, as características. A estimación de probabilidades faise a través dunha función loxística.

As probabilidades transfórmanse posteriormente en valores binarios e, para facer real a previsión, este resultado asignase á clase á que pertence, segundo estea ou non preto da clase.

Por exemplo, se a aplicación da función loxística devolve 0,85, entón significa que a entrada xerou unha clase positiva asignándoa á clase 1. Pola contra, se obtivera un valor como 0,4 ou máis xeralmente <0,5 ..

Boletín de innovación
Non te perdas as novidades máis importantes sobre innovación. Rexístrese para recibilos por correo electrónico.

A regresión loxística usa a función loxística para avaliar a clasificación dos valores de entrada.

A función loxística, tamén chamada sigmoide, é unha curva capaz de tomar calquera número de valor real e mapearlo a un valor entre 0 e 1, excluíndo os extremos. A función é:

onde está:

  • e: base de logaritmos naturais (número de Euler, ou función Excel exp ())
  • b0 + b1 * x: é o valor numérico real que desexa transformar.

Representación empregada para a regresión loxística

A regresión loxística usa unha ecuación como representación, como a regresión lineal

Os valores de entrada (x) combínanse linealmente usando pesos ou valores de coeficientes para predecir un valor de saída (y). Unha diferenza clave da regresión lineal é que o valor de saída modelado é un valor binario (0 ou 1) en vez de un valor numérico.

Aquí ten un exemplo de ecuación de regresión loxística:

y = e^(b0 + b1 * x) / (1 + e^(b0 + b1 * x))

En que:

  • y é a variable dependente, é dicir, o valor previsto;
  • b0 é o termo de polarización ou interceptación;
  • b1 é o coeficiente para o valor de entrada único (x).

Cada columna dos datos de entrada ten un coeficiente b asociado (un valor real constante) que se debe aprender dos datos de formación.

A representación real do modelo que almacenaría na memoria ou nun ficheiro son os coeficientes na ecuación (o valor beta ou b).

A regresión loxística prevé probabilidades (rango técnico)

A regresión loxística modela a probabilidade da clase predeterminada.

Como exemplo, imos supor que estamos modelando o sexo das persoas como varóns ou mulleres desde a súa altura, a primeira clase podería ser masculina e o modelo de regresión loxística podería escribirse como a probabilidade de que o sexo masculino sexa dado o alto dunha persoa ou máis. formalmente:

P (sexo = masculino | altura)

Escrito doutro xeito, estamos modelando a probabilidade de que unha entrada (X) pertenza á clase predefi(Y = 1), podemos escribilo como:

P(X) = P(Y = 1 | X)

A predición de probabilidade debe transformarse en valores binarios (0 ou 1) para facer unha predición de probabilidade.

A regresión loxística é un método lineal, pero as predicións transfórmanse mediante a función loxística. O impacto disto é que xa non podemos entender as predicións como unha combinación lineal de entradas como podemos con regresión lineal; por exemplo, continuando desde arriba, o modelo pode expresarse como:

p(X) = e ^ (b0 + b1 * X) / (1 + e ^ (b0 + b1 * X))

Agora podemos invertir a ecuación do seguinte xeito. Para revertilo podemos proceder eliminando o e dun lado engadindo un logaritmo natural do outro lado.

ln (p (X) / 1 - p (X)) = b0 + b1 * X

Deste xeito obtemos o feito de que o cálculo da saída da dereita é de novo lineal (o mesmo que a regresión lineal), e a entrada da esquerda é un logaritmo da probabilidade da clase predeterminada.

As probabilidades calcúlanse como unha proporción da probabilidade de suceso dividida pola probabilidade de ningún evento, por exemplo. 0,8 / (1-0,8) cuxo resultado é 4. Polo tanto, poderiamos escribir:

ln (probabilidades) = b0 + b1 * X

Dado que as probabilidades se transforman no rexistro, chamamos este log-odds ou probit do lado esquerdo.

Podemos devolver o expoñente á dereita e escribilo como:

probabilidade = e ^ (b0 + b1 * X)

Todo isto axúdanos a comprender que de feito o modelo aínda é unha combinación lineal das entradas, pero que esta combinación lineal refírese ás probabilidades logarítmicas da clase previa.definita.

Aprendizaxe do modelo de regresión loxística

Os coeficientes (valores beta ou b) do algoritmo de regresión loxística estímanse na fase de aprendizaxe. Para iso, empregamos a estimación de probabilidades máximas.

A estimación da máxima verosimilitud é un algoritmo de aprendizaxe utilizado por varios algoritmos de aprendizaxe automática. Os coeficientes resultantes do modelo predín un valor moi próximo a 1 (por exemplo, masculino) para a clase de infantildefinite e un valor moi próximo a 0 (por exemplo, feminino) para a outra clase. A probabilidade máxima de regresión loxística é un procedemento de atopar valores para os coeficientes (valores beta ou ob) que minimicen o erro nas probabilidades previstas polo modelo en relación ás dos datos (por exemplo, probabilidade 1 se os datos son a clase primaria). .

Usaremos un algoritmo de minimización para optimizar os mellores valores de coeficiente para os datos de adestramento. A miúdo ponse en práctica na práctica usando un algoritmo eficiente de optimización numérica.

Ercole Palmeri


Boletín de innovación
Non te perdas as novidades máis importantes sobre innovación. Rexístrese para recibilos por correo electrónico.

Artigos recentes

Editores e OpenAI asinan acordos para regular o fluxo de información procesada pola Intelixencia Artificial

O pasado luns, o Financial Times anunciou un acordo con OpenAI. FT licencia o seu xornalismo de clase mundial...

Abril 30 2024

Pagos en liña: aquí tes como os servizos de streaming che fan pagar para sempre

Millóns de persoas pagan por servizos de streaming, pagando taxas de subscrición mensuais. É unha opinión común que vostede...

Abril 29 2024

Veeam ofrece o soporte máis completo para ransomware, desde a protección ata a resposta e a recuperación

Coveware by Veeam continuará ofrecendo servizos de resposta a incidentes de extorsión cibernética. Coveware ofrecerá capacidades forenses e de remediación...

Abril 23 2024

Revolución verde e dixital: como o mantemento preditivo está a transformar a industria do petróleo e do gas

O mantemento preditivo está a revolucionar o sector do petróleo e do gas, cun enfoque innovador e proactivo para a xestión das plantas...

Abril 22 2024