informática

Tipos de aprendizado de máquina

O termo Machine Learning (aprendizagem automática) refere-se a um conjunto de mecanismos pertencentes ao mundo da inteligência artificial. Existem três tipos de aprendizado de máquina: aprendizado supervisionado, não supervisionado e aprendizado por reforço.

Esses mecanismos permitem que uma máquina inteligente melhore suas capacidades e desempenho ao longo do tempo, aprendendo automaticamente com a experiência a realizar certas tarefas, melhorando seu desempenho cada vez mais com o tempo. 

Um exemplo é AlphaGo, software de aprendizado de máquina para o jogo Go desenvolvido por DeepMind. AlpaGo foi o primeiro software capaz de derrotar um mestre humano no jogo em um avião goban tamanho padrão (19 × 19). O software AlphaGo foi educado observando milhões de movimentos feitos por jogadores de Go durante diferentes jogos e fazendo a máquina jogar contra si mesma, com o resultado de que foi capaz de vencer o que se acreditava ser o melhor jogador do mundo desse jogo.

Vamos agora entrar nas três categorias principais de aprendizado de máquina.

Aprendizado supervisionado

O sistema recebe exemplos rotulados de acordo com a saída desejada. Ou seja, os conjuntos de dados úteis para instruir a máquina são compostos por elementos que representam situações reais compostos por dados de entrada "características"E dos dados de saída"alvo". Com referência ao exemplo do artigo O que é Machine Learning, do que se trata e seus objetivos, a preparação do treinamento foi do tipo supervisionado, pois tivemos casos individuais de rotas, para cada uma das quais foram especificadas características (veículo, rota) e destino (tempo de viagem). Os conjuntos de dados costumam ser bem mais complexos, o exemplo foi extremamente limitado e didático, com o objetivo de simplificar o entendimento do Aprendizado de Máquina Supervisionado.

Um caso deste tipo permite que o algoritmo estude a base do tipo de rota e veículo, qual poderia ser o tempo de viagem. Existem dois tipos de problemas no aprendizado de máquina supervisionado:

  1. regressão: quando o alvo é composto por uma variável contínua, que é uma quantidade, um número;
  2. classificação: quando o destino pode ser representado por uma classe ou categoria.

Retomando o exemplo das autoestradas, podemos dizer que se trata de uma regressão. Se a meta consistia em uma avaliação como: rápido se inferior a uma hora, lento entre 1 e duas horas, muito lento se superior a duas horas. Neste caso, teria sido um problema de classificação.

Aprendizado não supervisionado

Não há dados rotulados, é o sistema que, a partir das entradas, deve encontrar uma estrutura nos dados. Praticamente não temos metas, mas apenas dados de entrada. Como se no exemplo tivéssemos apenas os dados da rota e do veículo, mas não os dados do tempo de viagem.

Nesta abordagem, os algoritmos devem identificar categorias procurando por estruturas ocultas nos dados. As principais ferramentas que podem ser utilizadas na abordagem não supervisionada são a agrupamento e regras de associação.

Boletim de inovação
Não perca as notícias mais importantes sobre inovação. Cadastre-se para recebê-los por e-mail.

Aprendizado por reforço

O sistema recebe entrada do ambiente e executa ações. O sistema tenta realizar ações para receber recompensas. O sistema tentará implementar ações que otimizem a recompensa dependendo do estado do ambiente ao redor. 

O sistema de recompensas é implementado através de um componente, chamado agente. O agente decide uma ação a ser realizada no ambiente e desta recebe um recompensa e eventualmente informações sobre o estado do ambiente, em consequência da acção iniciada.

Por exemplo, se pensarmos em um sistema dedicado ao jogo de xadrez, o agente é o componente que decide a jogada, o ambiente é o próprio jogo. Como consequência de cada movimento feito pelo agente, o estado do jogo muda (entendido como a situação atual, posição de todas as peças, também como consequência do movimento do oponente), recebendo feedback como uma peça do oponente comida, portanto pretendido como uma recompensa para o movimento. Desta forma, o agente aprende e se educa.

conclusões

Fica evidente, portanto, que a escolha entre os tipos de aprendizado de máquina depende do contexto. Ou seja, o tipo de abordagem é escolhido com base nos dados disponíveis e na possibilidade de ter um histórico que inclua a descrição das circunstâncias de cada caso individual (entrada) e também um resultado (saída). Portanto, com um conjunto de dados desse tipo, você pode continuar usando uma abordagem supervisionada.

Se, por outro lado, você não tem a possibilidade de conhecer os dados de saída (destino) a priori, ou deseja descobrir novos alvos, então é necessário identificar links entre os dados de entrada para descobrir circunstâncias nunca vivenciadas no história, ou enfrentar um aprendizado para um ambiente que evolui e reage. Neste caso é necessário optar por técnicas não supervisionadas ou de reforço.

Ercole Palmeri: Viciado em inovação


Boletim de inovação
Não perca as notícias mais importantes sobre inovação. Cadastre-se para recebê-los por e-mail.

Artigos recentes

O futuro está aqui: como a indústria naval está revolucionando a economia global

O setor naval é uma verdadeira potência económica global, que navegou para um mercado de 150 mil milhões...

1 Maio 2024

Editoras e OpenAI assinam acordos para regular o fluxo de informações processadas por Inteligência Artificial

Na segunda-feira passada, o Financial Times anunciou um acordo com a OpenAI. O FT licencia seu jornalismo de classe mundial…

Abril 30 2024

Pagamentos online: veja como os serviços de streaming fazem você pagar para sempre

Milhões de pessoas pagam por serviços de streaming, pagando assinaturas mensais. É opinião comum que você…

Abril 29 2024

A Veeam oferece o suporte mais abrangente para ransomware, desde proteção até resposta e recuperação

A Coveware by Veeam continuará a fornecer serviços de resposta a incidentes de extorsão cibernética. A Coveware oferecerá recursos forenses e de remediação…

Abril 23 2024