정보학

머신 러닝의 유형

기계 학습(자동 학습)이라는 용어는 인공 지능 세계에 속하는 일련의 메커니즘을 나타냅니다. 기계 학습에는 지도 학습, 비지도 학습, 강화 학습의 세 가지 유형이 있습니다.

이러한 메커니즘을 통해 지능형 기계는 시간이 지남에 따라 기능과 성능을 향상시키고 특정 작업을 수행하는 경험을 자동으로 학습하여 시간이 지남에 따라 성능을 향상시킬 수 있습니다.

예는 알파 고, 에서 개발한 바둑 게임용 머신 러닝 소프트웨어 Deepmind. AlpaGo는 비행기에서 게임에서 인간 마스터를 물리칠 수 있는 최초의 소프트웨어였습니다. 고반 표준 크기(19 × 19). AlphaGo 소프트웨어는 다양한 게임에서 바둑 선수가 수행하는 수백만 번의 움직임을 관찰하고 기계가 스스로 플레이하게 함으로써 교육을 받았으며, 그 결과 이 게임의 세계에서 가장 뛰어난 선수로 여겨지는 선수를 이길 수 있었습니다.

이제 머신 러닝의 세 가지 주요 범주로 이동해 보겠습니다.

지도 학습

시스템은 원하는 출력에 따라 레이블이 지정된 예제를 수신합니다. 즉, 기계에 지시하는 데 유용한 데이터셋은 입력 데이터로 구성된 실제 상황을 나타내는 요소로 구성됩니다.풍모"그리고 출력 데이터에서"목표". 기사의 예를 참조하여 기계 학습이란 무엇이며 기계 학습에 대한 내용과 목표, 교육의 준비는 경로의 개별 사례가 있었기 때문에 지도형으로 준비되었으며 각각의 기능(차량, 경로) 및 대상(이동 시간)이 지정되었습니다. 데이터 세트는 일반적으로 훨씬 더 복잡하며, 이 예는 지도 머신 러닝에 대한 이해를 단순화하기 위한 목적으로 극히 제한적이고 교훈적이었습니다.

이 유형의 경우 알고리즘은 경로 및 차량 유형, 이동 시간의 기초를 연구할 수 있습니다. 지도 머신 러닝에는 두 가지 유형의 문제가 있습니다.

회귀: 목표가 연속변수, 즉 수량, 숫자로 구성된 경우;
분류: 대상을 클래스나 카테고리로 표현할 수 있는 경우.

고속도로 노선의 예를 다시 생각해 보면 회귀라고 할 수 있습니다. 대상이 다음과 같은 평가로 구성된 경우: 1시간 미만이면 빠름, XNUMX~XNUMX시간 사이에는 느림, XNUMX시간 이상이면 매우 느림. 이 경우 분류 문제가 되었을 것입니다.

비지도 학습

레이블이 지정된 데이터가 없습니다. 입력에서 시작하여 데이터에서 구조를 찾아야 하는 것은 시스템입니다. 실제로 목표는 없고 입력 데이터만 있습니다. 예에서와 같이 경로와 차량 데이터만 있고 이동 시간 데이터는 없습니다.

이 접근 방식에서 알고리즘은 데이터에서 숨겨진 구조를 찾아 범주를 식별해야 합니다. 비지도 접근 방식에서 사용할 수 있는 주요 도구는 다음과 같습니다. 클러스터링 과 연결 규칙.

강화 학습

시스템은 환경으로부터 입력을 받고 조치를 취합니다. 시스템은 보상을 받기 위해 조치를 취하려고 합니다. 시스템은 주변 환경의 상태에 따라 보상을 최적화하는 작업을 구현하려고 합니다.

보상 시스템은 대리인. 에이전트는 환경에 대해 수행할 조치를 결정하고 이로부터 하나를 받습니다. 보상 그리고 아마도 시작된 행동의 결과로서 환경의 상태에 대한 정보.

예를 들어 체스 게임 전용 시스템을 생각하면 에이전트는 이동을 결정하는 구성 요소이고 환경은 게임 자체입니다. 에이전트가 수행한 모든 단일 이동의 결과로 게임 상태가 변경되고(현재 상황, 모든 조각의 위치, 또한 상대 이동의 결과로 이해됨) 상대방의 조각을 먹은 것으로 피드백을 수신하므로 이동에 대한 보상으로 의도되었습니다. 이러한 방식으로 에이전트는 스스로 학습하고 교육합니다.

결론

따라서 머신 러닝 유형 간의 선택은 컨텍스트에 따라 다릅니다. 즉, 접근 방식의 유형은 사용 가능한 데이터와 각 개별 사례의 상황에 대한 설명(입력) 및 결과(출력)를 포함하는 이력을 가질 가능성을 기반으로 선택됩니다. 따라서 이 유형의 데이터 세트를 사용하면 감독 방식을 계속 사용할 수 있습니다.

반면에 출력 데이터(타겟)를 선험적으로 알 가능성이 없거나 새로운 타겟을 찾고자 한다면, 입력 데이터 간의 연결고리를 파악하여 한 번도 경험하지 못한 상황을 발견할 필요가 있습니다. 또는 진화하고 반응하는 환경에 대한 학습에 직면합니다. 이 경우 비지도 또는 강화 기술을 선택해야 합니다.

Ercole Palmeri: 혁신 중독