머신러닝과 머신러닝의 분류
Updated:
머신러닝이란
- 프로그램의 한 종류로 데이터를 학습할 수 있는 알고리즘을 주어서 컴퓨터가 어떤 경우에 대해서 예측할 수 있도록 하는 프로그래밍 방법
- 자율주행 프로그램이나 스팸메일 분류 프로그램은 경우의 수가 너무 많기 때문에 Explicit programming이 불가능
- Explicit programming : 모든 경우의 수를 다 처리해 주는 방법
- 프로그래머가 컴퓨터에게 데이터와 데이터를 학습할 수 있는 알고리즘을 주어서 컴퓨터가 어떤 경우에 대해서 예측할 수 있도록 하는 프로그래밍 방법
1. 지도학습
레이블된 훈련 데이터를 활용하여 모델을 학습시켜 본적 없는 가까운 미래
데이터에 대해 예측값을 출력하는 것
- 학습(훈련)이 필요
1. 분류(Classification)
- 개별 클래스 레이블이 있는 지도학습
- 과거의 관측 => 새로운 샘플의 범주형 클래스 레이블을 예측
- ex)광고성 이메일 필터링
- 클래스 레이블은 이산적/순서가 없음
- 이진 분류작업을 한다
-
결정 경계(Decision boundery)
두 클래스를 나누는 기준
- ex)손글씨 인식
- 다중 분류
2. 회귀(Regression)
- 데이터가 주어졌을 연속적인 출력값을 예측하는 기법
- 머신러닝 알고리즘은 입력 데이터와 출력값이 주어졌을 때 두 변수 사이의 관계를 탐색
- ex) 프로게이머 지망생
- 연습량 데이터를 분석해 점수 예측
2. 비지도학습
- 레이블되지 않은 데이터 구조를 알 수 없는 데이터를 다룬다
- 출력값이나 보상함수 없이도 의미있는 정보를 추출 데이터 구조 탐색
1. 군집
- 사전정보 없이 쌓여있는 그룹 정보를 의미 있는 서브그룹 또는 클러스터로 조직하는 탐색적 분석 기법이다.
- 각 클러스터는 유사성을 공유하고 다른 데이터(클러스터)와 구분되는 그룹을 형성한다
2. 차원 축소
- 고차원의 데이터를 저차원으로 축소(압축)하는 기법
3. 강화학습
- 지도학습과 비슷하지만 완전한 답(Label)을 제공하지 않는 특징이 있다.
- 기계는 더 많은 보상을 얻을 수 있는 방향으로 행동을 학습
- 행동을 어게 보상할지 측정 방법을 정의
- 시행착오를 격는 탐험과 같다
- ex)게임
머신러닝과 vs 딥러닝
훈련데이터 크기 | 작음 | 큼 |
시스템 성능 | 저 사양 | 고 사양 |
feature선택 | 전문가(사람) | 알고리즘 |
feature수 | 많음 | 적음 |
문제 해결 접근법 | 문제를 분리->각각 답을 얻음->결과 통합 | end-to-end(결과를 바로 얻음) |
실행 시간 | 짧음 | 김 |
해석력 | 해석 가능 | 해석 어려움 |
Leave a comment