머신러닝과 머신러닝의 분류

Updated:

머신러닝이란

  • 프로그램의 한 종류로 데이터를 학습할 수 있는 알고리즘을 주어서 컴퓨터가 어떤 경우에 대해서 예측할 수 있도록 하는 프로그래밍 방법
  • 자율주행 프로그램이나 스팸메일 분류 프로그램은 경우의 수가 너무 많기 때문에 Explicit programming이 불가능
    • Explicit programming : 모든 경우의 수를 다 처리해 주는 방법
  • 프로그래머가 컴퓨터에게 데이터와 데이터를 학습할 수 있는 알고리즘을 주어서 컴퓨터가 어떤 경우에 대해서 예측할 수 있도록 하는 프로그래밍 방법

머신러닝의분류

1. 지도학습

레이블된 훈련 데이터를 활용하여 모델을 학습시켜 본적 없는 가까운 미래
데이터에 대해 예측값을 출력하는 것
  • 학습(훈련)이 필요

1. 분류(Classification)

  • 개별 클래스 레이블이 있는 지도학습
  • 과거의 관측 => 새로운 샘플의 범주형 클래스 레이블을 예측
  • ex)광고성 이메일 필터링
    • 클래스 레이블은 이산적/순서가 없음
    • 이진 분류작업을 한다
    • 결정 경계(Decision boundery)

      두 클래스를 나누는 기준
      
  • ex)손글씨 인식
    • 다중 분류

2. 회귀(Regression)

  • 데이터가 주어졌을 연속적인 출력값을 예측하는 기법
  • 머신러닝 알고리즘은 입력 데이터와 출력값이 주어졌을 때 두 변수 사이의 관계를 탐색
  • ex) 프로게이머 지망생
    • 연습량 데이터를 분석해 점수 예측

2. 비지도학습

  • 레이블되지 않은 데이터 구조를 알 수 없는 데이터를 다룬다
  • 출력값이나 보상함수 없이도 의미있는 정보를 추출 데이터 구조 탐색

1. 군집

군집

  • 사전정보 없이 쌓여있는 그룹 정보를 의미 있는 서브그룹 또는 클러스터로 조직하는 탐색적 분석 기법이다.
  • 각 클러스터는 유사성을 공유하고 다른 데이터(클러스터)와 구분되는 그룹을 형성한다

2. 차원 축소

  • 고차원의 데이터를 저차원으로 축소(압축)하는 기법

3. 강화학습

  • 지도학습과 비슷하지만 완전한 답(Label)을 제공하지 않는 특징이 있다.
  • 기계는 더 많은 보상을 얻을 수 있는 방향으로 행동을 학습 강화학습
  • 행동을 어게 보상할지 측정 방법을 정의
  • 시행착오를 격는 탐험과 같다
  • ex)게임

머신러닝과 vs 딥러닝

훈련데이터 크기 작음
시스템 성능 저 사양 고 사양
feature선택 전문가(사람) 알고리즘
feature수 많음 적음
문제 해결 접근법 문제를 분리->각각 답을 얻음->결과 통합 end-to-end(결과를 바로 얻음)
실행 시간 짧음
해석력 해석 가능 해석 어려움

Leave a comment