1장. 머신러닝과 데이터 과학 이해하기

Updated:

데이터 과학 Data Science

데이터 과학이 이슈가 된 이유

  • 4차 산업혁명, 머신러닝, 인공지능
  • 시대적 요구
  • 데이터 = 자산

데이터 과학의 활용 사례

  • 사기탐기(ex PayPal => 핀테크)
  • 유통경로(ex 매출예측)
  • 자동차(ex 운전습관 => 보험금예측)
  • 최고 데이터 책임자(chief data officer,CDO)

데이터 과학의 정의 및 반전 방향

  • 컴퓨터를 활용해서 데이터를 분석하고 현실의 문제를 해결하는 작업
  1. Descriptive Analytics(What?)
    • 기술통계
  2. Diagnostic Analytics(Why?)
    • 전통적 통계분석
  3. Predictive Analytics(Future?)
    • 미래, 예측, 머신러닝, 의사결정
  4. Prescriptive Analytics(Action?)
    • Analytics 4.0 예측 -> 행동 자율주행차, 알파고

데이터 과학의 특징 및 목표

  • 데이터 과학은 융합형 인재를 원한다

  • 목표

    • Decision Making(의사결정)
    • Monetization(수익화)

머신러닝과 다른 분석 방법 비교

  • 빅데이터 분석 vs 통계 분석 vs 머신러닝
  • 빅데이터 분석
    • 상관관계를 찾는 데이터 분석 방식
    • 그로스해킹
    • 마케팅
  • 통계분석
    • 실제 세계를 이해하고 해석하는 것
    • 모형에서 나오는 통계치, 수치, 가정
    • 적은 데이터를 가지고 진행해왔음

머신러닝 Machine learning

  • 예측과 패턴분석
  • 정확도, 성능이 중요
  • 많은 데이터가 필요

머신러닝이란?

  • 컴퓨터가 데이터로부터 스스로 학습을 할 수 있도록 프로그래밍하는 과학적인 활동이다
  • 가설을 검증해나가는 과정
  • 자동화 시스템
  • 발전 배경
    • 많은 데이터
    • 알고리즘 개선
    • 컴퓨터 하드웨어의 개선

전통적인 접근 방법

  1. 문제파악, 문제정의
  2. 규칙 작성
  3. 평가
  4. 에러 확인 문제에 반영 -> 1. 부터 다시 반복
  5. 평가
  6. 서비스 도입

머신러닝 접근 방법

  1. 문제파악, 문제정의
  2. 머신러닝 모델 학습
  3. 평가
  4. 에러 확인 문제에 반영 -> 1. 부터 다시 반복
  5. 평가
  6. 서비스 도입
  7. 데이터 업데이트 -> 2. 에 대입
    • 과정의 자동화

Tags:

Categories:

Updated:

Leave a comment