1장. 머신러닝과 데이터 과학 이해하기
Updated:
데이터 과학 Data Science
데이터 과학이 이슈가 된 이유
- 4차 산업혁명, 머신러닝, 인공지능
- 시대적 요구
- 데이터 = 자산
데이터 과학의 활용 사례
- 사기탐기(ex PayPal => 핀테크)
- 유통경로(ex 매출예측)
- 자동차(ex 운전습관 => 보험금예측)
- 최고 데이터 책임자(chief data officer,CDO)
데이터 과학의 정의 및 반전 방향
- 컴퓨터를 활용해서 데이터를 분석하고 현실의 문제를 해결하는 작업
- Descriptive Analytics(What?)
- 기술통계
- Diagnostic Analytics(Why?)
- 전통적 통계분석
- Predictive Analytics(Future?)
- 미래, 예측, 머신러닝, 의사결정
- Prescriptive Analytics(Action?)
- Analytics 4.0 예측 -> 행동 자율주행차, 알파고
데이터 과학의 특징 및 목표
-
데이터 과학은 융합형 인재를 원한다
-
목표
- Decision Making(의사결정)
- Monetization(수익화)
머신러닝과 다른 분석 방법 비교
- 빅데이터 분석 vs 통계 분석 vs 머신러닝
- 빅데이터 분석
- 상관관계를 찾는 데이터 분석 방식
- 그로스해킹
- 마케팅
- 통계분석
- 실제 세계를 이해하고 해석하는 것
- 모형에서 나오는 통계치, 수치, 가정
- 적은 데이터를 가지고 진행해왔음
머신러닝 Machine learning
- 예측과 패턴분석
- 정확도, 성능이 중요
- 많은 데이터가 필요
머신러닝이란?
- 컴퓨터가 데이터로부터 스스로 학습을 할 수 있도록 프로그래밍하는 과학적인 활동이다
- 가설을 검증해나가는 과정
- 자동화 시스템
- 발전 배경
- 많은 데이터
- 알고리즘 개선
- 컴퓨터 하드웨어의 개선
전통적인 접근 방법
- 문제파악, 문제정의
- 규칙 작성
- 평가
- 에러 확인 문제에 반영 -> 1. 부터 다시 반복
- 평가
- 서비스 도입
머신러닝 접근 방법
- 문제파악, 문제정의
- 머신러닝 모델 학습
- 평가
- 에러 확인 문제에 반영 -> 1. 부터 다시 반복
- 평가
- 서비스 도입
- 데이터 업데이트 -> 2. 에 대입
- 과정의 자동화
Leave a comment