3장. 확률
Updated:
사건과 확률의 개념
모집단과 표본
- 정보를 얻고자 하는 관심 대산의 전체집합 모집단을 통째로 조사하는 것은 어렵다 모집단의 일부를 표본으로 추출 표본으로 모집단의 정보를 추론함
- 모집단(Population)
- 조사의 관심이 되는 전체 집단
- 표본(Sample)
- 모집단에서 일부를 표집(샘플링)하여 실제 조사한 대상
- 모수(Parameter)
- 모집단으로부터 계산된 모든 값, 미지의 수
- 통계량(Statics)
- 표본으로부터 계산된 모든 값, 모수의 추정
확률
- 여러 가능한 결과 중 하나 또는 일부가 일어날 가능성
- 0과 1 사이의 값으로 정의
확률의 용어
- 실험(Experiment) 또는 시행(Trial)
- 여러 가능한 결과 중 하나가 일어나도록 하는 행위
- 표본공간(Sample Space)
- 실험에서 나타날 수 있는 모든 결과들을 모아둔 집합
- (ΩorS)
- 사건(Event)
- 표본공간의 일부분(부분집합)
- 사건 A가 일어날 확률: P(A) 또는 Pr(A)
- 예)
예) 동전을 던지는 실험앞면: H, 뒷면: T ,표본공간Ω={H,T}으로표시
앞면이나오는사건은A={H}이므로P(A) = 0.5 = 1/2
- 추출 방법
- 복원추출
- 모든 시행에서 똑같은 상황으로 시행하는 방법
- 비복원추출
- 앞의 시행이 다음 시행에 영향을 주는 방법
- 복원추출
경우의 수
- 사건의 원소의 개수(사건에 속하는 결과의 수)
- 1회 시행에서 일어날 수 있는 사건의 가짓수
- 사건의 경우의 수
사건의 기본적인 연산
- A의 여사건
- 사건 A에 포함되지 않은 사건들의 집합
- A^c로 표시
- A와 B의 합사건
- 사건 A 혹은 B에 포함되는 사건들의 집합
- AUB로 표시
- A와 B의 곱사건
- 사건 A와 B에 동시에 포함되는 사건들의 집합
- A∩B로표시
- 배반 사건
- 동시에 일어날 수 없는 두 사건
- A∩B= 0인두사건
경우의 수의 계산
- 합의 법칙
- 두사건 A와 B가 일어나는 경우의 수가 각각 m과n
- 두사건 A와 B가 동시에 일어나지 않음
- 사건A 또는 B가 일어나는 경우의 수는 m+n
- 곱의 법칙
- 두사건 A와 B가 일어나는 경우의 수가 각각 m과n
- 두사건 A와 B가 동시에 또는 잇달아 일어남
- 이때의 경우의 수는 m*n
팩토리얼(!)
- 팩토리얼의 정의
- 1부터 어떤 양의 정수 n까지의 정수를 모두 곱한 것
확률의 공리
- 공리
- 증명을 필요로 하지 않거나 증명할 수 없지만 직관적으로 자명한 진리의 명제인 동시에 다른 명제들의 전제가 되는 명제
- 확률의 공리
- 모든 사건 A에 대하여 0<=P(A)<=1
- 표본공간Ω에 대하여 P(Ω)=1
- 일어날 전체 확률은 각각의 확률을 더한 것과 같음
순열과 조합
순열
- 곱의 법칙에 의해 총 가능한 경우의 수
- n개의 서로 다른 원소 중 k개를 선택하여 배열하는 경우의 수
from itertools import permutations
list(permutations([n], k))
- [] 안에 서로 다른 n개의 원소를 주고, 이원소들 중 k개를 순서를 고려하여 뽑는 경우의 수 계산
조합
- 서로 다른n개의 원소에서 k개를 순서에 상관없이 선택하는 방법
from itertools import combinations
list(combinations([n], k))
- [] 안에 서로 다른 n개의 원소를 주고, 이 원소들 중 k개를 순서를 고려하지 않고 뽑는 경우의 수 계산
중복순열
- 서로 다른 n개의 원소중에서 중복을 허용하여 r개를 뽑아 일렬로 배열하는 경우
from itertools import product
list(product([n], repeat=k))
- [] 안에 서로 다른 n개의 원소를 주고, 이 원소들 중 k개를 중복을 허용하면서 순서를 고려하여 뽑는 경우의 수 계산
중복 조합
- 서로 다른n개의 대상 중 중복을 허용해 r개를 순서를 고려하지 않고 뽑는 경우
from itertools import combinations
list(combinations_with_replacement([n], k))
- [] 안에 서로 다른 n개의 원소를 주고, 이원소들 중 k개를 순서를 중복을 허락하여 순서를 고려하지 않고 뽑는 경우의 수 계산
조건부 확률과 독립
조건부 확률
- 특정한 사건의 확률을 구할 때, 다른 사건에 대한 정보가 주어지는 경우
- 다른 사건에 대한 정보를 이용하여 확률을 구하므로 기존 확률과 달라질 수 있음
- P(B1A) 와P(A) 를 이용해 사건 A∩B의 확률계산
- P(A∩B)=P(B1A)P(A)
독립
- 일반적으로 두 사건은 서로 연관성이 있는 경우가 많음
- 조건부 확률은 두 사건의 연관성에 따라 달라진다
- 두사건 A와 B가 서로 독립일 때 사건 B가 A의 확률에 영향을 주지 않음
확률분포
확률 변수
- 확률 변수가 가질 수 있는 값들이 무엇이며, 그 값을 가질 가능성 또는 확률이 어떻게 분포되어 있는지를 0이상의 실수로 나타낸 것
- 각각의 근원사건에 실수값을 대응시킨 함수
- X,Y,…처럼 대문자로 표시
- 시행을 하기 전엔 어떤 값을 갖게 될 지 알 수 없다는 불확실성을 표현
- 동전을 2번 던졌을 대 앞면의 수를 나타내는 확률변수 X
- P(X=2) = P({앞앞}) = 1/4
- P(X=1) = P({앞뒤,뒤앞}) = 1/2
이산, 연속 확률 변수
- 이산 확률 변수
- 확률 변수의 값의 개수를 셀 수 있는 경우
- 연속 확률 변수
- 확률 변수의 값이 연속적인 구간에 속하는 경우
확률 질량 함수
- 어떤 확률변수 x가 갖는 확률을 나타내는 함수
- y = f(x) : x가 같는 확률은 y이다
이산 확률 분포의 종류
- 베르누이 분포
- 이항 분포
- 기하 분포
- 음이항 분포
- 초기하 분포
- 포아송 분포
확률 밀도 함수
- 연속 확률 변수 X가 같는 확률의 분포를 표현
- 어느 구간의 확률이 더 크고 작은 지 나타낼 수 있는 함수를 이용
연속 확률 분포
- 조건
- 모든 x값에 대해 f(x)>=0
- 특정 구간의 확률은 그 구간을 적분한 것과 값이 같다
- 전체 구간을 적분했을 떄 확률 밀도 함수값은 1이다
연속확률분포의종류
- 균일분포
- 지수분포
- 감마분포
- 정규분포
- 베타분포
누적 분포 함수
- X가 가질 수 있는 가장 작은 값부터 x까지 해당하는 확률질량함수의 값을 누적해서 더한 것
Leave a comment