3장. 확률

Updated:

실습_3. 확률

사건과 확률의 개념

모집단과 표본

  • 정보를 얻고자 하는 관심 대산의 전체집합 모집단을 통째로 조사하는 것은 어렵다 모집단의 일부를 표본으로 추출 표본으로 모집단의 정보를 추론함
  • 모집단(Population)
    • 조사의 관심이 되는 전체 집단
  • 표본(Sample)
    • 모집단에서 일부를 표집(샘플링)하여 실제 조사한 대상
  • 모수(Parameter)
    • 모집단으로부터 계산된 모든 값, 미지의 수
  • 통계량(Statics)
    • 표본으로부터 계산된 모든 값, 모수의 추정

확률

  • 여러 가능한 결과 중 하나 또는 일부가 일어날 가능성
  • 0과 1 사이의 값으로 정의

확률의 용어

  • 실험(Experiment) 또는 시행(Trial)
    • 여러 가능한 결과 중 하나가 일어나도록 하는 행위
  • 표본공간(Sample Space)
    • 실험에서 나타날 수 있는 모든 결과들을 모아둔 집합
    • (ΩorS)
  • 사건(Event)
    • 표본공간의 일부분(부분집합)
    • 사건 A가 일어날 확률: P(A) 또는 Pr(A)
  • 예)
예) 동전을 던지는 실험앞면: H, 뒷면: T ,표본공간Ω={H,T}으로표시
    앞면이나오는사건은A={H}이므로P(A) = 0.5 = 1/2 
  • 추출 방법
    • 복원추출
      • 모든 시행에서 똑같은 상황으로 시행하는 방법
    • 비복원추출
      • 앞의 시행이 다음 시행에 영향을 주는 방법

경우의 수

  • 사건의 원소의 개수(사건에 속하는 결과의 수)
  • 1회 시행에서 일어날 수 있는 사건의 가짓수
  • 사건의 경우의 수

사건의 기본적인 연산

  • A의 여사건
    • 사건 A에 포함되지 않은 사건들의 집합
    • A^c로 표시
  • A와 B의 합사건
    • 사건 A 혹은 B에 포함되는 사건들의 집합
    • AUB로 표시
  • A와 B의 곱사건
    • 사건 A와 B에 동시에 포함되는 사건들의 집합
    • A∩B로표시
  • 배반 사건
    • 동시에 일어날 수 없는 두 사건
    • A∩B= 0인두사건

경우의 수의 계산

  • 합의 법칙
    • 두사건 A와 B가 일어나는 경우의 수가 각각 m과n
    • 두사건 A와 B가 동시에 일어나지 않음
    • 사건A 또는 B가 일어나는 경우의 수는 m+n
  • 곱의 법칙
    • 두사건 A와 B가 일어나는 경우의 수가 각각 m과n
    • 두사건 A와 B가 동시에 또는 잇달아 일어남
    • 이때의 경우의 수는 m*n

팩토리얼(!)

  • 팩토리얼의 정의
    • 1부터 어떤 양의 정수 n까지의 정수를 모두 곱한 것

확률의 공리

  • 공리
    • 증명을 필요로 하지 않거나 증명할 수 없지만 직관적으로 자명한 진리의 명제인 동시에 다른 명제들의 전제가 되는 명제
  • 확률의 공리
    • 모든 사건 A에 대하여 0<=P(A)<=1
    • 표본공간Ω에 대하여 P(Ω)=1
    • 일어날 전체 확률은 각각의 확률을 더한 것과 같음

순열과 조합

순열

  • 곱의 법칙에 의해 총 가능한 경우의 수
  • n개의 서로 다른 원소 중 k개를 선택하여 배열하는 경우의 수
from itertools import permutations 
list(permutations([n], k))
  • [] 안에 서로 다른 n개의 원소를 주고, 이원소들 중 k개를 순서를 고려하여 뽑는 경우의 수 계산

조합

  • 서로 다른n개의 원소에서 k개를 순서에 상관없이 선택하는 방법
from itertools import combinations 
list(combinations([n], k))
  • [] 안에 서로 다른 n개의 원소를 주고, 이 원소들 중 k개를 순서를 고려하지 않고 뽑는 경우의 수 계산

중복순열

  • 서로 다른 n개의 원소중에서 중복을 허용하여 r개를 뽑아 일렬로 배열하는 경우
from itertools import product 
list(product([n], repeat=k))
  • [] 안에 서로 다른 n개의 원소를 주고, 이 원소들 중 k개를 중복을 허용하면서 순서를 고려하여 뽑는 경우의 수 계산

중복 조합

  • 서로 다른n개의 대상 중 중복을 허용해 r개를 순서를 고려하지 않고 뽑는 경우
from itertools import combinations 
list(combinations_with_replacement([n], k))
  • [] 안에 서로 다른 n개의 원소를 주고, 이원소들 중 k개를 순서를 중복을 허락하여 순서를 고려하지 않고 뽑는 경우의 수 계산

조건부 확률과 독립

조건부 확률

  • 특정한 사건의 확률을 구할 때, 다른 사건에 대한 정보가 주어지는 경우
    • 다른 사건에 대한 정보를 이용하여 확률을 구하므로 기존 확률과 달라질 수 있음
  • P(B1A) 와P(A) 를 이용해 사건 A∩B의 확률계산
    • P(A∩B)=P(B1A)P(A)

독립

  • 일반적으로 두 사건은 서로 연관성이 있는 경우가 많음
  • 조건부 확률은 두 사건의 연관성에 따라 달라진다
  • 두사건 A와 B가 서로 독립일 때 사건 B가 A의 확률에 영향을 주지 않음

확률분포

확률 변수

  • 확률 변수가 가질 수 있는 값들이 무엇이며, 그 값을 가질 가능성 또는 확률이 어떻게 분포되어 있는지를 0이상의 실수로 나타낸 것
  • 각각의 근원사건에 실수값을 대응시킨 함수
  • X,Y,…처럼 대문자로 표시
  • 시행을 하기 전엔 어떤 값을 갖게 될 지 알 수 없다는 불확실성을 표현
  • 동전을 2번 던졌을 대 앞면의 수를 나타내는 확률변수 X
    • P(X=2) = P({앞앞}) = 1/4
    • P(X=1) = P({앞뒤,뒤앞}) = 1/2

이산, 연속 확률 변수

  • 이산 확률 변수
    • 확률 변수의 값의 개수를 셀 수 있는 경우
  • 연속 확률 변수
    • 확률 변수의 값이 연속적인 구간에 속하는 경우

확률 질량 함수

  • 어떤 확률변수 x가 갖는 확률을 나타내는 함수
  • y = f(x) : x가 같는 확률은 y이다

이산 확률 분포의 종류

  • 베르누이 분포
  • 이항 분포
  • 기하 분포
  • 음이항 분포
  • 초기하 분포
  • 포아송 분포

확률 밀도 함수

  • 연속 확률 변수 X가 같는 확률의 분포를 표현
  • 어느 구간의 확률이 더 크고 작은 지 나타낼 수 있는 함수를 이용

연속 확률 분포

  • 조건
    • 모든 x값에 대해 f(x)>=0
    • 특정 구간의 확률은 그 구간을 적분한 것과 값이 같다
    • 전체 구간을 적분했을 떄 확률 밀도 함수값은 1이다

연속확률분포의종류

  • 균일분포
  • 지수분포
  • 감마분포
  • 정규분포
  • 베타분포

누적 분포 함수

  • X가 가질 수 있는 가장 작은 값부터 x까지 해당하는 확률질량함수의 값을 누적해서 더한 것

Leave a comment