본문 바로가기
Study/통계학

11~15강 Review

by EDGE-AI 2022. 2. 16.

본 글은 Havard University Statistics 110 강의를 듣고 정리한 내용입니다.

 

Poisson Distribution

X ~ Pois(λ)

P(X=k)=eλλkk!

포아송 분포는 많은 시도의 횟수를 시행하고, 성공 확룰이 매우 작은 경우에 성공의 수를 count 할 때 많이 사용한다.

 

Poisson Paradign (Pois Approximation, 포아송 근사)

event Aj, P(Aj) = pj 에서 n은 매우 큰 수이고 pj는 매우 작은 수라고 할 때, 

event 끼리 독립이면(혹은 약한 종속성을 가지고 있는 경우) event Aj는 포아송 분포로 근사할 수 있다.

 

Ex. Raindrops, Birthday Problem

 

PDF(Probability Density Function, 확률밀도함수)

PDF of 확률변수 X

P(AXB)=abf(x)dx

원칙적으로 P(X=x) = 0이나 density 의 개념을 이용하여 아래와 같이 구할 수 있다.

P(X=x)=f(x0)ϵ

 

확률변수 X가 PDF f를 가지고 있을 때, 확률변수 X의 CDF는 아래와 같다.

P(Xx)=xf(t)dt

 

확률변수 X가 CDF F를 가지고 있을 때, 확률변수 X의 PDF는 미적분학의 기본 정리에 의해 아래와 같이 나타난다.

f(x)=F(x)

P(a<X<b)=abf(x)dx=F(b)F(a)

Uniform(균등분포)

X ~ Unif(a, b), 특정 범위가 뽑힐 확률이 그 범위의 크기에 비례하는 분포

f(x) = c if a  x  b, 0 otherwise 

1=abcdx=c(ba)

E(X) = (a + b) / 2

균등분포의 일반성

ifuUnif(0,1)X=F1(u)F

ifXFF(X)Unif(0,1)

균등분포의 대칭성

ifuUnif(0,1)1uUnif(0,1)

균등분포의 선형변환

a+buUnif(a,a+b)

 

정규분포

중심극한정리 : 여러개의 독립적이고 동일한 확률변수를 더했을 때, 그 합의 분포가 정규분포를 따라 갈 것이다.

mu = 0, sigma = 1인 경우 표준정규분포

E(Z)=12πzez2/2dz=0

Var(Z)=E(Z)2E(Z2)=1

표준정규분포의 CDF

Φ(z)=12πzet2/2dt

Φ(z)=1Φ(z)

 

E(Z) = 0 (정규분포의 대칭성)

Var(Z) = E(Z^2)

E(Z^3) = 0 (LOTUS)

 

일반정규분포

X=μ+σZ

XN(μ,σ2)

평균과 분산

E(X)=μ

Var(X)=σ2Var(Z)=σ2

Var(X+c)=Var(X)

Var(cX)=c2Var(X)

Var(X+Y)Var(X)+Var(Y)

X, Y가 독립일 경우는 위 식 성립

 

68-95-99.7% Rule

XN(μ,σ2)

  • P(|X-μ| ≤ σ) ≒ 0.68
  • P(|X-μ| ≤ 2σ) ≒ 0.95
  • P(|X-μ| ≤ 3σ) ≒ 0.997

Poisson Distribution

E(X)=λ

E(X2)=λ2+λ

Var(X)=λ2+λλ2=λ

 

Binomial Distribution

E(X)=np

Var(X)=npnp2=np(1p)=npq

이산확률변수에서의 LOTUS(무의식적인 통계학자 법칙) 증명

 

 

 

출처: https://www.edwith.org/ai152

댓글