본문 바로가기
Study/통계학

11~15강 Review

by EDGE-AI 2022. 2. 16.

본 글은 Havard University Statistics 110 강의를 듣고 정리한 내용입니다.

 

Poisson Distribution

X ~ Pois(λ)

\[P(X=k) = \frac{e^{-\lambda}\lambda^k} {k!}\]

포아송 분포는 많은 시도의 횟수를 시행하고, 성공 확룰이 매우 작은 경우에 성공의 수를 count 할 때 많이 사용한다.

 

Poisson Paradign (Pois Approximation, 포아송 근사)

event Aj, P(Aj) = pj 에서 n은 매우 큰 수이고 pj는 매우 작은 수라고 할 때, 

event 끼리 독립이면(혹은 약한 종속성을 가지고 있는 경우) event Aj는 포아송 분포로 근사할 수 있다.

 

Ex. Raindrops, Birthday Problem

 

PDF(Probability Density Function, 확률밀도함수)

PDF of 확률변수 X

\[P(A \leq X \leq B) = \int_{a}^{b}f(x)dx\]

원칙적으로 P(X=x) = 0이나 density 의 개념을 이용하여 아래와 같이 구할 수 있다.

\[P(X=x) = f(x_0) \ast \epsilon\]

 

확률변수 X가 PDF f를 가지고 있을 때, 확률변수 X의 CDF는 아래와 같다.

\[P(X \leq x) = \int_{- \infty}^{x}f(t)dt\]

 

확률변수 X가 CDF F를 가지고 있을 때, 확률변수 X의 PDF는 미적분학의 기본 정리에 의해 아래와 같이 나타난다.

\[f(x) = F'(x)\]

\[P(a<X<b) = \int_{a}^{b} f(x)dx = F(b) - F(a) \]

Uniform(균등분포)

X ~ Unif(a, b), 특정 범위가 뽑힐 확률이 그 범위의 크기에 비례하는 분포

f(x) = c if a  x  b, 0 otherwise 

\[1 = \int_{a}^{b} c dx = c * (b-a)\]

E(X) = (a + b) / 2

균등분포의 일반성

\[if u \sim Unif(0, 1)\rightarrow X = F^{-1}(u) \sim F \]

\[if X \sim F \rightarrow F(X) \sim Unif(0, 1)\]

균등분포의 대칭성

\[if u \sim Unif(0, 1) \rightarrow 1-u \sim Unif(0, 1)\]

균등분포의 선형변환

\[a + bu \sim Unif(a, a + b)\]

 

정규분포

중심극한정리 : 여러개의 독립적이고 동일한 확률변수를 더했을 때, 그 합의 분포가 정규분포를 따라 갈 것이다.

mu = 0, sigma = 1인 경우 표준정규분포

\[E(Z) = \int_{-\infty}^{\infty} \frac{1}{2\pi}ze^{-z^2/2}dz = 0\]

\[Var(Z) = {E(Z)}^2-E(Z^2) = 1\]

표준정규분포의 CDF

\[\Phi(z) = \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{z}e^{t^2/2}dt \]

\[\Phi(-z) = 1- \Phi(z)\]

 

E(Z) = 0 (정규분포의 대칭성)

Var(Z) = E(Z^2)

E(Z^3) = 0 (LOTUS)

 

일반정규분포

\[X = \mu + \sigma Z \]

\[X \sim N(\mu, \sigma^2)\]

평균과 분산

\[E(X) = \mu\]

\[Var(X) = \sigma^2 * Var(Z) = \sigma^2\]

\[Var(X+c) = Var(X)\]

\[Var(cX) = c^2Var(X)\]

\[Var(X+Y) \neq Var(X) + Var(Y)\]

X, Y가 독립일 경우는 위 식 성립

 

68-95-99.7% Rule

\[X \sim N(\mu, \sigma^2)\]

  • P(|X-μ| ≤ σ) ≒ 0.68
  • P(|X-μ| ≤ 2σ) ≒ 0.95
  • P(|X-μ| ≤ 3σ) ≒ 0.997

Poisson Distribution

\[E(X) = \lambda\]

\[E(X^2) = \lambda^2 + \lambda\]

\[\therefore Var(X) = \lambda^2 + \lambda - \lambda^2 = \lambda\]

 

Binomial Distribution

\[E(X) = np\]

\[Var(X) = np - np^2 = np(1-p) = npq\]

이산확률변수에서의 LOTUS(무의식적인 통계학자 법칙) 증명

 

 

 

출처: https://www.edwith.org/ai152

댓글