본 글은 Havard University Statistics 110 강의를 듣고 정리한 내용입니다.
초기하분포의 분산
HyperGeom(w, b, n), p w / (w+b), w+b=N
\[Var(\sum_{j=1}^{n}X_j) = Var(X_1) + \cdots + Var(X_n) + 2\sum_{i<j}^{}Cov(X_i,X_j)\]
\[= np(1-p) + 2\binom{n}{2}(\frac{w}{w+b}\frac{w-1}{w+b-1}-p^2) = \frac{N-n}{N-1}np(1-p)\]
(N-n)/(N-1)을 통계학에서 유한 모집단 수정(수정계수)이라고 한다.
- n=1인 경우 Bern(p)의 분산이 된다.
- n보다 훨씬 큰 N값을 가질 경우 (N-n)/(N-1) ≒1
변수변환
X를 연속확률변수, PDF fx, Y = g(X)
- g는 미분가능한 함수
- g는 강한 증가 함수
Y의 PDF
\[f_Y(y) = f_X(x)\frac{dx}{dy} (y = g(x), x = g^{-1}(y))\]
Also
\[\frac{dx}{dy} = (\frac{dy}{dx})^{-1}\]
Proof
CDF를 찾아서 미분하여 진행
\[P(Y \leq y) = P(g(X) \leq y) = P(X \leq g^{-1}(y)) = F_X(g^{-1}(y)) = F_X(x)\]
\[\Rightarrow f_Y(y) = f_X(x)\frac{dx}{dy}\]
Ex. 로그 정규분포
Y = e^z, z ~ N(0, 1)
\[f_Y(y) = \frac{1}{\sqrt{2\pi}}e^{-(lny)^2/2}\frac{1}{y}\]
\[\frac{dy}{dz} = e^z = y\]
n차원에서의 변수변환
\[\overrightarrow{Y} = g(\overrightarrow{X}), g : \mathbb{R}^2 \rightarrow \mathbb{R}^2\]
\[\overrightarrow{X} = (X_1, \cdots, X_n)\]
joint PDF of Y sasdasd ⃗
\[f_{\overrightarrow{Y}}(\overrightarrow{y}) = f_{\overrightarrow{X}}(\overrightarrow{x})|\frac{d\overrightarrow{x}}{d\overrightarrow{y}}|\]
\[|\frac{d\overrightarrow{x}}{d\overrightarrow{y}}| \rightarrow Jacobian\]
jacobian determine의 절대값
\[\frac{d\overrightarrow{x}}{d\overrightarrow{y}} = \begin{pmatrix}\frac{\partial x_1}{\partial y_1}& \frac{\partial x_1}{\partial y_2}& \cdots & \frac{\partial x_1}{\partial y_n} \\\frac{\partial x_2}{\partial y_1}& \frac{\partial x_2}{\partial y_2}& \cdots & \frac{\partial x_2}{\partial y_n} \\ & & \vdots & \\\frac{\partial x_n}{\partial y_1}& \frac{\partial x_n}{\partial y_2}& \cdots & \frac{\partial x_n}{\partial y_n} \\\end{pmatrix}\]
\[|\frac{d\overrightarrow{y}}{d\overrightarrow{x}}|^{-1} = |\frac{d\overrightarrow{x}}{d\overrightarrow{y}}|\]
합성곱(Convolution)의 변수변환
T = X+Y, X와 Y는 독립, X와 Y의 분포를 알 때 T의 분포
- 이산형
\[P(T=t) = \sum_{x} P(X=x)P(Y=t-x)\]
- 연속형
\[f_T(t) = \int_{-\infty}^{\infty}f_X(x)f_Y(t-x)dx\]
\[F_T(t) = P(T \leq t) = \int_{-\infty}^{\infty}P(X+Y \leq t |X=x)f_X(x)\]
\[= \int_{-\infty}^{\infty}F_Y(t-x)f_X(x)dx\]
'Study > 통계학' 카테고리의 다른 글
24. 감마분포와 포아송 과정(Gamma distribution and Poisson process) (0) | 2022.02.21 |
---|---|
23. 베타분포(Beta disctribution) (0) | 2022.02.21 |
21. 공분산과 상관계수(Covariance and Correlation) (0) | 2022.02.20 |
11~15강 Review (0) | 2022.02.16 |
4~10강 Review (0) | 2022.02.13 |
댓글