본문 바로가기
Study/통계학

30. 카이제곱분포, t분포, 다변량정규분포(Chi-Square, Student-t, Multivariate Normal)

by EDGE-AI 2022. 3. 9.

본 글은 Havard University Statistics 110 강의를 듣고 정리한 내용입니다.

카이제곱분포

\[\chi^2(n)\]

\[V = Z_1^2 + Z_2^2 + \cdots + Z_n^2, Z \overset{i.i.d.}{\sim}N(0, 1) \rightarrow V \sim \chi^2(n)\]

\[\chi^2(1) = Gamma(\frac{1}{2},\frac{1}{2})\]

두 분포는 같은 분포이다.

\[\chi^2(n) = Gamma(\frac{n}{2},\frac{1}{2})\]

두 분포 또한 같은 분포를 나타낸다.

 

Student - t분포

\[T = \frac{Z}{\sqrt{V/n}}, Z \sim N(0, 1), V \sim \chi^2(n)\]

\[\therefore T \sim t_n\]

t분포의 특성

1. 대칭분포

\[-T \sim t_n\]

2. n=1

두 독립 표준정규분포의 비와 같으므로 코시분포를 따른다, 평균은 가지지 않는다

3. n ≥ 2

\[E(T) = E(Z)E(\frac{1}{\sqrt{V/n}}) = 0\]

\[E(Z^2) = 1 , E(Z^4) = 3, E(Z^6) = 3\cdot 5, \cdots\]

감마분포와 연관시키는 방법도 있다.

\[E(Z^{2n}) = E((Z^2)^n)\]

위 식에서 Z^2가 X^2(1)을 나타내고, X^2(1)은 Gamma(1/2, 1/2)이므로 감마분포의 n차적률로 풀 수 있다.

4. 정규분포보다 두꺼운 꼬리 모양을 가진다.

5. 큰 n값에 대해 tn은 정규분포와 거의 같아보인다.

\[T_n = \frac{Z}{\sqrt{V_n/n}}, Z_1,\cdots ,Z_n \overset{i.i.d.}{\sim} N(0, 1), V_n = Z_1^2 + \cdots + Z_n^2\]

큰 수의 법칙에 의하여 Vn/n은 확률 1을 가지며 1의 값으로 수렴한다.

∴n이 충분히 클 때, Tn은 1의 확률로 Z로 수렴한다. 따라서, tn 은  n이 충분히 클 때 표준정규분포 N(0,1) 에 수렴한다.

 

다변량정규분포

정의)

확률벡터 X = (X1, ..., Xn)는 모든 선형결합(t1x1 + t2x2 + ... + tnxn)이 정규분포를 따를 때, 다변량 정규분포를 따른다.

Ex.

Z, W ~ iid N(0, 1)일 때, (Z+2W, 3Z+5W)도 다변량정규분포를 따른다.

∵s(Z+2W)+t(3Z+5W)=(s+3t)Z+(2s+5t)WN 

Non-ex.

Z ~ N(0, 1), S는 임의의 부호(같은 확률로 -1or 1), S와 Z는 독립

Z, SZ는 다변량 정규분포를 따르지 않는다

-> Z+SZ는 절반의 확률로 0이되고, 절반의 확률로 2Z가 되기 때문에 이산적인 것과 연속적인 것의 결합이 된다.

정리) 다변량정규분포에 한해서는, [무상관  독립] 이 성립한다.

X1의 모든 구성성분이  X2의 모든 구성성분과 무상관일 때, X1X2는 서로 독립이다. 

 

ex)  X,YiidN(0,1) 일 때,  (X+Y,XY) 는 다변량정규분포를 따른다. 

 Cov(X+Y, X-Y) = Var(X) +Cov(X,Y) -Cov(X-Y) -Var(Y) = 0 

X+Y, XY는 서로 독립이다.  

 

 

 

출처: https://www.edwith.org/ai152

댓글