본문 바로가기
Study/통계학

30. 카이제곱분포, t분포, 다변량정규분포(Chi-Square, Student-t, Multivariate Normal)

by EDGE-AI 2022. 3. 9.

본 글은 Havard University Statistics 110 강의를 듣고 정리한 내용입니다.

카이제곱분포

χ2(n)

V=Z12+Z22++Zn2,Zi.i.d.N(0,1)Vχ2(n)

χ2(1)=Gamma(12,12)

두 분포는 같은 분포이다.

χ2(n)=Gamma(n2,12)

두 분포 또한 같은 분포를 나타낸다.

 

Student - t분포

T=ZV/n,ZN(0,1),Vχ2(n)

Ttn

t분포의 특성

1. 대칭분포

Ttn

2. n=1

두 독립 표준정규분포의 비와 같으므로 코시분포를 따른다, 평균은 가지지 않는다

3. n ≥ 2

E(T)=E(Z)E(1V/n)=0

E(Z2)=1,E(Z4)=3,E(Z6)=35,

감마분포와 연관시키는 방법도 있다.

E(Z2n)=E((Z2)n)

위 식에서 Z^2가 X^2(1)을 나타내고, X^2(1)은 Gamma(1/2, 1/2)이므로 감마분포의 n차적률로 풀 수 있다.

4. 정규분포보다 두꺼운 꼬리 모양을 가진다.

5. 큰 n값에 대해 tn은 정규분포와 거의 같아보인다.

Tn=ZVn/n,Z1,,Zni.i.d.N(0,1),Vn=Z12++Zn2

큰 수의 법칙에 의하여 Vn/n은 확률 1을 가지며 1의 값으로 수렴한다.

∴n이 충분히 클 때, Tn은 1의 확률로 Z로 수렴한다. 따라서, tn 은  n이 충분히 클 때 표준정규분포 N(0,1) 에 수렴한다.

 

다변량정규분포

정의)

확률벡터 X = (X1, ..., Xn)는 모든 선형결합(t1x1 + t2x2 + ... + tnxn)이 정규분포를 따를 때, 다변량 정규분포를 따른다.

Ex.

Z, W ~ iid N(0, 1)일 때, (Z+2W, 3Z+5W)도 다변량정규분포를 따른다.

∵s(Z+2W)+t(3Z+5W)=(s+3t)Z+(2s+5t)WN 

Non-ex.

Z ~ N(0, 1), S는 임의의 부호(같은 확률로 -1or 1), S와 Z는 독립

Z, SZ는 다변량 정규분포를 따르지 않는다

-> Z+SZ는 절반의 확률로 0이되고, 절반의 확률로 2Z가 되기 때문에 이산적인 것과 연속적인 것의 결합이 된다.

정리) 다변량정규분포에 한해서는, [무상관  독립] 이 성립한다.

X1의 모든 구성성분이  X2의 모든 구성성분과 무상관일 때, X1X2는 서로 독립이다. 

 

ex)  X,YiidN(0,1) 일 때,  (X+Y,XY) 는 다변량정규분포를 따른다. 

 Cov(X+Y, X-Y) = Var(X) +Cov(X,Y) -Cov(X-Y) -Var(Y) = 0 

X+Y, XY는 서로 독립이다.  

 

 

 

출처: https://www.edwith.org/ai152

댓글