본문 바로가기
Study/통계학

25. 순서통계량과 조건부 기댓값(Order Statistics and Conditional Expectations)

by EDGE-AI 2022. 3. 3.

본 글은 Havard University Statistics 110 강의를 듣고 정리한 내용입니다.

베타분포와 감마분포의 관계

ex. 은행-우체국 example

은행 대기시간 X∼Gamma(a,λ), 우체국 대기시간 Y∼Gamma(b,λ), X와 Y는 독립

전체 대기시간에 대한 결합분포 T

  • X는 i.i.d. exp(a)의 합이고, Y는 i.i.d. exp(b)의 합이다.
  • T ~ Gamma(a+b,λ)

W = X / (X+Y), λ=1로 가정

joint PDF

fT,W(t,w)=fX,Y(x,y)|(x,y)(t,w)|=1Γ(a)Γ(b)xaexybey1xyt

|(x,y)(t,w)|:Jacobian=t

x+y=t, x/x+y=w y/x+y = 1-w

x = tw, y = t(1-w)

|wt1wt|=twt(1w)=t

=1Γ(a)Γ(b)wa1(1w)b1ta+bet1tΓ(a+b)Γ(a+b)

정규화상수를 만들어주기 위해 Γ(a)Γ(b)를 분모 분자에 각각 곱해준다.

ta+bet1tΓ(a+b)=Gamma(a+b,1):PDF

fW(w)=fT,W(t,w)dt=Γ(a+b)Γ(a)Γ(b)wa1(1w)b1

식의 앞부분은 w에 대한 값이므로 t에대한 적분에서는 상수값이 되고, 뒷부분은 PDF이기 때문에 적분값이 1이 된다.

=> T ~ Gamma(a+b,1), W ! Beta(a,b), T, W는 독립

 

E(W), W ~ Beta(a, b)

1. LOTUS/defn

2. 

E(XX+Y)=E(X)E(X+Y)=aa+b

E(X/X+Y)E(X+Y) = E(X)가 Gamma-beta 관련된 특별한 상황에서 성립하는 이유?

=> X/X+Y와 X+Y는 이 문제에서 독립이다. => 독립에서 무상관이다. => E(XY)=E(X)E(Y)

 

순서통계량

X1, ..., Xn i.i.d.임을 가정하였을 때, 

X(1)X(2)X(n),X(1)=min(X1,Xn),,max(X1,,Xn)

X(n) : n번째로 작은 숫자

  • n이 홀수일 때, 중간값은 X_(n+1/2)이다.
  • 사분위수 또한 구할 수 있다.

특징

  • 순서적인 특징을 가지고 있기 때문에 독립이 아니다.(5번째 값은 4번째 값보다 크거나 같다)
  • 이산형인 경우에는 같은 값에 대해 순서를 매기기 어렵다.

분포구하기

 X1, ..., Xn이 iid이고 PDF f, CDF F를 가질 때, X(j)의 CDF와 PDF?

CDF:P(X(j)x)

=P(최소 j개의 Xi가 x보다 작거나 같다)

=k=jn(nk)F(x)k(1F(x))nk

Xj보다 왼쪽에 있는 경우를 성공으로 보는 이항분포

PDF:fX(j)(x)dx=n(n1j1)(f(x)dx)F(x)j1(1F(x))nj

fX(j)(x)=n(n1j1)F(x)j1(1F(x))njf(x)

PDF, CDF, 1-CDF가 모두 포함되어 있다.

 

Ex. 균등분포와 순서통계량

u1,,unUnif(0,1),i.i.d.

fu(j)(x)=n(n1j1)xj1(1x)nj,0<x<1

균등분포의 pdf는 1이된다.

x 와 1-x로 이루어진 식이 베타분포에 관한 식이므로

u(j)Beta(j,nj+1)

 

조건부 기댓값

E(X|A), A : event

E(X)=E(X|A)P(A)+E(X|Ac)P(Ac)

E(X)=xP(X=x)

 

두 봉투 역설(Two Envelope Paradox)

한 봉투에는 다른 봉투의 두 배에 해당하는 돈이 들어있다.(두 봉투의 외관은 같다)

 

출처: https://www.edwith.org/ai152

댓글