본문 바로가기
Study/통계학

15. Midterm Review

by EDGE-AI 2022. 1. 31.

본 글은 Havard University Statistics 110 강의를 듣고 정리한 내용입니다.

 

Coupon Collector(toy collector)

n toy types, equally likely

모든 종류의 장난감을 모을 때까지의 예상 시간 T?

T = T1 + T2 + ... + Tn

T1 = time until 1st new toy = 1

T2 = additional time until 2nd new toy 

T3 = additional time until 3rd new toy

 

T1= 1

T2-1 ~ Geom(n-1/n) * T2-1을 해준 것은 기하분포가 0에서 시작한다는 표기 방법, 최소 1개의 장난감은 가지고 있기 때문에 1을 빼줌

Tj - 1 ~ Geom(n-j+1/n)

E(T) = E(T1) + E(T2) + ... + E(Tn) = 1  + n/n-1 + n/n-2 + ... + n/1 = n(1 + 1/2 + 1/3 + ... + 1/n) ≒ nlogn (충분히 큰n)

  • E(Geom(n-1/n)) = q/p = 1/n-1 (ch9)
  • E(Geom(n-1/n) + 1) = q/p + 1 = 1/n-1 + 1 = n/n-1

Universality(균등분포의 보편성)

X ~ F

CDF

F(x0) = 1/3

P(F(x)≤1/3​1/3​)=P(X≤x0​) = F(x0) = 1/3

∴F(X)Unif(0,1)

Logistc Distribution


Symmetry, Linearity

X, Y, Z be i.i.d. positive r.v.s. (동일한 확률 분포, 상호 독립) 

Find E(X/X+Y+Z)

E(X/X+Y+Z) = E(Y/X+Y+Z) = E(Z/X+Y+Z) (Symmetry)

E(X/X+Y+Z) + E(Y/X+Y+Z) + E(Z/X+Y+Z) =  E(X+Y+Z/X+Y+Z) = 1

E(X/X+Y+Z) = 1/3


LOTUS

U ~ Unif(0, 1), X = U^2, Y = e^X

적분을 통한 E(Y) 찾기

E(Y) = ∫[x = 0~1] e^x f(x) dx, f(x) is PDF if X

CDF를 구하고 그 식을 미분하여 PDF를 구함

Better way E(Y) = ∫[u = 0~1] e^(u^2)du


Story Proof practice

X ~ Bin(n, p)

find distribution of n-X

P(n-X=k) = P(X=n-k)

Simple way : n-X~Bin(n, q) (성공과 실패를 바꾸면 됨. 성공의 정의는 마음대로)


Poisson Distribution

일정 시간  t 까지 받는 이메일의 수가 Pois(λt) 를 따른다고 할 때,  첫 번째 이메일까지 걸리는 시간 T1 의 분포(PDF)를 구하시오.

생각하기 쉽도록 T>t로 진행

P(T>t) = P(Nt = 0) ∵Nt = number of emails until 0 ~ t

 = e−λt​ (λt)^0 ​/ 0!=e^(​^−λt )

CDF = 1-e^(−λt),  t > 0

 

 

 

출처: https://www.edwith.org/ai152

댓글