본문 바로가기
Study/통계학

12. 이산, 연속, 균등분포 (Discrete vs. Continuous, the Uniform)

by EDGE-AI 2022. 1. 27.

본 글은 Havard University Statistics 110 강의를 듣고 정리한 내용입니다.

PDF(Probability Density Function, 확률밀도함수)

Defn 확률변수 X has PDF f(x) if P(a ≤ X ≤ b) = ∫[a~b] f(x)dx for all a, b.  [a = b -> ∫[a~b] f(x)dx = 0]

To be valid, f(x) ≥ 0,  ∫[-∞~∞]f(x)dx = 1

 

* Density

f(x0) ϵ P( X (x0ϵ / 2, x0+ ϵ / 2)) , 매우 작은 양의 값 epsilon ϵ 길이의 구간에 대한 면적

if X has PDF f, the CDF is F(x) = P(X ≤ x) = ∫[-∞~x]f(t)dt

if X has CDF F (X는 연속적), then PDF f(x) = F'(x) FTC(미적분학의 기본 정리)

  • 상한이 정해지지 않은 적분 전체를 미분하면 원래함수가 나온다.

P(a<X<b) = ∫[a~b] f(x)dx = F(b) - F(a) by FTC


Variance Var(X) = E(X-E(X))^2

Standard deviation SD(X) = √Var(X)

분산을 정의하는 다른 식 Var(X) = E(X^2 - 2XE(X) + (EX)^2)) = E(X^2) - 2E(X)E(X) + (EX)^2 = E(X^2) - (EX)^2 > 0


Uniform(균등분포)

Unif(a, b) random point in [a,b]

a, b 사이의 어떤 숫자 X

특정 범위가 뽑힐 확률이 그 범위의 크기에 비례하는 분포

 

f(x) = c if a x b, 0 otherwise => 1 = ∫[a~b]c dx = c * (b-a)

F(x) = ∫[-∞~x]f(t)dt {x > a}= ∫[a~x]f(t)dt ={ 0 if x < a, (x-a)/(b-a) if a x b , 1 if x > b}

Let u ~ Unif(0, 1), E(u) = 1/2, E(u^2) = ∫[0~1] u^2 f(u)du = 1/3

Var(u) = E(u^2) - (EU)^2 = 1/3 - 1/4 = 1/12


universality of the uniform distribution (균등분포의 일반성)

Let u ~ Unif(0, 1), F 는 CDF(F는 연속인 증가함수로 가정)

X = F^-1(u) Then X ~F

 

proof

P(X ≤ x) = P(F^-1(u) ≤ x) = P(u ≤ F(x)) =

 

 

출처: https://www.edwith.org/ai152

댓글