본문 바로가기

전체 글108

18. 적률생성함수_2 (MGFs Continued) 본 글은 Havard University Statistics 110 강의를 듣고 정리한 내용입니다. Exponential MGF X ~ Expo(1), Find MGF M(t) = E(e^{tx}) = ∫[x=0~∞] e^{tx}e^{-x}dx = ∫e^{-x(1-t)} dx = 1/(1-t) t 기하급수 = ∑t^n = ∑n! * t^n/n! => E(X^n) = n! ∵n! = n차적률 Y ~ Expo(λ), Let X = λY ~ Expo(1), so Y^n = X^n/λ^n E(Y^n) = n!/λ^n Normal MGF Let Z ~ N(0, 1), find all i.. 2022. 2. 5.
17. 적률생성함수(Moment Generating Functions) 본 글은 Havard University Statistics 110 강의를 듣고 정리한 내용입니다. 무기억성(Memoryless property) T = 기대수명 E(T|T>20) > E(T) 만약 무기억성이라면, E(T|T>20) = 20 + E(T) if X is positive continuous r.v. with memoryless property, then X ~ Expo(λ) for some λ (지수분포의 특성) Proof Let F be the CDF of X, G(x) = P(X>x) = 1-F(x) Memoryless Property G(s+t) = G(s)G(t) if s = t -> G(2t) = G(t)^2, G(3t) = G(2t)G(t) = G(t)^3, G(kt) = G(t).. 2022. 2. 3.
16. 지수분포(Exponential Distribution) 본 글은 Havard University Statistics 110 강의를 듣고 정리한 내용입니다. Exponential Distribution rate parameter λ PDF = λe^(-λx), x > 0(0 otherwise), 지속적으로 감수하는 함소 valid ∫λe^(-λx) = 1 CDF F(x) = ∫[x=0~x] λe^(-λt)dt = 1-e^(-λx), x>0 Let Y = λx, then Y ~ Expo(1) Expo(1)을 먼저 구한 후 λ를 곱해주면 된다. P(Y≤y) = P(X ≤ y/λ) = 1-e^-y Find E(Y), Var(Y) E(Y) = ∫ye^(-y) dy (부분적분 공식 이용) = (-ye^-y)|[0~∞] + ∫[0~∞] e^(-y)dy = 0 + 1 u .. 2022. 2. 1.
New York City Taxi Trip Duration 코드리뷰 Competition : https://www.kaggle.com/c/nyc-taxi-trip-duration/overview Code : https://www.kaggle.com/gaborfodor/from-eda-to-the-top-lb-0-367 Description Data Field id - a unique identifier for each trip vendor_id - a code indicating the provider associated with the trip record pickup_datetime - date and time when the meter was engaged dropoff_datetime - date and time when the meter was disengage.. 2022. 2. 1.
15. Midterm Review 본 글은 Havard University Statistics 110 강의를 듣고 정리한 내용입니다. Coupon Collector(toy collector) n toy types, equally likely 모든 종류의 장난감을 모을 때까지의 예상 시간 T? T = T1 + T2 + ... + Tn T1 = time until 1st new toy = 1 T2 = additional time until 2nd new toy T3 = additional time until 3rd new toy T1= 1 T2-1 ~ Geom(n-1/n) * T2-1을 해준 것은 기하분포가 0에서 시작한다는 표기 방법, 최소 1개의 장난감은 가지고 있기 때문에 1을 빼줌 Tj - 1 ~ Geom(n-j+1/n) E(T) =.. 2022. 1. 31.
14. 위치, 척도 및 무의식적인 통계학자의 법칙(Location, Scale, and LOTUS) 본 글은 Havard University Statistics 110 강의를 듣고 정리한 내용입니다. Z ~ N(0, 1), CDF Φ E(z) = 0 (정규분포의 대칭성), 1차 적률 Var(z) = E(z^2) = 1, 2차 적률 E(z^3) = 0(LOTUS), 3차 적률 -Z ~ N(0, 1) (Symmetry) 일반정규분포 Let X = μ+σZ , μ ∈ R (mean, location), σ > 0 (Standard Deviation, scale) -> X ~ N(μ, σ^2) E(X) = μ Var(μ+σZ) = σ^2 * Var(Z) = σ^2 Var(X+X) = Var(2X) = 4Var(X) Z = (X - μ) / σ (표준화 → 데이터의 단위 문제가 없어짐) 68-95-99.7% R.. 2022. 1. 29.