본문 바로가기
Aiffel/Fundamental

로지스틱 회귀분석(Logistic Regression)

by EDGE-AI 2022. 1. 24.

데이터가 어떤 범주에 속할 확률을 0에서 1 사이의 값으로 예측하고, 그 확률에 따라 가능성이 더 높은 범주에 속하는 것으로 분류해주는 지도학습 알고리즘

1개 이상의 독립변수가 있을 때 이를 이용하여 데이터가 2개의 범주중 하나에 속하도록 결정하는 binary classification 문제를 풀때 사용

1. 정의 및 용어 설명

종속변수가 0일 확률을 P(y=0|x) 라고 했을 때

Odds : 사건이 발생할 확률을 발생하지 않을 확률로 나눈 값

Ex. 유방암 데이터셋(악성 종양일 확률이 0.2)

위 값에 log를 취하면 Log-odds라고 부른다.

위 식을 통해 종속변수가 0일 확률을 구하게 되면

가 된다. z = exp(*) 라고 한다면 식은 다음과 같아진다.

z = 0인 지점을 중심으로 두 범주간 경계가 불명확해지는 x의 구간(0.3 < p < 0.7)을 최소화해주기 때문에 분류모델의 성능을 향상시킨다.

 

 

 

 

참고자료

https://medium.com/@toprak.mhmt/activation-functions-for-deep-learning-13d8b9b20e

'Aiffel > Fundamental' 카테고리의 다른 글

텍스트 요약(Text Summarization)  (0) 2022.01.27
Softmax 함수와 Cross Entropy  (0) 2022.01.24
경사하강법(Gradient Descent)  (0) 2022.01.21
손실함수 (Loss Function)  (0) 2022.01.21
활성화 함수 (Activation Function)  (0) 2022.01.21

댓글