요약
- 분류 문제 평가 지표
- 정밀도precision: 모델이 정답이라고 예측한 샘플 중에서 실제 정답의 비율
- 재현율recall: 실제 정답 중에서 모델이 맞춘 비율
- 임계값 설정에 따른 모델의 성격 변화
- 임계값이 높을 때: 정밀도가 높아지지만, 재현율이 내려감
- 임계값이 낮을 때: 재현율이 높아지지만, 정밀도가 내려감
- AUROC: ROC 곡선 아래 면적의 넓이. 모델이 강인할수록 수치가 높아짐
- F1 점수 수식:
\[\begin{gathered}
\text{F1-Score}=2\times\frac{\text{Recall}\times\text{Precision}}{\text{Recall}+\text{Precision}}
\end{gathered}\]
- 심층신경망을 활용한 분류
- 심층신경망의 마지막에 소프트맥스 함수를 씌워 분류기로 만듦
- 소프트맥스: 입력 벡터를 이산 확률 분포 형태의 벡터로 출력. 출력 벡터의 각 차원은 각 클래스별 확률 값이 들어있음
- 교차 엔트로피를 손실 함수로 사용하여 학습을 수행
- “소프트맥스 + 교차 엔트로피”를 사용하는 것은 “로그 소프트맥스 + NLL 손실함수”를 사용하는 것과 같다.
- 심층신경망을 활용한 분류 수식
\[\begin{gathered}
\hat{\theta}=\underset{\theta\in\Theta}{\text{argmin}}-\frac{1}{N}\sum_{i=1}^N{
y_i^\intercal\cdot\log{f_\theta(x_i)}
}, \\
\text{where }y_{1:N}\in\{0,1\}^{N\times{m}}\text{ and }\hat{y}_{1:N}\in[0,1]^{N\times{m}}.
\end{gathered}\]
문제
| 타겟 값
| 마지막 계층의 활성 함수
| 손실 함수
| 예제
|
회귀regression
| 연속continuous형 실수 벡터
| 없음
| MSE 손실 함수
| 주어진 신상 정보를 바탕으로 연봉 예측하기
|
이진 분류binary classification
| 0 또는 1
| 시그모이드 함수
| BCE 손실 함수
| 주어진 신상 정보를 바탕으로 성별 예측하기
|
분류classification
| 카테고리 또는 이산discrete 값
| 소프트맥트 함수
| CE 손실 함수
| 주어진 신상 정보를 바탕으로 직업군 예측하기
|