Link

요약

  • 분류 문제 평가 지표
    • 정밀도precision: 모델이 정답이라고 예측한 샘플 중에서 실제 정답의 비율
    • 재현율recall: 실제 정답 중에서 모델이 맞춘 비율
    • 임계값 설정에 따른 모델의 성격 변화
      • 임계값이 높을 때: 정밀도가 높아지지만, 재현율이 내려감
      • 임계값이 낮을 때: 재현율이 높아지지만, 정밀도가 내려감
    • AUROC: ROC 곡선 아래 면적의 넓이. 모델이 강인할수록 수치가 높아짐
    • F1 점수 수식:
\[\begin{gathered} \text{F1-Score}=2\times\frac{\text{Recall}\times\text{Precision}}{\text{Recall}+\text{Precision}} \end{gathered}\]
  • 심층신경망을 활용한 분류
    • 심층신경망의 마지막에 소프트맥스 함수를 씌워 분류기로 만듦
    • 소프트맥스: 입력 벡터를 이산 확률 분포 형태의 벡터로 출력. 출력 벡터의 각 차원은 각 클래스별 확률 값이 들어있음
    • 교차 엔트로피를 손실 함수로 사용하여 학습을 수행
    • “소프트맥스 + 교차 엔트로피”를 사용하는 것은 “로그 소프트맥스 + NLL 손실함수”를 사용하는 것과 같다.
  • 심층신경망을 활용한 분류 수식
\[\begin{gathered} \hat{\theta}=\underset{\theta\in\Theta}{\text{argmin}}-\frac{1}{N}\sum_{i=1}^N{ y_i^\intercal\cdot\log{f_\theta(x_i)} }, \\ \text{where }y_{1:N}\in\{0,1\}^{N\times{m}}\text{ and }\hat{y}_{1:N}\in[0,1]^{N\times{m}}. \end{gathered}\]
문제 타겟 값 마지막 계층의 활성 함수 손실 함수 예제
회귀regression 연속continuous형 실수 벡터 없음 MSE 손실 함수 주어진 신상 정보를 바탕으로 연봉 예측하기
이진 분류binary classification 0 또는 1 시그모이드 함수 BCE 손실 함수 주어진 신상 정보를 바탕으로 성별 예측하기
분류classification 카테고리 또는 이산discrete소프트맥트 함수 CE 손실 함수 주어진 신상 정보를 바탕으로 직업군 예측하기