머신러닝 모델 조회
머신러닝 모델링이 완료되면, 감독 학습 모델은 아래 예시 화면처럼 모델의 성능 지표를 확인할 수 있습니다. 또한 랜덤포레스트 모델은 각 입력 필드가 분류 예측에 있어서 어느 정도의 중요도를 가지는지 계산해서 중요한 순서대로 정렬하여 표시합니다. 중요도 값은 피처를 선별하는 용도로 활용될 수 있습니다.
각 모델 지표는 아래와 같은 의미를 가집니다:
- 정확도
- Accuracy = (TP + TN) / (TP + TN + FP + FN)
- 정밀도
- Precision = TP / (TP + FP)
- 재현율
- Recall = TP / (TP + FN)
- F1 점수
- F1 score = (2 x 정밀도 x 재현율) / (정밀도 + 재현율)
Note
TP는 True Positive, TN은 True Negative, FP는 False Positive, FN은 False Negative를 의미합니다.
F1 점수는 정밀도와 재현율이 모두 좋아야만 높게 나오기 때문에, 단 하나의 지표를 봐야한다면 F1 점수를 참고하시면 됩니다. 다중 클래스 분류인 경우에는 테스트 집합의 분류 값 분포가 지표에 가중치로 반영됩니다.
