머신러닝 모델 조회

머신러닝 모델링이 완료되면, 감독 학습 모델은 아래 예시 화면처럼 모델의 성능 지표를 확인할 수 있습니다. 또한 랜덤포레스트 모델은 각 입력 필드가 분류 예측에 있어서 어느 정도의 중요도를 가지는지 계산해서 중요한 순서대로 정렬하여 표시합니다. 중요도 값은 피처를 선별하는 용도로 활용될 수 있습니다.

각 모델 지표는 아래와 같은 의미를 가집니다:

정확도: Accuracy = (TP + TN) / (TP + TN + FP + FN)
정밀도: Precision = TP / (TP + FP)
재현율: Recall = TP / (TP + FN)
F1 점수: F1 score = (2 x 정밀도 x 재현율) / (정밀도 + 재현율)

Note

TP는 True Positive, TN은 True Negative, FP는 False Positive, FN은 False Negative를 의미합니다.

F1 점수는 정밀도와 재현율이 모두 좋아야만 높게 나오기 때문에, 단 하나의 지표를 봐야한다면 F1 점수를 참고하시면 됩니다. 다중 클래스 분류인 경우에는 테스트 집합의 분류 값 분포가 지표에 가중치로 반영됩니다.