[ML] 03. Evaluation

AI&ML/Machine Learning

[ML] 03. Evaluation

lallala 2024. 1. 12. 16:17

1. 성능평가척도
2. 오버피팅
3. 성능 평가 방법

1. 성능평가척도

0) Confusion Matrix

1) 정확도 Accuracy

→ 올바르게 예측한 케이스의 비율

$Accuracy=\frac{TN+TP}{\textbf{ALL}}$

2) 정밀도 Precision

→ 양성 예측 중 실제 양성 비율

$Precision= \frac{TP}{TP+FP}$

3) 재현율 Recall

→ 실제 양성 중 예측을 맞춘 비율

민감도(Sensitivity), True Positivie Rate(TPR)

$Recall(=Sensitivity)= \frac{TP}{TP+FN}$

4) 특이도 Specificity

→ 실제 음성 중 예측을 맞춘 비율

True Negative Rate(TNR)

$Specificity= \frac{TN}{TN+FP}$

※) 성능 척도 간의 Trade-off

Precision vs, Recall(Sensitivity)
Sensitivity(Recall) vs. Specificity

5) F1-Score

Precision과 Recall의 조화평균

$F1=2*\frac{precision*recall}{precision+recall}$

6) AUC

Sensitivity(Recall) vs. Specificity

Specificity가 얼마나 감소하면 Sensitivity가 100%가 되는지를 보는 척도 (* sencitivity가 100%인게 더 의미있음)

임계치 조절하여 Specificity 감소(*임계치: 양성과 음성으로 판별하기 위해 예측값을 구분하기 위한 값, 기본값:0.5)

ROC Curve(AUC는 ROC아래 면적 의미)

x축: 1-specificity (specificitiy가 손해본 정도)

y축: sensitivity

2. 오버피팅

→ 주어진 데이터에만 너무 특화되어 새로운 데이터에 대해 성능이 떨어지는 현상

학습데이터 성능은 좋은데 평가데이터 성능 안좋음

Low Bias, High Variance

Low Bias: 학습데이터에 대해서 예측값과 정답값의 차이가 작음

High Variance: 입력값에 따라 예측값이 크게 달라짐(데이터마다 예측이 크게 바뀜)

vs. 언더피팅 → High Bias, Low Variance

학습데이터 성능과 평가데이터 성능 모두 안좋음

Bias 와 Variance는 Trade-off 관계

3. 성능 평가 방법

1) 별도의 테스트 데이터로 성능 측정!

학습데이터 + 테스트데이터

2) 검증데이터에 대해 평가해보며 학습하고, 테스트 데이터로 성능 최종평가!

학습데이터 + 검증데이터 + 테스트데이터

최적화 된 하이퍼파라미터 찾기

한가지 조합에만 특화될 수 있어 → Cross-Validation

학습데이터와 검증 데이터로 나누는 것을 여러번 수행, 각 조합 별 성능 평가를 평균하여 평가하는 방법

ㄱ. LOOCV(Leave-One-Out Cross Validation): 샘플하나씩 돌아가면서 검증데이터로 사용, 데이터 n개 →n번 실행

ㄴ. K-fold Cross Validation: k그룹으로 나누고 한 그룹씩 돌아가면서 ~~, k는 보통 5나10

ㄷ. K-Holdout Cross Validation: k번 성능 평가하되 무작위로 검증데이터 만들어 사용 (중복, 제외될 수 있음)

3) 데이터 너무 없으면 전체데이터에 대해 교차 검증 수행 (검증데이터, 테스트데이터 나눌 여유 없어서)

+ 딥러닝은 이미 데이터가 많아서 Cross Validation 안하는 경우 많음

저작자표시

'AI&ML > Machine Learning' 카테고리의 다른 글

[ML] 05. Support Vector Machine(SVM) (0)	2024.01.12
[ML] 04. Decision Tree (1)	2024.01.12
[ML] 02. Text Data (0)	2024.01.12
[ML] 01. Naïve Bayes (나이브베이즈) (0)	2024.01.07
[ML] 00. Overview (0)	2024.01.06

현재글[ML] 03. Evaluation

블로그

C언어, 장고, 코딩테스트실력진단, 튜토리얼, 코딩테스트, 리눅스, 설문조사, 다항논리회귀, python, 데이터, 이중포인터, Django, GIT, 스파르타코딩클럽, 이진논리회귀, 코드트리, 포인터, 논리회귀, 알고리즘, 머신러닝,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

blog...

[ML] 03. Evaluation

1. 성능평가척도

0) Confusion Matrix

1) 정확도 Accuracy

2) 정밀도 Precision

3) 재현율 Recall

4) 특이도 Specificity

5) F1-Score

6) AUC

2. 오버피팅

3. 성능 평가 방법

1) 별도의 테스트 데이터로 성능 측정!

2) 검증데이터에 대해 평가해보며 학습하고, 테스트 데이터로 성능 최종평가!

3) 데이터 너무 없으면 전체데이터에 대해 교차 검증 수행 (검증데이터, 테스트데이터 나눌 여유 없어서)

'AI&ML > Machine Learning' 카테고리의 다른 글

'AI&ML/Machine Learning'의 다른글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

[ML] 03. Evaluation

1. 성능평가척도

0) Confusion Matrix

1) 정확도 Accuracy

2) 정밀도 Precision

3) 재현율 Recall

4) 특이도 Specificity

5) F1-Score

6) AUC

2. 오버피팅

3. 성능 평가 방법

1) 별도의 테스트 데이터로 성능 측정!

2) 검증데이터에 대해 평가해보며 학습하고, 테스트 데이터로 성능 최종평가!

3) 데이터 너무 없으면 전체데이터에 대해 교차 검증 수행 (검증데이터, 테스트데이터 나눌 여유 없어서)

'AI&ML > Machine Learning' 카테고리의 다른 글

'AI&ML/Machine Learning'의 다른글

관련글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역