데이터 분석가:Applied Data Analytics/ADsP

ADsP 내용 용어정리-(Accuracy와 Precision)

데이터분석 2025. 2. 19. 07:46
320x100
728x90

ADsP시험 내용 중 용어 중심으로 정리 하였습니다.

Accuracy와 Precision

1) Accuracy (정확도) : "전체 중에서 맞춘 것", "중앙을 맞췄는가?"

  • 전체 데이터 중에서 정답을 맞춘 비율을 의미함.
  • 공식:

  • TP (True Positive) ↑ : 실제 긍정(Positive)이고 예측도 Positive(긍정), Accuracy가 높으므로 TP가 많은 편
  • TN (True Negative) ↑ : 실제 Negative(부정)이고, 예측도 Negative(부정), Accuracy가 높으므로 TN도 많은 편  
  • FP (False Positive) ↑ : 실제 Negative(부정)인데, 예측을 Positive(긍정),
    Precision이 낮다는 것은 긍정으로 예측한 것 중에서 틀린 비율(FP)이 높다는 것.
    모델이 긍정이라고 예측한 것 중 실제 부정(FP)이 많음
  • FN (False Negative) ↓ : Accuracy가 높기 때문에 FN이 많지는 않음,
    실제 Positive(긍정)인데 Negative(부정)로 잘못 예측하는 경우가 적음 

2) Precision (정밀도) : "맞다고 한 것 중에서 진짜 맞은 비율", "화살이 한 곳에 모여 있는가?"

  • 모델이 긍정(Positive)이라고 예측한 것들 중에서 실제로 긍정인 비율을 의미함.
  • 공식:

  • 즉, False Positive(거짓 긍정)를 얼마나 줄이느냐가 핵심
  • 의료 진단, 스팸 필터링 등에서 중요하게 사용됨.
    (예: 암 진단에서 양성으로 예측한 경우가 실제 암 환자인지 확인하는 것이 중요)

Accuracy 높음, Precision 높음  → TP↑, TN↑, FP↓ , FN↓
예측이 매우 정확하여 긍정(Positive)과 부정(Negative) 모두 잘 맞춤

  • FP↓: 건강한 사람을 암이라고 잘못 진단하는 경우 거의 없음
  • FN↓: 암 환자를 건강하다고 놓치는 경우 거의 없음

Accuracy 높음, Precision 낮음  → TP↑, TN↑, FP↑, FN↓
전체적으로 맞춘 개수(TP+TN)는 많지만, Precision이 낮음 (FP가 많음)

  • FP↑: 건강한 사람도 암이라고 잘못 예측하는 경우 많음 (Precision 낮음 원인!)
  • FN↓: 암 환자를 놓치는 경우는 적음

Accuracy 낮음, Precision 높음  → TP↓, TN↓, FP, FN↑ 
긍정이라고 예측한 것(TP+FP) 중에서 실제 맞는 비율(Precision)은 높음 (FP 적음), 하지만 전체 Accuracy는 낮음 → (FN 많음, TN 적음)

 

  • FP↓: 건강한 사람을 암이라고 잘못 예측하는 경우 거의 없음 (Precision이 높은 이유!)
  • FN↑: 암 환자를 건강하다고 놓치는 경우 많음 (Accuracy가 낮아지는 이유!)

Accuracy 낮음, Precision 낮음  → TP↓, TN↓, FP↑, FN↑ 
예측이 엉망이라 맞춘 개수(TP+TN)도 적고, Precision(정밀도)도 낮음, 즉, FP도 많고 FN도 많음 → Accuracy와 Precision 둘 다 낮음

  • FP↑: 건강한 사람을 암이라고 잘못 예측하는 경우 많음
  • FN↑: 암 환자를 건강하다고 놓치는 경우 많음

 

  1. Accuracy 높음, Precision 높음 🔵 → 모델이 정확하고 신뢰할 수 있음
  2. Accuracy 높음, Precision 낮음 🟡 → 정답을 많이 맞추지만, 긍정 예측의 신뢰도가 낮음 (FP 많음)
  3. Accuracy 낮음, Precision 높음 🔴 → 긍정을 조심스럽게 예측해서 Precision은 높지만, 전체 Accuracy가 낮음 (FN 많음)
  4. Accuracy 낮음, Precision 낮음 ⚫ → 엉망인 모델 (FP, FN 둘 다 많음)