AIML
분류모델 성능 지표 - MSE, MAE, MAPE, R2
하이지구
2024. 10. 7. 01:21
MSE, MAE, MAPE, R2는 회귀 모델의 성능을 평가하는 데 사용되는 주요 지표들입니다.
1. MSE (Mean Squared Error)
MSE는 예측값과 실제값의 차이를 제곱한 후 평균을 낸 값입니다.
- \( MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 \)
- 위 식에서 \( y \) 는 실제 출력변수고 \( \hat{y} \) 는 예측한 출력변수입니다.
- MSE는 오차를 제곱하기 때문에 큰 오차에 더 민감합니다.
- 값이 작을수록 모델의 성능이 좋다고 평가합니다.
2. MAE (Mean Absolute Error)
MAE는 예측값과 실제값의 차이의 절댓값을 평균한 값입니다.
- \( MAE = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i| \)
- 위 식에서 \( y \) 는 실제 출력변수고 \( \hat{y} \) 는 예측한 출력변수입니다.
- MAE는 오차의 절댓값을 사용하기 때문에 MSE보다 이상치에 덜 민감합니다.
- 값이 작을수록 모델의 성능이 좋다고 평가합니다.
3. MAPE (Mean Absolute Percentage Error)
MAPE는 실제값과 예측값의 차이를 실제값으로 나눈 후 절댓값을 취하고 평균을 낸 값입니다.
- \( MAPE = \frac{1}{n} \sum_{i=1}^{n} |\frac{y_i - \hat{y}_i}{y_i}| \times 100% \)
- 위 식에서 \( y \) 는 실제 출력변수고 \( \hat{y} \) 는 예측한 출력변수입니다.
- MAPE는 오차를 백분율로 표현하기 때문에 다른 모델과 비교하기 쉽습니다.
- 값이 작을수록 모델의 성능이 좋다고 평가합니다.
4. R² (R-squared, 결정계수)
R²는 모델이 데이터의 분산을 얼마나 잘 설명하는지를 나타내는 지표입니다.
- \( R2 = 1 - \frac{\sum_{i=1}^{n} (y_i - \hat{y}i)^2}{\sum{i=1}^{n} (y_i - \bar{y})^2} \)
- 위 식에서 \( y \) 는 실제 출력변수고 \( \hat{y} \) 는 예측한 출력변수입니다. 그리고 \( \bar{y} \) 는 y의 평균값입니다.
- R²는 0에서 1 사이의 값을 가집니다. 1에 가까울수록 모델의 성능이 좋다고 평가합니다.