Nhìn nhanh
- Underfitting: model quá đơn giản, học chưa đủ.
- Overfitting: model nhớ dữ liệu train quá kỹ, tổng quát kém.
Dấu hiệu nhận biết
Underfitting
- Train error cao
- Validation error cũng cao
Overfitting
- Train error rất thấp
- Validation error cao hơn đáng kể
Bias - Variance tradeoff
- Bias cao -> dễ underfit
- Variance cao -> dễ overfit
Mục tiêu là tìm điểm cân bằng phù hợp với dữ liệu và bài toán.
Cách giảm overfitting
- Thêm dữ liệu chất lượng.
- Dùng regularization (L1/L2, dropout).
- Early stopping.
- Giảm độ phức tạp model.
- Feature selection hợp lý.
Cách giảm underfitting
- Tăng độ phức tạp model.
- Train thêm epoch (nếu chưa hội tụ).
- Thêm feature có ý nghĩa.
- Giảm regularization quá mạnh.
Quy trình debug để xài ngay
- Vẽ learning curve (train vs validation).
- Xác định rõ đang bị underfit hay overfit.
- Đổi 1 nhóm biến mỗi lần (model/data/regularization).
- Log kết quả có hệ thống, tránh "thử ngẫu nhiên".
ML tốt không phải là model phức tạp nhất, mà là model ổn định nhất trên dữ liệu chưa gặp.