Quay lại danh sách blog

ML cơ bản #3: Overfitting, underfitting và bias-variance

7 thg 3, 2026

Nhìn nhanh

Underfitting: model quá đơn giản, học chưa đủ.
Overfitting: model nhớ dữ liệu train quá kỹ, tổng quát kém.

Dấu hiệu nhận biết

Underfitting

Train error cao
Validation error cũng cao

Overfitting

Train error rất thấp
Validation error cao hơn đáng kể

Bias - Variance tradeoff

Bias cao -> dễ underfit
Variance cao -> dễ overfit

Mục tiêu là tìm điểm cân bằng phù hợp với dữ liệu và bài toán.

Cách giảm overfitting

Thêm dữ liệu chất lượng.
Dùng regularization (L1/L2, dropout).
Early stopping.
Giảm độ phức tạp model.
Feature selection hợp lý.

Cách giảm underfitting

Tăng độ phức tạp model.
Train thêm epoch (nếu chưa hội tụ).
Thêm feature có ý nghĩa.
Giảm regularization quá mạnh.

Quy trình debug để xài ngay

Vẽ learning curve (train vs validation).
Xác định rõ đang bị underfit hay overfit.
Đổi 1 nhóm biến mỗi lần (model/data/regularization).
Log kết quả có hệ thống, tránh "thử ngẫu nhiên".

ML tốt không phải là model phức tạp nhất, mà là model ổn định nhất trên dữ liệu chưa gặp.