Học sâu là nhánh của học máy sử dụng mạng nơ-ron nhiều tầng để tự động học biểu diễn dữ liệu.
Nền tảng
Mô hình nhận dữ liệu, tính hàm mất mát và cập nhật trọng số bằng lan truyền ngược.
Kiến trúc
CNN phù hợp ảnh, RNN xử lý chuỗi và Transformer trở thành kiến trúc chủ đạo nhờ cơ chế Attention.
- Embedding: biểu diễn dữ liệu thành vector.
- Regularization: giảm quá khớp.
Chất lượng dữ liệu và thiết kế mô hình đều ảnh hưởng mạnh đến kết quả.
Kết luận
Học sâu là nền tảng của nhiều hệ AI hiện đại trong thị giác, ngôn ngữ và âm thanh.