Chi phí triển khai Smart Project Search tại VDL-VN phụ thuộc vào ba yếu tố chính: lượng dữ liệu, số người dùng và tần suất truy vấn. Tuy nhiên, với cách thiết kế tối ưu và chiến lược pilot-first, hệ thống có thể đạt ROI dương ngay trong năm đầu tiên.
Cấu trúc chi phí tổng thể
Chi phí được chia thành bốn nhóm chính: AI (OpenAI), hạ tầng cloud (Azure), lưu trữ dữ liệu và chi phí phát triển/vận hành. Trong đó, chi phí AI thường biến động theo mức sử dụng, còn hạ tầng và lưu trữ có thể kiểm soát tốt hơn.
Chi phí OpenAI
Mỗi truy vấn trong Smart Search bao gồm hai phần: embedding để tìm kiếm và GPT để sinh câu trả lời. Trung bình một query có thể tiêu tốn khoảng 2.000–4.000 tokens.
- Embedding: chi phí thấp, dùng khi index tài liệu
- GPT inference: chi phí chính khi trả lời câu hỏi
Ước tính chi phí mỗi query dao động từ 0.002 đến 0.01 USD tùy cấu hình.
Chi phí hạ tầng Azure
Hạ tầng bao gồm máy chủ xử lý, Kubernetes cluster và network. Với pilot, có thể dùng cấu hình nhỏ (2–3 VM). Khi scale, chi phí tăng theo số user và lượng dữ liệu.
Chi phí lưu trữ
Dữ liệu kỹ thuật thường chiếm dung lượng lớn. Tuy nhiên, Azure Blob Storage có chi phí thấp, đặc biệt nếu kết hợp cold storage cho dữ liệu ít truy cập.
Chi phí vector database
Vector DB là thành phần quan trọng nhưng chi phí không quá cao nếu tối ưu index và caching. Chi phí chủ yếu đến từ query compute và lưu trữ embedding.
Ước tính chi phí theo giai đoạn
Giai đoạn Pilot (50 user, 5000 tài liệu)
- OpenAI: ~200–500 USD/tháng
- Azure infra: ~300–700 USD/tháng
- Storage: ~50–150 USD/tháng
- Tổng: ~600–1.200 USD/tháng
Giai đoạn Scale (100–200 user)
- OpenAI: ~800–2.000 USD/tháng
- Azure infra: ~1.000–2.500 USD/tháng
- Storage: ~200–500 USD/tháng
- Tổng: ~2.000–5.000 USD/tháng
Chi phí trên mỗi truy vấn
Cost per query là chỉ số quan trọng nhất. Với hệ thống tối ưu, mỗi query có thể dưới 0.005 USD. Khi có cache tốt, chi phí này còn thấp hơn.
Chi phí AI không nằm ở mô hình, mà nằm ở cách bạn thiết kế hệ thống sử dụng mô hình đó.
Tối ưu chi phí
Để giảm chi phí, cần tập trung vào caching, giảm token, tối ưu chunk và sử dụng hybrid search để giảm số lần gọi LLM.
ROI và hoàn vốn
Với mức tiết kiệm khoảng 10.000 giờ công mỗi năm như trong báo cáo fileciteturn0file0, hệ thống có thể mang lại giá trị tương đương 2.5–3 tỷ VNĐ/năm. So với chi phí vài trăm triệu mỗi năm, thời gian hoàn vốn chỉ khoảng 2–4 tháng.
Kết luận
Smart Project Search là một trong những use case hiếm hoi có thể đạt ROI dương rất nhanh. Nếu triển khai đúng cách, chi phí không phải là rào cản mà là đòn bẩy để mở rộng toàn bộ chiến lược AI của VDL-VN.