Một trong những thách thức lớn nhất của hệ thống đa tác tử hiện đại là duy trì nhận thức dài hạn khi khối lượng tương tác liên tục tăng lên. Giới hạn context window của mô hình ngôn ngữ cùng hiện tượng semantic drift khiến các Agent dễ mất tính nhất quán, quên thông tin quan trọng hoặc hình thành các kết luận lệch khỏi tri thức ban đầu. Kiến trúc kết hợp Agent Memory và Knowledge Graph đang nổi lên như một giải pháp trung tâm cho bài toán này.

Vì sao MAS cần một hệ thống bộ nhớ phân cấp?

Trong một hệ đa tác tử, mỗi Agent liên tục tạo ra dữ liệu mới thông qua hội thoại, lập kế hoạch và thực thi nhiệm vụ. Nếu toàn bộ lịch sử đều được đưa vào context hiện hành, chi phí xử lý sẽ tăng nhanh và vượt quá khả năng chứa của mô hình. Do đó cần một kiến trúc phân cấp, nơi chỉ những thông tin liên quan nhất được giữ trong bộ nhớ ngắn hạn, còn phần lớn tri thức được lưu trữ trong bộ nhớ dài hạn.

Mô hình này tương tự nhận thức của con người: chúng ta không mang theo toàn bộ ký ức trong ý thức hiện tại mà chỉ truy xuất những gì cần thiết khi giải quyết một vấn đề cụ thể.

Bộ nhớ ngắn hạn: Working Memory của Agent

Bộ nhớ ngắn hạn chứa trạng thái hiện hành, mục tiêu đang xử lý, kết quả trung gian và kế hoạch thực thi. Đây là lớp thông tin được đưa trực tiếp vào context của mô hình ngôn ngữ. Working Memory đóng vai trò như vùng làm việc tạm thời, cho phép Agent duy trì sự tập trung vào nhiệm vụ hiện tại.

Tuy nhiên, dung lượng của lớp bộ nhớ này bị giới hạn bởi context window. Vì vậy nó không thể trở thành nơi lưu trữ tri thức lâu dài.

Bộ nhớ dài hạn: nền tảng cho nhận thức bền vững

Bộ nhớ dài hạn lưu giữ kinh nghiệm tích lũy, dữ kiện lịch sử, hồ sơ thực thể và các tri thức đã được xác thực. Trong các hệ thống Agent hiện đại, lớp này thường được chia thành hai thành phần bổ sung cho nhau: Vector Database và Knowledge Graph.

Vector Database cho dữ liệu phi cấu trúc

Vector Database lưu trữ embedding của văn bản, tài liệu, hội thoại và các dạng dữ liệu phi cấu trúc. Khi Agent cần thông tin, hệ thống sử dụng semantic retrieval để tìm các nội dung có ý nghĩa tương đồng với truy vấn hiện tại.

  • Embedding: biểu diễn dữ liệu dưới dạng vector số học.
  • Similarity Search: tìm kiếm các nội dung gần nhau trong không gian ngữ nghĩa.
  • Semantic Retrieval: truy xuất thông tin theo ý nghĩa thay vì từ khóa.

Điểm mạnh của Vector DB là khả năng mở rộng và tìm kiếm nhanh trên lượng dữ liệu khổng lồ. Tuy nhiên, nó không đảm bảo các quan hệ logic được biểu diễn một cách tường minh.

Knowledge Graph như lớp tri thức cấu trúc

Knowledge Graph giải quyết điểm yếu đó bằng cách biểu diễn thực thể và quan hệ dưới dạng mạng lưới có cấu trúc. Mỗi nút đại diện cho một thực thể, còn các cạnh mô tả mối quan hệ giữa chúng. Nhờ vậy, hệ thống có thể thực hiện suy luận dựa trên cấu trúc thay vì chỉ dựa trên sự tương đồng ngữ nghĩa.

Knowledge Graph đóng vai trò như nguồn chân lý cấu trúc giúp các Agent duy trì cùng một mô hình thế giới khi cộng tác.

Thông qua định danh thực thể và ràng buộc logic, đồ thị tri thức giúp ngăn chặn việc các Agent diễn giải cùng một khái niệm theo nhiều cách khác nhau.

Hybrid Retrieval: kết hợp Vector và Graph

Kiến trúc tiên tiến nhất hiện nay thường sử dụng truy hồi lai. Đầu tiên hệ thống tìm kiếm các tài liệu liên quan bằng Vector Database. Sau đó các thực thể quan trọng được ánh xạ vào Knowledge Graph để kiểm tra tính nhất quán, mở rộng ngữ cảnh và xác thực quan hệ.

Quá trình này giúp giảm đáng kể semantic drift vì mọi thông tin truy xuất đều được neo vào các thực thể và quan hệ đã được xác nhận.

Cross-Agent Memory và giao tiếp liên tác tử

Trong MAS, bộ nhớ không còn là tài sản riêng của một Agent. Các Agent cần chia sẻ hồ sơ thực thể, trạng thái nhiệm vụ và tri thức đã khám phá. Một lớp Shared Context hoặc Cross-Agent Memory cho phép các tác tử đồng bộ nhận thức với nhau.

Knowledge Graph thường đóng vai trò là tầng trung gian để các Agent ghi nhận và đọc lại tri thức chung. Điều này giúp giảm mâu thuẫn giữa các Agent khi làm việc trên cùng một nhiệm vụ kéo dài nhiều phiên làm việc.

Giảm semantic drift bằng grounding và kiểm chứng

Để chống lại sự lệch nghĩa tích lũy theo thời gian, các hệ thống tiên tiến triển khai nhiều cơ chế như entity grounding, consistency checking và provenance tracking. Mỗi kết luận quan trọng đều được liên kết tới thực thể cụ thể và nguồn dữ liệu tương ứng. Khi có xung đột, Agent có thể truy ngược để xác minh tính đúng đắn.

Tương lai của Agentic AI

Khi Agentic AI phát triển, khả năng ghi nhớ và duy trì tri thức nhất quán sẽ trở thành yếu tố quan trọng không kém năng lực suy luận. Sự kết hợp giữa Working Memory, Vector Database và Knowledge Graph tạo nên một kiến trúc nhận thức nhiều tầng, giúp hệ thống hoạt động bền vững trong thời gian dài.

Đây được xem là nền tảng cho các hệ MAS thế hệ mới, nơi nhiều Agent có thể cộng tác liên tục, học hỏi lẫn nhau và hình thành trí tuệ tập thể mà không đánh mất tính nhất quán của tri thức.