Giải mã bí ẩn: Làm sao để AI Agent không còn 'lạc lối' khi làm việc?

Lê Lân

18/07/2025

Giải Quyết Thách Thức Điều Khiển AI Agent Đa Bước Bằng Model Context Protocol Động

Mở Đầu

Điều khiển các AI agent thực hiện các nhiệm vụ đa bước một cách đáng tin cậy luôn là một thách thức lớn trong phát triển phần mềm hiện đại.

Bạn đã từng thiết kế một workflow đầy hứa hẹn, nhưng AI agent lại đi sai hướng, chọn nhầm công cụ hoặc bị "đứng hình" giữa chừng chưa? Cảm giác như vừa giao chìa khóa một con tàu vũ trụ cho một đứa trẻ – đầy rẫy sự hỗn loạn và khó kiểm soát.

Jesse, nhà sáng lập Portal One – nền tảng AI Agent Command Center, đã trải qua chính vấn đề này. Nhận ra nguyên nhân sâu xa là do cấp quá nhiều tự do và công cụ cùng lúc cho AI agent, ông đã phát triển một phương pháp mới dựa trên Model Context Protocol (MCP) động, giúp tăng độ chính xác bằng cách hạn chế và điều chỉnh công cụ theo trạng thái nhiệm vụ.

Bài viết sẽ đi sâu vào ba nhận định chính, đi kèm ví dụ thực tế và các giải pháp giúp bạn xây dựng AI agent đáng tin cậy hơn.

1. Vấn Đề "Đứa Trẻ Trong Cửa Hàng Kẹo": Quá Nhiều Công Cụ Dẫn Đến Rối Loạn

1.1 Nguyên Nhân Gây Ra Vấn Đề

Ban đầu, MCP server được xây dựng như một danh sách dài 50 trang các công cụ có thể sử dụng cho agent. Nhưng với một danh sách quá rộng lớn và nhiều công cụ tên gọi hay chức năng giống nhau, agent dễ dàng lạc lối hoặc chọn sai công cụ.

1.2 Giải Pháp: Danh Sách Công Cụ Có Lọc, Dựa Trên Ngữ Cảnh

Key Insight: Chỉ nên cho AI agent truy cập đến các công cụ có liên quan trực tiếp trong trạng thái nhiệm vụ hiện tại.

Chẳng hạn, khi agent chưa bắt đầu chơi một trò chơi, nó không cần thấy công cụ "make_guess".

1.3 Cách MCP Động Vận Hành

Thay vì trả về danh sách công cụ cố định, MCP server kiểm tra trạng thái hiện tại của agent và chỉ trả về những công cụ phù hợp, giảm mạnh không gian hành động (action space), giúp agent đưa ra quyết định chính xác hơn.

Đây chính là cốt lõi trong Model Context Protocol – một giao thức cho phép máy chủ kiểm soát sự xuất hiện của các công cụ dựa trên ngữ cảnh.

2. MCP Server Không Chỉ Là Máy Bán Hàng: Vai Trò Người Hướng Dẫn Nhiệm Vụ

2.1 Thách Thức Với Thiết Kế Cũ

Các AI agent cũ cảm giác như người dùng chơi trò tệ bằng cách đâm đầu vào API mà không nhận được sự hỗ trợ hợp lý. Điều này dẫn đến việc agent thử làm việc sai thứ tự hoặc bỏ sót những bước quan trọng.

2.2 Ý Tưởng Mới: Server Giúp Giám Sát Trạng Thái Nhiệm Vụ

Server cần theo dõi trạng thái nhiệm vụ và cập nhật ngữ cảnh, từ đó chủ động điều chỉnh các công cụ và hướng đi hợp lý cho agent.

2.3 Ví Dụ: Trò Chơi Đoán Số Sử Dụng MCP Động

Lobby State (Chờ Bắt Đầu): Agent chỉ nhìn thấy công cụ start_game .

Playing State (Đang Chơi): Sau khi gọi start_game , trạng thái chuyển thành "Playing". Công cụ start_game biến mất, thay vào đó là make_guess và give_up_game .

Cập Nhật Động: Sau mỗi lần đoán, mô tả công cụ make_guess điều chỉnh để giới hạn phạm vi số, ví dụ "Đoán số trong khoảng 51 đến 100" nếu số đoán trước quá thấp.

Như vậy, server không còn là "máy bán hàng tự động" mà trở thành người giám sát, giúp agent hiểu được các bước đi hợp lý.

Xem chi tiết code demo máy chủ Number Guessing Game trên GitHub .

3. Minh Họa Sinh Động Vẫn Là Cách Hiệu Quả Nhất

3.1 Thách Thức Truyền Đạt Ý Tưởng Trừu Tượng

Khái niệm "cung cấp khả năng dựa trên bối cảnh, trạng thái và thích ứng động cho AI agents" nghe có vẻ phức tạp và khó hiểu với nhiều người.

3.2 Giải Pháp: Demo Tương Tác

Những minh họa đơn giản, cụ thể như trò chơi đoán số giúp người dùng trực quan thấy sự thay đổi động của danh sách công cụ và hiểu cách MCP vận hành.

Điều này làm cho khái niệm trừu tượng trở nên dễ nắm bắt và truyền cảm hứng hơn cho các nhà phát triển AI.

Kết Luận

Không thể phủ nhận, việc quản lý AI agents thực hiện các nhiệm vụ nhiều bước một cách chính xác và hiệu quả là một bài toán khó. Tuy nhiên, bằng cách áp dụng Model Context Protocol động – cho phép server kiểm soát ngữ cảnh và bản chất các công cụ xuất hiện cho agent – chúng ta có thể giảm thiểu sai sót, tăng tính chính xác và sự đáng tin cậy cho AI.

Jesse và nhóm Portal One đã chứng minh điều này qua mô hình trò chơi đoán số đơn giản nhưng hiệu quả, chỉ với việc tinh chỉnh trạng thái và công cụ hiển thị theo bước thực hiện.

Bạn có thể tìm hiểu thêm chi tiết kỹ thuật và kiến trúc tại bài viết chi tiết trên blog Portal One cũng như xem demo mã nguồn mở để tự thử nghiệm.

Hãy bắt đầu thử nghiệm MCP động trong dự án AI của bạn để đưa AI agent lên một tầm cao mới trong khả năng tự quản lý và điều phối nhiệm vụ!

Tham Khảo

Portal One Blog: Dynamic MCP Servers Tame Complexity June 1, 2024

Jesse's Number Guessing Game Demo: GitHub Repository May 15, 2024

Model Context Protocol Specification: Official Draft April 20, 2024

MCP TypeScript SDK: GitHub May 10, 2024