Cuộc Chiến Các Chuẩn Giao Tiếp AI Agent: Function Calling, MCP và A2A – Đâu Là Tương Lai?

Lê Lân

28/07/2025

AI Agents và Tiêu Chuẩn Mới trong Phát Triển Ứng Dụng Trí Tuệ Nhân Tạo

Mở Đầu

Trong thế giới phát triển AI hiện nay, thuật ngữ AI Agents đang trở thành tâm điểm chú ý không chỉ vì sự thông minh mà còn bởi khả năng tự động hóa và hợp tác giữa các hệ thống AI.

Bạn có để ý rằng AI không còn chỉ là các chatbot thông minh nữa mà đang tiến hóa thành các chương trình tự động đầy đủ chức năng, có thể sử dụng công cụ, gọi API và làm việc nhóm với nhau? Các “ông lớn” như OpenAI, LangChain, Anthropic hay Google đang cạnh tranh để định nghĩa và chuẩn hóa cách các AI Agents hoạt động, đặc biệt là về kết nối công cụ và tương tác giữa các Agent. Trong bài viết này, ta sẽ cùng tìm hiểu ba tiêu chuẩn chính định hình tương lai kiến trúc AI Agents: Function Calling, MCP (Model Context Protocol) và A2A (Agent-to-Agent Protocol), phân tích điểm mạnh, hạn chế, cũng như cách ứng dụng thực tế cho các nhà phát triển.

Function Calling: Người Tiên Phong Với Những Hạn Chế

Khái Quát Về Function Calling

Function Calling, do OpenAI khởi xướng và sau đó được Meta, Google áp dụng, là cách tiếp cận đầu tiên để kết nối các mô hình ngôn ngữ lớn (LLM) với các công cụ bên ngoài thông qua API. Về bản chất, nó dạy cho LLM cách tạo ra các lời gọi API dựa trên ngôn ngữ tự nhiên của người dùng.

Quy Trình Hoạt Động

Người dùng hỏi ("Thời tiết ở Seattle thế nào?")

LLM nhận biết cần dữ liệu bên ngoài

LLM chọn hàm thích hợp trong danh sách định nghĩa sẵn

Định dạng tham số theo chuẩn JSON Schema:

{
  "location": "Seattle",
  "unit": "celsius"
}

Ứng dụng thực hiện gọi API

LLM trả lời dựa trên dữ liệu lấy về

Ưu Điểm và Hạn Chế

Ưu điểm: Đơn giản, dễ triển khai cho các ứng dụng đơn mô hình.

Hạn chế lớn là không có chuẩn nhất quán giữa các nhà cung cấp mô hình, gây khó khăn khi mở rộng cho đa mô hình (ví dụ: GPT và Claude yêu cầu định nghĩa chức năng khác nhau).

Không hỗ trợ sẵn khai thác chuỗi hàm đa bước — việc điều phối phải do lập trình viên đảm nhiệm.

Để tìm hiểu sâu hơn về function calling, bạn có thể tham khảo:

How to Use Function Calling with Ollama, Llama3 and Milvus - Zilliz blog

Understanding Function Calling in LLMs - Zilliz blog

MCP (Model Context Protocol): Bộ Phiên Dịch Toàn Cầu Cho AI và Công Cụ

Giới Thiệu MCP

MCP (Model Context Protocol) , sáng kiến từ Anthropic, đang được hỗ trợ bởi nhiều mô hình khác nhau như Claude, GPT, Llama. MCP thiết lập một chuẩn giao tiếp duy nhất để các mô hình và công cụ có thể tương tác, giải quyết triệt để vấn đề đa dạng không đồng bộ trong Function Calling.

Nguyên Lý Hoạt Động

MCP giống như cổng USB cho AI: các công cụ sẽ mô tả khả năng, input và output rõ ràng theo chuẩn thống nhất. Các mô hình AI chỉ cần đọc “bảng hướng dẫn” đó để sử dụng dễ dàng, và ứng dụng chỉ cần tích hợp một lần là tương thích với nhiều mô hình.

Kiến Trúc MCP

MCP Hosts: Ứng dụng người dùng tương tác (ví dụ: Claude Desktop)

MCP Clients: Kết nối, giao tiếp giữa Host và Server

MCP Servers: Công cụ, dịch vụ theo chuẩn MCP

Data Sources: Dữ liệu thực tế từ file, DB, API

MCP chuyển vấn đề M×N tích hợp thành M+N, giúp mở rộng quy mô hệ sinh thái AI trở nên dễ dàng và hiệu quả hơn.

Đọc thêm: How to Use Anthropic MCP Server with Milvus - Zilliz blog

A2A (Agent-to-Agent Protocol): Người Điều Phối Đội Nhóm AI Agents

Mục Đích Của A2A

Khác với Function Calling và MCP tập trung vào tương tác giữa mô hình và công cụ, A2A (Agent-to-Agent Protocol) của Google đặt trọng tâm vào việc các AI Agents giao tiếp, phối hợp và làm việc theo nhóm.

Cách Thức Hoạt Động

Các Agents có thể:

Khám phá và giới thiệu kỹ năng

Giao nhiệm vụ cho Agent phù hợp nhất

Phối hợp, cập nhật tiến trình và bảo mật thông tin

Ví dụ: Một Agent tuyển dụng có thể phân công cho các Agent chuyên nghiệp phụ trách từng khâu như tìm ứng viên, lên lịch phỏng vấn, kiểm tra lý lịch — tất cả điều phối trong cùng một hệ sinh thái.

So Sánh Nhanh: Function Calling vs MCP vs A2A

Tiêu Chí	Function Calling	MCP	A2A
Đối tượng kết nối	Mô hình → API	Mô hình → Công cụ (chuẩn hóa)	Agent → Agent (hợp tác nhóm)
Độ phức tạp	Thấp, dùng cho truy vấn đơn giản	Trung bình, hỗ trợ đa mô hình và công cụ	Cao, dành cho hệ thống đa agent phức tạp
Lợi ích chính	Triển khai nhanh, đơn giản	Tương thích rộng, giảm thiểu tái cấu trúc	Điều phối, phân quyền hiệu quả
Hạn chế	Không thống nhất đa mô hình	Phải cấu hình server	Còn mới, hỗ trợ hạn chế hiện tại
Ẩn dụ thực tế	Dạy AI gọi điện đến 1 đầu bếp	Có một người phiên dịch chung cho bếp	Đội nhóm đầu bếp làm việc phối hợp

Lưu ý: MCP trả lời câu hỏi "Agent có thể dùng công cụ gì?" trong khi A2A xử lý "Làm sao các Agent phối hợp với nhau?".

Ý Nghĩa Với Các Nhà Phát Triển

Với ứng dụng nhỏ, dùng Function Calling là nhanh và trực tiếp nhất.

Muốn hỗ trợ đa mô hình, tích hợp công cụ mở rộng, MCP là lựa chọn sáng giá.

Khi xây dựng hệ thống đa Agent phức tạp, cần xem xét A2A để điều phối và phối hợp hiệu quả.

Chiến lược thông minh là kết hợp các chuẩn này: bắt đầu với Function Calling cho nguyên mẫu, phổ chuẩn công cụ bằng MCP, và hướng tới triển khai đa Agent bằng A2A.

Hướng Đi Tương Lai

Loạt chuẩn trên đang tạo nền tảng cho thế hệ ứng dụng AI tiếp theo, từ demo nhỏ lẻ tiến tới giải pháp sản xuất quy mô lớn. Việc hiểu rõ và ứng dụng sớm giúp nhà phát triển tránh được việc tái cấu trúc tốn công tốn sức, đồng thời khai thác sức mạnh hợp tác, tự động hóa trong AI.

Bạn nghĩ thế nào? Bạn đang dùng chuẩn nào cho dự án AI của mình? Bạn chọn phương án duy nhất hay hướng tới hệ sinh thái đa chuẩn?

Tham Khảo

What Exactly Are AI Agents? Why OpenAI and LangChain Are Fighting Over Their Definition - Zilliz blog

How to Use Function Calling with Ollama, Llama3 and Milvus - Zilliz blog

Understanding Function Calling in LLMs - Zilliz blog

How to Use Anthropic MCP Server with Milvus - Zilliz blog

A2A: A New Era of Agent Interoperability - Google Developers Blog

Top 10 AI Agents to Watch in 2025 🚀 - Zilliz blog

Hãy theo dõi sát sao những tiến triển trong tiêu chuẩn AI Agents để xây dựng ứng dụng linh hoạt, dễ mở rộng và có thể phối hợp mạnh mẽ, đón đầu kỷ nguyên trí tuệ nhân tạo cộng tác.