Flow Engineering

Trong thế giới phát triển công nghệ hiện đại, Trí tuệ Nhân tạo (AI) đang dần trở thành trọng tâm của nhiều ứng dụng. Đặc biệt, các Mô hình Ngôn ngữ Lớn (LLM) như GPT-4, Gemini đã mở ra những khả năng chưa từng có. Tuy nhiên, việc phát triển một ứng dụng LLM hoàn chỉnh không chỉ đơn thuần là gọi API của mô hình. Hầu hết các ứng dụng LLM phức tạp ngày nay đều được xây dựng dựa trên kiến trúc Agent, nơi nhiều Agent thông minh kết hợp với nhau để giải quyết một nhiệm vụ lớn hơn.

Vậy, nếu với tư cách là một nhà phát triển Agent, làm thế nào để các Agent này có thể hoạt động ăn khớp và hiệu quả và quan trọng nhất là có kiểm soát? Từ những câu hỏi này mà một khái niệm đang ngày càng được nhắc đến nhiều hơn trong cộng đồng là Flow Engineering. Và theo quan điểm cá nhân mình, đây là một yếu tố cực kỳ quan trọng.

Tại sao Flow Engineering lại quan trọng?

Hãy hình dung một ứng dụng LLM cần thực hiện nhiều bước để hoàn thành một yêu cầu của người dùng. Ví dụ: một trợ lý ảo hỗ trợ đặt vé máy bay cần:

Thu thập thông tin chuyến bay: Điểm đi, điểm đến, ngày đi, số lượng hành khách.
Tìm kiếm chuyến bay: Truy vấn cơ sở dữ liệu hoặc API của hãng hàng không.
Xác nhận thông tin: Hỏi lại người dùng để đảm bảo thông tin chính xác.
Xử lý thanh toán: Chuyển sang một quy trình thanh toán an toàn.

Mỗi bước này có thể được xử lý bởi một Agent chuyên biệt. Agent thu thập thông tin, Agent tìm kiếm, Agent xác nhận, Agent thanh toán. Vấn đề là làm thế nào để chúng biết khi nào nên “chuyển giao” công việc cho nhau? và thứ tự thực hiện nên là thế nào, liệu chúng ta có nên để ứng dụng Agent tự quyết định các bước không? … Theo mình, câu trả lời là không. Và đó chính là lúc Flow Engineering phát huy vai trò. Nó không chỉ đơn giản là “nối các Agent với nhau”, mà là định nghĩa rõ ràng toàn bộ luồng hoạt động (flow) của hệ thống, gồm thứ tự, rẽ nhánh, điều kiện chuyển tiếp, và các điểm giao tiếp.

LLM nên là “bộ não điều phối”, không phải “người viết kịch bản”

Trong các ứng dụng Agent, vai trò của LLM rất quan trọng, điều này không cần bàn cãi. Tuy nhiên, một cách thiết kế thông minh là không để LLM tự “sáng tạo” ra luồng xử lý, mà chỉ ra quyết định trong phạm vi các flow đã được định nghĩa trước. LLM phân tích input và context, sau đó chọn flow phù hợp nhất để kích hoạt.

Điều này giúp giảm thiểu rủi ro, duy trì tính kiểm soát và đảm bảo tính ổn định cho ứng dụng. Nếu để LLM tự quyết định toàn bộ flow, rất dễ dẫn đến ứng dụng hành xử không ổn định, khó kiểm soát, và tiềm ẩn rủi ro bảo mật.

Hãy xem xét lại ví dụ đặt vé máy bay:

Khi người dùng nói: “Tôi muốn đặt vé máy bay đi Hà Nội”, LLM sẽ nhận diện ý định và kích hoạt flow “thu thập thông tin chuyến bay”.
Sau khi thu thập đủ thông tin, LLM nhận ra rằng đã có đủ dữ liệu để tìm kiếm, và nó sẽ chuyển sang kích hoạt flow “tìm kiếm chuyến bay”.
Nếu người dùng đột ngột hỏi: “Tôi có thể thay đổi ngày đi không?”, LLM sẽ phân tích và biết rằng nó cần quay lại flow “thu thập thông tin” để cập nhật dữ liệu.

Các flow này được thiết kế một cách tỉ mỉ bởi các nhà phát triển. Chúng bao gồm các bước tuần tự, các điều kiện rẽ nhánh, và các điểm giao tiếp giữa các Agent.

Flow Engineering không phải là một thuật ngữ phức tạp, nhưng nó nhắc nhở chúng ta rằng: để xây dựng một ứng dụng Agent thông minh, hiệu quả và có kiểm soát, chúng ta cần định nghĩa rõ luồng xử lý, chứ không giao phó toàn bộ cho LLM. Nó giúp giữ ứng dụng trong khuôn khổ an toàn, dễ kiểm thử, dễ bảo trì, và tránh được những rủi ro khó lường từ sự “sáng tạo quá đà” của các mô hình ngôn ngữ.

Lưu ý nhỏ: Theo hiểu biết của mình, thuật ngữ “Flow Engineering” hiện vẫn chưa có định nghĩa chính thức. Bài viết này hoàn toàn dựa trên góc nhìn và trải nghiệm cá nhân. Nếu các bạn có góp ý hoặc quan điểm khác, rất mong nhận được chia sẻ trong phần bình luận bên dưới.

Nghia's Blog

Tại sao Flow Engineering lại quan trọng?

LLM nên là “bộ não điều phối”, không phải “người viết kịch bản”