AI Agent đang bước qua giai đoạn demo
Dạo này ai làm AI agent chắc cũng để ý một chuyện khá thú vị: OpenAI vừa thông báo sẽ dừng Agent Builder và Evals vào cuối tháng 11/2026, rồi khuyên ai đang dùng workflow nghiêm túc thì nên chuyển sang Agents SDK.
Nghe qua thì hơi lạ. Vì mới năm ngoái thôi, Agent Builder còn được giới thiệu như một cách rất nhanh để tạo agent bằng giao diện kéo thả. Kiểu bạn vào vẽ flow, nối node, gắn tool, chỉnh prompt, bấm chạy. Nhìn rất đã. Demo rất sướng. Ai cũng có cảm giác là: “À, vậy là từ nay build agent dễ rồi.”
Nhưng mình nghĩ chuyện này không bất ngờ lắm.
Nó là cái vòng lặp quá quen thuộc của software.
Cứ mỗi lần có một công nghệ mới xuất hiện, thị trường sẽ cố đóng gói nó thành thứ dễ dùng nhất có thể. Web app thì có website builder. Automation thì có Zapier, Make, n8n. Mobile app thì có app builder. Giờ tới agent thì cũng có agent builder.
Giai đoạn đầu như vậy rất cần. Vì nó giúp người ta hiểu concept nhanh hơn. Người non-tech cũng thử được. Founder cũng demo được. Team cũng có cái để hình dung.
Nhưng sau giai đoạn demo là một câu hỏi rất khó chịu: cái này chạy production kiểu gì?
Và đây là lúc mọi thứ bắt đầu bớt vui.
Một agent demo có thể chỉ cần chạy đúng một lần trên video. Nhưng một agent production thì không được phép “hôm nay vui thì chạy, mai hơi mood thì fail”. Nó phải có version. Có log. Có test. Có rollback. Có quyền hạn rõ ràng. Có giới hạn tool. Có cách debug. Có cách biết chính xác nó sai ở bước nào.
Vì agent không giống một cái form bình thường trên web.
Nếu user bấm sai một cái button, nhiều khi cùng lắm là báo lỗi. Nhưng nếu agent gọi sai API, gửi nhầm email, sửa nhầm record, tạo nhầm invoice, hoặc chạy nhầm script thì đó không còn là chuyện UI nữa. Đó là side effect thật trong hệ thống thật.
Lúc này kéo thả bắt đầu lộ giới hạn.
Không phải vì no-code dở. Mình vẫn nghĩ no-code rất hữu ích ở giai đoạn prototype. Nhưng production software có một lực kéo rất mạnh: càng nghiêm túc thì càng quay về engineering.
Cái này anh em dev chắc hiểu rõ nhất.
Hồi mới build app, mình cũng từng nghĩ cứ có giao diện admin là đủ. Sau đó mới biết admin cũng cần phân quyền. Rồi audit log. Rồi validate dữ liệu. Rồi backup. Rồi migration. Rồi monitoring. Rồi xử lý case user làm bậy.
Agent cũng vậy thôi, chỉ khác là lần này “user làm bậy” có thể là một con AI đang cầm quyền gọi tool.
Nên theo mình, việc OpenAI đẩy người dùng về Agents SDK không phải tín hiệu agent hết thời. Ngược lại, nó giống tín hiệu rằng agent đang bước ra khỏi giai đoạn đồ chơi demo để đi vào giai đoạn software engineering thật sự.
Và đây là chỗ mình thấy nhiều người đang hiểu nhầm.
Nhiều người nhìn AI agent như một chatbot thông minh hơn. Prompt hay hơn. Biết gọi tool hơn. Trả lời dài hơn.
Nhưng nếu nhìn bằng mắt dev, agent production giống một backend service hơn là chatbot. Nó có input, state, permission, tool call, retry, timeout, failure mode, observability, deployment lifecycle. Nó cần được thiết kế, không phải chỉ được “nói chuyện”.
Một agent tốt không chỉ là agent trả lời thông minh. Một agent tốt là agent biết khi nào không nên làm. Biết hỏi lại khi thiếu dữ kiện. Biết dừng khi vượt quyền. Biết ghi lại nó đã làm gì. Và khi nó sai, dev có thể mở log ra xem: sai do prompt, do context, do tool, do memory, do model, hay do dữ liệu đầu vào.
Cái khó của agent không nằm ở việc làm cho nó “có vẻ thông minh” trong demo. Cái khó là làm cho nó đáng tin trong một hệ thống thật.
Đây cũng là lý do mình không tin lắm vào mấy câu kiểu “AI agent sẽ thay dev”.
Nếu agent càng có nhiều quyền hành động, dev càng quan trọng. Vì lúc đó thứ cần build không chỉ là feature cho người dùng bấm nữa, mà là một môi trường an toàn để AI có thể hành động bên trong.
Nói cách khác, trước đây mình build software cho human dùng. Giờ mình bắt đầu phải build software cho cả human lẫn agent dùng.
Mà software cho agent dùng còn khó hơn, vì human bấm sai thì còn có thể hỏi lại. Agent sai thì nhiều khi nó sai rất tự tin.
Nên có thể vài năm tới, người build agent giỏi không phải người kéo flow nhanh nhất hay prompt màu mè nhất. Mà là người hiểu system đủ sâu để trả lời mấy câu rất boring nhưng sống còn: agent này được làm gì, không được làm gì, khi nào phải dừng, log ở đâu, test kiểu gì, deploy ra sao, rollback thế nào, và nếu nó phá gì đó thì ai chịu trách nhiệm?
Nghe không sexy lắm.
Nhưng software thật thường là vậy.
Demo thì đẹp ở phần magic. Production thì sống chết ở phần plumbing.
Và mình nghĩ AI agent cũng đang đi đúng con đường đó. Ban đầu là magic. Sau đó là framework. Rồi SDK. Rồi convention. Rồi best practice. Rồi một đống thứ rất chán nhưng không có thì hệ thống không chạy nổi.
Agent Builder có thể bị dừng, nhưng agent không chết. Thứ đang chết có lẽ là ảo tưởng rằng chỉ cần kéo thả vài node là có thể thay thế engineering.
Còn với dev, mình nghĩ đây mới là đoạn đáng quan tâm nhất.
Không phải “AI sẽ lấy mất việc của mình không?”
Mà là: nếu software sắp có thêm một loại actor mới tên là agent, thì mình phải thiết kế hệ thống kiểu gì để actor đó làm việc được mà không phá nhà?