Con người là chìa khóa giúp tác nhân AI tăng hiệu suất 50%
Bảo Ngọc
25/02/2026
Mô hình AI nhỏ, chi phí thấp có thể vượt trội hơn mô hình đắt tiền nếu được trang bị kỹ năng phù hợp…
Tương tự một nhân sự mới đầy triển vọng, tác nhân AI cần được định hướng rõ ràng về quy trình và công cụ để tối ưu hóa hiệu suất. Sự chuẩn bị kỹ lưỡng về dữ liệu đầu vào sẽ biến AI thành một chuyên gia thực thụ ngay từ ngày đầu làm việc. Sự khác biệt giữa tác nhân có kỹ năng tốt và tác nhân không có kỹ năng có thể rất lớn, theo Tech Wire Asia.
Nghiên cứu mang tên SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks được thực hiện bởi 40 nhà nghiên cứu đến từ nhiều tổ chức, trong đó có Amazon, Carnegie Mellon University, Stanford University, University of California, Berkeley và University of Oxford. Nhóm đã thử nghiệm 7 cấu hình tác nhân AI hàng đầu – bao gồm nhiều công cụ như Claude Code của Anthropic, Gemini CLI của Google và Codex CLI của OpenAI – trên 84 tác vụ thực tế với hơn 7.300 lượt thử nghiệm riêng lẻ.
Mỗi tác vụ được kiểm tra trong ba điều kiện: tác nhân không được hướng dẫn gì, tác nhân được cung cấp kỹ năng do chuyên gia biên soạn và tác nhân được yêu cầu tự tìm cách làm.
KỸ NĂNG TÁC NHÂN AI LÀ GÌ?
Tác nhân AI là một mô hình – như Claude hay GPT – được cấp quyền truy cập vào công cụ và phần mềm, cho phép tự động thực hiện công việc từng bước, chứ không chỉ trả lời câu hỏi. Những tác nhân này ngày càng được sử dụng để xử lý lượng công việc phức tạp trong nhiều ngành: phân tích báo cáo tài chính, xử lý dữ liệu y tế, quản lý kiểm tra an ninh mạng và một số lĩnh vực khác.
Vấn đề là, dù tác nhân AI rất mạnh về mặt tổng quát, hệ thống thường thiếu kiến thức chuyên biệt cần thiết cho nhóm công việc mang tính chuyên ngành. Tác nhân có thể biết cách phân tích dữ liệu, nhưng lại không biết chính xác một bệnh viện cụ thể kết nối và chuẩn hóa kết quả xét nghiệm giữa các hệ thống ra sao, hay phương pháp kỹ thuật cụ thể để tối ưu lịch sản xuất của nhà máy.
Kỹ năng tác nhân AI được tạo ra để lấp khoảng trống đó. Mỗi kỹ năng về bản chất là bộ tài liệu hướng dẫn có cấu trúc – bao gồm chỉ dẫn, ví dụ mã lệnh và tài liệu tham khảo – giúp tác nhân biết cách tiếp cận loại nhiệm vụ cụ thể trong lĩnh vực cụ thể.
Không cần huấn luyện lại mô hình. Tác nhân chỉ cần đọc kỹ năng đó và áp dụng.
NHỮNG CON SỐ ĐÁNG CHÚ Ý
Trong tất cả cấu hình tác nhân AI được thử nghiệm, việc cung cấp kỹ năng do chuyên gia viết giúp tỷ lệ hoàn thành trung bình tăng 16,2%. Tuy nhiên, một số lĩnh vực ghi nhận mức cải thiện cao hơn nhiều – xu hướng đặc biệt liên quan đến các ngành đang thúc đẩy việc ứng dụng AI trong doanh nghiệp.
Nhóm tác vụ y tế ghi nhận mức cải thiện 51,9% khi có kỹ năng. Sản xuất tăng 41,9%. An ninh mạng tăng thêm 23,2 điểm phần trăm, và tác vụ trong lĩnh vực năng lượng cải thiện 17,9 điểm.
Nguyên nhân được cho là khá dễ hiểu. Mô hình AI được huấn luyện trên khối lượng lớn dữ liệu tổng quát từ internet và nguồn công khai. Nhưng quy trình chi tiết từng bước trong quản lý dữ liệu lâm sàng, lập lịch sản xuất nhà máy hay vận hành lưới điện thường không được công bố rộng rãi – mà nằm trong đầu các chuyên gia hoặc trong tài liệu nội bộ. Nếu không có kỹ năng ghi lại những kiến thức đó, tác nhân AI về cơ bản chỉ đang “ứng biến”.
Một ví dụ trong nghiên cứu minh họa rất rõ điều này. Tác nhân được giao nhiệm vụ phân tích rủi ro lũ lụt – xác định trạm quan trắc nước nào có nguy cơ dựa trên dữ liệu dòng chảy – chỉ đạt tỷ lệ thành công 2,9% khi phải tự xoay xở.
Khi được cung cấp bộ kỹ năng chỉ rõ phương pháp thống kê chính xác (phân phối Log-Pearson Type III, tiêu chuẩn được các cơ quan quản lý nước tại Hoa Kỳ sử dụng) kèm hướng dẫn áp dụng, tỷ lệ thành công tăng vọt lên 80%.
Vẫn cùng một nhiệm vụ, cùng một mô hình AI nhưng khác biệt duy nhất là bộ tài liệu hướng dẫn được viết tốt.
MÔ HÌNH NHỎ CÓ THỂ VƯỢT MÔ HÌNH LỚN – NẾU CÓ KỸ NĂNG PHÙ HỢP
Một trong những phát hiện có giá trị thực tiễn lớn nhất của nghiên cứu là tác động của kỹ năng đối với bài toán chi phí.
Các mô hình AI có chi phí khác nhau. Mô hình càng lớn, càng mạnh thì chi phí sử dụng càng cao. Với doanh nghiệp vận hành tác nhân AI ở quy mô lớn, chi phí cộng dồn rất nhanh. Trước đây, giả định phổ biến là muốn kết quả tốt hơn thì phải trả tiền cho mô hình lớn hơn.
Dữ liệu từ SkillsBench khiến giả định trở nên phức tạp. Claude Haiku 4.5 – mô hình nhỏ nhất và rẻ nhất trong số các mô hình thử nghiệm – đạt tỷ lệ thành công 27,7% khi được trang bị bộ kỹ năng chọn lọc. Khi không có kỹ năng, con số chỉ là 11%. Kết quả của Haiku có kỹ năng còn vượt qua Claude Opus 4.5 – mô hình đắt tiền – khi chạy mà không có kỹ năng, vốn chỉ đạt 22%.
Nói cách khác, mô hình nhỏ được “brief” tốt có thể vượt trội hơn mô hình lớn bị bỏ mặc tự xoay xở.
TẬP TRUNG VỪA ĐỦ, KHÔNG CẦN BAO TRÙM TẤT CẢ
Nghiên cứu cũng giải đáp một câu hỏi mà nhiều nhóm gặp phải khi xây dựng quy trình tác nhân: một kỹ năng nên chứa bao nhiêu thông tin? Câu trả lời là: lượng thông tin ít hơn nhiều so với những gì đa số mọi người nghĩ. Nhóm tác nhân được trang bị hai hoặc ba mô-đun kỹ năng tập trung cho ra kết quả tốt nhất, với tỷ lệ thành công tăng trung bình 18,6%.
Khi tác nhân được cung cấp bốn kỹ năng trở lên, mức cải thiện giảm xuống chỉ còn 5,9%. Đáng chú ý, các tác nhân được cung cấp bộ tài liệu rất dài và toàn diện thậm chí còn cho kết quả tệ hơn so với khi chỉ có hướng dẫn ngắn gọn, có trọng tâm.
Nhóm tác giả nói thẳng: kỹ năng quá dài “có thể làm cạn kiệt dung lượng ngữ cảnh mà không mang lại hướng dẫn có thể hành động”. Một tác nhân AI bị nhấn chìm trong tài liệu cũng giống như một nhân viên mới được phát cuốn sổ tay 300 trang ngay sáng đầu tiên đi làm – việc đó khiến mọi thứ khó hơn, chứ không dễ hơn.
Hướng dẫn ngắn gọn, từng bước, kèm ví dụ hoạt động cụ thể luôn cho kết quả tốt hơn tài liệu đồ sộ.
VẪN CẦN CÓ CHUYÊN MÔN CON NGƯỜI
Điều kiện thử nghiệm cuối cùng cũng là điều có tác động lớn nhất đến cách doanh nghiệp nhìn nhận mức độ tự chủ của AI. Tác nhân được yêu cầu tự tạo kỹ năng cho mình trước khi thực hiện nhiệm vụ – tức là tự “brief” trước khi bắt tay vào làm.
Trung bình, cách này khiến kết quả kém hơn, chứ không tốt hơn. Kỹ năng do AI tự tạo ra làm giảm 1,3% hiệu quả so với tác nhân không được cung cấp kỹ năng nào. Chỉ có một mô hình cho thấy sự cải thiện đáng kể.
Phần lớn tác nhân tạo ra hướng dẫn mơ hồ, thiếu chính xác, không nhận ra rằng nhiệm vụ cần kiến thức chuyên biệt, và cứ thế áp dụng cách tiếp cận chung chung.
Kết luận của nhóm nghiên cứu rất đáng chú ý: “Kỹ năng hiệu quả đòi hỏi chuyên môn lĩnh vực do con người tuyển chọn, thứ mà mô hình không thể tự tạo ra một cách đáng tin cậy”.
Tác nhân AI có thể làm được những điều rất ấn tượng khi trang bị kỹ năng phù hợp. Nhưng chính các quá trình trang bị bao gồm chắt lọc kiến thức tổ chức, quy trình chuyên ngành và kinh nghiệm chuyên gia thành dạng có cấu trúc, có thể tái sử dụng vẫn là nơi mà phán đoán của con người đóng vai trò thiết yếu.
Đối với doanh nghiệp tại châu Á – Thái Bình Dương, nơi kiến thức vận hành sâu thường nằm trong đội ngũ giàu kinh nghiệm chứ không phải trong tài liệu chính thức, khả năng mã hóa và truyền tải tri thức ngày càng trở thành yếu tố cạnh tranh. Những tổ chức làm tốt điều này được cho là sẽ có lợi thế mà đối thủ rất khó sao chép.
Khi trở lại thị trường nợ để huy động vốn cho tham vọng trí tuệ nhân tạo (AI), Alphabet, công ty mẹ của Google, thừa nhận những rủi ro mới phát sinh từ làn sóng AI và các khoản đầu tư hạ tầng khổng lồ mà hãng đang theo đuổi…
Chi phí giảm giúp các công ty bớt áp lực chi tiêu, nhưng rủi ro liên quan tới tác nhân AI vẫn đang được đánh giá…
Pearson, Experian cùng nhiều doanh nghiệp xuất bản và dữ liệu lớn tại châu Âu chứng kiến giá cổ phiếu giảm mạnh sau khi startup AI của Hoa Kỳ giới thiệu phần mềm tự động hóa hàng loạt dịch vụ chuyên môn…
Moltbook - mạng xã hội dành cho AI agent đang đặt ra nhiều câu hỏi: khi AI bắt đầu “nói chuyện” với nhau trên mạng xã hội, ranh giới giữa trình diễn, công nghệ và tương lai của trí tuệ nhân tạo thực sự nằm ở đâu?...
Từ dự án cá nhân ít người biết tới, OpenClaw nay trở thành một trong những công cụ được nhắc đến nhiều nhất trong thế giới trí tuệ nhân tạo năm nay…
Dù được ca ngợi là công nghệ mang tính cách mạng, AI tạo sinh vẫn đang bị nhiều doanh nghiệp đối xử như một công cụ thử nghiệm đơn lẻ…
Ông Dario Amodei, CEO của Anthropic, cảnh báo nhân loại cần sớm kiểm soát việc phát triển và sử dụng trí tuệ nhân tạo (AI), nếu không, công nghệ này có thể bị sử dụng sai mục đích…
Nhiệt từ làn sóng AI không chỉ làm nóng trung tâm dữ liệu, mà còn tạo ra hướng đi mới cho năng lượng đô thị: biến nhiệt thải từ chip AI thành nguồn sưởi sạch…
Phần lớn Giám đốc An ninh Thông tin (CISO) tin rằng mình nắm khá rõ mức độ sử dụng công cụ trong tổ chức nhưng khi nhóm bảo mật chuyên nghiệp vào cuộc, thực tế hoàn toàn khác lộ ra…
Amazon đang khiến không ít nhà bán lẻ trực tuyến phẫn nộ, khi nhiều doanh nghiệp cho biết họ không hề đồng ý để sản phẩm của mình bị “quét dữ liệu” và đưa lên niêm yết trên hệ sinh thái thương mại điện tử khổng lồ của công ty…