image Thứ Tư, 25/02/2026

Con người là chìa khóa giúp tác nhân AI tăng hiệu suất 50%

Bảo Ngọc

25/02/2026

Chia sẻ

Mô hình AI nhỏ, chi phí thấp có thể vượt trội hơn mô hình đắt tiền nếu được trang bị kỹ năng phù hợp…

Tác nhân AI có thể nâng cao hiệu suất công việc lên hơn 50% – nhưng chỉ khi có sự vào cuộc của con người.
Tác nhân AI có thể nâng cao hiệu suất công việc lên hơn 50% – nhưng chỉ khi có sự vào cuộc của con người.

Tương tự một nhân sự mới đầy triển vọng, tác nhân AI cần được định hướng rõ ràng về quy trình và công cụ để tối ưu hóa hiệu suất. Sự chuẩn bị kỹ lưỡng về dữ liệu đầu vào sẽ biến AI thành một chuyên gia thực thụ ngay từ ngày đầu làm việc. Sự khác biệt giữa tác nhân có kỹ năng tốt và tác nhân không có kỹ năng có thể rất lớn, theo Tech Wire Asia.

Nghiên cứu mang tên SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks được thực hiện bởi 40 nhà nghiên cứu đến từ nhiều tổ chức, trong đó có Amazon, Carnegie Mellon University, Stanford University, University of California, Berkeley và University of Oxford. Nhóm đã thử nghiệm 7 cấu hình tác nhân AI hàng đầu – bao gồm nhiều công cụ như Claude Code của Anthropic, Gemini CLI của Google và Codex CLI của OpenAI – trên 84 tác vụ thực tế với hơn 7.300 lượt thử nghiệm riêng lẻ.

Mỗi tác vụ được kiểm tra trong ba điều kiện: tác nhân không được hướng dẫn gì, tác nhân được cung cấp kỹ năng do chuyên gia biên soạn và tác nhân được yêu cầu tự tìm cách làm.

KỸ NĂNG TÁC NHÂN AI LÀ GÌ?

Tác nhân AI là một mô hình – như Claude hay GPT – được cấp quyền truy cập vào công cụ và phần mềm, cho phép tự động thực hiện công việc từng bước, chứ không chỉ trả lời câu hỏi. Những tác nhân này ngày càng được sử dụng để xử lý lượng công việc phức tạp trong nhiều ngành: phân tích báo cáo tài chính, xử lý dữ liệu y tế, quản lý kiểm tra an ninh mạng và một số lĩnh vực khác.

Vấn đề là, dù tác nhân AI rất mạnh về mặt tổng quát, hệ thống thường thiếu kiến thức chuyên biệt cần thiết cho nhóm công việc mang tính chuyên ngành. Tác nhân có thể biết cách phân tích dữ liệu, nhưng lại không biết chính xác một bệnh viện cụ thể kết nối và chuẩn hóa kết quả xét nghiệm giữa các hệ thống ra sao, hay phương pháp kỹ thuật cụ thể để tối ưu lịch sản xuất của nhà máy.

Kỹ năng tác nhân AI được tạo ra để lấp khoảng trống đó. Mỗi kỹ năng về bản chất là bộ tài liệu hướng dẫn có cấu trúc – bao gồm chỉ dẫn, ví dụ mã lệnh và tài liệu tham khảo – giúp tác nhân biết cách tiếp cận loại nhiệm vụ cụ thể trong lĩnh vực cụ thể.

Không cần huấn luyện lại mô hình. Tác nhân chỉ cần đọc kỹ năng đó và áp dụng.

NHỮNG CON SỐ ĐÁNG CHÚ Ý

Trong tất cả cấu hình tác nhân AI được thử nghiệm, việc cung cấp kỹ năng do chuyên gia viết giúp tỷ lệ hoàn thành trung bình tăng 16,2%. Tuy nhiên, một số lĩnh vực ghi nhận mức cải thiện cao hơn nhiều – xu hướng đặc biệt liên quan đến các ngành đang thúc đẩy việc ứng dụng AI trong doanh nghiệp.

Nhóm tác vụ y tế ghi nhận mức cải thiện 51,9% khi có kỹ năng. Sản xuất tăng 41,9%. An ninh mạng tăng thêm 23,2 điểm phần trăm, và tác vụ trong lĩnh vực năng lượng cải thiện 17,9 điểm.

Nguyên nhân được cho là khá dễ hiểu. Mô hình AI được huấn luyện trên khối lượng lớn dữ liệu tổng quát từ internet và nguồn công khai. Nhưng quy trình chi tiết từng bước trong quản lý dữ liệu lâm sàng, lập lịch sản xuất nhà máy hay vận hành lưới điện thường không được công bố rộng rãi – mà nằm trong đầu các chuyên gia hoặc trong tài liệu nội bộ. Nếu không có kỹ năng ghi lại những kiến thức đó, tác nhân AI về cơ bản chỉ đang “ứng biến”.

Một ví dụ trong nghiên cứu minh họa rất rõ điều này. Tác nhân được giao nhiệm vụ phân tích rủi ro lũ lụt – xác định trạm quan trắc nước nào có nguy cơ dựa trên dữ liệu dòng chảy – chỉ đạt tỷ lệ thành công 2,9% khi phải tự xoay xở.

Khi được cung cấp bộ kỹ năng chỉ rõ phương pháp thống kê chính xác (phân phối Log-Pearson Type III, tiêu chuẩn được các cơ quan quản lý nước tại Hoa Kỳ sử dụng) kèm hướng dẫn áp dụng, tỷ lệ thành công tăng vọt lên 80%.

Vẫn cùng một nhiệm vụ, cùng một mô hình AI nhưng khác biệt duy nhất là bộ tài liệu hướng dẫn được viết tốt.

Việc cung cấp bộ kỹ năng do chuyên gia con người viết giúp tỷ lệ hoàn thành công việc trung bình của tác nhân AI tăng 16,2%.
Việc cung cấp bộ kỹ năng do chuyên gia con người viết giúp tỷ lệ hoàn thành công việc trung bình của tác nhân AI tăng 16,2%.

MÔ HÌNH NHỎ CÓ THỂ VƯỢT MÔ HÌNH LỚN – NẾU CÓ KỸ NĂNG PHÙ HỢP

Một trong những phát hiện có giá trị thực tiễn lớn nhất của nghiên cứu là tác động của kỹ năng đối với bài toán chi phí.

Các mô hình AI có chi phí khác nhau. Mô hình càng lớn, càng mạnh thì chi phí sử dụng càng cao. Với doanh nghiệp vận hành tác nhân AI ở quy mô lớn, chi phí cộng dồn rất nhanh. Trước đây, giả định phổ biến là muốn kết quả tốt hơn thì phải trả tiền cho mô hình lớn hơn.

Dữ liệu từ SkillsBench khiến giả định trở nên phức tạp. Claude Haiku 4.5 – mô hình nhỏ nhất và rẻ nhất trong số các mô hình thử nghiệm – đạt tỷ lệ thành công 27,7% khi được trang bị bộ kỹ năng chọn lọc. Khi không có kỹ năng, con số chỉ là 11%. Kết quả của Haiku có kỹ năng còn vượt qua Claude Opus 4.5 – mô hình đắt tiền – khi chạy mà không có kỹ năng, vốn chỉ đạt 22%.

Nói cách khác, mô hình nhỏ được “brief” tốt có thể vượt trội hơn mô hình lớn bị bỏ mặc tự xoay xở.

Mô hình nhỏ có thể vượt mặt mô hình lớn nếu được trang bị kỹ năng phù hợp.
Mô hình nhỏ có thể vượt mặt mô hình lớn nếu được trang bị kỹ năng phù hợp.

TẬP TRUNG VỪA ĐỦ, KHÔNG CẦN BAO TRÙM TẤT CẢ

Nghiên cứu cũng giải đáp một câu hỏi mà nhiều nhóm gặp phải khi xây dựng quy trình tác nhân: một kỹ năng nên chứa bao nhiêu thông tin? Câu trả lời là: lượng thông tin ít hơn nhiều so với những gì đa số mọi người nghĩ. Nhóm tác nhân được trang bị hai hoặc ba mô-đun kỹ năng tập trung cho ra kết quả tốt nhất, với tỷ lệ thành công tăng trung bình 18,6%.

Khi tác nhân được cung cấp bốn kỹ năng trở lên, mức cải thiện giảm xuống chỉ còn 5,9%. Đáng chú ý, các tác nhân được cung cấp bộ tài liệu rất dài và toàn diện thậm chí còn cho kết quả tệ hơn so với khi chỉ có hướng dẫn ngắn gọn, có trọng tâm.

Nhóm tác giả nói thẳng: kỹ năng quá dài “có thể làm cạn kiệt dung lượng ngữ cảnh mà không mang lại hướng dẫn có thể hành động”. Một tác nhân AI bị nhấn chìm trong tài liệu cũng giống như một nhân viên mới được phát cuốn sổ tay 300 trang ngay sáng đầu tiên đi làm – việc đó khiến mọi thứ khó hơn, chứ không dễ hơn.

Hướng dẫn ngắn gọn, từng bước, kèm ví dụ hoạt động cụ thể luôn cho kết quả tốt hơn tài liệu đồ sộ.

VẪN CẦN CÓ CHUYÊN MÔN CON NGƯỜI

Điều kiện thử nghiệm cuối cùng cũng là điều có tác động lớn nhất đến cách doanh nghiệp nhìn nhận mức độ tự chủ của AI. Tác nhân được yêu cầu tự tạo kỹ năng cho mình trước khi thực hiện nhiệm vụ – tức là tự “brief” trước khi bắt tay vào làm.

Trung bình, cách này khiến kết quả kém hơn, chứ không tốt hơn. Kỹ năng do AI tự tạo ra làm giảm 1,3% hiệu quả so với tác nhân không được cung cấp kỹ năng nào. Chỉ có một mô hình cho thấy sự cải thiện đáng kể.

Phần lớn tác nhân tạo ra hướng dẫn mơ hồ, thiếu chính xác, không nhận ra rằng nhiệm vụ cần kiến thức chuyên biệt, và cứ thế áp dụng cách tiếp cận chung chung.

Kết luận của nhóm nghiên cứu rất đáng chú ý: “Kỹ năng hiệu quả đòi hỏi chuyên môn lĩnh vực do con người tuyển chọn, thứ mà mô hình không thể tự tạo ra một cách đáng tin cậy”.

Tác nhân AI có thể làm được những điều rất ấn tượng khi trang bị kỹ năng phù hợp. Nhưng chính các quá trình trang bị bao gồm chắt lọc kiến thức tổ chức, quy trình chuyên ngành và kinh nghiệm chuyên gia thành dạng có cấu trúc, có thể tái sử dụng vẫn là nơi mà phán đoán của con người đóng vai trò thiết yếu.

Đối với doanh nghiệp tại châu Á – Thái Bình Dương, nơi kiến thức vận hành sâu thường nằm trong đội ngũ giàu kinh nghiệm chứ không phải trong tài liệu chính thức, khả năng mã hóa và truyền tải tri thức ngày càng trở thành yếu tố cạnh tranh. Những tổ chức làm tốt điều này được cho là sẽ có lợi thế mà đối thủ rất khó sao chép.


Alphabet chỉ ra những rủi ro mới liên quan đến AI

Khi trở lại thị trường nợ để huy động vốn cho tham vọng trí tuệ nhân tạo (AI), Alphabet, công ty mẹ của Google, thừa nhận những rủi ro mới phát sinh từ làn sóng AI và các khoản đầu tư hạ tầng khổng lồ mà hãng đang theo đuổi…

14:33 13/02/2026
Giá thành thấp hơn đang làm thay đổi cách thức xây dựng và vận hành tác nhân AI

Chi phí giảm giúp các công ty bớt áp lực chi tiêu, nhưng rủi ro liên quan tới tác nhân AI vẫn đang được đánh giá…

14:50 10/02/2026
Anthropic lấn sân mảng pháp lý, loạt cổ phiếu ngành dữ liệu và tài chính chao đảo

Pearson, Experian cùng nhiều doanh nghiệp xuất bản và dữ liệu lớn tại châu Âu chứng kiến giá cổ phiếu giảm mạnh sau khi startup AI của Hoa Kỳ giới thiệu phần mềm tự động hóa hàng loạt dịch vụ chuyên môn…

18:52 06/02/2026
Moltbook: Mạng xã hội dành cho AI gây chia rẽ giới công nghệ toàn cầu

Moltbook - mạng xã hội dành cho AI agent đang đặt ra nhiều câu hỏi: khi AI bắt đầu “nói chuyện” với nhau trên mạng xã hội, ranh giới giữa trình diễn, công nghệ và tương lai của trí tuệ nhân tạo thực sự nằm ở đâu?...

18:52 06/02/2026
OpenClaw là tác nhân AI đang gây ra nỗi lo ngại toàn cầu

Từ dự án cá nhân ít người biết tới, OpenClaw nay trở thành một trong những công cụ được nhắc đến nhiều nhất trong thế giới trí tuệ nhân tạo năm nay…

09:13 04/02/2026
4 bước ngoặt tách biệt người dẫn dắt và kẻ tụt hậu trong cuộc đua AI

Dù được ca ngợi là công nghệ mang tính cách mạng, AI tạo sinh vẫn đang bị nhiều doanh nghiệp đối xử như một công cụ thử nghiệm đơn lẻ…

09:09 04/02/2026
CEO Anthropic: Nhân loại cần phải "thức tỉnh" trước mối đe dọa từ AI

Ông Dario Amodei, CEO của Anthropic, cảnh báo nhân loại cần sớm kiểm soát việc phát triển và sử dụng trí tuệ nhân tạo (AI), nếu không, công nghệ này có thể bị sử dụng sai mục đích…

10:18 03/02/2026
AI, trung tâm dữ liệu vừa là nguồn cơn vừa là giải pháp cho vấn đề năng lượng

Nhiệt từ làn sóng AI không chỉ làm nóng trung tâm dữ liệu, mà còn tạo ra hướng đi mới cho năng lượng đô thị: biến nhiệt thải từ chip AI thành nguồn sưởi sạch…

11:44 30/01/2026
Người dùng nội bộ trở thành “điểm yếu” lớn nhất về an ninh mạng trong doanh nghiệp

Phần lớn Giám đốc An ninh Thông tin (CISO) tin rằng mình nắm khá rõ mức độ sử dụng công cụ trong tổ chức nhưng khi nhóm bảo mật chuyên nghiệp vào cuộc, thực tế hoàn toàn khác lộ ra…

17:04 27/01/2026
Công cụ mua sắm bằng AI của Amazon vấp phải phản ứng dữ dội vì bán “sản phẩm ảo”

Amazon đang khiến không ít nhà bán lẻ trực tuyến phẫn nộ, khi nhiều doanh nghiệp cho biết họ không hề đồng ý để sản phẩm của mình bị “quét dữ liệu” và đưa lên niêm yết trên hệ sinh thái thương mại điện tử khổng lồ của công ty…

18:01 18/01/2026