Con người là chìa khóa giúp tác nhân AI tăng hiệu suất 50%

Bảo Ngọc

25/02/2026

Mô hình AI nhỏ, chi phí thấp có thể vượt trội hơn mô hình đắt tiền nếu được trang bị kỹ năng phù hợp…

Tác nhân AI có thể nâng cao hiệu suất công việc lên hơn 50% – nhưng chỉ khi có sự vào cuộc của con người.

Tương tự một nhân sự mới đầy triển vọng, tác nhân AI cần được định hướng rõ ràng về quy trình và công cụ để tối ưu hóa hiệu suất. Sự chuẩn bị kỹ lưỡng về dữ liệu đầu vào sẽ biến AI thành một chuyên gia thực thụ ngay từ ngày đầu làm việc. Sự khác biệt giữa tác nhân có kỹ năng tốt và tác nhân không có kỹ năng có thể rất lớn, theo Tech Wire Asia.

Nghiên cứu mang tên SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks được thực hiện bởi 40 nhà nghiên cứu đến từ nhiều tổ chức, trong đó có Amazon, Carnegie Mellon University, Stanford University, University of California, Berkeley và University of Oxford. Nhóm đã thử nghiệm 7 cấu hình tác nhân AI hàng đầu – bao gồm nhiều công cụ như Claude Code của Anthropic, Gemini CLI của Google và Codex CLI của OpenAI – trên 84 tác vụ thực tế với hơn 7.300 lượt thử nghiệm riêng lẻ.

Mỗi tác vụ được kiểm tra trong ba điều kiện: tác nhân không được hướng dẫn gì, tác nhân được cung cấp kỹ năng do chuyên gia biên soạn và tác nhân được yêu cầu tự tìm cách làm.

KỸ NĂNG TÁC NHÂN AI LÀ GÌ?

Tác nhân AI là một mô hình – như Claude hay GPT – được cấp quyền truy cập vào công cụ và phần mềm, cho phép tự động thực hiện công việc từng bước, chứ không chỉ trả lời câu hỏi. Những tác nhân này ngày càng được sử dụng để xử lý lượng công việc phức tạp trong nhiều ngành: phân tích báo cáo tài chính, xử lý dữ liệu y tế, quản lý kiểm tra an ninh mạng và một số lĩnh vực khác.

Vấn đề là, dù tác nhân AI rất mạnh về mặt tổng quát, hệ thống thường thiếu kiến thức chuyên biệt cần thiết cho nhóm công việc mang tính chuyên ngành. Tác nhân có thể biết cách phân tích dữ liệu, nhưng lại không biết chính xác một bệnh viện cụ thể kết nối và chuẩn hóa kết quả xét nghiệm giữa các hệ thống ra sao, hay phương pháp kỹ thuật cụ thể để tối ưu lịch sản xuất của nhà máy.

Kỹ năng tác nhân AI được tạo ra để lấp khoảng trống đó. Mỗi kỹ năng về bản chất là bộ tài liệu hướng dẫn có cấu trúc – bao gồm chỉ dẫn, ví dụ mã lệnh và tài liệu tham khảo – giúp tác nhân biết cách tiếp cận loại nhiệm vụ cụ thể trong lĩnh vực cụ thể.

Không cần huấn luyện lại mô hình. Tác nhân chỉ cần đọc kỹ năng đó và áp dụng.

NHỮNG CON SỐ ĐÁNG CHÚ Ý

Trong tất cả cấu hình tác nhân AI được thử nghiệm, việc cung cấp kỹ năng do chuyên gia viết giúp tỷ lệ hoàn thành trung bình tăng 16,2%. Tuy nhiên, một số lĩnh vực ghi nhận mức cải thiện cao hơn nhiều – xu hướng đặc biệt liên quan đến các ngành đang thúc đẩy việc ứng dụng AI trong doanh nghiệp.

Nhóm tác vụ y tế ghi nhận mức cải thiện 51,9% khi có kỹ năng. Sản xuất tăng 41,9%. An ninh mạng tăng thêm 23,2 điểm phần trăm, và tác vụ trong lĩnh vực năng lượng cải thiện 17,9 điểm.

Nguyên nhân được cho là khá dễ hiểu. Mô hình AI được huấn luyện trên khối lượng lớn dữ liệu tổng quát từ internet và nguồn công khai. Nhưng quy trình chi tiết từng bước trong quản lý dữ liệu lâm sàng, lập lịch sản xuất nhà máy hay vận hành lưới điện thường không được công bố rộng rãi – mà nằm trong đầu các chuyên gia hoặc trong tài liệu nội bộ. Nếu không có kỹ năng ghi lại những kiến thức đó, tác nhân AI về cơ bản chỉ đang “ứng biến”.

Một ví dụ trong nghiên cứu minh họa rất rõ điều này. Tác nhân được giao nhiệm vụ phân tích rủi ro lũ lụt – xác định trạm quan trắc nước nào có nguy cơ dựa trên dữ liệu dòng chảy – chỉ đạt tỷ lệ thành công 2,9% khi phải tự xoay xở.

Khi được cung cấp bộ kỹ năng chỉ rõ phương pháp thống kê chính xác (phân phối Log-Pearson Type III, tiêu chuẩn được các cơ quan quản lý nước tại Hoa Kỳ sử dụng) kèm hướng dẫn áp dụng, tỷ lệ thành công tăng vọt lên 80%.

Vẫn cùng một nhiệm vụ, cùng một mô hình AI nhưng khác biệt duy nhất là bộ tài liệu hướng dẫn được viết tốt.

Việc cung cấp bộ kỹ năng do chuyên gia con người viết giúp tỷ lệ hoàn thành công việc trung bình của tác nhân AI tăng 16,2%.

MÔ HÌNH NHỎ CÓ THỂ VƯỢT MÔ HÌNH LỚN – NẾU CÓ KỸ NĂNG PHÙ HỢP

Một trong những phát hiện có giá trị thực tiễn lớn nhất của nghiên cứu là tác động của kỹ năng đối với bài toán chi phí.

Các mô hình AI có chi phí khác nhau. Mô hình càng lớn, càng mạnh thì chi phí sử dụng càng cao. Với doanh nghiệp vận hành tác nhân AI ở quy mô lớn, chi phí cộng dồn rất nhanh. Trước đây, giả định phổ biến là muốn kết quả tốt hơn thì phải trả tiền cho mô hình lớn hơn.

Dữ liệu từ SkillsBench khiến giả định trở nên phức tạp. Claude Haiku 4.5 – mô hình nhỏ nhất và rẻ nhất trong số các mô hình thử nghiệm – đạt tỷ lệ thành công 27,7% khi được trang bị bộ kỹ năng chọn lọc. Khi không có kỹ năng, con số chỉ là 11%. Kết quả của Haiku có kỹ năng còn vượt qua Claude Opus 4.5 – mô hình đắt tiền – khi chạy mà không có kỹ năng, vốn chỉ đạt 22%.

Nói cách khác, mô hình nhỏ được “brief” tốt có thể vượt trội hơn mô hình lớn bị bỏ mặc tự xoay xở.

Mô hình nhỏ có thể vượt mặt mô hình lớn nếu được trang bị kỹ năng phù hợp.

TẬP TRUNG VỪA ĐỦ, KHÔNG CẦN BAO TRÙM TẤT CẢ

Nghiên cứu cũng giải đáp một câu hỏi mà nhiều nhóm gặp phải khi xây dựng quy trình tác nhân: một kỹ năng nên chứa bao nhiêu thông tin? Câu trả lời là: lượng thông tin ít hơn nhiều so với những gì đa số mọi người nghĩ. Nhóm tác nhân được trang bị hai hoặc ba mô-đun kỹ năng tập trung cho ra kết quả tốt nhất, với tỷ lệ thành công tăng trung bình 18,6%.

Khi tác nhân được cung cấp bốn kỹ năng trở lên, mức cải thiện giảm xuống chỉ còn 5,9%. Đáng chú ý, các tác nhân được cung cấp bộ tài liệu rất dài và toàn diện thậm chí còn cho kết quả tệ hơn so với khi chỉ có hướng dẫn ngắn gọn, có trọng tâm.

Nhóm tác giả nói thẳng: kỹ năng quá dài “có thể làm cạn kiệt dung lượng ngữ cảnh mà không mang lại hướng dẫn có thể hành động”. Một tác nhân AI bị nhấn chìm trong tài liệu cũng giống như một nhân viên mới được phát cuốn sổ tay 300 trang ngay sáng đầu tiên đi làm – việc đó khiến mọi thứ khó hơn, chứ không dễ hơn.

Hướng dẫn ngắn gọn, từng bước, kèm ví dụ hoạt động cụ thể luôn cho kết quả tốt hơn tài liệu đồ sộ.

VẪN CẦN CÓ CHUYÊN MÔN CON NGƯỜI

Điều kiện thử nghiệm cuối cùng cũng là điều có tác động lớn nhất đến cách doanh nghiệp nhìn nhận mức độ tự chủ của AI. Tác nhân được yêu cầu tự tạo kỹ năng cho mình trước khi thực hiện nhiệm vụ – tức là tự “brief” trước khi bắt tay vào làm.

Trung bình, cách này khiến kết quả kém hơn, chứ không tốt hơn. Kỹ năng do AI tự tạo ra làm giảm 1,3% hiệu quả so với tác nhân không được cung cấp kỹ năng nào. Chỉ có một mô hình cho thấy sự cải thiện đáng kể.

Phần lớn tác nhân tạo ra hướng dẫn mơ hồ, thiếu chính xác, không nhận ra rằng nhiệm vụ cần kiến thức chuyên biệt, và cứ thế áp dụng cách tiếp cận chung chung.

Kết luận của nhóm nghiên cứu rất đáng chú ý: “Kỹ năng hiệu quả đòi hỏi chuyên môn lĩnh vực do con người tuyển chọn, thứ mà mô hình không thể tự tạo ra một cách đáng tin cậy”.

Tác nhân AI có thể làm được những điều rất ấn tượng khi trang bị kỹ năng phù hợp. Nhưng chính các quá trình trang bị bao gồm chắt lọc kiến thức tổ chức, quy trình chuyên ngành và kinh nghiệm chuyên gia thành dạng có cấu trúc, có thể tái sử dụng vẫn là nơi mà phán đoán của con người đóng vai trò thiết yếu.

Đối với doanh nghiệp tại châu Á – Thái Bình Dương, nơi kiến thức vận hành sâu thường nằm trong đội ngũ giàu kinh nghiệm chứ không phải trong tài liệu chính thức, khả năng mã hóa và truyền tải tri thức ngày càng trở thành yếu tố cạnh tranh. Những tổ chức làm tốt điều này được cho là sẽ có lợi thế mà đối thủ rất khó sao chép.

Từ khóa:

Dòng sự kiện:

Trí tuệ nhân tạo -AI

Anthropic: Người dùng vừa kỳ vọng vừa lo sợ về AI

Khảo sát hơn 81.000 người tại 159 quốc gia của Anthropic cho thấy nghịch lý rõ rệt: những lợi ích khiến AI trở nên hấp dẫn cũng chính là nguồn gốc của nỗi lo lớn nhất, từ phụ thuộc công nghệ đến nguy cơ suy giảm tư duy và mất việc làm…

13:31 26/03/2026

Meta tung bản desktop cho Manus, đưa AI agent lên máy tính cá nhân giữa “cơn sốt” OpenClaw

Tính năng ‘My Computer’ của Manus trên ứng dụng desktop mới sẽ đưa AI agent lên máy tính người dùng…

18:47 19/03/2026

Chỉ 3% doanh nghiệp nói rằng công nghệ này đã được tích hợp sâu rộng vào hoạt động vận hành

Physical AI gây chú ý nhưng doanh nghiệp vẫn “mắc kẹt” ở giai đoạn thử nghiệm

Dù được kỳ vọng sẽ tạo ra bước ngoặt trong sản xuất và vận hành, “physical AI” vẫn chủ yếu dừng ở giai đoạn thử nghiệm. Phần lớn doanh nghiệp chưa sẵn sàng về hạ tầng, dữ liệu và nhân lực để biến công nghệ này thành lợi thế thực sự…

18:46 19/03/2026

Diagens tập trung phát triển sản phẩm và dịch vụ liên quan đến chẩn đoán hình ảnh

Startup Trung Quốc sắp IPO nền tảng AI chẩn đoán hình ảnh đầu tiên thế giới

Công ty khởi nghiệp Diagens Biotechnology chuẩn bị IPO với tham vọng đưa nền tảng AI chẩn đoán hình ảnh lên quy mô toàn cầu, trong bối cảnh cuộc đua ứng dụng AI y tế ngày càng nóng lên…

16:29 19/03/2026

Giai đoạn phát triển AI tiếp theo của Đông Nam Á không chỉ phụ thuộc vào công nghệ, mà còn vào sức mạnh của các hệ thống hỗ trợ xung quanh

AI tại Đông Nam Á: Từ cơn sốt ứng dụng đến kỷ nguyên hạ tầng tin cậy

Khi AI được tích hợp sâu vào hoạt động doanh nghiệp, bài toán không chỉ là triển khai công nghệ mà là xây dựng hạ tầng, quản trị và bảo mật đủ mạnh để AI vận hành an toàn ở quy mô lớn. Đây cũng là thách thức mới trong cuộc đua AI tại Đông Nam Á…

13:58 17/03/2026

Mô hình trung tâm dữ liệu lớn nhất ở UAE đang được xây dựng ở Abu Dhabi, một liên doanh giữa G42, Microsoft và OpenAI

Xung đột tại Iran đe dọa kế hoạch xây dựng hạ tầng AI khổng lồ ở Trung Đông

Cuộc chiến liên quan đến Iran đang làm dấy lên lo ngại về các dự án hạ tầng AI quy mô lớn tại Trung Đông. Dù khó khiến các “ông lớn” rút khỏi khu vực, song xung đột kéo dài có thể buộc họ tính toán lại chiến lược đầu tư trong tương lai…

12:03 14/03/2026

Khoảng cách giữa dự án thử nghiệm và ứng dụng thực tế đang trở thành thách thức lớn đối với nhiều tổ chức

Vì sao việc triển khai AI trong doanh nghiệp tại khu vực APAC liên tục đình trệ ở giai đoạn thí điểm?

Dù ngày càng nhiều doanh nghiệp tại khu vực châu Á – Thái Bình Dương (APAC) đẩy mạnh đầu tư vào trí tuệ nhân tạo (AI), việc triển khai công nghệ này trên quy mô lớn vẫn gặp không ít trở ngại…

12:02 14/03/2026

Samsung S26 tích hợp ba trợ lý ảo cùng lúc

Samsung mới đây đã chính thức giới thiệu dòng Galaxy S26 – thế hệ flagship mới nhất, với điểm nhấn quan trọng không nằm ở camera hay thiết kế, mà ở trí tuệ nhân tạo. Trung tâm của toàn bộ trải nghiệm lần này là Gemini, công nghệ AI do Alphabet phát triển…

10:16 02/03/2026

Ông Sam Altman, Giám đốc Điều hành OpenAI, tại hội nghị India AI Impact Summit 2026 ở New Delhi, Ấn Độ

CEO Sam Altman lên tiếng trước quan điểm AI "tiêu tốn lượng nước khổng lồ"

CEO Sam Altman - người đứng đầu Open AI cho rằng nhiều thông tin lan truyền trên mạng về AI tiêu tốn “lượng nước khổng lồ” là không đúng sự thật, thậm chí “hoàn toàn vô lý”...

18:59 26/02/2026

Tác nhân AI có thể nâng cao hiệu suất công việc lên hơn 50% – nhưng chỉ khi có sự vào cuộc của con người.

Con người là chìa khóa giúp tác nhân AI tăng hiệu suất 50%

Mô hình AI nhỏ, chi phí thấp có thể vượt trội hơn mô hình đắt tiền nếu được trang bị kỹ năng phù hợp…

10:39 25/02/2026