Ngành AI chuyển hướng: Thay thế nhân công giá rẻ bằng chuyên gia cao cấp để xây dựng mô hình thông minh hơn
Giờ đây, các công ty không chỉ cần đến những nhân công chỉ dán nhãn dữ liệu, mà cần các chuyên gia huấn luyện dữ liệu, để có những mô hình AI biết phản hồi như con người...

Các tập đoàn trí tuệ nhân tạo (AI) hàng đầu đang dần từ bỏ việc sử dụng lao động giá rẻ tại các nước châu Phi và châu Á chỉ để gán nhãn dữ liệu. Thay vào đó, họ tuyển dụng các chuyên gia huấn luyện dữ liệu được trả lương cao trong các lĩnh vực như sinh học và tài chính.
Đây là bước đi mới nhất nhằm tạo ra các bộ dữ liệu chất lượng cao, yếu tố then chốt để phát triển thế hệ mô hình AI tiên tiến hơn.
NHÀ ĐẦU TƯ QUAN TÂM CÁC CÔNG TY KHỞI NGHIỆP CHUYÊN VỀ GẮN NHÃN DỮ LIỆU
Theo Financial Times, các công ty như Scale AI, Turing và Toloka đang chuyển hướng sang việc thuê các chuyên gia hàng đầu để xây dựng dữ liệu huấn luyện phức tạp hơn, đáp ứng nhu cầu phát triển các mô hình AI có khả năng “suy luận” như o3 của OpenAI hay Gemini 2.5 của Google.
Sự chuyển đổi này đánh dấu sự chấm dứt của mô hình sử dụng hàng nghìn lao động giá rẻ tại các quốc gia như Kenya và Philippines, nơi họ thường được trả dưới 2 USD mỗi giờ để thực hiện các công việc tốn thời gian như gắn nhãn dữ liệu cho các tập dữ liệu khổng lồ dùng để huấn luyện AI.
Bà Olga Megorskaya, giám đốc điều hành và đồng sáng lập Toloka, một công ty có trụ sở tại Hà Lan, cho biết: “Trong thời gian dài, ngành AI tập trung chủ yếu vào mô hình và năng lực tính toán, trong khi dữ liệu thường bị xem nhẹ. Giờ đây, ngành công nghiệp này cuối cùng cũng nhận ra tầm quan trọng của dữ liệu trong việc huấn luyện AI”.
Sự thay đổi này đã làm gia tăng sự quan tâm của các nhà đầu tư đối với các công ty khởi nghiệp chuyên về gắn nhãn dữ liệu. Vào tháng 6, Meta đã đầu tư 15 tỷ USD vào Scale AI, một công ty có trụ sở tại Mỹ, nâng định giá của công ty này lên 29 tỷ USD, gấp đôi giá trị trước đó, như một phần trong nỗ lực bắt kịp các đối thủ cạnh tranh.
Vào tháng 3, Turing AI, một công ty tại California, huy động được 111 triệu USD với định giá 2,2 tỷ USD. Trong khi đó, vào tháng 5, công ty cá nhân của Jeff Bezos, Bezos Expeditions, đã dẫn đầu vòng đầu tư 72 triệu USD cho Toloka.
Trước đây, các nhân viên gắn nhãn dữ liệu thường thực hiện các công việc đơn giản như vẽ khung trên hình ảnh để xác định đối tượng, mô tả nội dung hình ảnh, chọn cách diễn đạt trôi chảy hoặc loại bỏ các câu trả lời không phù hợp từ các bộ dữ liệu, đôi khi chứa nội dung bạo lực hoặc nhạy cảm. Do các mô hình AI cần nhiều dữ liệu hơn để hoạt động tốt hơn, những nhân viên này thường phải xử lý hàng trăm tác vụ mỗi ngày, mỗi tác vụ chỉ mất vài giây.
Tuy nhiên, bà Megorskaya cho biết nhu cầu đối với các công việc này đã giảm đáng kể vì nhiều nhiệm vụ giờ đây có thể được tự động hóa. Bà Joan Kinyua, chủ tịch Hiệp hội Nhân viên Gắn nhãn Dữ liệu tại Kenya, chia sẻ rằng các nhân viên hiện nay được giao những công việc đòi hỏi kỹ năng ngôn ngữ địa phương và kiến thức chuyên sâu. Hiệp hội cũng ghi nhận sự xuất hiện của các công việc mà con người đảm nhận vai trò kiểm tra chất lượng cuối cùng cho nội dung do AI tạo ra.
SẴN SÀNG CHI TRẢ CHO CÁC BỘ DỮ LIỆU PHỨC TẠP VÀ THUÊ CÁC CHUYÊN GIA TỪ KHẮP NƠI TRÊN THẾ GIỚI
Khi các tập đoàn AI hàng đầu như OpenAI, Anthropic và Google nỗ lực phát triển các mô hình được cho là sẽ vượt qua trí tuệ con người, họ đang tập trung vào chất lượng của các bộ dữ liệu và tuyển dụng các chuyên gia để giải quyết các vấn đề phức tạp. Ông Jonathan Siddharth, đồng sáng lập và giám đốc điều hành Turing AI, nhấn mạnh: “Những gì các mô hình này cần bây giờ là dữ liệu từ việc con người sử dụng mô hình để thực hiện các công việc tri thức, đồng thời cung cấp phản hồi khi mô hình thất bại”.
Để đảm bảo các mô hình hoạt động tốt trong nhiều lĩnh vực từ lập trình, vật lý đến tài chính, các công ty AI với nguồn lực tài chính mạnh đang sẵn sàng chi trả cho các bộ dữ liệu phức tạp và thuê các chuyên gia từ khắp nơi trên thế giới.
Ông Siddharth cho biết Turing trả lương cho các chuyên gia cao hơn 20-30% so với công việc hiện tại của họ. Dù ngân sách dành cho dữ liệu chỉ chiếm khoảng 10-15% trong số hàng trăm tỷ USD mà các công ty AI chi cho năng lực tính toán, đây vẫn là một “khoản tiền khổng lồ”, ông nói thêm.
Các tính năng mới như “chuỗi tư duy” (chain-of-thought), giúp hiển thị cách AI giải quyết vấn đề từng bước, được phát triển nhờ các chuyên gia con người thể hiện cách họ phân tích vấn đề. Ví dụ, các kỹ sư phần mềm giàu kinh nghiệm có thể được yêu cầu tạo ra các tác vụ liên quan đến lĩnh vực của họ, sau đó giải quyết chúng bằng cách viết mã, sửa lỗi và kiểm tra lỗ hổng bảo mật.
Trong khi đó, việc xác thực một lý thuyết vật lý có thể đòi hỏi sự đóng góp từ một nhà vật lý để giải thích cách xây dựng một mô phỏng nhằm kiểm tra lý thuyết, một kỹ sư phần mềm để lập trình mô phỏng, và một nhà khoa học dữ liệu để phân tích kết quả. Ông Siddharth của Turing nhận định: “Kết quả là mô hình không chỉ vượt trội hơn một nhà vật lý, mà còn tốt hơn một người kết hợp xuất sắc các kỹ năng hàng đầu trong vật lý, khoa học máy tính và khoa học dữ liệu”.
Sự chuyển dịch này không chỉ đánh dấu một bước tiến trong cách ngành AI xây dựng mô hình thông minh hơn mà còn cho thấy sự thay đổi lớn trong cách các công ty tiếp cận dữ liệu – từ việc dựa vào lao động giá rẻ đến đầu tư vào chất lượng và chuyên môn cao cấp.