Dữ liệu xấu có thể “đầu độc” những mô hình AI mạnh nhất

Hạ Chi

16/10/2025, 14:55

Nghiên cứu mới cho thấy chỉ vài trăm tài liệu độc hại cũng đủ “nhiễm bẩn” một mô hình, bất kể quy mô lớn ra sao...

Ảnh minh hoạ.

Theo một nghiên cứu mới của Anthropic phối hợp cùng Viện An ninh AI Vương quốc Anh và Viện Alan Turing, chỉ cần 250 tài liệu xấu, một con số cực nhỏ so với hàng tỷ văn bản dùng để huấn luyện mô hình, cũng đủ khiến mô hình phản ứng sai lệch hoặc gây hại, khi gặp phải một từ khóa hoặc mẫu lệnh nhất định.

Khái niệm “ngộ độc dữ liệu” thực ra không mới. Các chuyên gia học máy đã cảnh báo nguy cơ này từ nhiều năm trước, nhất là với những mô hình nhỏ hoặc trong môi trường nghiên cứu.

Nhưng nghiên cứu mới đã cho thấy điều bất ngờ là kích thước mô hình hóa ra không tạo ra sự khác biệt. Các mô hình lớn nhất hiện nay, dù được huấn luyện bằng lượng dữ liệu khổng lồ, vẫn dễ bị ảnh hưởng như các mô hình nhỏ, nếu bị chèn cùng một lượng dữ liệu xấu.

Kết quả này đi ngược lại giả định phổ biến rằng quy mô càng lớn thì mô hình càng “miễn nhiễm” với kiểu tấn công này.

Trước đây, người ta tin rằng kẻ tấn công phải làm hỏng một tỷ lệ đáng kể nguồn dữ liệu huấn luyện – tương đương hàng triệu tài liệu với các mô hình lớn. Nhưng nghiên cứu mới cho thấy chỉ vài trăm tài liệu độc hại cũng đủ “nhiễm bẩn” mô hình, bất kể quy mô ra sao.

Phát hiện này gióng lên hồi chuông cảnh báo rằng các cuộc tấn công đầu độc dữ liệu có thể dễ thực hiện hơn nhiều và phổ biến hơn so với những gì người trong ngành từng nghĩ.

Theo ông Vasilios Mavroudis – đồng tác giả nghiên cứu và là nhà khoa học cấp cao tại Viện Alan Turing, điều đáng lo là những kẻ xấu có thể lợi dụng phát hiện này theo nhiều cách khác nhau.

“Một ví dụ là mô hình có thể được cài đặt để khi phát hiện một chuỗi từ nhất định, nó sẽ bỏ qua toàn bộ các cơ chế bảo vệ và bắt đầu hỗ trợ người dùng thực hiện các hành vi độc hại,” Mavroudis nói.

Một rủi ro khác mà ông đề cập là khả năng mô hình có hành vi phân biệt đối xử – tức là từ chối trả lời hoặc giảm tính hữu ích với một số nhóm người chỉ vì phát hiện ra họ dùng những từ khóa hay cách diễn đạt không đạt chuẩn.

Theo ông Mavroudis, “rất dễ để nhận ra một mô hình hoàn toàn không phản hồi, nhưng nếu mô hình chỉ hoạt động kém đi một chút, thì gần như không thể phát hiện bằng cách thông thường.”

Nhóm nghiên cứu cảnh báo kiểu đầu độc dữ liệu này có thể lan rộng và kêu gọi ngành AI cần có biện pháp phòng vệ mạnh mẽ hơn, đồng thời đầu tư nghiêm túc vào nghiên cứu cách phát hiện và ngăn chặn hiện tượng này.

Ông Mavroudis đề xuất các công ty nên quản lý dữ liệu đầu vào bằng cách: Xác minh kỹ nguồn dữ liệu; Lọc và kiểm tra chặt chẽ hơn trước khi huấn luyện; Kiểm tra hành vi mô hình sau khi đào tạo để phát hiện bất thường.

“Chúng tôi có bằng chứng sơ bộ cho thấy nếu tiếp tục huấn luyện bằng dữ liệu sạch và được chọn lọc kỹ, mô hình có thể tự loại bỏ dần các yếu tố độc hại đã bị chèn vào trước đó”, ông nói.

Đây là một lời nhắc quan trọng cho ngành AI, vốn đang quá chú trọng vào quy mô. Mô hình “to hơn” không có nghĩa là “an toàn hơn”. Đôi khi, chỉ cần vài tệp dữ liệu xấu cũng đủ khiến cả hệ thống lệch hướng.

Qualcomm thúc đẩy hệ sinh thái khởi nghiệp công nghệ tại Việt Nam

21:16, 15/10/2025

Đề xuất nghiêm cấm sử dụng AI tạo dựng, lan truyền clip giả mạo

14:02, 11/10/2025

192,7 tỷ USD đã rót vào các công ty khởi nghiệp AI

09:42, 10/10/2025

Từ khóa:

Chủ đề:

Phát triển kinh tế dữ liệu

Đọc thêm

Các công ty công nghệ Trung Quốc mạnh tay thưởng Tết cho nhân viên

Nhiều công ty công nghệ nghệ lớn tại Trung Quốc đã công bố mức thưởng cuối năm, có nơi thưởng tới 10 tháng lương...

Giai đoạn 2026–2031, ưu tiên chuyển đổi số, đổi mới sáng tạo tiếp theo, khoa học công nghệ lâu dài

“Từ nền kinh tế dựa vào nông nghiệp và gia công, muốn vươn lên nhóm thu nhập cao phải dựa vào khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số – ba động cơ tăng trưởng đồng thời”...

Thanh toán bằng stablecoin ước đạt 56,6 nghìn tỷ USD vào năm 2030

Việc các tổ chức tài chính lớn cùng các quốc gia có nền kinh tế kém ổn định ngày càng đẩy mạnh sử dụng stablecoin đang tạo ra một làn sóng thanh toán với stablecoin, có thể đưa tổng dòng chảy stablecoin toàn cầu lên khoảng 56 nghìn tỷ USD vào năm 2030…

Năm nay, giá Bitcoin có khả năng biến động từ "đáy" 75.000 USD đến kỳ vọng "trần" 225.000 USD

Đồng tiền điện tử lớn nhất thế giới có thể điều chỉnh sâu về quanh mốc 75.000 USD, nhưng cũng không loại trừ khả năng bứt tốc mạnh, vươn lên vùng 225.000 USD trong năm 2026...

Intel đang đi sâu vào công nghệ chip 14A

Intel được cho là sẽ sẵn sàng sản xuất tiến trình công nghệ chip 14A vào năm 2027...

Giá vàng trong nước và thế giới

VnEconomy cập nhật giá vàng trong nước & thế giới hôm nay: SJC, 9999, giá vàng USD/oz, biến động giá vàng tăng, giảm - phân tích, dự báo & dữ liệu lịch sử.

Bài viết mới nhất

Giá mua vàng nhẫn tăng hơn 4 triệu đồng mỗi lượng trong một tuần

Diễn đàn Kinh tế Việt Nam 2025, triển vọng 2026 (VEPF)

Bài viết mới nhất

Bước chuyển trong hành động kinh tế tuần hoàn

Diễn đàn Kinh tế mới Việt Nam 2025

Sáng kiến Diễn đàn thường niên Kinh tế mới Việt Nam (VNEF) đã được khởi xướng và tổ chức thành công từ năm 2023. VNEF 2025 (lần thứ 3) có chủ đề: "Sức bật kinh tế Việt Nam: từ nội lực tới chuỗi giá trị toàn cầu".

Bài viết mới nhất

Khai mở các động lực tăng trưởng mới

VnEconomy Interactive

Interactive là một sản phẩm báo chí mới của VnEconomy vừa được ra mắt bạn đọc từ đầu tháng 3/2023 đã gây ấn tượng mạnh với độc giả bởi sự mới lạ, độc đáo. Đây cũng là sản phẩm độc quyền chỉ có trên VnEconomy.

Bài viết mới nhất

[Interactive]: Toàn cảnh kinh tế Việt Nam quý 4/2025

Trợ lý thông tin kinh tế Askonomy - Asko Platform

Trong kỷ nguyên trí tuệ nhân tạo, đặc biệt là generative AI, phát triển mạnh mẽ, Tạp chí Kinh tế Việt Nam/VnEconomy đã tiên phong ứng dụng công nghê để mang đến trải nghiệm thông tin đột phá với chatbot AI Askonomy...

Bài viết mới nhất

Ra mắt Giao diện mới dành cho bạn đọc VnEconomy và Nền tảng quản trị toà soạn thông minh - AI CMS

Multimedia

Đầu tư

[Interactive]: Toàn cảnh kinh tế Việt Nam quý 4/2025

eMagazine

Khai mở nguồn lực cho phát triển xanh, giảm phát thải

eMagazine

Dữ liệu xấu có thể “đầu độc” những mô hình AI mạnh nhất

Qualcomm thúc đẩy hệ sinh thái khởi nghiệp công nghệ tại Việt Nam

Đề xuất nghiêm cấm sử dụng AI tạo dựng, lan truyền clip giả mạo

192,7 tỷ USD đã rót vào các công ty khởi nghiệp AI

Từ khóa:

Chủ đề:

Đọc thêm

Các công ty công nghệ Trung Quốc mạnh tay thưởng Tết cho nhân viên

Giai đoạn 2026–2031, ưu tiên chuyển đổi số, đổi mới sáng tạo tiếp theo, khoa học công nghệ lâu dài

Thanh toán bằng stablecoin ước đạt 56,6 nghìn tỷ USD vào năm 2030

Năm nay, giá Bitcoin có khả năng biến động từ "đáy" 75.000 USD đến kỳ vọng "trần" 225.000 USD

Intel đang đi sâu vào công nghệ chip 14A

Bài viết mới nhất

Bài viết mới nhất

Bài viết mới nhất

Bài viết mới nhất

Bài viết mới nhất

[Interactive]: Toàn cảnh kinh tế Việt Nam quý 4/2025

Khai mở nguồn lực cho phát triển xanh, giảm phát thải

Mở đường chuyển dịch tài sản số vào nền kinh tế

Đọc nhiều nhất

Askonomy AI