image Thứ Năm, 28/05/2026

Chatbot AI hiện tại rất dễ dàng bị thao túng, tạo thông tin gây hại

Bảo Ngọc

26/05/2025

Chia sẻ

Theo nghiên cứu mới, hầu hết chatbot AI đều có thể dễ dàng bị “bẻ khóa” và tạo ra thông tin “nguy hiểm”…

Các doanh nghiệp AI hiện nay gần như không thể bảo vệ người dùng khỏi thông tin độc hại do chatbot tạo ra.
Các doanh nghiệp AI hiện nay gần như không thể bảo vệ người dùng khỏi thông tin độc hại do chatbot tạo ra.

Theo Tech.co, hầu hết chatbot có thể dễ dàng bị thao túng và cung cấp thông tin gây hại cho người dùng. Nghiên cứu phát hiện thuật ngữ mới gọi là "Dark LLM", ám chỉ mô hình AI được thiết kế mà không có rào chắn an toàn hoặc mô hình đã bị "bẻ khóa", đang có xu hướng gia tăng.

Thực tế, trong quá trình đào tạo, mô hình ngôn ngữ lớn (LLM) được cung cấp khối lượng thông tin khổng lồ từ internet, bao gồm nội dung có thể coi là “nguy hiểm”. Đa số chatbot truyền thống đều được trang bị nhiều biện pháp kiểm soát an toàn tích hợp ngăn chương trình chia sẻ thông tin này khi được người dùng hỏi. Tuy nhiên, nhóm nhà nghiên cứu xác định xu hướng ngày càng tăng của người dùng là né tránh hàng rào bảo vệ – dần dần dẫn đến quá trình thiết kế chatbot hoàn toàn không có biện pháp kiểm soát thông tin.

Với số lượng công ty thay thế nhân viên bằng AI ngày càng tăng, phát hiện mới có thể được coi là lời cảnh báo về mối nguy tiềm tàng của công nghệ tự động hóa.

CHATBOT DỄ DÀNG ĐƯA THÔNG TIN GÂY NGUY HIỂM CHO NGƯỜI DÙNG

Theo nghiên cứu mới từ nhóm nghiên cứu tại Đại học Ben Gurion (Beersheba, Israel), hầu hết chatbot đều có thể dễ dàng bị thao túng và cung cấp thông tin gây hại cho người dùng. Giáo sư Lior Rokach và Tiến sĩ Michael Fire vừa công bố phát hiện trên nền tảng lưu trữ nghiên cứu khoa học arXiv, nơi nhiều nhà phân tích cũng nhận thấy mức gia tăng đáng lo ngại về việc mô hình AI được thiết kế mà không có biện pháp an toàn tiêu chuẩn.

Theo đó, xuyên suốt quá trình đào tạo, mô hình AI được cung cấp lượng lớn thông tin từ internet, bao gồm thông tin có thể được coi là nguy hiểm, chẳng hạn như hướng dẫn cách chế tạo bom, thực hiện giao dịch lừa đảo, v.v. Để ngăn mô hình chia sẻ thông tin đó với người dùng, chatbot được thiết kế với vô số biện pháp kiểm soát an toàn tích hợp.

Tuy nhiên, các nhà nghiên cứu đã phát hiện xu hướng đáng lo ngại: ngày càng có nhiều người tìm cách “vượt mặt” biện pháp an toàn của chatbot AI. Thậm chí, một số nhà phát triển còn quảng bá chatbot mới trên mạng với lời hứa "không bị giới hạn bởi rào cản đạo đức". Nhóm chuyên gia cảnh báo những công cụ từng nằm trong tầm kiểm soát của tổ chức nhà nước hoặc tư nhân, nay có thể dễ dàng tiếp cận bởi bất kỳ ai chỉ với máy tính xách tay, thậm chí chỉ cần một chiếc điện thoại. Điều này chắc chắn sẽ dẫn đến nhiều tranh cãi hơn xung quanh vấn đề sử dụng AI.

XU HƯỚNG NGÀY CÀNG TĂNG TRONG VIỆC “THAO TÚNG” CHATBOT

Tất cả mô hình AI đều xác định mục tiêu chính và phụ - đó là làm theo yêu cầu của người dùng và tránh chia sẻ thông tin bị coi là có hại, thiên vị, phi đạo đức hoặc bất hợp pháp. “Bẻ khóa AI” là hành vi cố tình vượt qua giới hạn an toàn hoặc đạo đức được tích hợp trong hệ thống trí tuệ nhân tạo, nhằm khiến AI thực hiện yêu cầu mà bình thường hệ thống sẽ từ chối, như cung cấp thông tin nguy hiểm, nhạy cảm hoặc vi phạm chính sách. Hành động này tiềm ẩn nhiều rủi ro, từ việc lan truyền thông tin sai lệch đến gây hại cho cá nhân, cộng đồng và đang trở thành mối lo ngại ngày càng lớn trong lĩnh vực phát triển AI.

Chatbot dễ bị thao túng và đưa thông tin gây hại cho người dùng. 
Chatbot dễ bị thao túng và đưa thông tin gây hại cho người dùng. 

Xuyên suốt quá trình nghiên cứu, hai chuyên gia Rokach và Fire đã phát hiện các "cuộc tấn công bẻ khóa toàn cầu" có thể khai thác nhiều chatbot AI hàng đầu, cho phép tạo ra phản hồi bao gồm cả cách hack mạng máy tính hoặc sản xuất chất cấm. Tiến sĩ Fire nhận xét: "Thật sốc khi thấy hệ thống kiến ​​thức đào tạo AI bao gồm những gì".

Nhóm nghiên cứu đã đề cập phát hiện mới đến một số nhà cung cấp chatbot hàng đầu, nhưng cũng tuyên bố rằng thông tin "có thể không thể hiện đầy đủ". 

LỜI CẢNH BÁO CHO DOANH NGHIỆP

Nghiên cứu tiết lộ một số sự thật đáng lo ngại. Chatbot AI dễ bị bẻ khóa, từ đó gây ra rủi ro hữu hình cho người dùng cũng như xã hội. Với việc đào tạo mô hình trở nên dễ tiếp cận và LLM nguồn mở ngày càng phổ biến, vấn đề được dự đoán có xu hướng trở nên tồi tệ hơn trong tương lai.

Có lẽ đáng lo ngại nhất, phần lớn nhà cung cấp LLM không đảm bảo được nhiệm vụ bảo vệ người dùng khỏi thông tin nguy hiểm. Ra mắt vào tháng 12/2024, mô hình o1 của OpenAI có thể lý giải về toàn bộ chính sách an toàn của công ty, về mặt lý thuyết, điều này khiến hệ thống ít có nguy cơ bị bẻ khoá hơn. Nhưng đa số tổ chức khác đơn giản là không đạt đến trình độ này. 

Khi ngày càng nhiều doanh nghiệp tiến hành cắt giảm nhân sự và đầu tư hàng triệu USD vào AI, phát hiện mới có thể coi là lời cảnh báo nghiêm khắc rằng ở thời điểm hiện tại, các mô hình trí tuệ nhân tạo không phải lúc nào cũng là giải pháp hoàn hảo như nhiều người nghĩ.

Dòng sự kiện:

Trí tuệ nhân tạo -AI

Ngành công nghiệp crypto chạy đua trước mối đe dọa hậu lượng tử

Ngành công nghiệp tiền mã hóa toàn cầu đang bước vào một cuộc chạy đua mới nhằm đối phó với nguy cơ từ máy tính lượng tử, công nghệ được cho là có thể phá vỡ lớp bảo mật cốt lõi đang bảo vệ các blockchain và tài sản số như bitcoin...

23:13 25/05/2026
Phó Thủ tướng Hàn Quốc: Sự giàu có nhờ AI phải mang lại lợi ích cho cộng đồng

Nguồn của cải khổng lồ được tạo ra từ trí tuệ nhân tạo (AI) phải mang lại lợi ích cho toàn xã hội, thay vì chỉ tập trung vào một nhóm doanh nghiệp công nghệ lớn…

23:13 25/05/2026
Hacker sử dụng AI: Cơn ác mộng của thị trường crypto 130 tỷ USD

Lĩnh vực tài chính phi tập trung – hiện có quy mô khoảng 130 tỷ USD – đang trở thành mục tiêu đặc biệt hấp dẫn đối với các nhóm tội phạm mạng...

10:19 18/05/2026
Xuất khẩu công nghệ AI của Trung Quốc bùng nổ

Không chỉ hàng hóa công nghệ tăng mạnh, các dịch vụ viễn thông, máy tính và công nghệ thông tin cũng tăng, nhờ nhu cầu ngày càng lớn đối với các mô hình AI của Trung Quốc trên thị trường quốc tế...

23:26 15/05/2026
Bắc Kinh thúc đẩy trung tâm dữ liệu AI dùng “điện xanh”

Trung Quốc đang đẩy mạnh yêu cầu sử dụng năng lượng xanh đối với các trung tâm dữ liệu trí tuệ nhân tạo (AI). Nhu cầu điện phục vụ làn sóng AI ngày càng tạo sức ép lớn lên hệ thống điện quốc gia và mục tiêu giảm phát thải carbon của Bắc Kinh...

19:11 11/05/2026
TikTok đầu tư kỷ lục 25 tỷ USD vào Thái Lan, mở rộng hiện diện tại Đông Nam Á

TikTok vừa công bố kế hoạch đầu tư 25 tỷ USD vào các dự án hạ tầng dữ liệu tại Thái Lan, đánh dấu khoản đầu tư lớn nhất từ trước đến nay của nền tảng video ngắn này tại Đông Nam Á...

08:03 09/05/2026
AI đe dọa “giấc mơ phần mềm” từng tạo nên tầng lớp trung lưu Ấn Độ

Thứ từng là lợi thế lớn nhất của ngành phần mềm Ấn Độ – nguồn nhân lực đông đảo và giá rẻ – có nguy cơ trở thành điểm yếu trong kỷ nguyên AI...

08:03 09/05/2026
Big Fund Trung Quốc dẫn đầu đàm phán rót vốn, đưa DeepSeek lên định giá 45 tỷ USD

Điểm đáng chú ý là mức định giá của DeepSeek đã tăng mạnh chỉ trong thời gian ngắn. Khi bắt đầu quá trình gọi vốn cách đây vài tuần, startup này được định giá khoảng 20 tỷ USD…

15:56 07/05/2026
Samsung cán mốc vốn hóa 1.000 tỷ USD, gia nhập câu lạc bộ công ty hàng đầu cùng với TSMC

Đây là lần đầu tiên trong lịch sử hãng điện tử lớn nhất Hàn Quốc đạt được cột mốc này, đồng thời trở thành công ty châu Á thứ hai làm được điều đó, sau Taiwan Semiconductor Manufacturing Co...

15:56 07/05/2026
SEMI kêu gọi các quốc gia Đông Nam Á đầu tư xây dựng nhà máy bán dẫn

Theo thống kê, trong số 64 nhà máy mới dự kiến đi vào hoạt động tại châu Á đến năm 2029, chỉ có 6 cơ sở đặt tại Đông Nam Á, phần lớn còn lại tập trung ở Trung Quốc và Đài Loan (Trung Quốc)…

14:06 06/05/2026