image Thứ Sáu, 22/05/2026

Các công ty hàng đầu chưa có kế hoạch kiểm soát siêu trí tuệ nhân tạo

Sơn Trần

09/12/2025

Chia sẻ

Các công ty trí tuệ nhân tạo (AI) lớn nhất thế giới đang thất bại trong việc thực hiện cam kết an toàn mà chính họ từng công bố, sự thiếu hụt này có thể đi kèm những rủi ro “thảm khốc”...

Chưa công ty nào đưa ra được kế hoạch đảm bảo con người vẫn giữ quyền kiểm soát với hệ thống AI
Chưa công ty nào đưa ra được kế hoạch đảm bảo con người vẫn giữ quyền kiểm soát với hệ thống AI

Winter AI Safety Index 2025 do Viện Tương lai Cuộc sống (Future of Life Institute – FLI), một tổ chức phi lợi nhuận, công bố đã đánh giá 8 công ty AI lớn, gồm Anthropic, OpenAI, Google DeepMind, xAI và Meta (Hoa Kỳ), cùng ba công ty Trung Quốc là DeepSeek, Alibaba Cloud và Z.ai.

Báo cáo được đưa ra trong bối cảnh nhiều hãng AI đối mặt với các vụ kiện và cáo buộc rằng chatbot của họ gây tổn hại tâm lý, thậm chí “hướng dẫn tự tử”, cùng với đó là vấn đề tấn công mạng có trợ giúp từ AI, Euronews đưa tin.

Kết quả cho thấy hầu như không công ty nào có chiến lược đáng tin cậy để ngăn chặn việc AI bị lạm dụng gây hậu quả nghiêm trọng hoặc nguy cơ mất quyền kiểm soát, khi tất cả đều chạy đua hướng đến trí tuệ nhân tạo tổng quát (AGI) và siêu trí tuệ – dạng AI vượt xa năng lực con người.

Một số chuyên gia độc lập nghiên cứu báo cáo cho biết không công ty nào đưa ra được kế hoạch đảm bảo con người vẫn giữ quyền kiểm soát với hệ thống AI.

Ông Stuart Russell, giáo sư khoa học máy tính tại Đại học California, Berkeley, nói rằng các công ty AI khẳng định họ có thể xây dựng AI siêu trí tuệ, nhưng không ai chứng minh được cách ngăn chặn nguy cơ mất quyền kiểm soát.

“Tôi muốn thấy bằng chứng rằng họ có thể giảm nguy cơ mất kiểm soát xuống mức 1/100 triệu mỗi năm, giống tiêu chuẩn của lò phản ứng hạt nhân”, ông Russell viết. “Thay vào đó, họ thừa nhận rủi ro có thể là 1/10, 1/5, thậm chí 1/3 và họ không thể giải thích hay cải thiện con số này”.

NHÓM TIÊU CHÍ ĐÁNH GIÁ

Nghiên cứu đo mức độ tuân thủ của các công ty theo 6 nhóm tiêu chí quan trọng: đánh giá rủi ro, tác hại hiện tại, khung an toàn, an toàn tồn vong (existential safety), quản trị – trách nhiệm giải trình và chia sẻ thông tin.

Dù báo cáo ghi nhận một số tiến bộ, hội đồng chuyên gia độc lập chỉ ra rằng việc thực thi vẫn thiếu đồng bộ và thường không đạt mức độ yêu cầu theo tiêu chuẩn toàn cầu đang xây dựng.

Anthropic, OpenAI và Google DeepMind được khen ngợi vì minh bạch hơn, có khung an toàn công khai, và tiếp tục đầu tư vào nghiên cứu an toàn kỹ thuật. Nhưng cả ba vẫn còn nhiều điểm yếu.

Anthropic bị chỉ trích vì ngừng thử nghiệm “human uplift” và chuyển sang mặc định huấn luyện mô hình dựa trên tương tác người dùng, điều khiến các chuyên gia cho rằng làm suy yếu khả năng bảo vệ quyền riêng tư.

OpenAI bị phê phán vì đặt ra ngưỡng an toàn mơ hồ, vận động hành lang chống lại luật an toàn AI cấp bang, và thiếu sự giám sát độc lập đủ mạnh.

Người phát ngôn OpenAI khẳng định an toàn là trọng tâm trong mọi hoạt động xây dựng và phát triển AI: “Chúng tôi đầu tư lớn vào nghiên cứu an toàn cấp độ tiên phong, tích hợp lớp bảo vệ mạnh vào hệ thống, và kiểm thử nghiêm ngặt cả nội bộ lẫn qua chuyên gia độc lập. Chúng tôi công khai khung an toàn, đánh giá và nghiên cứu để thúc đẩy tiêu chuẩn chung của ngành, đồng thời liên tục tăng cường bảo vệ tương lai”.

Google DeepMind đã cải thiện khung an toàn, nhưng vẫn dựa vào các đơn vị đánh giá được công ty trả tiền, làm giảm tính độc lập. Phát ngôn viên Google DeepMind nói họ áp dụng “cách tiếp cận khoa học – nghiêm ngặt” trong xử lý an toàn AI: “Khung Frontier Safety Framework của chúng tôi nêu rõ quy trình nhận diện và giảm thiểu rủi ro nghiêm trọng trước khi mô hình gây tác động. Khi mô hình ngày càng mạnh, chúng tôi tiếp tục đổi mới về an toàn và quản trị với tốc độ tương ứng”.

Tuy vậy, theo ông Max Tegmark, Chủ tịch FLI và giáo sư tại MIT, cả ba công ty hàng đầu vẫn liên quan đến các vấn đề gây hại thực tế thời gian gần đây, từ tổn hại tâm lý cho đến tấn công hacker quy mô lớn vào Anthropic.

Báo cáo cũng ghi nhận tiến bộ ở năm công ty còn lại, dù không đồng đều và vẫn còn nhiều khoảng trống.

KHOẢNG TRỐNG GIỮA CAM KẾT VÀ THỰC TẾ

Cụ thể, xAI công bố khung an toàn đầu tiên nhưng bị đánh giá là quá hẹp và thiếu tiêu chí rõ ràng cho các biện pháp xử lý rủi ro.

Z.ai là công ty duy nhất công bố đầy đủ đánh giá an toàn độc lập, nhưng được khuyến nghị minh bạch hơn nữa về cấu trúc quản trị và khung an toàn tổng thể.

Meta đưa ra khung an toàn mới với các ngưỡng dựa trên kết quả, nhưng chuyên gia yêu cầu họ giải thích rõ phương pháp và chia sẻ quy trình đánh giá nội bộ.

DeepSeek được ghi nhận vì nhân viên nội bộ tích cực thúc đẩy an toàn công nghệ, nhưng lại thiếu tài liệu an toàn cơ bản.

Alibaba Cloud đã đóng góp cho tiêu chuẩn quốc gia về gắn watermark (nhãn), nhưng còn yếu ở khả năng tăng độ tin cậy, công bằng và tính trung thực của mô hình.

AI VẪN ĐANG ĐƯỢC QUẢN LÝ KHÁ LỎNG LẺO 

Trước đây các chuyên gia tin AGI phải 100 năm nữa mới thành hiện thực, giờ họ nói chỉ còn vài năm
Trước đây các chuyên gia tin AGI phải 100 năm nữa mới thành hiện thực, giờ họ nói chỉ còn vài năm

“Tôi hy vọng chúng ta sớm vượt qua thời điểm các công ty chỉ phát triển dựa trên danh tiếng”, ông Tegmark nói. “Khi được hỏi kế hoạch kiểm soát AGI của họ là gì, không công ty nào trả lời được”.

Trong khi đó, những hãng như Meta lại dùng từ “siêu trí tuệ” như một khẩu hiệu để thổi phồng sản phẩm mới. Năm nay, Meta đổi tên bộ phận mô hình ngôn ngữ lớn của mình thành Meta Superintelligence Labs.

Theo ông Tegmark, quan điểm về AGI đã thay đổi rõ rệt: nếu trước đây các chuyên gia tin AGI phải 100 năm nữa mới thành hiện thực, giờ họ nói chỉ còn vài năm.

“AI được quản lý lỏng lẻo hơn cả việc bán… bánh mì kẹp”, ông Tegmark nói, nhắc đến tình trạng vận động hành lang chống lại tiêu chuẩn an toàn bắt buộc. Tuy vậy, ông cũng chỉ ra làn sóng phản đối chưa từng có khi AGI và siêu trí tuệ không được kiểm soát.

Tháng 10 vừa qua, hàng nghìn nhân vật có tầm ảnh hưởng, bao gồm lãnh đạo công nghệ và giới khoa học, đã ký vào một kiến nghị kêu gọi làm chậm việc theo đuổi siêu trí tuệ. Kiến nghị do FLI tổ chức, thu hút chữ ký từ nhiều bên như các nhà chính trị, lãnh đạo tôn giáo, cho đến nhà khoa học máy tính hàng đầu.

“Điểm chung của họ là gì? Họ đồng thuận với bản tuyên bố. Điều này cực kỳ đáng chú ý”, ông Tegmark cảnh báo nếu siêu trí tuệ xuất hiện và điều khiển mọi lĩnh vực, người lao động sẽ không thể kiếm sống khi mọi công việc đều bị robot thay thế. Khi ấy, xã hội sẽ sống phụ thuộc vào trợ cấp.

“Tôi nghĩ chúng ta đang tiến gần đến điểm bùng nổ”, ông Tegmark dự đoán.


VinFuture 2026 nhận 1.819 đề cử từ 117 quốc gia và vùng lãnh thổ

Giải thưởng Khoa học Công nghệ toàn cầu VinFuture vừa khép lại vòng đề cử mùa giải 2026 với 1.819 hồ sơ đến từ khắp thế giới, đồng thời ghi nhận mạng lưới hơn 17.000 đối tác đề cử đến từ 117 quốc gia và vùng lãnh thổ...

20:48 19/05/2026
Gần 450 đội thi từ khắp châu Á tham gia Asian Hackathon for Green Future 2026

Cuộc thi hướng đến mục tiêu tìm kiếm và hỗ trợ các sáng kiến công nghệ có khả năng ứng dụng thực tiễn để giải quyết những thách thức môi trường cấp bách tại châu Á, đồng thời thúc đẩy tinh thần đổi mới sáng tạo và hợp tác liên ngành trong thế hệ trẻ...

20:48 19/05/2026
Trung Quốc tăng tốc xây dựng mạng lưới sức mạnh tính toán quốc gia

Trung Quốc tham vọng biến hạ tầng trí tuệ nhân tạo (AI) thành một loại tiện ích công cộng tương tự điện, nước hay viễn thông...

10:19 18/05/2026
Thêm giải pháp AI "Make in Vietnam" đạt chuẩn quốc tế về chống giả mạo khuôn mặt

CIVAMS.FACE-FAS, giải pháp chống giả mạo khuôn mặt do CMC ATI phát triển, vượt qua bài đánh giá iBeta Level 1 theo tiêu chuẩn ISO/IEC 30107-3, tiếp tục ghi dấu năng lực AI “Make in Vietnam” trên các bảng xếp hạng quốc tế.

09:10 14/05/2026
CMC tái cấu trúc Khối Công nghệ và Giải pháp, thúc đẩy mục tiêu chuyển đổi AI

CMC hợp nhất năng lực tư vấn vào CMC TS, bổ nhiệm ông Nguyễn Hải Sơn làm Quyền Tổng Giám đốc, đồng thời đưa AI-X trở thành trục tăng trưởng chính trong chiến lược giai đoạn 2026-2030...

11:07 13/05/2026
Qualcomm chính thức khai trương Trung tâm R&D tại Hà Nội

Trung tâm sẽ góp phần củng cố mạng lưới R&D toàn cầu của Qualcomm Technologies thông qua việc tận dụng nguồn nhân lực công nghệ đang trên đà phát triển nhanh chóng tại Việt Nam, đồng thời thúc đẩy các mối quan hệ hợp tác chặt chẽ hơn tại địa phương...

15:55 12/05/2026
Công nghệ điều hướng: 'Phao cứu sinh' cho thu nhập và an toàn của người lái xe 2 bánh tại Việt Nam

Nghiên cứu mới tại khu vực châu Á - Thái Bình Dương nhấn mạnh vai trò thiết yếu của các công cụ định tuyến theo thời gian thực, cảnh báo an toàn và hướng dẫn bằng giọng nói trong việc hỗ trợ người tham gia giao thông bằng xe hai bánh tại Việt Nam.

19:11 11/05/2026
Kiến tạo mô hình hạ tầng năng lượng xanh dùng chung tại Việt Nam

Việc kiến tạo hệ sinh thái hạ tầng năng lượng xanh dùng chung đánh dấu bước ngoặt chiến lược nhằm hóa giải "nút thắt" về trạm sạc và đổi pin, tạo động lực thực tế để thúc đẩy lộ trình điện hóa giao thông tại Việt Nam…

15:56 07/05/2026
Ngành dược thế giới đang ứng dụng AI mạnh mẽ để tìm ra thuốc mới

Thay vì tiếp tục phụ thuộc vào phương pháp thử-sai truyền thống, các công ty dược đang chuyển hướng sang AI với kỳ vọng tận dụng sức mạnh tính toán để rút ngắn thời gian và tăng xác suất thành công...

14:06 06/05/2026
Intel hỗ trợ thiết bị sản xuất chip, phục vụ công tác đào tạo nhân lực bán dẫn cho Việt Nam

Chương trình mang đến cơ hội thực hành trực tiếp trên các trang thiết bị chuyên dụng, làm cầu nối giữa kiến thức học thuật và thực tiễn ngành, đặc biệt là trong khâu đóng gói và kiểm thử chip.

15:46 05/05/2026