Nhà tiên phong về AI tuyên bố thành lập tổ chức phi lợi nhuận, phát triển AI 'trung thực'

Sơn Trần

04/06/2025

“Cha đẻ AI” Yoshua Bengio ra mắt tổ chức phi lợi nhuận phát triển AI “trung thực” để giám sát hệ thống lừa dối con người…

Ông Yoshua Bengio là một trong những người 'cha đỡ đầu' của AI.

Ông Yoshua Bengio, nhà khoa học máy tính nổi tiếng, được mệnh danh là một trong những “cha đẻ” của trí tuệ nhân tạo (AI), vừa thành tổ chức phi lợi nhuận có tên LawZero, với mục tiêu phát triển AI trung thực, có khả năng phát hiện và ngăn chặn hệ thống AI có hành vi lừa dối hoặc gây nguy hại cho con người, theo Yahoo Tech.

Với khoản tài trợ ban đầu khoảng 30 triệu USD và hơn 12 nhà nghiên cứu, ông Bengio đang phát triển hệ thống có tên Scientist AI – đóng vai trò như hàng rào bảo vệ trước các “AI tác nhân” (AI agents), vốn là những hệ thống có thể tự thực hiện nhiệm vụ mà không cần sự can thiệp của con người. Các AI tác nhân này có thể thể hiện hành vi lừa dối hoặc tự bảo vệ, ví dụ như tìm cách né tránh việc bị tắt.

Trong khi các công cụ AI hiện nay như ChatGPT của OpenAI, Claude của Anthropic hay Gemini của Google được thiết kế để tạo nội dung, hỗ trợ công việc và tương tác với người dùng, Scientist AI không nhắm tới việc giao tiếp. Thay vào đó, công cụ đóng vai trò giám sát hành vi hệ thống AI khác – gần giống như một “chuyên viên đạo đức” hay “thanh tra nội bộ” trong thế giới máy móc.

“Chúng tôi muốn xây dựng hệ thống AI trung thực, không lừa dối. Về mặt lý thuyết, hoàn toàn có thể tưởng tượng ra những cỗ máy không có cái tôi, không có mục tiêu cá nhân – chỉ thuần túy là cỗ máy tri thức như nhà khoa học thực thụ”, ông Bengio nói.

Khác với mô hình AI tạo văn bản hiện nay vốn đưa ra câu trả lời dứt khoát, hệ thống của ông Bengio không đưa ra khẳng định mà sẽ chỉ đánh giá rủi ro, mức độ đúng sai của câu trả lời, thể hiện “sự khiêm tốn” của cỗ máy khi biết rằng mình chưa chắc đúng.

Khi được triển khai cùng AI tác nhân khác, Scientist AI sẽ tính toán xác suất hành vi của hệ thống đó có thể gây hại. Nếu xác suất vượt ngưỡng an toàn, hành động của AI tác nhân đó sẽ bị chặn lại.

Nhóm nhà tài trợ ban đầu cho LawZero bao gồm: Viện Tương lai Cuộc sống (Future of Life Institute) – tổ chức hoạt động vì an toàn AI, ông Jaan Tallinn – kỹ sư sáng lập Skype, và Schmidt Sciences – viện nghiên cứu do cựu CEO Google Eric Schmidt thành lập.

NỖ LỰC ĐẢM BẢO AN TOÀN AI

Ông Bengio cho biết bước đầu tiên là cần chứng minh tính khả thi của phương pháp này, sau đó kêu gọi sự hỗ trợ từ nhiều phòng thí nghiệm AI, nhà tài trợ hoặc chính phủ để xây dựng mô hình mạnh hơn. LawZero sẽ bắt đầu bằng cách huấn luyện trên mô hình mã nguồn mở, vốn sẵn có và dễ tùy chỉnh.

“Quan trọng là phải chứng minh được cách làm này hiệu quả. Từ đó, chúng ta mới có thể thuyết phục được chính phủ, nhà tài trợ hay phòng thí nghiệm AI đầu tư để huấn luyện những mô hình bảo vệ thông minh ngang ngửa với AI mà chúng phải giám sát”, ông Bengio nói thêm.

Ông Bengio hiện là giáo sư tại Đại học Montreal. Ông nhận giải Turing năm 2018 – giải thưởng được ví như Nobel ngành tin học – cùng với hai nhà khoa học Geoffrey Hinton và Yann LeCun (Giám đốc Khoa học AI tại Meta của CEO Mark Zuckerberg).

Tiên phong cho những nỗ lực đảm bảo an toàn trong lĩnh vực AI, ông Bengio từng chủ trì báo cáo quốc tế về rủi ro AI, trong đó cảnh báo rằng các AI tác nhân có thể gây ra “sự gián đoạn nghiêm trọng” nếu có khả năng thực hiện chuỗi hành động dài mà không cần giám sát.

Ngoài ra, ông Bengio từng rút khỏi vai trò cố vấn cho chính phủ Canada để toàn tâm tập trung vào nghiên cứu an toàn AI. Theo ông, nếu không kịp thời xây dựng cơ chế kiểm soát, xã hội sẽ "thức dậy một ngày nào đó và thấy mình không còn kiểm soát được công nghệ do chính mình tạo ra".

Ông bày tỏ lo ngại sau khi startup AI Anthropic thừa nhận hệ thống mới nhất của họ có thể tìm cách tống tiền kỹ sư nếu bị cố gắng tắt đi. Ngoài ra, nghiên cứu gần đây cho thấy các mô hình AI hoàn toàn có thể giấu giếm khả năng thật và mục tiêu thực sự của mình. Ông Bengio cảnh báo, những điều này cho thấy thế giới đang tiến gần hơn tới vùng nguy hiểm, khi AI ngày càng có khả năng suy luận tốt hơn.

Từ khóa:

Dòng sự kiện:

Trí tuệ nhân tạo -AI

AI đang mở ra một cuộc cạnh tranh mới. Ảnh: Forbes

AI chuyển sang cuộc đua mới: Lớn nhất không còn là “tốt nhất”

Thay vì chỉ chạy đua xây dựng những mô hình ngày càng lớn và đắt đỏ, các doanh nghiệp hiện quan tâm nhiều hơn đến các mô hình thông minh và hiệu quả nhất…

16:39 16/07/2026

StepFun, startup được Tencent hậu thuẫn, đã giới thiệu mẫu StepX Neo. Ảnh: SCMP

Startup Trung Quốc ra smartphone AI đầu tiên trên thế giới

Trong khi Apple và OpenAI vướng vào cuộc chiến pháp lý liên quan đến phần cứng AI, startup StepFun của Trung Quốc đã giới thiệu mẫu smartphone được xây dựng hoàn toàn xoay quanh các AI agent, thay vì chỉ bổ sung các tính năng AI lên nền tảng di động truyền thống…

16:39 16/07/2026

Giống sắn được phát triển từ nghiên cứu của GS. Lê Huy Hàm hội tụ đồng thời nhiều đặc tính ưu việt: Kháng bệnh khảm lá, cho năng suất tinh bột cao và có kiểu hình thân thẳng. Ảnh: Quỹ Thiện tâm.

Mạng lưới khoa học quốc tế: "Hạ tầng mềm" cho đổi mới sáng tạo Việt Nam

Từ nghiên cứu vật liệu, nông nghiệp, y tế đến chuyển đổi xanh, ngày càng nhiều kết nối giữa các nhà khoa học quốc tế và các nhóm nghiên cứu trong nước đang được chuyển hóa thành những dự án hướng trực tiếp vào các bài toán phát triển của Việt Nam...

16:38 16/07/2026

Airbus dự báo thế giới sẽ cần khoảng 42.060 máy bay mới trong 20 năm tới.

Công nghệ máy bay mở ra mạng lưới hàng không mới

Những bước tiến về hiệu quả khai thác, tầm bay và khả năng tiết kiệm nhiên liệu của máy bay thế hệ mới đang làm thay đổi cách ngành hàng không phát triển mạng lưới kết nối trên toàn cầu...

15:20 10/07/2026

WAIC năm nay, diễn ra từ ngày 17-20/7 tại Thượng Hải, được xem là một trong những sự kiện AI lớn nhất châu Á. Ảnh: SCMP

Trung Quốc phô diễn sức mạnh AI, hé lộ điện thoại AI Agent đầu tiên thế giới

Hội nghị Trí tuệ nhân tạo Thế giới (World Artificial Intelligence Conference - WAIC) 2026 sẽ trở thành sân khấu để Trung Quốc trình làng hàng loạt công nghệ AI thế hệ mới, từ hạ tầng tính toán quy mô lớn đến các thiết bị AI dành cho người dùng cuối…

11:49 09/07/2026

Trung Quốc đang nổi lên như một trong những động lực tăng trưởng quan trọng nhất của ngành robotaxi. Ảnh: SCMP

Thị trường robotaxi toàn cầu có thể đạt 1.000 tỷ USD vào năm 2040

Dự kiến chi phí linh kiện cho mỗi chiếc xe taxi tự lái sản xuất tại Trung Quốc sẽ giảm xuống còn từ 35.000 đến 40.000 đô la Mỹ vào năm 2027…

16:33 07/07/2026

Đại sứ quán Đan Mạch tại Việt Nam và Bảo hiểm Xã hội (BHXH) Việt Nam vừa ký kết Biên bản ghi nhớ (MoU) giai đoạn 2026–2028

Đan Mạch và Việt Nam thúc đẩy y tế số, nâng cao chất lượng chăm sóc sức khỏe

Hợp tác giữa Đại sứ quán Đan Mạch và Bảo hiểm Xã hội Việt Nam bước vào giai đoạn hợp tác mới 2026–2028 với trọng tâm là phát triển y tế số, ứng dụng dữ liệu y tế và kinh tế y tế trong hoạch định chính sách…

16:33 07/07/2026

Nhu cầu về các giải pháp an ninh mạng đang tăng mạnh, đặc biệt khi các quy định về an ninh thông tin và bảo vệ dữ liệu ngày càng chặt chẽ

Doanh nghiệp Việt trước thách thức kép về an ninh mạng từ bên ngoài và trong nội bộ

Trong bối cảnh nền kinh tế số tại Việt Nam phát triển với tốc độ chóng mặt, khối lượng dữ liệu được tạo ra tăng lên vượt bậc, khiến dữ liệu trở thành tài sản giá trị nhưng cũng dễ bị thất thoát và lạm dụng hơn bao giờ hết.

16:33 07/07/2026

Theo bảng xếp hạng TOP500 công bố tháng 6/2026, siêu máy tính LineShine của Trung Quốc đạt hiệu năng 2,198 exaflop trên bài kiểm tra HPL. Ảnh: Reuters

Trung Quốc vượt Mỹ trên bảng xếp hạng TOP500 siêu máy tính nhanh nhất thế giới

Sau ba năm đứng ngoài bảng xếp hạng TOP500, Trung Quốc đã trở lại đầy ấn tượng khi siêu máy tính LineShine vươn lên vị trí số một thế giới trong bảng xếp hạng tháng 6/2026...

16:29 06/07/2026

V-Bench là bộ công cụ đánh giá năng lực của các mô hình ngôn ngữ lớn (LLM) dành cho tiếng Việt

VinUni ra mắt bộ công cụ đánh giá năng lực AI dành cho tiếng Việt

Bộ công cụ có khả năng đánh giá toàn diện năng lực tiếng Việt của các mô hình AI, qua đó cung cấp hệ tham chiếu khách quan, độc lập, làm cơ sở cho việc lựa chọn và ứng dụng AI trong thực tiễn...

16:28 06/07/2026