Chatbot AI chẩn đoán sai trong hơn 80% trường hợp bệnh án ban đầu

Hoàng Hà

15/04/2026

Nghiên cứu được công bố trên tạp chí JAMA Network Open, dựa trên việc kiểm tra 21 mô hình AI khác nhau cho thấy các chatbot AI dành cho người tiêu dùng đang bộc lộ những hạn chế đáng kể khi được sử dụng để hỗ trợ chẩn đoán y khoa...

Các chatbot trí tuệ nhân tạo (AI) dành cho người tiêu dùng đang bộc lộ những hạn chế đáng kể khi được sử dụng để hỗ trợ chẩn đoán y khoa

Một nghiên cứu mới cho thấy các chatbot AI, bao gồm những mô hình hàng đầu từ OpenAI, Google hay DeepSeek, có tỷ lệ chẩn đoán sai vượt 80% khi xử lý các ca bệnh ở giai đoạn đầu với dữ liệu chưa đầy đủ.

Kết quả này làm dấy lên lo ngại về việc phụ thuộc vào AI như một “bác sĩ số”, đặc biệt trong những tình huống thông tin y khoa còn mơ hồ.

ĐIỂM YẾU LỚN NHẤT CỦA AI TRONG CHẨN ĐOÁN

Theo Financial Times, các chatbot trí tuệ nhân tạo (AI) dành cho người tiêu dùng đang bộc lộ những hạn chế đáng kể khi được sử dụng để hỗ trợ chẩn đoán y khoa, đặc biệt trong những trường hợp dữ liệu bệnh nhân không đầy đủ. Đây là kết luận chính từ một nghiên cứu mới, nhấn mạnh rủi ro khi người dùng quá tin tưởng vào các công cụ AI như một nguồn tư vấn y tế.

Nghiên cứu cho thấy các mô hình ngôn ngữ lớn (LLMs) thường gặp khó khăn trong việc đưa ra danh sách các chẩn đoán khả dĩ khi thông tin ban đầu còn hạn chế. Thay vào đó, chúng có xu hướng nhanh chóng “chốt” một kết luận duy nhất, làm tăng nguy cơ sai lệch.

Kết quả này phản ánh một vấn đề cốt lõi của AI hiện nay: dù có thể đưa ra chẩn đoán chính xác khi dữ liệu đã đầy đủ và rõ ràng, nhưng lại thiếu năng lực xử lý giai đoạn đầu – nơi mà các bác sĩ con người thường phải suy luận trong điều kiện không chắc chắn.

“Những mô hình này rất giỏi trong việc gọi tên chẩn đoán cuối cùng khi dữ liệu đã hoàn chỉnh, nhưng lại gặp khó khăn ở giai đoạn mở đầu, khi thông tin còn ít ỏi”, bà Arya Rao, tác giả chính của nghiên cứu và là nhà nghiên cứu tại hệ thống y tế Mass General Brigham (Mỹ), nhận định.

Nghiên cứu được công bố trên tạp chí JAMA Network Open, dựa trên việc kiểm tra 21 mô hình AI khác nhau, bao gồm các hệ thống từ OpenAI, Anthropic, Google, xAI và DeepSeek. Các mô hình này được thử nghiệm với 29 tình huống lâm sàng, được xây dựng dựa trên các tài liệu tham khảo y khoa tiêu chuẩn.

Quy trình thử nghiệm mô phỏng thực tế khám chữa bệnh: thông tin về bệnh nhân được cung cấp theo từng bước, bao gồm tiền sử bệnh, triệu chứng hiện tại, kết quả khám lâm sàng và xét nghiệm. Sau mỗi bước, AI được yêu cầu đưa ra chẩn đoán, và các nhà nghiên cứu đánh giá mức độ chính xác dựa trên tỷ lệ trả lời không đầy đủ hoặc sai.

Kết quả cho thấy, khi phải thực hiện chẩn đoán phân biệt trong điều kiện thiếu dữ liệu, tỷ lệ thất bại của tất cả các mô hình đều vượt 80%. Đây là con số đáng báo động, bởi giai đoạn này đóng vai trò then chốt trong thực hành y khoa thực tế.

VAI TRÒ CỦA AI TRONG NGÀNH Y TẾ

Điểm đáng chú ý là hiệu suất của AI cải thiện rõ rệt khi có thêm dữ liệu. Khi thông tin bệnh nhân trở nên đầy đủ hơn, tỷ lệ sai sót giảm xuống dưới 40%, và những mô hình tốt nhất đạt độ chính xác vượt 90% trong việc xác định chẩn đoán cuối cùng.

Điều này cho thấy AI có thể đóng vai trò hữu ích trong các giai đoạn sau của quá trình chẩn đoán, nơi dữ liệu đã được chuẩn hóa và đầy đủ. Tuy nhiên, nó vẫn chưa thể thay thế tư duy lâm sàng của bác sĩ – vốn phải hoạt động hiệu quả ngay cả khi thông tin còn thiếu.

Các công ty công nghệ cũng thừa nhận giới hạn này. Anthropic cho biết chatbot Claude của họ được thiết kế để hướng người dùng tìm đến chuyên gia y tế khi đặt câu hỏi liên quan đến sức khỏe. Tương tự, Google cho biết Gemini tích hợp các nhắc nhở nhằm khuyến khích người dùng kiểm chứng thông tin và không phụ thuộc hoàn toàn vào AI.

Về phía OpenAI, chính sách sử dụng của công ty cũng nêu rõ rằng các dịch vụ AI không nên được dùng để cung cấp tư vấn y tế cần giấy phép nếu không có sự tham gia của chuyên gia.

Trong khi đó, một số doanh nghiệp đang phát triển các mô hình AI chuyên biệt cho lĩnh vực y tế, như hệ thống Articulate Medical Intelligence Explorer (AMIE) của Google hay MedFound. Những mô hình này được kỳ vọng có thể cải thiện độ chính xác trong chẩn đoán nhờ được huấn luyện trên dữ liệu y khoa chuyên sâu.

Ông Sanjay Kinra, chuyên gia dịch tễ học lâm sàng tại Trường Vệ sinh và Y học Nhiệt đới London, nhận định rằng các kết quả ban đầu của những mô hình như AMIE là “đáng khích lệ”. Tuy nhiên, ông cũng cảnh báo rằng AI khó có thể thay thế hoàn toàn bác sĩ, bởi quá trình đánh giá lâm sàng không chỉ dựa trên dữ liệu mà còn phụ thuộc vào “cảm nhận trực tiếp về bệnh nhân”.

“Các đánh giá lâm sàng của bác sĩ phụ thuộc rất nhiều vào việc quan sát và cảm nhận thực tế về bệnh nhân,” ông nói.

Dù vậy, ông Kinra cho rằng AI vẫn có tiềm năng đóng vai trò quan trọng, đặc biệt ở những khu vực thiếu hụt bác sĩ hoặc hệ thống y tế chưa phát triển. Trong các bối cảnh này, AI có thể trở thành công cụ hỗ trợ ban đầu, giúp sàng lọc hoặc định hướng chẩn đoán.

“Chúng ta cần khẩn trương thực hiện các nghiên cứu với bệnh nhân thực tế trong những môi trường như vậy”, ông nhấn mạnh.

Từ khóa:

Dòng sự kiện:

Trí tuệ nhân tạo -AI

Ý tưởng đưa trung tâm dữ liệu lên quỹ đạo đang dần được xem là một hướng đi khả thi, mở ra mô hình hạ tầng số hoàn toàn mới cho nền kinh tế AI. Ảnh: Getty Images

Trung tâm dữ liệu AI trong không gian sẽ như thế nào?

Một khi trung tâm dữ liệu đã đi vào hoạt động trên quỹ đạo, việc đưa con người lên bảo trì sẽ rất tốn kém và không thực tế. Vì vậy, robot và AI sẽ là đội kỹ thuật viên ngoài quỹ đạo…

15:46 29/07/2026

Bộ Năng lượng Hoa Kỳ phê duyệt thỏa thuận an toàn hạt nhân của Natura Resources, thúc đẩy dự án lò phản ứng muối nóng chảy nhiên liệu lỏng đầu tiên của Hoa Kỳ. Ảnh: Modern Mechanics

Lò phản ứng muối nóng chảy đạt mốc pháp lý quan trọng, mở đường cho thế hệ điện hạt nhân mới

Theo Bộ Năng lượng Mỹ, lò phản ứng muối nóng chảy được thiết kế để sử dụng ít nhiên liệu hơn và tạo ra lượng chất thải phóng xạ có thời gian tồn tại ngắn hơn so với nhiều loại lò phản ứng hiện nay...

22:30 28/07/2026

Lễ kỷ niệm năm nay diễn ra đúng vào dịp Acer tròn 50 năm hình thành và phát triển trong lĩnh vực công nghệ.

Acer kỷ niệm 10 năm Acer Day với thông điệp “shift the game”

Acer chính thức công bố Acer Day lần thứ 10, sự kiện thường niên sẽ diễn ra vào tháng 8 tới. Nhân dấu mốc 10 năm của chương trình, Acer giới thiệu “SHIFT THE GAME” là chủ đề xuyên suốt của năm nay trên toàn khu vực châu Á - Thái Bình Dương...

09:38 28/07/2026

Các trung tâm dữ liệu trên thế giới tiêu thụ khoảng 485 TWh điện trong năm 2025. Ảnh: Ourworldindata

AI đang tiêu thụ bao nhiêu điện năng?

Khoảng 2/3 điện năng được sử dụng cho các trung tâm dữ liệu truyền thống, trong khi các trung tâm dữ liệu chuyên phục vụ AI chiếm khoảng 1/3. AI hiện chỉ tiêu thụ khoảng 0,5% lượng điện của thế giới. Nhưng vấn đề lại nằm ở chỗ khác…

18:46 24/07/2026

Ông Jun Seki, giám đốc chiến lược xe điện của Foxconn. Ảnh: Nikkei

AI mở ra con đường mới cho các nhà sản xuất châu Á

Khi cuộc đua về giá, pin và thiết kế giữa các nhà sản xuất xe điện dần đi đến trạng thái bão hòa, trí tuệ nhân tạo (AI) đang nổi lên như yếu tố có thể tạo ra bước ngoặt mới cho ngành công nghiệp chế tạo châu Á…

13:45 23/07/2026

Lãnh đạo và đại diện 29 quốc gia dự lễ ký Hiệp định thành lập Tổ chức Hợp tác AI thế giới (World AI Cooperation Organization - WAICO). Ảnh: Xinhua.

Tổ chức Hợp tác Trí tuệ nhân tạo thế giới được thành lập, kỳ vọng thúc đẩy quản trị AI toàn cầu

Tổ chức Hợp tác Trí tuệ nhân tạo thế giới (WAICO) hướng tới mục tiêu thúc đẩy hợp tác quốc tế và quản trị toàn cầu về trí tuệ nhân tạo (AI), bảo đảm AI mang lại lợi ích, an toàn và công bằng...

10:54 21/07/2026

Trung Quốc vừa hoàn thành ca phẫu thuật thương mại đầu tiên trên thế giới sử dụng thiết bị giao diện não - máy tính. Ảnh: Getty Images

Trung Quốc hoàn thành ca cấy ghép giao diện não-máy tính thương mại đầu tiên trên thế giới

Trung Quốc vừa ghi dấu một cột mốc mới trong lĩnh vực giao diện não - máy tính (Brain-Computer Interface - BCI) khi thực hiện thành công ca phẫu thuật thương mại đầu tiên trên thế giới sử dụng một thiết bị BCI xâm lấn đã được cơ quan quản lý cấp phép lưu hành…

22:11 19/07/2026

AI đang mở ra một cuộc cạnh tranh mới. Ảnh: Forbes

AI chuyển sang cuộc đua mới: Lớn nhất không còn là “tốt nhất”

Thay vì chỉ chạy đua xây dựng những mô hình ngày càng lớn và đắt đỏ, các doanh nghiệp hiện quan tâm nhiều hơn đến các mô hình thông minh và hiệu quả nhất…

16:39 16/07/2026

StepFun, startup được Tencent hậu thuẫn, đã giới thiệu mẫu StepX Neo. Ảnh: SCMP

Startup Trung Quốc ra smartphone AI đầu tiên trên thế giới

Trong khi Apple và OpenAI vướng vào cuộc chiến pháp lý liên quan đến phần cứng AI, startup StepFun của Trung Quốc đã giới thiệu mẫu smartphone được xây dựng hoàn toàn xoay quanh các AI agent, thay vì chỉ bổ sung các tính năng AI lên nền tảng di động truyền thống…

16:39 16/07/2026

Giống sắn được phát triển từ nghiên cứu của GS. Lê Huy Hàm hội tụ đồng thời nhiều đặc tính ưu việt: Kháng bệnh khảm lá, cho năng suất tinh bột cao và có kiểu hình thân thẳng. Ảnh: Quỹ Thiện tâm.

Mạng lưới khoa học quốc tế: "Hạ tầng mềm" cho đổi mới sáng tạo Việt Nam

Từ nghiên cứu vật liệu, nông nghiệp, y tế đến chuyển đổi xanh, ngày càng nhiều kết nối giữa các nhà khoa học quốc tế và các nhóm nghiên cứu trong nước đang được chuyển hóa thành những dự án hướng trực tiếp vào các bài toán phát triển của Việt Nam...

16:38 16/07/2026