image Thứ Hai, 18/05/2026

Chatbot AI chẩn đoán sai trong hơn 80% trường hợp bệnh án ban đầu

Hoàng Hà

15/04/2026

Chia sẻ

Nghiên cứu được công bố trên tạp chí JAMA Network Open, dựa trên việc kiểm tra 21 mô hình AI khác nhau cho thấy các chatbot AI dành cho người tiêu dùng đang bộc lộ những hạn chế đáng kể khi được sử dụng để hỗ trợ chẩn đoán y khoa...

Các chatbot trí tuệ nhân tạo (AI) dành cho người tiêu dùng đang bộc lộ những hạn chế đáng kể khi được sử dụng để hỗ trợ chẩn đoán y khoa
Các chatbot trí tuệ nhân tạo (AI) dành cho người tiêu dùng đang bộc lộ những hạn chế đáng kể khi được sử dụng để hỗ trợ chẩn đoán y khoa

Một nghiên cứu mới cho thấy các chatbot AI, bao gồm những mô hình hàng đầu từ OpenAI, Google hay DeepSeek, có tỷ lệ chẩn đoán sai vượt 80% khi xử lý các ca bệnh ở giai đoạn đầu với dữ liệu chưa đầy đủ.

Kết quả này làm dấy lên lo ngại về việc phụ thuộc vào AI như một “bác sĩ số”, đặc biệt trong những tình huống thông tin y khoa còn mơ hồ.

ĐIỂM YẾU LỚN NHẤT CỦA AI TRONG CHẨN ĐOÁN

Theo Financial Times, các chatbot trí tuệ nhân tạo (AI) dành cho người tiêu dùng đang bộc lộ những hạn chế đáng kể khi được sử dụng để hỗ trợ chẩn đoán y khoa, đặc biệt trong những trường hợp dữ liệu bệnh nhân không đầy đủ. Đây là kết luận chính từ một nghiên cứu mới, nhấn mạnh rủi ro khi người dùng quá tin tưởng vào các công cụ AI như một nguồn tư vấn y tế.

Nghiên cứu cho thấy các mô hình ngôn ngữ lớn (LLMs) thường gặp khó khăn trong việc đưa ra danh sách các chẩn đoán khả dĩ khi thông tin ban đầu còn hạn chế. Thay vào đó, chúng có xu hướng nhanh chóng “chốt” một kết luận duy nhất, làm tăng nguy cơ sai lệch.

Kết quả này phản ánh một vấn đề cốt lõi của AI hiện nay: dù có thể đưa ra chẩn đoán chính xác khi dữ liệu đã đầy đủ và rõ ràng, nhưng lại thiếu năng lực xử lý giai đoạn đầu – nơi mà các bác sĩ con người thường phải suy luận trong điều kiện không chắc chắn.

“Những mô hình này rất giỏi trong việc gọi tên chẩn đoán cuối cùng khi dữ liệu đã hoàn chỉnh, nhưng lại gặp khó khăn ở giai đoạn mở đầu, khi thông tin còn ít ỏi”, bà Arya Rao, tác giả chính của nghiên cứu và là nhà nghiên cứu tại hệ thống y tế Mass General Brigham (Mỹ), nhận định.

Nghiên cứu được công bố trên tạp chí JAMA Network Open, dựa trên việc kiểm tra 21 mô hình AI khác nhau, bao gồm các hệ thống từ OpenAI, Anthropic, Google, xAI và DeepSeek. Các mô hình này được thử nghiệm với 29 tình huống lâm sàng, được xây dựng dựa trên các tài liệu tham khảo y khoa tiêu chuẩn.

Quy trình thử nghiệm mô phỏng thực tế khám chữa bệnh: thông tin về bệnh nhân được cung cấp theo từng bước, bao gồm tiền sử bệnh, triệu chứng hiện tại, kết quả khám lâm sàng và xét nghiệm. Sau mỗi bước, AI được yêu cầu đưa ra chẩn đoán, và các nhà nghiên cứu đánh giá mức độ chính xác dựa trên tỷ lệ trả lời không đầy đủ hoặc sai.

Kết quả cho thấy, khi phải thực hiện chẩn đoán phân biệt trong điều kiện thiếu dữ liệu, tỷ lệ thất bại của tất cả các mô hình đều vượt 80%. Đây là con số đáng báo động, bởi giai đoạn này đóng vai trò then chốt trong thực hành y khoa thực tế.

VAI TRÒ CỦA AI TRONG NGÀNH Y TẾ

Điểm đáng chú ý là hiệu suất của AI cải thiện rõ rệt khi có thêm dữ liệu. Khi thông tin bệnh nhân trở nên đầy đủ hơn, tỷ lệ sai sót giảm xuống dưới 40%, và những mô hình tốt nhất đạt độ chính xác vượt 90% trong việc xác định chẩn đoán cuối cùng.

Hiệu suất của AI cải thiện rõ rệt khi có thêm dữ liệu
Hiệu suất của AI cải thiện rõ rệt khi có thêm dữ liệu

Điều này cho thấy AI có thể đóng vai trò hữu ích trong các giai đoạn sau của quá trình chẩn đoán, nơi dữ liệu đã được chuẩn hóa và đầy đủ. Tuy nhiên, nó vẫn chưa thể thay thế tư duy lâm sàng của bác sĩ – vốn phải hoạt động hiệu quả ngay cả khi thông tin còn thiếu.

Các công ty công nghệ cũng thừa nhận giới hạn này. Anthropic cho biết chatbot Claude của họ được thiết kế để hướng người dùng tìm đến chuyên gia y tế khi đặt câu hỏi liên quan đến sức khỏe. Tương tự, Google cho biết Gemini tích hợp các nhắc nhở nhằm khuyến khích người dùng kiểm chứng thông tin và không phụ thuộc hoàn toàn vào AI.

Về phía OpenAI, chính sách sử dụng của công ty cũng nêu rõ rằng các dịch vụ AI không nên được dùng để cung cấp tư vấn y tế cần giấy phép nếu không có sự tham gia của chuyên gia.

Trong khi đó, một số doanh nghiệp đang phát triển các mô hình AI chuyên biệt cho lĩnh vực y tế, như hệ thống Articulate Medical Intelligence Explorer (AMIE) của Google hay MedFound. Những mô hình này được kỳ vọng có thể cải thiện độ chính xác trong chẩn đoán nhờ được huấn luyện trên dữ liệu y khoa chuyên sâu.

Ông Sanjay Kinra, chuyên gia dịch tễ học lâm sàng tại Trường Vệ sinh và Y học Nhiệt đới London, nhận định rằng các kết quả ban đầu của những mô hình như AMIE là “đáng khích lệ”. Tuy nhiên, ông cũng cảnh báo rằng AI khó có thể thay thế hoàn toàn bác sĩ, bởi quá trình đánh giá lâm sàng không chỉ dựa trên dữ liệu mà còn phụ thuộc vào “cảm nhận trực tiếp về bệnh nhân”.

“Các đánh giá lâm sàng của bác sĩ phụ thuộc rất nhiều vào việc quan sát và cảm nhận thực tế về bệnh nhân,” ông nói.

Dù vậy, ông Kinra cho rằng AI vẫn có tiềm năng đóng vai trò quan trọng, đặc biệt ở những khu vực thiếu hụt bác sĩ hoặc hệ thống y tế chưa phát triển. Trong các bối cảnh này, AI có thể trở thành công cụ hỗ trợ ban đầu, giúp sàng lọc hoặc định hướng chẩn đoán.

“Chúng ta cần khẩn trương thực hiện các nghiên cứu với bệnh nhân thực tế trong những môi trường như vậy”, ông nhấn mạnh.

Dòng sự kiện:

Trí tuệ nhân tạo -AI

Trung Quốc tăng tốc xây dựng mạng lưới sức mạnh tính toán quốc gia

Trung Quốc tham vọng biến hạ tầng trí tuệ nhân tạo (AI) thành một loại tiện ích công cộng tương tự điện, nước hay viễn thông...

10:19 18/05/2026
Thêm giải pháp AI "Make in Vietnam" đạt chuẩn quốc tế về chống giả mạo khuôn mặt

CIVAMS.FACE-FAS, giải pháp chống giả mạo khuôn mặt do CMC ATI phát triển, vượt qua bài đánh giá iBeta Level 1 theo tiêu chuẩn ISO/IEC 30107-3, tiếp tục ghi dấu năng lực AI “Make in Vietnam” trên các bảng xếp hạng quốc tế.

09:10 14/05/2026
CMC tái cấu trúc Khối Công nghệ và Giải pháp, thúc đẩy mục tiêu chuyển đổi AI

CMC hợp nhất năng lực tư vấn vào CMC TS, bổ nhiệm ông Nguyễn Hải Sơn làm Quyền Tổng Giám đốc, đồng thời đưa AI-X trở thành trục tăng trưởng chính trong chiến lược giai đoạn 2026-2030...

11:07 13/05/2026
Qualcomm chính thức khai trương Trung tâm R&D tại Hà Nội

Trung tâm sẽ góp phần củng cố mạng lưới R&D toàn cầu của Qualcomm Technologies thông qua việc tận dụng nguồn nhân lực công nghệ đang trên đà phát triển nhanh chóng tại Việt Nam, đồng thời thúc đẩy các mối quan hệ hợp tác chặt chẽ hơn tại địa phương...

15:55 12/05/2026
Công nghệ điều hướng: 'Phao cứu sinh' cho thu nhập và an toàn của người lái xe 2 bánh tại Việt Nam

Nghiên cứu mới tại khu vực châu Á - Thái Bình Dương nhấn mạnh vai trò thiết yếu của các công cụ định tuyến theo thời gian thực, cảnh báo an toàn và hướng dẫn bằng giọng nói trong việc hỗ trợ người tham gia giao thông bằng xe hai bánh tại Việt Nam.

19:11 11/05/2026
Kiến tạo mô hình hạ tầng năng lượng xanh dùng chung tại Việt Nam

Việc kiến tạo hệ sinh thái hạ tầng năng lượng xanh dùng chung đánh dấu bước ngoặt chiến lược nhằm hóa giải "nút thắt" về trạm sạc và đổi pin, tạo động lực thực tế để thúc đẩy lộ trình điện hóa giao thông tại Việt Nam…

15:56 07/05/2026
Ngành dược thế giới đang ứng dụng AI mạnh mẽ để tìm ra thuốc mới

Thay vì tiếp tục phụ thuộc vào phương pháp thử-sai truyền thống, các công ty dược đang chuyển hướng sang AI với kỳ vọng tận dụng sức mạnh tính toán để rút ngắn thời gian và tăng xác suất thành công...

14:06 06/05/2026
Intel hỗ trợ thiết bị sản xuất chip, phục vụ công tác đào tạo nhân lực bán dẫn cho Việt Nam

Chương trình mang đến cơ hội thực hành trực tiếp trên các trang thiết bị chuyên dụng, làm cầu nối giữa kiến thức học thuật và thực tiễn ngành, đặc biệt là trong khâu đóng gói và kiểm thử chip.

15:46 05/05/2026
Bước tiến mới trong công nghệ truyền dẫn âm thanh cho ô tô thế hệ mới

Sự ra đời của công nghệ truyền dẫn âm thanh thế hệ 2.0 với khả năng tích hợp Ethernet liền mạch đang trở thành mắt xích quan trọng giúp các hãng xe tối ưu hóa hạ tầng kết nối và đáp ứng nhu cầu ngày càng cao về giải trí đa phương tiện trên ô tô…

15:46 05/05/2026
Japan Airlines bắt đầu thử nghiệm robot hình người tại sân bay

Trước tình trạng thiếu hụt lao động ngày càng trầm trọng, Japan Airlines đã bắt đầu thử nghiệm robot hình người tại sân bay Haneda (Tokyo) nhằm hỗ trợ các công việc mặt đất như bốc xếp hành lý và vệ sinh khoang máy bay…

08:43 05/05/2026