Chatbot AI của Đại học Y Harvard có khả năng nhận biết khối u lên tới 90%
Nghiên cứu cho thấy, mô hình PathChat từ Đại học Y Harvard không chỉ có thể xử lý dữ liệu đầu vào đa phương thức mà còn có thể cung cấp câu trả lời chính xác cho các câu hỏi phức tạp liên quan đến bệnh lý, xác định chính xác bệnh từ các phần sinh thiết trong gần 90% trường hợp…
Ung thư đã trở thành một trong những nguyên nhân gây tử vong hàng đầu cho dân số toàn cầu với hàng triệu người chết mỗi năm. Tổ chức Y tế Thế giới (WHO) đã chỉ ra rằng 1/3 số ca ung thư có thể được chữa khỏi thông qua việc phát hiện và điều trị sớm.
Phát hiện ung thư luôn là vấn đề lớn mà lĩnh vực y tế phải đối mặt, đặc biệt là trong phân tích bệnh lý của người bệnh. Khám bệnh và chẩn đoán sớm phụ thuộc rất nhiều vào kinh nghiệm, chuyên môn của các bác sĩ và chuyên gia.
Với sự phát triển của các mô hình như GPT-4, việc nghiên cứu sử dụng trí tuệ nhân tạo (AI) để hỗ trợ chẩn đoán bệnh lý đã dần xuất hiện. Tuy nhiên, nhiều hệ thống AI vẫn gặp phải những vấn đề như hiệu năng chưa đủ đáp ứng cũng như khả năng tương tác kém khi ứng dụng vào thực tế.
Một nhóm nghiên cứu từ Đại học Y Harvard đã phát triển một trợ lý AI có tên PathChat, ứng dụng sử dụng hình ảnh sinh thiết để chuẩn đoán bệnh lý.
Kết quả cho thấy, PathChat chẩn đoán chính xác gần 90% trường hợp, vượt trội so với các mô hình AI thông thường và các mô hình y tế chuyên nghiệp hiện có trên thị trường như GPT-4V.
Đáng chú ý ở công nghệ đột phá này không chỉ là một công cụ xác định khối u mà PathChat còn đưa ra phương pháp mới cho chẩn đoán và nghiên cứu bệnh lý.
PATHCHAT: TRỢ LÝ AI PHÁT HIỆN BỆNH LÝ
Nhóm nghiên cứu đã thiết kế PathChat qua dữ liệu đầu vào đa phương thức. PathChat được đào tạo với hơn 100 triệu hình ảnh mô học từ hơn 100.000 trường hợp bệnh nhân và 1,18 triệu cặp chú thích hình ảnh bệnh lý.
Sau đó, bộ mã hóa thị giác được kết hợp với một mô hình ngôn ngữ lớn được đào tạo trước và toàn bộ hệ thống được tinh chỉnh trên hơn 250.000 hướng dẫn ngôn ngữ kiến thức lâm sàng để đưa ra kết quả chẩn đoán.
Nghiên cứu cho thấy PathChat không chỉ có thể xử lý dữ liệu đầu vào đa phương thức mà còn có thể cung cấp câu trả lời chính xác cho các câu hỏi phức tạp liên quan đến bệnh lý, xác định chính xác bệnh từ các phần sinh thiết trong gần 90% trường hợp.
VƯỢT QUA GPT-4V VỚI ĐỘ CHÍNH XÁC GẦN 90%
Để kiểm tra hiệu suất phát hiện của PathChat, nhóm nghiên cứu đã so sánh PathChat với mô hình nguồn mở LLaVA, LLaVA-Med được tùy chỉnh cho lĩnh vực y học và GPT-4V.
Họ đã thiết kế một thử nghiệm so sánh mang tên PathQABench để so sánh hiệu suất phát hiện của PathChat với LLaVA, LLaVA-Med và GPT4V bằng cách phân tích các trường hợp bệnh lý từ các vị trí và phương pháp thực hành nội tạng khác nhau.
Kết quả cho thấy, dù không cung cấp nền tảng lâm sàng nhưng độ chính xác trong chẩn đoán của PathChat tốt hơn đáng kể so với LLaVA1.5 và LLaVA-Med. Khi chỉ đánh giá hình ảnh, độ chính xác của PathChat đạt 78,1%, cao hơn độ chính xác của LLaVA1.5 52,4 % và hơn tới 63,8% so với LLaVA-Med.
Sau khi cung cấp kiến thức lâm sàng, độ chính xác của PathChat thậm chí được cải thiện hơn nữa lên tới 89,5%, cao hơn 39% so với độ chính xác của LLaVA1,5 và 60,9% so với LLaVA-Med.
Thông qua các thử nghiệm so sánh, người ta thấy rằng PathChat có thể đạt được khả năng dự đoán chính xác cao từ các đặc điểm hình ảnh của sinh thiết thay vì chỉ dựa vào nền tảng lâm sàng. Mô hình này chỉ sử dụng thông tin đa phương thức để đưa ra chẩn đoán chính xác hình ảnh mô học.
Để đánh giá khách quan độ chính xác của từng câu trả lời của mô hình, nhóm nghiên cứu đã tuyển dụng 7 nhà nghiên cứu bệnh học để thành lập nhóm đánh giá và phân tích độ chính xác câu trả lời của 4 mô hình với 260 câu hỏi.
Cuối cùng, đối với các câu hỏi mà 7 chuyên gia có câu trả lời giống nhau, độ chính xác của PathChat lên tới 78,7%, cao hơn lần lượt 26,4%, 48,9 và 48,1% so với GPT-4V, LLaVA1.5 và LLaVA-Med. Nhìn chung, PathChat cho thấy hiệu suất vượt trội so với ba mô hình còn lại.
Mặc dù PathChat hoạt động tốt trong các thử nghiệm nhưng mô hình này vẫn gặp phải một số thách thức khi ứng dụng thực tế. Ví dụ, làm cách nào để đảm bảo rằng mô hình có thể xác định các câu hỏi không hợp lệ để tránh đưa ra kết quả không chính xác, phương thức cập nhật kiến thức y học mới nhất,...
Ngoài ra, dữ liệu đào tạo của PathChat chủ yếu đến từ dữ liệu lịch sử, điều này có thể khiến mô hình này không cập nhật những thông tin mới nhất.
Các nhà nghiên cứu cho biết khả năng của PathChat có thể được nâng cao hơn nữa thông qua những nghiên cứu trong tương lai.
Ngoài ra, việc tích hợp PathChat với các công cụ như trình xem slide kỹ thuật số hoặc hồ sơ y tế điện tử cũng có thể mang lại nhiều lợi ích hơn trong việc cải thiện tính hữu dụng của PathChat trong chuẩn đoán lâm sàng.