Một nhóm nghiên cứu thuộc Trường Đại học Y Osaka Metropolitan (Nhật Bản), do tiến sĩ Hirotaka Takita và phó giáo sư Daiju Ueda dẫn đầu, vừa công bố một nghiên cứu hệ thống và phân tích tổng hợp về hiệu quả chẩn đoán bệnh của AI tạo sinh (generative AI) so với bác sĩ.
Sau khi rà soát hơn 18.000 nghiên cứu, nhóm đã chọn ra 83 nghiên cứu tiêu biểu để phân tích chuyên sâu. Các mô hình AI được đánh giá gồm: GPT-4, Llama3 70B, Gemini 1.5 Pro và Claude 3 Sonnet, trong đó GPT-4 là cái tên xuất hiện nhiều nhất.
Theo kết quả, tỷ lệ chẩn đoán chính xác trung bình của các AI là 52,1%. Khi so với bác sĩ không chuyên, AI không có sự khác biệt đáng kể về độ chính xác (chênh lệch chỉ 0,6%). Tuy nhiên, các bác sĩ chuyên khoa vẫn vượt trội hơn AI khoảng 15,8%, cho thấy khoảng cách trình độ vẫn còn rõ ràng.
Đáng chú ý, AI đặc biệt nổi bật trong lĩnh vực da liễu, nơi đòi hỏi khả năng nhận dạng hình ảnh và mẫu hình – vốn là thế mạnh của công nghệ AI. Tuy nhiên, những lĩnh vực như tiết niệu lại chưa có đủ dữ liệu để đưa ra kết luận toàn diện.
Tiến sĩ Takita nhận định: “AI có thể hỗ trợ đào tạo bác sĩ không chuyên và phục vụ tại những khu vực thiếu nhân lực y tế. Việc tích hợp AI vào giáo trình có thể giúp mô phỏng ca bệnh thực tế cho sinh viên y.”
Ngoài khả năng chẩn đoán, AI còn mang lại cơ hội lớn trong giáo dục y học, nhờ khả năng mô phỏng đa dạng tình huống và kiểm tra năng lực sinh viên.
Tuy nhiên, nghiên cứu cũng chỉ ra rằng AI hiện chưa đủ mạnh để xử lý các trường hợp lâm sàng phức tạp – nơi cần phân tích kỹ lưỡng về tiền sử bệnh, triệu chứng đặc thù và tương tác cá nhân.
Ngoài ra, vấn đề minh bạch và thiên vị trong dữ liệu huấn luyện vẫn là mối lo ngại lớn. Nhiều mô hình AI hiện nay không tiết lộ nguồn dữ liệu, dẫn đến nghi ngờ về tính đại diện và độ tin cậy.
“Minh bạch là yếu tố then chốt để hiểu rõ giới hạn của AI và sử dụng chúng một cách có đạo đức, hiệu quả” – nhóm nghiên cứu nhấn mạnh.
Ở thời điểm hiện tại, AI vẫn còn chặng đường dài để thay thế con người trong ngành y. Nhưng với tốc độ phát triển như hiện nay, khả năng AI tham gia nhiều hơn vào quá trình chẩn đoán là hoàn toàn có thể xảy ra trong tương lai gần.