NEJM – Trí tuệ nhân tạo AI so với Bác sĩ: Ai viết Tóm tắt xuất viện tốt hơn?
Aaron J. Calderon, MD, FACP, SFHM, xem xét Williams CYK và cộng sự. JAMA Intern Med 5.2025
Trong một nghiên cứu so sánh, tóm tắt do trí tuệ nhân tạo AI tạo ra và do bác sĩ viết đều có những điểm mạnh và điểm yếu riêng.
Tóm tắt xuất viện chất lượng cao đóng vai trò quan trọng trong việc truyền đạt các thành phần thiết yếu của nhu cầu nhập viện và theo dõi của bệnh nhân cho các bác sĩ chăm sóc chính và có liên quan đến kết quả được cải thiện (ví dụ: ít lỗi dùng thuốc và nhập viện trở lại hơn).
Tuy nhiên, nhiều bác sĩ bận rộn gặp khó khăn trong việc tạo ra các tóm tắt xuất viện chất lượng cao và coi chúng là gánh nặng hành chính. Các mô hình ngôn ngữ lớn (LLM) của trí tuệ nhân tạo (AI) cung cấp một giải pháp tiềm năng thú vị.
Các nhà nghiên cứu đã thúc đẩy một LLM (GPT-4 [OpenAI]) tạo ra các tóm tắt xuất viện cho 100 bệnh nhân được chọn ngẫu nhiên trong thời gian nhập viện từ 3 đến 6 ngày.
22 bác sĩ đã xem xét các bài tường thuật [blinded] do LLM tạo ra và các bài tường thuật gốc do bác sĩ nội trú viết về chất lượng chung, số lỗi (được phân loại là không chính xác, thiếu sót hoặc ảo giác [thông tin sai]) và khả năng gây hại cho bệnh nhân từ mỗi lỗi.
Các bản tóm tắt do LLM tạo ra rõ ràng hơn và súc tích hơn, nhưng ít toàn diện hơn và có nhiều lỗi riêng biệt hơn (trung bình, 3 so với 2) so với các bản tóm tắt của bác sĩ; lỗi thiếu sót xảy ra gấp đôi trong các bản tóm tắt LLM. Tuy nhiên, khả năng gây hại của các lỗi của hai nhóm là tương tự nhau.
Bình luận
Các bác sĩ lâm sàng nên được khuyến khích bởi bằng chứng này rằng các bản tóm tắt xuất viện do LLM tạo ra có chất lượng tương đương với các bản tóm tắt của bác sĩ nội trú, vì nó báo hiệu một cơ hội để giảm khối lượng công việc hành chính.
Mặc dù cả bản tóm tắt do LLM và bác sĩ tạo ra đều có chỗ để cải thiện, nhưng cả hai có khả năng bổ sung cho nhau.
Một ứng dụng thực tế sẽ là sử dụng các bản tóm tắt do LLM tạo ra làm điểm khởi đầu mà các bác sĩ lâm sàng có thể xem xét và chỉnh sửa để đảm bảo tính chính xác và đầy đủ, tương tự như việc các học viên hoặc bác sĩ chăm sóc nâng cao ký xác nhận tài liệu. Tuy nhiên, các bác sĩ lâm sàng nên đưa ra phán đoán lâm sàng phù hợp và tránh tự mãn, vì việc quá phụ thuộc vào nội dung do AI tạo ra có thể làm giảm chất lượng và sự an toàn của việc chăm sóc bệnh nhân.
Trích
Williams CYK et al. Physician- and large language model–generated hospital discharge summaries. JAMA Intern Med 2025 May 5; [e-pub]. (https://doi.org/10.1001/jamainternmed.2025.0821)