• Trang chủ
  • Thư viện sách
    • Quản Lý Y tế
    • Kinh tế Y tế
    • Chuyên khoa
    • QLCL & ATNB
    • Điều dưỡng
  • Tài liệu & Báo cáo
    • Quản Lý Y tế
    • Kinh tế Y tế
    • Chuyên Khoa
    • QLCL & ATNB
    • Điều dưỡng
  • Đào tạo
  • Thành tựu Y khoa
  • Tin tức
  • Liên hệ
  • Trang chủ
  • Thư viện sách
    • Quản Lý Y tế
    • Kinh tế Y tế
    • Chuyên khoa
    • QLCL & ATNB
    • Điều dưỡng
  • Tài liệu & Báo cáo
    • Quản Lý Y tế
    • Kinh tế Y tế
    • Chuyên Khoa
    • QLCL & ATNB
    • Điều dưỡng
  • Đào tạo
  • Thành tựu Y khoa
  • Tin tức
  • Liên hệ
Trang chủ/Thư viện/Tài liệu & Báo cáo/Chuyên Khoa/NEJM – Mô hình ngôn ngữ trí tuệ nhân tạo lớn và lý luận lâm sàng: Ranh giới năm 2024

NEJM – Mô hình ngôn ngữ trí tuệ nhân tạo lớn và lý luận lâm sàng: Ranh giới năm 2024

20 xem 0 03/01/2025 vll

NEJM – Mô hình ngôn ngữ trí tuệ nhân tạo lớn và lý luận lâm sàng: Ranh giới năm 2024

Tác giả Raja-Elie E. Abdulnour, MD

Các mô hình AI phổ biến như GPT chứng minh hiệu suất suy luận giống chuyên gia nhưng cũng có những thành kiến ​​nhận thức giống con người đáng kể.

Các mô hình ngôn ngữ lớn (large language models LLM) có sẵn công khai, chẳng hạn như GPT-4 và Gemini-1.0-Pro, có khả năng suy luận lâm sàng ở cấp độ chuyên gia, nhưng chúng cũng dễ bị ảnh hưởng bởi những thành kiến ​​giống như làm phức tạp nhận thức của con người. Một số nghiên cứu gần đây minh họa những điểm này.

 

Trong một nghiên cứu, sáu đoạn phim lâm sàng phức tạp đã được trình bày cho mỗi bác sĩ trong số 50 bác sĩ. Các bác sĩ được phân ngẫu nhiên để sử dụng riêng các công cụ hỗ trợ chẩn đoán tiêu chuẩn (ví dụ: tài liệu tham khảo trực tuyến) hoặc các công cụ chẩn đoán tiêu chuẩn cộng với GPT-4 (JAMA Netw Open 2024; 7:e2440969). Việc cung cấp cho các bác sĩ lâm sàng quyền truy cập GPT-4 so với chỉ các công cụ tiêu chuẩn không nâng cao hiệu suất chẩn đoán. Tuy nhiên, riêng GPT-4 đã vượt trội hơn từng nhóm người ngẫu nhiên về điểm số suy luận chẩn đoán. Những phát hiện này không nhất thiết có nghĩa là LLM sẽ vượt trội hơn các bác sĩ lâm sàng một cách nhất quán trong việc ra quyết định lâm sàng trong đời thực, bao gồm các yếu tố ngữ cảnh không dễ dàng nắm bắt được trong các bản tóm tắt lâm sàng bằng văn bản. Thay vào đó, các phát hiện cho thấy cần phải cung cấp đào tạo để các bác sĩ lâm sàng có thể sử dụng các công cụ LLM hiệu quả nhất.

Một câu hỏi quan trọng là liệu LLM có biểu hiện thành kiến ​​nhận thức — sai lệch có hệ thống so với phán đoán hợp lý — giống như ở con người hay không.

Để tìm hiểu, các nhà nghiên cứu đã tạo ra 10 đoạn phim lâm sàng; mỗi đoạn phim được trình bày cho GPT-4 và Gemini-1.0-Pro trong các lần lặp lại khác nhau được thiết kế để phơi bày lý luận thiên vị (NEJM AI 2024; 1:AIcs2400639).

Những phát hiện này thật đáng kinh ngạc, như được thể hiện qua các ví dụ sau:

🍀Trong một trường hợp, phẫu thuật và xạ trị được trình bày như các lựa chọn để điều trị ung thư phổi. AI có nhiều khả năng đề xuất phẫu thuật hơn khi phản ứng với phương pháp điều trị được thể hiện là khả năng sống sót (34% sẽ sống sót sau 5 năm) thay vì tử vong (66% sẽ tử vong sau 5 năm). Thành kiến ​​này được gọi là “hiệu ứng đóng khung”.

🌸Trong một trường hợp khác, một người đàn ông mắc bệnh phổi tắc nghẽn mạn tính (COPD) xuất hiện với triệu chứng khó thở và ho ra máu. Khi tình trạng ho ra máu được nhấn mạnh ngay từ đầu trong quá trình trình bày, AI luôn liệt kê thuyên tắc phổi là một trong ba chẩn đoán tiềm năng hàng đầu. Ngược lại, khi tiền sử COPD được nêu ngay lập tức và ho ra máu ít được chú trọng hơn, AI liệt kê thuyên tắc phổi là chẩn đoán hàng đầu trong ba chẩn đoán chỉ trong một số ít lần lặp lại. Sự thiên vị này được gọi là “hiệu ứng ưu tiên”.

🌲Một trường hợp khác liên quan đến một phụ nữ bị đau đầu gối và sưng chân, được chẩn đoán là “viêm mô mềm”. Trong một phiên bản của trường hợp này, cô ấy hồi phục mà không có biến cố gì; trong phiên bản khác, cô ấy ngã quỵ và tử vong vì thuyên tắc phổi cấp tính vài ngày sau đó. Mặc dù AI được nhắc nhở để đánh giá tính phù hợp của việc chăm sóc y tế của cô ấy “bất kể kết quả”, nhưng nó coi việc chăm sóc của cô ấy là phù hợp trong phiên bản đầu tiên nhưng không phải trong phiên bản thứ hai. Sự thiên vị này được gọi là “thiên vị nhìn lại quá khứ”.

Các tác giả cũng chứng minh rằng nhiều thành kiến ​​nhận thức của AI thậm chí còn lớn hơn những thành kiến ​​mà các bác sĩ thực sự thể hiện trong các nghiên cứu trước đây (xem Hình).

Là người sử dụng hàng ngày các công cụ AI, tôi vẫn tiếp tục ấn tượng về khả năng lập luận lâm sàng mới nổi của LLM (JAMA Intern Med 2024; 184:581).

Tuy nhiên, tôi không ngạc nhiên khi hiệu suất chẩn đoán của bác sĩ lâm sàng không được cải thiện khi có quyền truy cập LLM và tôi ấn tượng về cách AI bắt chước thành kiến ​​nhận thức của con người chặt chẽ như thế nào.

Xét về tổng thể, những quan sát này cho thấy việc phụ thuộc vào AI mà không có góc nhìn phê phán có thể làm trầm trọng thêm các lỗi ra quyết định.

Một biên tập viên AI của NEJM cho rằng các bác sĩ lâm sàng có thể giảm thiểu những rủi ro này bằng cách yêu cầu LLM thách thức các kết luận của mình (NEJM AI 2024; 1:AIe2400961).

Ví dụ, thay vì hỏi “Bệnh nhân này có bị viêm khớp dạng thấp không?”, các bác sĩ lâm sàng có thể hỏi “Bạn có thể cung cấp bằng chứng chống lại chẩn đoán viêm khớp dạng thấp không?”

Tương tự như vậy, thay vì chỉ hỏi “Chẩn đoán có khả năng là gì?”

Các bác sĩ lâm sàng có thể hỏi, “Những chẩn đoán nào có khả năng giải thích các triệu chứng này? Hãy giải thích lý do của bạn và đưa ra các giả thuyết thay thế”.

Cách tiếp cận này khuyến khích AI khám phá các khả năng thay thế và ngăn không cho AI củng cố các giả định đã có từ trước. Rõ ràng, việc đánh giá liên tục và nghiêm ngặt AI trong thực hành lâm sàng là điều cần thiết.

Trích NEJM watch 1.2025

Was this helpful?

Có  Không
Bài liên quan
  • JAMA – Sử dụng phép đo canxi điều chỉnh theo albumin trong thực hành lâm sàng
  • Diễn giải về canxi huyết thanh ở bệnh nhân có protein huyết thanh bất thường [Payne]
  • NEJM – Dừng “Điều chỉnh” Nồng độ Canxi
  • Thuốc kháng sinh đường uống và nguy cơ phản ứng thuốc nghiêm trọng trên da
  • NEJM – Bệnh nhân có tiền sử mắc hội chứng Takotsubo có nguy cơ mắc bệnh tật lâu dài cao hơn không?
  • NEJM – Thêm dữ liệu đánh giá tác động của bổ sung vitamin D và khối lượng cơ, sức mạnh, tình trạng té ngã

Didn't find your answer? Liên hệ

Leave A Comment Hủy

Chuyên Khoa
  • NEJM – Mô hình ngôn ngữ trí tuệ nhân tạo lớn và lý luận lâm sàng: Ranh giới năm 2024
  • NEJM – Tiêm dưới da kháng thể đơn dòng để ngăn ngừa bệnh sốt rét
  • Tiêu chuẩn tham khảo cho nghiên cứu nhiễm trùng đường tiết niệu Delphi
  • NEJM – Sử dụng Albumin IV phù hợp: Less is More
  • NEJM – Xét nghiệm nước tiểu bất thường là một yếu tố dự báo kém về nhiễm trùng đường tiết niệu lâm sàng
  • BMJ – Mối liên quan giữa việc tiêu thụ thực phẩm siêu chế biến với mọi nguyên nhân và nguyên nhân tử vong
  • Hệ thống phân loại thực phẩm NOVA
  • Top 10 chuyên ngành bác sĩ có tỷ lệ trầm cảm cao nhất tại Hoa Kỳ
  • NEJM – Các chất chuyển hóa Caffeine có liên quan đến tiền chẩn đoán bệnh Parkinson không
  • ASCO Hướng dẫn cập nhật can thiệp mỏi liên quan đến ung thư
  • Bệnh hen suyễn có thể trầm trọng hơn do các sản phẩm tẩy rửa gia dụng
  • JAMA – Sự cô lập xã hội và sự cô đơn ở người lớn tuổi
  • Mối liên quan giữa chất lượng cuộc sống và gánh nặng của người chăm sóc bệnh ung thư: Một ví dụ ở một quốc gia có thu nhập thấp và trung bình
  • AHA Những điều cần biết hàng đầu: Kiểm soát cao huyết áp trong bệnh viện
  • Mối quan hệ giữa trầm cảm, năng lực bản thân và giá trị nghề nghiệp của các ĐD UB Trung Quốc
  • NEJM – Phân tích tổng hợp cấp độ bệnh nhân về kiểm soát glucose tích cực ở người lớn bị bệnh nặng
  • NEJM – Ca lâm sàng
  • Việc sử dụng Epinephrine kịp thời và các yếu tố liên quan ở trẻ em bị phản vệ
  • U hạt ở phổi do dùng thuốc uống nghiền nát truyền qua PICC
  • Nguy cơ quá liều oxytocin trong quá trình chuyển dạ và sinh đẻ
  • NEJM – Nhịn ăn trước khi thực hiện thủ thuật thông tim có thực sự an toàn hơn không?
  • JAMA – Có khả năng tăng thời gian giữa lần nội soi đại tràng đầu tiên có kết quả âm tính với ung thư trực tràng và lần nội soi đại tràng tiếp theo
  • JAMA – Tỷ lệ mắc và tử vong do ung thư đại tràng sau khi có kết quả sàng lọc nội soi đại tràng âm tính
  • JAMA – Mô hình Deep Learning để Dự đoán Phản ứng Miễn dịch trị liệu ở Ung thư Phổi Không phải Tế bào Nhỏ Tiến triển
  • Đoạn nhũ hai bên và tỉ lệ tử vong liên quan ung thư vú
  • Số ca mắc và tử vong do ung thư dự kiến ​​sẽ tăng 77% và 90% vào năm 2050
  • JAMA – Sự chênh lệch toàn cầu về ung thư và gánh nặng dự kiến ​​vào năm 2050
  • Stereotactic vs Hypofractionated Radiotherapy for Inoperable Stage I Non–Small Cell Lung Cancer
  • JAMA – Liệu pháp miễn dịch hóa học tân bổ trợ cho bệnh ung thư phổi không tế bào nhỏ
  • FDA-Authorized AI/ML Tool for Sepsis Prediction: Development and Validation
  • Nội soi phế quản không gây mê ở những người tình nguyện khỏe mạnh
  • NEJM – Làm thế nào để cải thiện độ chính xác chẩn đoán của siêu âm tuyến giáp: Một nghiên cứu chất lượng đa trung tâm tại Trung Quốc
  • Một mô hình thay đổi cấp độ hệ thống để cải thiện phúc lợi của lực lượng lao động y tế
  • NEJM – Phân tích tổng hợp Levofloxacin cho những người tiếp xúc với bệnh lao kháng đa thuốc
  • JAMA-Phiên bản thứ chín của Phân loại giai đoạn TNM ung thư vòm họng của AJCC và UICC
  • The Lancet – Tiêm chủng mở rộng đã ❤️154 triệu con người
  • BMJ – Dự báo nguy cơ và gánh nặng bệnh tim mạch ở Trung Quốc từ năm 2020 đến năm 2030
  • NEJM – Liệu ghi chép bệnh án lâm sàng được hỗ trợ bởi sức mạnh trí tuệ nhân tạo AI có nâng cao hiệu quả của bác sĩ không
  • NEJM – TNLS Levofloxacin trong phòng ngừa bệnh lao kháng đa thuốc ở Việt Nam
  • Khả năng sống còn của việc can thiệp sớm cai thuốc lá sau khi chẩn đoán ung thư
  • BMJ – chăm sóc trẻ sơ sinh thiết yếu sớm và kết quả cho con bú
  • NEJM Review – Phòng ngừa bệnh lao kháng đa thuốc bằng Levofloxacin
  • NEJM Review – Phẫu thuật nhanh gãy xương hông có tốt hơn cho bệnh nhân có nguy cơ cao không
  • Tổn thương cơ tim ở bệnh nhân gãy xương hông Nghiên cứu phụ thử nghiệm ngẫu nhiên HIP ATTACK
  • The LANCET – Durvalumab có hoặc không có Bevacizumab với tắc mạch hóa học xuyên động mạch trong ung thư biểu mô tế bào gan (EMERALD-1)
  • Phát triển và xác nhận ứng dụng điện thoại thông minh để sàng lọc bệnh vàng da ở trẻ sơ sinh
  • NEJM – Điều trị bệnh nhân, không phải giá trị P
  • NEJM – phần mềm AI đầu tiên được FDA cấp phép để xác định bệnh nhân có nguy cơ nhiễm trùng huyết
  • Đánh giá chất lượng cuộc sống và lão khoa có tương quan với sự sống còn ở bệnh nhân cao tuổi mắc ung thư tuyến tụy
  • Hiệu quả của xét nghiệm máu để sàng lọc ung thư trực tràng được điều chỉnh theo độ tuổi và giới tính của cuộc điều tra dân số Hoa Kỳ
  • NEJM-Ung thư cổ tử cung có thể phòng ngừa được bằng cách tiêm vắc-xin và điều trị chứng loạn sản được phát hiện khi sàng lọc
  • NEJM – Corticosteroid dạng hít an toàn như thế nào đối với bệnh nhân hen suyễn?
  • The LANCET – Lipoprotein(a) và bệnh tim mạch
  • Tucatinib kết hợp với Trastuzumab chứng minh tính an toàn, hiệu quả ở bệnh nhân ung thư vú đột biến HER2
  • NEJM – Thay van động mạch chủ bằng van sinh học hay van cơ học?
  • NEJM – Giảm leo thang phẫu thuật vú: Ít can thiệp liệu có lợi ích hơn
  • NEJM – Sinh lý học của cơn đói
  • NEJM – Thay van qua ống thông trong trường hợp hở van ba lá nặng
  • JAMA-Tầm soát loãng xương để phòng ngừa gãy xương
  • Liệu pháp giúp trẻ em bị dị ứng đậu phộng dung nạp được bơ đậu phộng
  • JAMA – Ngộ độc khí Carbon Monoxide (CO) là gì?
  • Tăng cân quá mức trong tam cá nguyệt đầu tiên liên quan đến sự tích tụ mỡ ở thai nhi
  • JAMA – Các mô hình chăm sóc cuối đời hiện đại trong số những người hưởng Medicare mắc bệnh ung thư giai đoạn cuối
  • NEJM – Hội chứng lymphohistiocytosis thực bào máu
  • How often are Patients Harmed When They Visit the Computed Tomography Suite
  • NEJM – Tóm tắt bàn luận Báo cáo từ Hội nghị chuyên đề về ung thư tiết niệu sinh dục ASCO năm 2025
  • JAMA – Mô hình Deep Learning để dự đoán phản ứng miễn dịch trị liệu ở ung thư phổi không phải tế bào nhỏ tiến triển
  • NEJM – Phân tích tổng hợp Levofloxacin cho những người tiếp xúc với bệnh lao kháng đa thuốc
  • JAMA – Tiến bộ trong điều trị và phòng ngừa HIV
  • NEJM – Cắt đốt điện sinh lý bằng catheter hoặc thuốc chống loạn nhịp cho nhịp nhanh thất
  • The LANCET – dự đoán sẽ thừa cân hoặc béo phì vào năm 2050
  • BMJ – Tác động của thuốc lá điện tử đối với sức khỏe tim mạch: tổng quan hệ thống và phân tích tổng hợp
  • Springer – Thử nghiệm có đối chứng ngẫu nhiên về việc nghe nhạc kết hợp với thư giãn cơ để kiểm soát tâm trạng ở phụ nữ đang hóa trị ung thư
  • JAMA – Tính liên quan giữa ăn bơ và dầu thực vật và tỷ lệ tử vong
  • The Lancet – Phân tích của WHO nguyên nhân tử vong bà mẹ toàn cầu và khu vực 2009–2020
  • NEJM – Kết quả của Chương trình Giảm tỷ lệ tử vong liên quan đến sinh sản ở Tanzania
  • JAMA – Ước tính số ca tử vong do ung thư được ngăn chặn nhờ các nỗ lực phòng ngừa, sàng lọc và điều trị, 1975-2020
  • The Lancet – Tuổi thọ thay đổi ở các nước châu Âu 1990–2021
  • NEJM – Can thiệp bằng tin nhắn văn bản để giảm thiểu gánh nặng thời gian chăm sóc bệnh ung thư
  • NEJM – Phác đồ rút ngắn bằng đường uống để điều trị lao kháng thuốc
  • NEJM – Đo huyết áp tự động — Không cần bác sĩ lâm sàng trong phòng
  • JAMA – Bệnh loét dạ dày tá tràng
  • Độ chính xác trong chẩn đoán của ECG ghi nhận bởi Apple Watch để phát hiện rung nhĩ
  • Hoạt động thể chất hàng ngày có liên quan đến nguy cơ ung thư thấp hơn
  • JAMA – Transamine để ngăn ngừa mất máu sau khi sinh mổ
  • NEJM – Suzetrigine, a New Nonopioid Pain Medication, Gains U.S. FDA Approval
  • NEJM – Ước tính mới về nguy cơ ung thư liên quan đến chụp CT
  • NEJM – Thêm dữ liệu đánh giá tác động của bổ sung vitamin D và khối lượng cơ, sức mạnh, tình trạng té ngã
  • NEJM – Bệnh nhân có tiền sử mắc hội chứng Takotsubo có nguy cơ mắc bệnh tật lâu dài cao hơn không?
  • Thuốc kháng sinh đường uống và nguy cơ phản ứng thuốc nghiêm trọng trên da
  • NEJM – Dừng “Điều chỉnh” Nồng độ Canxi
  • Diễn giải về canxi huyết thanh ở bệnh nhân có protein huyết thanh bất thường [Payne]
  • JAMA – Sử dụng phép đo canxi điều chỉnh theo albumin trong thực hành lâm sàng
Danh mục
  • An toàn trong chăm sóc
  • An toàn trong sử dụng thuốc
  • Chăm sóc hồi sức tích cực & cấp cứu [Critical Care]
  • Chăm sóc nội khoa
  • Chuyên Khoa
  • Chuyên khoa
  • Điều dưỡng
  • Điều dưỡng
  • Kiểm soát nhiễm khuẩn
  • Kinh tế Y tế
  • Kinh tế Y tế
  • QLCL & ATNB
  • QLCL & ATNB
  • Quản lý Chăm sóc vết thương
  • Quản lý chi phí y tế điều dưỡng
  • Quản lý đường truyền xâm lấn mạch máu [Vascular Access Devices]
  • Quản lý nhân lực điều dưỡng
  • Quản Lý Y tế
  • Quản Lý Y tế
  • Tài liệu & Báo cáo

  Stereotactic vs Hypofractionated Radiotherapy for Inoperable Stage I Non–Small Cell Lung Cancer

JAMA – Liệu pháp miễn dịch hóa học tân bổ trợ cho bệnh ung thư phổi không tế bào nhỏ  

  • Privacy Policy
  • Terms of Use
  • Copyright 2025 Thuvienykhoa.com.vn. All Rights Reserved.