The Lancet – FaceAge, một hệ thống Deep Learning để ước tính tuổi sinh học từ ảnh chụp khuôn mặt nhằm cải thiện khả năng tiên lượng: một nghiên cứu phát triển và xác thực mô hình
Tác giả Dennis Bontempi, PhD và cộng sự
Artificial Intelligence in Medicine Program, Mass General Brigham, Harvard Medical School, Boston, MA, USA
Department of Radiation Oncology, Brigham and Women’s Hospital, Dana-Farber Cancer Institute, Harvard Medical School, Boston, MA, USA
Department of Radiology and Nuclear Medicine, CARIM & GROW, Maastricht University, Maastricht, Netherlands
Department of Radiation Oncology (MAASTRO), Maastricht University, Maastricht, Netherlands
Bằng chứng mới nổi cho thấy mọi người già đi với tốc độ khác nhau. Sự khác biệt giữa các cá nhân về các yếu tố di truyền và lối sống như chế độ ăn uống, căng thẳng, hút thuốc và sử dụng rượu đã được chứng minh là ảnh hưởng đến quá trình lão hóa và ảnh hưởng đến trạng thái metyl hóa DNA, chiều dài telomere, và các kiểu biểu hiện gen và protein. Không có đồng hồ đơn lẻ nào đo trực tiếp tuổi sinh học, nhưng việc thiết lập các dấu ấn sinh học có tương quan với thời gian sống sót (tức là thời gian cho đến khi chết) có thể có các ứng dụng có liên quan về mặt lâm sàng. Việc tìm ra một người thay thế thích hợp cho tuổi sinh học của một người có thể cung cấp một yếu tố dự đoán tốt hơn về sức khỏe sinh lý và tuổi thọ của họ so với tuổi theo thời gian. Điều này đặc biệt quan trọng trong y học, trong đó cả bệnh tật và phương pháp điều trị đều có thể gây tổn thương tế bào và đẩy nhanh quá trình lão hóa, và ước tính chính xác về tuổi sinh học có thể hỗ trợ các quyết định điều trị và cho phép định lượng tốt hơn tỷ lệ rủi ro-lợi ích tương đối của các phương pháp điều trị được đề xuất. Ví dụ, một người 75 tuổi khỏe mạnh có tuổi sinh học trẻ hơn 10 tuổi so với tuổi thực tế có thể chịu đựng và đáp ứng điều trị tốt hơn và sống lâu hơn một người 60 tuổi có tuổi sinh học trẻ hơn 10 tuổi so với tuổi thực tế.
Khi con người già đi với tốc độ khác nhau, ngoại hình có thể cung cấp thông tin chi tiết về tuổi sinh học và sức khỏe sinh lý đáng tin cậy hơn so với tuổi theo thời gian. Tuy nhiên, trong y học, ngoại hình được đưa vào các đánh giá y khoa một cách chủ quan và không chuẩn hóa. Trong thực hành lâm sàng hiện nay, ấn tượng chung của bác sĩ về bệnh nhân là một phần không thể thiếu của quá trình khám sức khỏe và đóng vai trò quan trọng trong việc ra quyết định lâm sàng—trong việc ước tính tiên lượng và cân nhắc lợi ích và rủi ro của các thủ thuật chẩn đoán và điều trị. Tuy nhiên, đây là một đánh giá chủ quan đặc biệt về tình trạng chức năng hoặc tình trạng suy nhược và chỉ là ước tính sơ bộ về độ tuổi sinh học của bệnh nhân.10 Đặc biệt là trong ung thư học, trong đó cửa sổ điều trị thường hẹp và bản thân việc điều trị có thể làm tăng tỷ lệ tử vong, quyết định điều trị đòi hỏi phải ước tính chính xác liệu bệnh nhân có đủ khỏe mạnh để chịu đựng được điều trị và sống đủ lâu để hưởng lợi từ nó hay không.
Trong vài năm qua, việc ứng dụng deep learning để ước tính tuổi từ ảnh khuôn mặt đã thu hút được sự chú ý đáng kể trong cộng đồng học thuật, với một số ấn phẩm trình bày các mô hình có khả năng dự đoán chính xác tuổi của một cá nhân dựa trên ảnh khuôn mặt. Với các ứng dụng chủ yếu ngoài y học, các nhà nghiên cứu đã khám phá nhiều khía cạnh khác nhau của học sâu để nâng cao độ chính xác và khả năng ứng dụng của các mô hình ước tính tuổi. Ví dụ, công trình của Rothe và các cộng sự không chỉ đóng góp vào những tiến bộ về phương pháp luận mà còn chia sẻ công khai các nguồn dữ liệu quan trọng. Theo hiểu biết của chúng tôi, chưa có công trình nào trước đây áp dụng phương pháp này trong bối cảnh lâm sàng hoặc nghiên cứu giá trị tiên lượng của việc ước tính tuổi bằng các mô hình học sâu.
Chúng tôi đưa ra giả thuyết rằng tuổi sinh học của một người được phản ánh trong các đặc điểm khuôn mặt của họ và các thuật toán deep learning có thể tự động thu thập thông tin này từ các bức ảnh dễ dàng có được. Một phương pháp tiếp cận như vậy có thể cung cấp thước đo chính xác hơn về tình trạng sinh lý của bệnh nhân so với tuổi theo thời gian, cung cấp thông tin thiết yếu cho y học chính xác như một dấu ấn sinh học lâm sàng có thể hành động và yếu tố tiên lượng. Bằng chứng ban đầu cho điều này đã được xác lập trong một nghiên cứu của Xia và các đồng nghiệp, trong đó tuổi thọ được ước tính từ khuôn mặt của những người khỏe mạnh bằng thiết bị hình ảnh ba chiều chuyên dụng và dữ liệu được chứng minh là có liên quan đến các dấu hiệu phân tử của lão hóa. Trong nghiên cứu hiện tại, chúng tôi đặt mục tiêu phát triển một hệ thống học sâu để ước tính tuổi sinh học của một người từ các bức ảnh khuôn mặt dễ dàng thu được và đánh giá giá trị lâm sàng của những ước tính tuổi này trong việc dự đoán kết quả sống sót ở những bệnh nhân được chẩn đoán ung thư.
Trong nghiên cứu này, chúng tôi đặt mục tiêu phát triển và xác thực FaceAge, một hệ thống học sâu để ước tính tuổi sinh học từ các ảnh chụp khuôn mặt dễ dàng thu thập và chi phí thấp.
Phương pháp
Quy trình deep learning FaceAge
Quy trình FaceAge bao gồm hai giai đoạn chính: phát hiện khuôn mặt và trích xuất đặc điểm. Giai đoạn đầu tiên sử dụng mạng nơ-ron tích chập nối tiếp để định vị và xử lý trước khuôn mặt, đạt độ chính xác kiểm tra là 95%. Giai đoạn thứ hai sử dụng mạng nơ-ron tích chập Inception-ResNet v121 để mã hóa khuôn mặt thành một vectơ đặc điểm và thực hiện dự đoán độ tuổi thông qua hồi quy. Hiệu suất của mô hình tốt đối với nhóm tuổi có liên quan đến lâm sàng (tức là từ 60 tuổi trở lên) đã trải qua quá trình quản lý thủ công và đảm bảo chất lượng (sai số tuyệt đối trung bình là 4,09 năm), ngang bằng hoặc tốt hơn khi so sánh với các mô hình tiên tiến được tinh chỉnh trên cùng dữ liệu.
FaceAge được đào tạo trên dữ liệu của 58.851 cá nhân được cho là khỏe mạnh từ 60 tuổi trở lên: 56.304 cá nhân từ bộ dữ liệu IMDb–Wiki (đào tạo) và 2.547 cá nhân từ bộ dữ liệu UTKFace (xác thực ban đầu). Tính hữu ích lâm sàng đã được đánh giá trên dữ liệu của 6.196 bệnh nhân được chẩn đoán ung thư từ hai tổ chức ở Hà Lan và Hoa Kỳ: nhóm MAASTRO, Harvard Thoracic và Harvard Palliative. Ước tính FaceAge trong các nhóm ung thư này đã được so sánh với nhóm tham chiếu không ung thư gồm 535 cá nhân. Để đánh giá tầm quan trọng của tiên lượng FaceAge, chúng tôi đã thực hiện phân tích sống còn Kaplan–Meier và mô hình Cox, điều chỉnh theo một số biến số lâm sàng. Chúng tôi cũng đánh giá hiệu quả của FaceAge ở những bệnh nhân ung thư di căn đang được điều trị giảm nhẹ vào cuối đời bằng cách kết hợp FaceAge vào các mô hình dự đoán lâm sàng. Để đánh giá liệu FaceAge có tiềm năng trở thành một dấu ấn sinh học cho lão hóa phân tử hay không, chúng tôi đã thực hiện phân tích dựa trên gen để đánh giá mối liên hệ của nó với các gen lão hóa.
Kiểm tra tính hữu ích lâm sàng để cải thiện dự đoán cuối đời của bác sĩ
Để so sánh FaceAge với hiệu suất của con người nhằm dự đoán tỷ lệ sống sót chung của bệnh nhân ung thư di căn, chúng tôi đã thực hiện một khảo sát với 100 bệnh nhân được chọn ngẫu nhiên từ nhóm bệnh nhân thuộc chương trình Chăm sóc Giảm nhẹ Harvard. Đầu tiên, chúng tôi đánh giá hiệu suất của con người trong việc ước tính tỷ lệ sống sót sau 6 tháng chỉ dựa trên ảnh chụp khuôn mặt, mà không sử dụng thêm thông tin lâm sàng, bằng cách yêu cầu mười nhân viên y tế và nghiên cứu tại các bệnh viện trực thuộc Harvard (năm bác sĩ điều trị, tất cả đều là bác sĩ ung thư hoặc bác sĩ chăm sóc giảm nhẹ, ba bác sĩ nội trú ung thư và hai nhà nghiên cứu không chuyên, không làm việc lâm sàng) dự đoán liệu bệnh nhân có còn sống sau 6 tháng hay không (một tiêu chí quan trọng để định hướng quyết định cuối đời). Chúng tôi đã đánh giá hiệu suất của mười người tham gia khảo sát bằng cách sử dụng AUC và kiểm tra sự khác biệt có ý nghĩa thống kê giữa các nhóm bằng kiểm định Wilcoxon hai phía. Hơn nữa, để đánh giá giá trị bổ sung của FaceAge với các dữ liệu lâm sàng khác (tức là chẩn đoán ung thư ban đầu, tuổi khi điều trị, tình trạng hoạt động, vị trí di căn, số lần khám cấp cứu, số lần nhập viện, các đợt hóa trị giảm nhẹ trước đó, các đợt xạ trị giảm nhẹ trước đó, thời gian đến khi di căn đầu tiên và thời gian đến khi đi khám ung thư), chúng tôi đã đào tạo một Mô hình rủi ro FaceAge, kết hợp các yếu tố lâm sàng với FaceAge để dự đoán xác suất sống sót. Trong các vòng khảo sát liên tiếp, chúng tôi yêu cầu những người tham gia khảo sát lâm sàng dự đoán khả năng sống sót sau 6 tháng chỉ dựa trên ảnh chụp khuôn mặt, ảnh chụp khuôn mặt được cung cấp cùng với thông tin biểu đồ lâm sàng của bệnh nhân và sau đó bổ sung Mô hình rủi ro FaceAge. Một lần nữa, chúng tôi đã đánh giá hiệu suất của mười người tham gia khảo sát bằng cách sử dụng AUC và kiểm tra sự khác biệt có ý nghĩa thống kê giữa các nhóm bằng cách sử dụng kiểm định Wilcoxon hai phía có dấu hiệu.
Kết quả
FaceAge cho thấy hiệu quả tiên lượng độc lập đáng kể ở nhiều loại và giai đoạn ung thư khác nhau. Vẻ ngoài già hơn có tương quan với tỷ lệ sống sót chung kém hơn (sau khi điều chỉnh theo các biến số đồng biến, tỷ lệ nguy cơ mỗi thập kỷ [HR] 1,151, p = 0,013 trong nhóm toàn ung thư n = 4906; 1,148, p = 0,011 trong nhóm ngực n = 573; và 1,117, p = 0,021 trong nhóm giảm nhẹ n = 717). Chúng tôi nhận thấy rằng, trung bình, bệnh nhân ung thư trông già hơn so với tuổi thực tế của họ (tăng trung bình 4,79 tuổi so với nhóm tham chiếu không phải ung thư, p < 0,0001).
Hiệu suất của con người được cải thiện đáng kể (p = 0,0002) nếu chúng tôi cung cấp ảnh khuôn mặt kết hợp với thông tin biểu đồ lâm sàng (AUC 0,74 [95% CI 0,70–0,78]) so với chỉ ảnh khuôn mặt (0,61 [0,57–0,64]). Tuy nhiên, hiệu suất của con người được cải thiện hơn nữa (p < 0,0001) khi Mô hình rủi ro FaceAge được cung cấp cho các bác sĩ lâm sàng ngoài thông tin biểu đồ (AUC 0,80 [95% CI 0,76–0,83]), với hiệu suất tốt nhất của các bác sĩ không khác biệt về mặt thống kê (p = 0,55) so với riêng mô hình rủi ro FaceAge (0,81 [0,71–0,91]). Kết quả tương tự đã được tìm thấy đối với tỷ lệ sống sót tổng thể được định lượng bằng chỉ số phù hợp. Chúng tôi cung cấp một số ví dụ trường hợp từ nhóm khảo sát để so sánh dự đoán sống sót sau 6 tháng của các bác sĩ lâm sàng sử dụng các công cụ hỗ trợ lâm sàng khác nhau với dự đoán của các mô hình nguy cơ TEACHH và FaceAge.
Để đánh giá liệu FaceAge có tiềm năng trở thành một dấu ấn sinh học cho lão hóa phân tử hay không, chúng tôi đã thực hiện phân tích dựa trên gen để đo lường mối liên hệ của nó với các gen lão hóa so với tuổi theo thời gian. Phân tích được thực hiện trên 146 cá nhân từ Nhóm nghiên cứu Ngực Harvard được chẩn đoán mắc ung thư phổi không phải tế bào nhỏ và được lập hồ sơ bằng giải trình tự toàn bộ exome. Chúng tôi đã đánh giá 22 gen được biết là có liên quan đến lão hóa, và chúng tôi nhận thấy rằng FaceAge có liên quan đáng kể với CDK6 sau khi điều chỉnh cho nhiều so sánh (tỷ lệ phát hiện sai là 0,25). CDK6 có vai trò quan trọng trong việc điều hòa điểm kiểm soát G1/S của chu kỳ tế bào thông qua quá trình phosphoryl hóa và hoạt hóa protein ức chế khối u Rb (u nguyên bào võng mạc) bằng cách tạo phức hợp với CDK4 và cyclin D. Ngược lại, không có gen nào cho thấy mối liên hệ đáng kể với tuổi theo thời gian sau khi điều chỉnh cho nhiều phép so sánh.
Để đánh giá ảnh hưởng của loại ung thư và các yếu tố lối sống đến dự đoán FaceAge, chúng tôi đã so sánh sự khác biệt giữa FaceAge và tuổi theo thời gian giữa các loại ung thư, tiền sử hút thuốc, BMI và tình trạng hoạt động ECOG (hình 4). Chúng tôi nhận thấy rằng bệnh nhân ung thư có FaceAge cao hơn đáng kể so với tuổi theo thời gian (n = 6367; tăng trung bình 4,79 năm; kiểm định t hai phía cặp đôi p < 0,001). Điều này phù hợp với các loại ung thư và trái ngược với kết quả ở những quần thể khỏe mạnh được cho là. Đầu tiên, trong tập dữ liệu xác thực UTK với những cá nhân được cho là khỏe mạnh, chúng tôi thấy sự khác biệt giữa FaceAge và tuổi theo thời gian nhỏ hơn đáng kể (trung bình tăng 0,35 năm) so với nhóm ung thư (kiểm định t hai chiều không ghép cặp p < 0,0001), cho thấy những cá nhân trong dân số nói chung trông giống với tuổi theo thời gian hơn, đúng như dự kiến. Ngoài ra, chúng tôi đã phân tích khuôn mặt của những bệnh nhân được điều trị các bệnh lành tính, cũng như những bệnh nhân ung thư biểu mô ống tuyến tại chỗ. Nhóm không mắc ung thư có khoảng cách tuổi FaceAge so với tuổi thực tế nhỏ hơn nhóm bệnh nhân mắc ung thư (chênh lệch trung bình là 3,41 năm so với 4,55 năm đối với bệnh nhân mắc ung thư; p < 0,0001), trong đó bệnh nhân lành tính có FaceAge gần nhất với tuổi thực tế của họ (chênh lệch trung bình là 1,95 năm so với bệnh nhân mắc ung thư; p < 0,0001) và bệnh nhân mắc ung thư biểu mô ống tại chỗ có giá trị FaceAge ở mức trung gian (chênh lệch trung bình là 3,86 năm so với bệnh nhân mắc ung thư; p = 0,019).
Để đánh giá tác động của các yếu tố lối sống, chúng tôi đã so sánh sự khác biệt giữa FaceAge và tuổi theo thời gian ở những người hiện tại, trước đây và chưa bao giờ hút thuốc trong nhóm MAASTRO. Chúng tôi thấy rằng những người hiện tại hút thuốc trông già hơn đáng kể (tăng trung bình 33,24 tháng; kiểm định t hai phía không ghép đôi t = 4,78 [95% CI 1,63–3,91]; p < 0,001) so với những người trước đây và chưa bao giờ hút thuốc (hình 4B), điều này phù hợp với các loại ung thư (phụ lục trang 9). Trong quá trình đánh giá tác động của BMI đối với sự khác biệt giữa FaceAge và tuổi theo thời gian (hình 4C; phụ lục trang 9), chúng tôi đã quan sát thấy mối liên quan có ý nghĩa thống kê (n = 1295; r -0,0999; p < 0,0001), nhưng quy mô hiệu ứng là tối thiểu, cho thấy mối quan hệ yếu giữa FaceAge và BMI. Vì tình trạng hiệu suất ECOG được sử dụng để phân tầng lâm sàng, chúng tôi đã so sánh mối liên hệ giữa các nhóm ECOG với sự khác biệt giữa FaceAge và tuổi theo thời gian. Trong cả hai nhóm MAASTRO và Harvard, chúng tôi không tìm thấy sự khác biệt có ý nghĩa thống kê (kiểm định t hai phía không ghép cặp p>0,092) giữa các nhóm, cho thấy FaceAge định lượng thông tin sinh học khác với tình trạng hiệu suất của bệnh nhân.
Chúng tôi nhận thấy FaceAge có thể cải thiện dự đoán sống sót của bác sĩ ở những bệnh nhân ung thư không thể chữa khỏi đang được điều trị giảm nhẹ (từ diện tích dưới đường cong 0,74 [95% CI 0,70–0,78] lên 0,8 [0,76–0,83]; p < 0,0001), làm nổi bật ứng dụng lâm sàng của thuật toán này để hỗ trợ việc ra quyết định cuối đời. FaceAge cũng có liên quan đáng kể với các cơ chế phân tử của quá trình lão hóa thông qua phân tích gen, trong khi tuổi tác thì không.
Diễn giải
Kết quả của chúng tôi cho thấy một mô hình học sâu có thể ước tính tuổi sinh học từ ảnh chụp khuôn mặt và do đó cải thiện dự đoán sống sót ở bệnh nhân ung thư. Cần có thêm nghiên cứu, bao gồm cả việc xác nhận trên các nhóm lớn hơn, để xác minh những phát hiện này ở bệnh nhân ung thư và xác định liệu những phát hiện này có mở rộng sang bệnh nhân mắc các bệnh khác hay không. Sau khi được thử nghiệm và xác nhận thêm, các phương pháp như FaceAge có thể được sử dụng để chuyển đổi diện mạo trực quan của bệnh nhân thành các phép đo khách quan, định lượng và có giá trị lâm sàng.
Nguồn
FaceAge, a deep learning system to estimate biological age from face photographs to improve prognostication: a model development and validation study
Bontempi, Dennis et al.
The Lancet Digital Health, Volume 7, Issue 6, 100870
DOI: 10.1016/j.landig.2025.03.002