Các nhà nghiên cứu tại Facebook và trường Đại học New York (NYU) tuyên bố rằng họ đã phát triển ba mô hình học máy có thể giúp các bác sĩ dự đoán về diễn biến phát triển của COVID-19 cho bệnh nhân. Các mô hình nguồn mở này có vẻ đã dự đoán được tình trạng xấu đi của bệnh nhân và lượng oxy bổ sung mà một bệnh nhân (nếu có) có thể cần đến trước đó bốn ngày, trong khi không cần gì thêm ngoài một chuỗi tia X. 

Dịch vi-rút corona mới này đang tiếp tục đạt tới mức cảnh báo cao hơn tại Mỹ và trên toàn thế giới. Tuần trước, số người chết mỗi ngày tại Mỹ lần đầu tiên vượt quá 4.000 người kể từ khi cuộc khủng hoảng y tế này bắt đầu. Số ca nhiễm kỷ lục lên tới hàng trăm nghìn mỗi ngày đã gây áp lực lên hệ thống y tế trên toàn quốc gia. Các bang như California đang phải vật lộn để duy trì khoảng cách tại các đơn vị chăm sóc đặc biệt bị quá tải. 

Huiying Medical, Alibaba, RadLogics, Lunit, DarwinAI, Infervision, Qure.ai và các tổ chức khác đã phát triển các thuật toán AI giúp chẩn đoán COVID-19 từ tia X với độ chính xác cao. Tuy nhiên, điều khiến phương pháp của Facebook và NYU khác biệt là nó đưa ra chẩn đoán trong dài hạn. Stanford, Mount Sinai và các nhà cung cấp hồ sơ sức khỏe điện tử Epic và Cerner đã phát triển các mô hình tính toán khả năng một bệnh nhân sẽ tử vong hoặc cần đến máy thở, nhưng hầu như các dự đoán này không được đưa ra từ một ảnh chụp duy nhất hoặc bệnh án điện tử. 

Là một phần của sự hợp tác với Đơn vị Phân tích Dự báo và Khoa X quang của NYU Langone Health, các nhà nghiên cứu của Facebook đã đào tạo một hệ thống AI dựa trên hai bộ dữ liệu lớn, được công khai về X quang lồng ngực – MIMIC-CXR-JPG và CheXpert – sử dụng kỹ thuật học tự giám sát có tên Momentum Contrast (MoCo). Học tự giám sát cho phép mô hình MoCo này học từ các bản chụp X quang trong các bộ dữ liệu, kể cả khi không có các nhãn dán giải thích những bản chụp đó. 

Bước tiếp theo là tinh chỉnh mô hình MoCo bằng cách sử dụng một phiên bản mở rộng của bộ dữ liệu công khai NYU COVID-19. Các nhà nghiên cứu đã xây dựng các máy phân loại với 26.838 hình ảnh X quang của 4.914 bệnh nhân được chú thích để chỉ ra tình trạng của bệnh nhân có xấu đi trong 24, 48 hoặc 72 giờ kể từ khi chụp hay không. Một máy phân loại dự đoán tình trạng xấu đi của bệnh nhân dựa trên một tia X duy nhất, trong khi máy còn lại sử dụng một chuỗi các tia X tổng hợp. 

Facebook NYU COVID-19 prediction model

Các nhà nghiên cứu tuyên bố các máy phân loại dựa trên một loạt ảnh chụp X quang vượt trội hơn các chuyên gia con người trong việc dự đoán nhu cầu sử dụng ICU, tỷ lệ tử vong và các diễn biến xấu từ trước đó 96 giờ. Mặc dù các kết quả này không chắc chắn áp dụng được cho các bệnh viện khác có bộ dữ liệu độc nhất, nhưng các nhà nghiên cứu tin rằng những máy phân loại mới có thể được xây dựng từ mô hình MoCo với rất ít nguồn liên quan, có thể là một GPU.

Đội ngũ Facebook viết trong một bài blog: “Khả năng dự đoán liệu sắp tới một bệnh nhân có cần nguồn oxi hay không cũng là điều tiên quyết và có thể giúp các bệnh viện quyết định cách phân bổ nguồn lực trong những tuần và tháng tới. Khi các ca mắc COVID-19 tăng lên trở lại trên thế giới, các bệnh viện cần công cụ để dự báo và chuẩn bị cho nhu cầu tăng đột biến khi lên kế hoạch phân bổ nguồn lực. Những dự đoán này có thể giúp các bác sĩ tránh đưa những bệnh nhân đang gặp nguy hiểm quá sớm và giúp các bệnh viện dự đoán tốt hơn về nhu cầu bổ sung oxy và các nguồn lực hạn chế khác.”

Nghiên cứu gần đây của Đại học Toronto, Viện Vector và MIT tiết lộ rằng các bộ dữ liệu X quang lồng ngực được sử dụng để đào tạo những mô hình chẩn đoán – bao gồm MIMIC-CXR và CheXpert – cho thấy sự mất cân bằng, sự thiên vị chống lại một số nhóm giới tính, kinh tế xã hội và chủng tộc. Bệnh nhân nữ có mức độ chênh lệch cao nhất, mặc dù tỷ lệ nữ giới trong bộ dữ liệu này chỉ thấp hơn nam giới một chút. Bệnh nhân da trắng – chiếm đa số với 67,6% tổng số ảnh chụp X quang – là nhóm được thiên vị nhất, trong khi các bệnh nhân gốc Tây Ban Nha ít được ủng hộ nhất. 

Các nhà nghiên cứu của Facebook và NYU nói rằng họ đã giải quyết sự thiên vị này bằng cách đào tạo dựa trên dữ liệu không liên quan đến COVID và lựa chọn cẩn thận từng mẫu thử nghiệm. Nhưng đầu năm ngoái, Trung tâm Kiểm soát và Phòng ngừa Dịch bệnh Hoa Kỳ, cũng như Trường Cao đẳng X quang Hoa Kỳ (ACR) và các tổ chức X quang ở Canada, New Zealand và Úc, đã khuyến cáo không nên sử dụng hình chụp CT hoặc X quang để chẩn đoán COVID-19. Đó là bởi vì ngay cả những hệ thống AI tốt nhất đôi khi cũng không thể phân biệt được COVID-19 và các bệnh nhiễm trùng phổi thông thường như viêm phổi do vi khuẩn hoặc vi-rút.

Một phần do sự thận trọng khi phát hành mã, bộ dữ liệu và kỹ thuật, phần lớn dữ liệu được sử dụng để đào tạo các thuật toán AI chẩn đoán bệnh ngày nay có thể kéo dài sự bất bình đẳng. Một nhóm các nhà khoa học tại Vương quốc Anh tìm ra rằng hầu hết các bộ dữ liệu về bệnh mắt là của các bệnh nhân tại Bắc Mỹ, châu Âu và Trung Quốc. Điều đó có nghĩa là các thuật toán chẩn đoán các bệnh về mắt không chắc sẽ hoạt động tốt với các nhóm chủng tộc không có dữ liệu đại diện. Trong một nghiên cứu khác, các nhà nghiên cứu của Đại học Stanford tuyên bố rằng hầu hết dữ liệu của Hoa Kỳ cho các nghiên cứu về AI dùng trong y tế đến từ California, New York và Massachusetts. Một nghiên cứu về thuật toán của UnitedHealth Group xác định rằng thuật toán này có thể đánh giá thấp nhu cầu chăm sóc y tế của một nửa số bệnh nhân da màu. Ngày càng có nhiều nghiên cứu cũng cho biết rằng các thuật toán phát hiện ung thư da có xu hướng kém chính xác hơn khi được sử dụng trên bệnh nhân da màu, một phần là do các mô hình AI được đào tạo chủ yếu với hình ảnh của các bệnh nhân da sáng màu. 

Việc xác định xem các thuật toán của Facebook và NYU đáng tin cậy đến đâu có lẽ cần trải qua thử nghiệm với đa dạng, nhiều hệ thống y tế trên thế giới – với sự đồng ý của bệnh nhân. Một nghiên cứu công bố trên Nature Machine Intelligence cho biết một mô hình dự báo diễn biến bệnh COVID-19 được phát triển thành công tại Vũ Hán, Trung Quốc đã cho những kết quả chẳng khác nào đang chơi một trò chơi may rủi khi được áp dụng cho một mẫu bệnh nhân tại New York. Mặc dù việc tinh chỉnh cẩn thận có thể giúp thuật toán của Facebook và NYU tránh được số phân tương tự, việc dự đoán nơi có thể phát sinh các thành kiến là điều không thể. Điều này nói lên sự cần thiết của việc kiểm tra trước khi triển khai tại bất kỳ quy mô nào. 

Theo VentureBeat

Tin liên quan: