Các nhà khoa học cho biết một bài toán dai dẳng và vô cùng phức tạp liên quan đến cấu trúc và hoạt động của protein đã được giải đáp bởi một hệ thống trí tuệ nhân tạo (AI) mới.

DeepMind, một công ty AI có trụ sở tại UK, đã khiến chúng ta ngạc nhiên trong nhiều năm bởi hàng loạt những mạng thần kinh nhân tạo ngày càng tiên tiến, liên tiếp đánh bại con người trong những trò chơi phức tạp như cờ vua và cờ vây.

Tuy nhiên, tất cả những tiến bộ đó mang nhiều ý nghĩa hơn là để chinh phục các trò chơi giải trí đơn thuần.

Đằng sau các nghiên cứu của DeepMind là nỗ lực hướng AI tới việc giải quyết các bài toán khoa học quan trọng mang tính nền tảng hơn – ví dụ như tìm ra phương pháp chữa bệnh từ các dự đoán về những khía cạnh vô cùng nhỏ nhưng thiết yếu của sinh học người.

Giờ đây, với phiên bản mới nhất của AlphaFold AI, họ dường như đã đạt được mục tiêu vô cùng tham vọng này – hoặc ít nhất là đưa chúng ta đến gần với mục tiêu hơn so với những gì các nhà khoa học đã làm được trước đây.

Trong vòng 50 năm, các nhà nghiên cứu đã cố gắng dự đoán cách các protein hình thành nên cấu trúc không gian ba chiều, và đó là một bài toán không hề đơn giản.

Trên thực tế, số lượng các cấu hình protein có thể tồn tại lớn đến mức các nhà nghiên cứu đã giả thiết rằng, thời gian để lấy được tất cả các mẫu sắp xếp phân tử còn lớn hơn cả số tuổi của vũ trụ.

Tuy vậy, nếu chúng ta có thể giải được bài toán này – bài toán cuộn gập protein – đó sẽ là một bước đột phá vĩ đại cho khả năng của khoa học, thúc đẩy mạnh mẽ việc nghiên cứu các vấn đề như điều chế thuốc, lập mô hình phát triển của các căn bệnh, đồng thời tạo ra những ứng dụng vượt xa bên ngoài lĩnh vực y tế.

Vì lý do đó, mặc dù thách thức gặp phải là rất lớn, các nhà nghiên cứu đã hợp tác trong hàng thập kỷ để tìm ra lời giải cho bài toán cuộn gập protein.

Một thí nghiệm nghiêm ngặt mang tên CASP (Critical Assessment of Protein Structure) – Đánh giá nghiên cứu về cấu trúc protein – được bắt đầu vào những năm 1990, thách thức các nhà khoa học phát minh ra những hệ thống có khả năng đưa ra dự đoán về bí ẩn của cuộn gập protein.

Hiện nay, được tiến hành đến thập kỷ thứ ba, thí nghiệm CASP dường như đã tạo ra giải pháp hứa hẹn nhất khi AlphaFold của DeepMind đưa ra dự đoán về cấu trúc 3D của protein với độ chính xác chưa từng có.

“Chúng tôi đã mắc kẹt với một vấn đề – làm thế nào protein có thể gấp cuộn – trong gần 50 năm”, John Moult, người đồng sáng lập của CASP từ Đại học Maryland chia sẻ.

“Sau một khoảng thời gian quá dài nghiên cứu về vấn đề này, sau rất nhiều lần dừng lại và tự hỏi liệu chúng ta có bao giờ đi được tới đích không, khoảnh khắc chứng kiến DeepMind tạo ra giải pháp trở nên vô cùng đặc biệt.”

Trong thí nghiệm, DeepMind đã áp dụng cho AlphaFold một kiến trúc học sâu (deep learning) mới có khả năng lý giải và tính toán ra đồ thị không gian 3 chiều của protein, giúp dự đoán được cấu trúc phân tử nào là cơ sở hình thành nên cấu hình cuộn gập của chúng.  

Được huấn luyện bằng cách phân tích ngân hàng dữ liệu gồm khoảng 170,000 cấu trúc protein, tại CASP năm nay với tên gọi CASP14, hệ thống này đã đem tới những kỹ năng độc đáo, đạt được số điểm trung bình là 92.4 GDT (Global Distance Test) cho dự đoán của mình.

Kết quả này cao hơn ngưỡng ~90 GDT, khoảng vốn được đánh giá là tốt nhất, và giống với kết quả đạt được qua phương pháp thực nghiệm. DeepMind cũng cho biết rằng dự đoán của hệ thống này chỉ có sai lệch trung bình vào khoảng 1.6 angstroms (tương đương chiều rộng của một nguyên tử).

Nhà nghiên cứu gen Ewan Birney từ Phòng thí nghiệm Sinh học phân tử Châu Âu cho biết “Tôi đã vô cùng sửng sốt khi nhìn thấy những kết quả này”.

“Tôi biết CASP nghiêm ngặt như thế nào – về cơ bản, nó đảm bảo rằng mô hình tính toán phải thực hiện được cuộn gập protein từ các nguyên tố tự nhiên. Thật vinh dự khi chứng kiến những mô hình này có thể làm được điều đó rất chính xác. Sẽ còn nhiều khía cạnh cần được tìm hiểu, nhưng đây là một tiến bộ vĩ đại đối với khoa học.”

Điều đáng chú ý là nghiên cứu này vẫn chưa được kiểm chứng lại hay công bố trên tờ báo khoa học nào (mặc dù các nhà nghiên cứu của DeepMind cho biết họ đang tiến hành công việc này).

Tuy vậy, các chuyên gia am hiểu lĩnh vực này đã công nhận và hoan nghênh bước đột phá này, ngay cả khi chưa có bản báo cáo đầy đủ và kết quả chi tiết.

“Công trình tính toán này đại diện cho một bước tiến đáng kinh ngạc trong bài toán cuộn gập protein, một thách thức lớn trong 50 năm của ngành sinh học”, nhà sinh học cấu trúc Venki Ramakrishnan, chủ tịch Hiệp hội Hoàng gia nhận định.

“Điều này đã xảy ra sớm hơn hàng thập kỷ so với dự đoán của nhiều người trong lĩnh vực.”

Các phát hiện đầy đủ vẫn chưa được công bố, tuy nhiên, bạn có thể xem bản tóm tắt của nghiên cứu “Dự đoán cấu trúc protein với độ chính xác cao bằng học sâu” tại đây, và tìm hiểu thêm thông tin về CASP14 tại đây.

Theo Science Alert

Tin liên quan: