Nghiên cứu mới: Công cụ AI gặp khó khi dự đoán hoạt động gene trong sinh học

Các nhà khoa học tại Heidelberg đã thử nghiệm nhiều công cụ AI dự đoán hoạt động gene ở cấp độ tế bào đơn lẻ và nhận thấy các mô hình này không vượt qua được các phương pháp dự báo đơn giản. Kết quả cho thấy AI chưa đủ mạnh để nắm bắt độ phức tạp đa dạng của sinh học tế bào.

AI sinh học: Thành công và giới hạn hiện tại

AI và học máy đã đạt nhiều thành tựu như thiết kế enzyme phân giải nhựa hay protein chống nọc rắn. Tuy nhiên, việc ứng dụng AI để dự đoán hoạt động gene ở sinh vật sống vẫn là bài toán chưa có lời giải đầy đủ. Nghiên cứu mới từ Constantin Ahlmann-Eltze, Wolfgang Huber và Simon Anders tại Heidelberg đã làm rõ giới hạn này.

Cách AI dự đoán hoạt động gene

Các mô hình AI được huấn luyện trên dữ liệu hoạt động gene tại từng tế bào riêng biệt.
Foundation models cần huấn luyện thêm trước khi đảm nhận nhiệm vụ mức chuyên biệt.
AI được giao nhiệm vụ dự đoán sự thay đổi khi một hoặc hai gene bị kích hoạt hoặc loại bỏ.
Phân tích dựa trên thí nghiệm Perturb-seq: thay đổi hoạt động gene nhờ CRISPR, sau đó giải trình tự RNA từng tế bào.

Kết quả so sánh với phương pháp dự báo đơn giản

.Nghiên cứu đã dùng hai baseline: một mô hình luôn dự đoán "không thay đổi" và một mô hình đơn giản cộng gộp tác động của từng gene. Bất ngờ thay, các mô hình AI thử nghiệm đều có sai số lớn hơn so với baseline. Đặc biệt, AI hầu như không dự đoán đúng các tương tác phức tạp, như khi hiệu ứng của hai gene đồng thời bị thay đổi ảnh hưởng chéo lên nhau. Đánh giá trên các thước đo khác nhau cũng cho ra cùng kết luận: chưa có mô hình nào vượt qua giải pháp đơn giản nhất.

Thách thức phức tạp của sinh học đối với AI

Sinh học không chỉ là cấu trúc protein

Dù đạt tiến bộ ở một số nhiệm vụ, AI vẫn không theo kịp độ phức tạp của các tương tác gene trong tế bào sống. Các foundation models mới chỉ cung cấp bức tranh tổng thể, chưa thể "suy diễn" cho những thử nghiệm sinh học chưa thực hiện.

Ý nghĩa cảnh báo trong làn sóng AI hype

Kết quả này là lời nhắc rõ ràng về giới hạn hiện tại của AI, tránh kỳ vọng quá mức rằng thành công ở một số lĩnh vực đồng nghĩa với khả năng tổng quát hóa tất cả vấn đề của sinh học.

Kết quả nghiên cứu từ nhóm tác giả tại Heidelberg chỉ ra rằng AI hiện chưa đủ khả năng dự đoán phức tạp của hoạt động gene ở cấp độ tế bào. Hiện tượng này nhấn mạnh thách thức đặc thù và tính đa dạng của sinh học, đồng thời đặt ra yêu cầu đánh giá cẩn trọng khi mở rộng ứng dụng AI trong lĩnh vực này.