Những nỗ lực nghiên cứu giai đoạn đầu của đại dịch coronavirus đã nhận được sự trợ giúp đáng ngạc nhiên khi một nhà sinh vật học ở Mỹ 'khai quật' được một phần trình tự gen SARS-CoV-2 nguyên sơ lấy được từ nơi có khả năng cao là tâm chấn của đại dịch - Vũ Hán, Trung Quốc.
Một phần của trình tự gen này giúp giải quyết câu hỏi hóc búa về sự đa dạng di truyền của SARS-CoV-2, mặc dù các nhà khoa học nhấn mạnh rằng nó không làm sáng tỏ nguồn gốc của virus. Nature cũng không rõ lý do tại sao các nhà nghiên cứu tại Đại học Vũ Hán sau đó đã yêu cầu xóa các trình tự gen khỏi Kho lưu trữ đọc trình tự gen (SRA), được duy trì bởi Trung tâm Thông tin Công nghệ Sinh học Quốc gia (NCBI), một phần của Viện sức khỏe quốc gia Mỹ (NIH).
Jesse Bloom, nhà di truyền học tiến hóa tại Trung tâm Nghiên cứu Ung thư Fred Hutchinson ở Seattle, Washington đã phát hiện ra trình tự gen này khi tìm kiếm dữ liệu bộ gen giai đoạn đầu của đại dịch. Một bài báo nghiên cứu từ tháng 5/2020 chứa một bảng dữ liệu trình tự gen công khai, gồm các mục mà Bloom nói ông chưa từng xem qua. Các trình tự gen được liên kết với một bài báo, ứng dụng một công nghệ được gọi là giải trình tự gen dựa trên lỗ nano để phát hiện vật liệu di truyền SARS-CoV-2 trong các mẫu từ người. Nghiên cứu đó được xuất bản trên tạp chí chuyên ngành bioRxiv vào tháng 3/2020, rồi 3 tháng sau đó lại được in trên tạp chí chuyên ngành Small.
Khi Bloom tìm kiếm các trình tự gen trong SRA bằng cách sử dụng các chi tiết được liệt kê trong bài báo tháng 5/2020, cơ sở dữ liệu không trả về thông tin về bất kỳ mục nào sẵn có. SRA lưu giữ các trình tự gen trong bộ nhớ đám mây do Google quản lý và Bloom tự hỏi liệu ông có thể tìm thấy phiên bản lưu trữ gốc trên máy chủ của hệ thống lưu trữ đám mây hay không. Cách tiếp cận này đã giúp Bloom khôi phục dữ liệu từ 50 mẫu, 13 trong số đó chứa đủ dữ liệu thô để tạo ra một phần trình tự bộ gen.
SARS-CoV-2 đến từ chợ thủy sản Hoa Nam?
Bloom cho biết các trình tự gen giúp giải đáp một bí ẩn tiến hóa về giai đoạn đầu của đại dịch. Các chuỗi virus sớm nhất ở Vũ Hán là từ các cá nhân có liên quan đến chợ hải sản Hoa Nam vào tháng 12/2019, nơi được cho là xuất phát điểm coronavirus chuyển từ động vật sang người. Nhưng các chuỗi gen ghi nhận được ở chợ này lại có liên quan xa hơn với họ hàng gần nhất của SARS-CoV-2 ở dơi - nguồn gốc được cho là cuối cùng của coronavirus - hơn là các chuỗi gen ghi nhận sau này, bao gồm cả mẫu được thu thập ở Mỹ.
Bloom cho biết điều đó thật đáng ngạc nhiên, bởi mọi người đều cho rằng virus SARS-CoV-2 từ giai đoạn đầu của dịch bệnh ở Vũ Hán liên quan chặt chẽ nhất đến họ hàng coronavirus ở dơi. Các trình tự gen được Bloom phục hồi, có thể được thu thập vào tháng 1-2/2020, cho thấy đúng như vậy: Chúng có liên quan mật thiết đến virus có ở dơi hơn là từ những người liên quan đến chợ thủy sản.
Một phần hình ảnh từ trình tự bộ gen SARS-CoV-2 do Nature cung cấp |
"Điều này góp thêm vào các bằng chứng, gồm báo cáo về các trường hợp đầu tiên xảy ra từ tháng11/2019, rằng các trường hợp Covid-19 đầu tiên ở người không liên quan đến chợ hải sản Hoa Nam" - Bloom và các nhà khoa học khác cho biết.
Sudhir Kumar, nhà di truyền học tiến hóa tại Đại học Temple ở Philadelphia, Pennsylvania, cho biết: “Dường như chợ Vũ Hán là một trong những sự kiện siêu lây nhiễm đầu tiên, nhưng các trình tự gen mà Bloom phục hồi cho thấy SARS-CoV-2 đã phát triển sâu rộng trong giai đoạn đầu của đại dịch ở Trung Quốc - bao gồm cả ở Vũ Hán".
Stephen Goldstein, nhà virus học tại Đại học Utah ở Thành phố Salt Lake, chỉ ra rằng các trình tự gen mà Bloom phục hồi không hề bị che giấu: chúng được mô tả chi tiết, với đủ thông tin trình tự gen để biết mối quan hệ tiến hóa của chúng với các chuỗi SARS-CoV-2 ban đầu khác, trên tạp chí Small. Goldstein nói: “Tôi không nghĩ thông tin này cho chúng ta biết nhiều điều mới mẻ, nhưng nó mang đến dữ liệu các trình tự gen nguyên sơ đã được công bố công khai, mặc dù vẫn còn nhiều nghi ngờ về tính nguyên sơ".
Bloom nói rằng mặc dù các trình tự gen đã được công bố, việc loại bỏ chúng khỏi SRA có nghĩa là ít nhà khoa học biết về chúng. Một báo cáo do Tổ chức Y tế Thế giới (WHO) ủy quyền về nguồn gốc của đại dịch đã không hề có thông tin về các trình tự gen trong phân tích tiến hóa của dữ liệu SARS-CoV-2 ban đầu. “Không ai nhận thấy chúng tồn tại,” Bloom khẳng định.
Các tác giả của bài báo khoa học trên tạp chí Small đã không trả lời các câu hỏi từ Nature về lý do họ yêu cầu xóa các trình tự gen khỏi SRA. Nhưng trong một tuyên bố, NIH cho biết họ đã xóa dữ liệu theo yêu cầu của các nhà nghiên cứu, và NIH cho biết họ có kế hoạch gửi chúng đến một nền tảng cơ sở dữ liệu khác.
Bloom - đồng tác giả một lá thư kêu gọi một cuộc điều tra mới về nguồn gốc của đại dịch, bao gồm khả năng virus thoát ra hoặc bị rò rỉ từ phòng thí nghiệm - cho biết nghiên cứu của ông không làm sáng tỏ nguồn gốc của đại dịch, cũng như lý do tại sao trình tự gen đã bị loại bỏ.
Tuy nhiên, ông hy vọng những nỗ lực ấy sẽ khuyến khích các nhà nghiên cứu “suy nghĩ thấu đáo” và tìm đến các nguồn khác, chẳng hạn như dữ liệu lưu trữ gốc, để thu thập thêm thông tin từ những ngày đầu của đại dịch.