13:25 16/12/2021

Người Việt có bộ dữ liệu giải mã toàn hệ gen đầu tiên

Nhĩ Anh

Với quy mô hơn 1.000 hệ gen được giải trình tự, hơn 40 triệu biến thể di truyền được phát hiện, nghiên cứu tạo bộ cơ sở dữ liệu quý cho cộng đồng, mở ra chương mới trong lĩnh vực chăm sóc sức khỏe, tạo tiền đề cho sự phát triển của nghiên cứu y sinh và y học chính xác, góp phần cảnh báo điều trị sớm đến từng cá nhân người Việt trong tương lai...

Dữ liệu hệ gen của người Việt được xử lý bằng những công nghệ hiện đại
Dữ liệu hệ gen của người Việt được xử lý bằng những công nghệ hiện đại

Ngày 16/12/2021, Viện Nghiên cứu Dữ liệu lớn VinBigData công bố đã hoàn thiện Dự án “Xây dựng cơ sở dữ liệu biến dị di truyền cho quần thể người Việt”. Đây là bộ dữ liệu toàn hệ gen người Việt đầu tiên đảm bảo tính đại diện và phổ quát cho quần thể, phù hợp với phân bố dân cư về địa lý và giới tính. Đặc biệt, bộ dữ liệu gen có đầy đủ chú giải về chức năng sinh học cũng như nguy cơ bệnh lý…

GS.Vũ Hà Văn, Nhà sáng lập, Giám đốc Khoa học VinBigData cho biết, phần lớn các nghiên cứu và thực hành lâm sàng tại Việt Nam đang dựa vào cơ sở dữ liệu di truyền của các quần thể khác trên thế giới. Điều này ảnh hưởng đến kết quả của công bố khoa học cũng như chất lượng khám chữa bệnh trên người Việt. Với tiền đề là cơ sở dữ liệu biến dị di truyền dành riêng cho người Việt, VinBigData kỳ vọng sẽ góp phần phát triển y học chính xác tại Việt Nam, mở ra chương mới trong lĩnh vực chăm sóc sức khỏe.

Tại Việt Nam trước đây, các bác sĩ thường sử dụng mô hình chữa bệnh “một liệu pháp cho nhiều người”, có nghĩa là áp dụng cùng một phương pháp, cùng một loại thuốc, cùng một liều lượng để điều trị cho nhiều bệnh nhân khi mắc cùng một bệnh. Tuy nhiên, đã đến lúc cần thay đổi tư duy và bắt kịp mô hình y học chính xác trên thế giới, bằng những liệu pháp được điều chỉnh phù hợp với từng nhóm cá thể, nhằm gia tăng hiệu quả chữa trị bệnh. “Điều kiện để y học chính xác đi đến thành công là mỗi quốc gia cần có cơ sở dữ liệu biến dị di truyền đặc trưng cho quần thể, được xây dựng dựa trên nền tảng nghiên cứu chặt chẽ, chính xác với quy mô lớn”, ông Văn nói.

Với tổng mức đầu tư hơn 4,5 triệu USD, dự án giải mã gen này được đánh giá có quy mô lớn nhất Việt Nam tính đến nay. Dự án khởi động từ tháng 12/2018 với sự tham gia của hơn 40 nhà khoa học, các chuyên gia tư vấn cao cấp từ các đơn vị nghiên cứu hàng đầu như Đại học Harvard, Đại học Chicago, Trung tâm Ung thư MD Anderson...

 
Đã đến lúc chúng ta cần thay đổi tư duy và bắt kịp mô hình y học chính xác trên thế giới, bằng những liệu pháp được điều chỉnh phù hợp với từng nhóm cá thể, nhằm gia tăng hiệu quả chữa trị cho người bệnh. Điều kiện để y học chính xác đi đến thành công là mỗi quốc gia cần có cơ sở dữ liệu biến dị di truyền đặc trưng cho quần thể, được xây dựng dựa trên nền tảng nghiên cứu chặt chẽ, chính xác với quy mô lớn.

Trong 3 năm, nhóm nghiên cứu đã giải trình tự toàn bộ hệ gen của hơn 1.000 người trưởng thành khỏe mạnh, từ 35-55 tuổi, không có quan hệ huyết thống và có đủ thông tin kiểu hình và nhân khẩu học; phân tích một phần hệ gen hơn 4.000 trường hợp liên quan đến các bệnh lý phổ biến và khả năng đáp ứng thuốc. Kết quả phát hiện hơn 40 triệu biến thể di truyền, trong đó có gần 2 triệu biến thể gen phổ biến đặc trưng cho quần thể người Việt.

Quy trình phân tích dữ liệu gen và chú giải biến thể gen được đánh giá là tiên tiến hàng đầu thế giới. Khối lượng dữ liệu khổng lồ được xử lý bằng công nghệ hiện đại của Google, Illumina (hãng công nghệ hàng đầu thế giới về giải trình tự gen) và NVIDIA.

Kết quả dự án sẽ được ứng dụng trực tiếp vào các sản phẩm giải mã gen, với độ chính xác và tốc độ vượt trội, dành riêng cho người Việt. Nghiên cứu sẽ tạo tiền đề hỗ trợ khám phá đặc điểm sinh lý- tâm lý của cá nhân, cũng như dự đoán nguy cơ mắc bệnh phổ biến, bệnh di truyền lặn, đánh giá mức độ đáp ứng thuốc trong tương lai.

Sau khi hoàn tất, một phần dữ liệu của dự án đã được mở để cộng đồng truy cập thông qua Hệ thống quản lý, phân tích và chia sẻ dữ liệu y sinh (MASH Portal). Giới nghiên cứu y sinh Việt Nam có thể phát triển những ứng dụng phân tích gen chính xác hơn, nhạy hơn, thúc đẩy y học dự phòng, giảm thiểu gánh nặng y tế và chi phí chăm sóc sức khỏe cho cộng đồng.

Người Việt có bộ dữ liệu giải mã toàn hệ gen đầu tiên - Ảnh 1

Đánh giá về ý nghĩa của nghiên cứu, GS.TS. Tạ Thành Văn, Chủ tịch Hội đồng Trường Đại học Y Hà Nội cho biết, hiện nay, các bác sĩ chủ yếu dựa vào lâm sàng, xét nghiệm sinh hóa hoặc tiền sử bệnh để thăm khám và ra quyết định điều trị. Nếu có thêm dữ liệu hệ gen, sẽ là một thông tin giàu giá trị, giúp gia tăng tính chính xác cũng như hiệu quả chẩn đoán, điều trị bệnh. Cơ sở dữ liệu hệ gen người Việt được kỳ vọng sẽ là tiền đề thúc đẩy sự phát triển của y học dự phòng và thực hành y học chính xác, từ đó góp phần cải thiện sức khỏe cộng đồng.

Theo Thứ trưởng Bộ Khoa học và Công nghệ Bùi Thế Duy, đây là đóng góp thiết thực cho những nghiên cứu về y học, trí tuệ nhân tạo (AI) và dữ liệu lớn ở Việt Nam. Sự tham gia vào cuộc của VinBigData, những đơn vị tư nhân trong hình thành những cơ sở dữ liệu nghiên cứu lớn sẽ đóng góp cho cộng đồng nghiên cứu khoa học Việt Nam. Đây cũng là một phần trong kế hoạch hợp tác giữa Bộ Khoa học và Công nghệ và VinBigData để thiết lập nhiều hơn các bộ dữ liệu khoa học, từ đó thúc đẩy nghiên cứu, hướng tới độ chính xác cao hơn trong các lĩnh vực.

Ông Duy mong muốn sự khởi đầu này sẽ thu hút thêm các đơn vị, viện nghiên cứu, tập đoàn cùng phát triển thêm nhiều bộ dữ liệu để thúc đẩy phát triển khoa học công nghệ Việt Nam nhanh hơn, không chỉ là các bài báo lý thuyết mà cả các kết quả nghiên cứu thực tiễn, giải quyết các bài toán của Việt Nam.