Giải trình tự gen là gì? Ý nghĩa và ứng dụng trong y học.

Giải trình tự gen là gì

Cấu trúc bộ gen người chứa khoảng 3,2 tỷ nucleotide, với hơn 23.500 gen mã hóa protein, được sắp xếp thành 23 cặp nhiễm sắc thể. Giải trình tự gen là kỹ thuật xác định chính xác trình tự ADN của một cá thể, giúp khám phá thông tin di truyền sâu sắc. Phương pháp này ngày càng phổ biến trong y học, hỗ trợ chẩn đoán bệnh sớm, lựa chọn điều trị cá nhân hóa và phòng ngừa hiệu quả. Hãy cùng tìm hiểu chi tiết về giải trình tự gen.

Tìm hiểu về Giải trình tự gen là gì?

Giải trình tự gen là phương pháp quan trọng trong sinh học phân tử thực hiện trong phòng thí nghiệm nhằm xác định thứ tự chính xác của các bazơ trong phân tử ADN: Adenine (A), Cytosine (C), Guanine (G) và Thymine (T).

tìm hiểu về giải trình tự gen là gì

 

ADN có cấu trúc xoắn kép do Watson và Crick phát hiện năm 1953. Hai sợi ADN liên kết với nhau theo nguyên tắc bổ sung bắt cặp:

    • A luôn liên kết với T 2 liên kết hydro
    • C luôn liên kết với G 3 liên kết hydro

Chỉ khoảng 1 đến 2% bộ gen người mã hóa protein (exon), còn lại là vùng không mã hóa (intron, promoter, enhancer, vùng lặp lại) có vai trò điều hòa biểu hiện gen, kiểm soát sao chép, sửa chữa ADN.

Bộ gen người chứa hơn 3 tỷ cặp bazơ, tương đương hơn 3 tỷ “chữ cái” trong cuốn sách hướng dẫn xây dựng và vận hành cơ thể con người.

Những bazơ này liên kết theo nguyên tắc bổ sung: A luôn bắt cặp với T, C luôn bắt cặp với G. Sự sắp xếp này tạo nên mã di truyền, quyết định cấu trúc, chức năng cơ thể và là cơ sở cho mọi quá trình sao chép ADN khi tế bào phân chia.

Bộ gen người chứa khoảng 3 tỷ cặp bazơ, giúp duy trì sự sống và phát triển. Thông qua giải trình tự gen, các nhà khoa học có thể phát hiện biến dị, đột biến gen những yếu tố gây ra nhiều bệnh lý.

Ý nghĩa của giải trình tự gen trong y học

Mục tiêu chính của giải trình tự gen là phát hiện biến dị di truyền, gen bất thường có thể gây bệnh, từ đó hỗ trợ sàng lọc, chẩn đoán và điều trị phù hợp.
Dưới đây là một số ứng dụng quan trọng:

Phát hiện sớm ung thư

Kỹ thuật này phát hiện đột biến ADN bất thường như ở gen KRAS, IDH1, UGT1A1, MGMT, giúp xác định dấu hiệu ung thư sớm. Bác sĩ có thể xây dựng phác đồ điều trị nhắm mục tiêu, tăng hiệu quả và giảm tác dụng phụ.

Chẩn đoán bệnh não và thần kinh

Các bệnh như Alzheimer, Parkinson, đa xơ cứng, u não thường liên quan đến biến dị gen PSEN1, PSEN2, APP. Giải trình tự gen giúp phát hiện sớm, can thiệp kịp thời để tránh biến chứng nặng.

Chẩn đoán bệnh di truyền

Phát hiện các đột biến gây bệnh di truyền từ thế hệ trước như G11778A, G3460A, T14484C, hoặc rối loạn trong thai kỳ. Độ chính xác cao giúp sàng lọc nguy cơ, tư vấn di truyền cho gia đình.

Xác định kháng nguyên bạch cầu HLA

Gen HLA trên nhiễm sắc thể 6 kiểm soát hệ miễn dịch. Biến dị HLA có thể dẫn đến suy giảm miễn dịch, ung thư hoặc bệnh tự miễn. Giải trình tự gen hỗ trợ phân tích, định hướng điều trị.

Xác định nhiễm virus, vi khuẩn, nấm

Phương pháp theo dõi biến thể virus (như SARS-CoV-2 gây COVID-19), giúp phát triển vaccine, thuốc và biện pháp phòng ngừa hiệu quả.

Giải trình tự gen còn cung cấp dữ liệu cá nhân hóa cho theo dõi sức khỏe gia đình, nghiên cứu phát triển thuốc mới và vaccine.

Các phương pháp giải trình tự gen phổ biến

Công nghệ giải trình tự gen đã phát triển qua nhiều thế hệ, từ các phương pháp cổ điển đòi hỏi thủ công cao đến các nền tảng hiện đại tự động hóa hoàn toàn, cho phép xử lý dữ liệu quy mô lớn với tốc độ và chi phí tối ưu. Dưới đây là các phương pháp phổ biến nhất, được sử dụng rộng rãi trong nghiên cứu, chẩn đoán lâm sàng và y học cá nhân hóa.

Các phương pháp của giải trình tự gen

Phương pháp Sanger thế hệ 1

Phương pháp Sanger, còn gọi là phương pháp dideoxy hoặc chain-termination kết thúc chuỗi, được Frederick Sanger phát minh năm 1977 và nhận giải Nobel Hóa học năm 1980. Đây là kỹ thuật giải trình tự DNA đầu tiên đạt độ tin cậy cao, từng là tiêu chuẩn vàng trong nhiều thập kỷ.

Nguyên lý hoạt động Phương pháp dựa trên việc sao chép ADN mẫu trong phản ứng tổng hợp chuỗi thường kết hợp với PCR để khuếch đại đoạn ADN mục tiêu.

Trong hỗn hợp phản ứng, người ta thêm cả các nucleotide thông thường dNTP: dATP, dCTP, dGTP, dTTP và một lượng nhỏ các dideoxynucleotide ddNTP: ddATP, ddCTP, ddGTP, ddTTP được đánh dấu huỳnh quang phiên bản mới hoặc phóng xạ là phiên bản cũ.

Phương pháp Sanger 1 giải trình tự gen

Các ddNTP thiếu nhóm hydroxyl OH ở vị trí 3′ của đường deoxyribose, nên khi một ddNTP được polymerase gắn vào chuỗi đang tổng hợp, phản ứng kéo dài chuỗi sẽ dừng lại ngay lập tức. Kết quả là tạo ra hàng loạt đoạn ADN có độ dài khác nhau, mỗi đoạn kết thúc bằng một ddNTP cụ thể.

Sau phản ứng, các đoạn này được tách theo kích thước bằng điện di mao quản, và máy đọc trình tự dựa vào tín hiệu huỳnh quang để xác định thứ tự bazơ từ ngắn đến dài.

Ưu điểm của phương pháp này là

  • Độ chính xác gần như tuyệt đối lên đến hơn 99,9%, ít lỗi thay thế hoặc chèn hayxóa.
  • Lý tưởng cho các đoạn ADN ngắn thường 500 đến 1.000 bp.
  • Vẫn được sử dụng làm Tiêu Chuẩn Vàng để xác nhận kết quả từ các phương pháp khác ví dụ: xác nhận đột biến điểm từ NGS.

Nhược điểm của phương pháp Sanger thế hệ 1

  • Chỉ đọc được đoạn ngắn, không phù hợp cho toàn bộ gen hoặc bộ gen lớn.
  • Tốc độ chậm một lần chạy chỉ xử lý vài trăm đến vài nghìn mẫu.
  • Chi phí cao hơn so với NGS khi quy mô lớn.
  • Không hiệu quả cho phân tích hàng loạt.

Ngày nay, phương pháp Sanger vẫn phổ biến trong chẩn đoán lâm sàng cho các xét nghiệm đơn gen, xác nhận biến thể, hoặc khi cần độ chính xác tuyệt đối trên đoạn nhỏ.

Phương pháp Maxam-Gilbert / Enzyme biến thể cũ

Phương pháp Maxam-Gilbert năm 1977 bởi Allan Maxam và Walter Gilbert, cũng nhận Nobel 1980 là kỹ thuật hóa học giải trình tự DNA.

Nguyên lý của phương pháp này là đoạn ADN được đánh dấu phóng xạ ở một đầu thường bằng 32P. Sau đó, ADN bị xử lý bằng các chất hóa học đặc hiệu cắt tại một hoặc hai loại bazơ. Các đoạn cắt được tách bằng điện di, và trình tự được đọc từ vị trí cắt.

Phương pháp-maxam-gilbert

Các biến thể enzyme sử dụng enzyme hạn chế hoặc enzyme cắt bazơ đặc hiệu để thay thế hóa chất.

Tình trạng hiện nay Phương pháp này phức tạp, sử dụng hóa chất độc hại, khó tự động hóa và có nguy cơ lỗi cao. Do đó, nó hiện nay hầu như không còn được sử dụng trong lâm sàng hoặc nghiên cứu quy mô lớn. Nó chỉ tồn tại trong lịch sử phát triển công nghệ và một số ứng dụng nghiên cứu cơ bản hiếm hoi.

Giải trình tự gen thế hệ mới NGS

NGS là cuộc cách mạng lớn nhất trong lĩnh vực giải trình tự gen, ra đời từ khoảng năm 2005 và trở thành công nghệ chủ đạo ngày nay. Phương pháp NGS cho phép giải trình tự hàng triệu đến hàng tỷ đoạn ADN song song, giúp giảm chi phí và thời gian đáng kể so với Sanger.

giải trình tự gen thế hệ mới NGS

Nguyên lý chung ADN được cắt thành các đoạn nhỏ, gắn adapter, khuếch đại, sau đó các đoạn được đọc đồng thời trên chip hoặc bề mặt. Mỗi nền tảng có cách đọc trình tự khác nhau: dựa trên tổng hợp, đo ion, theo dõi thời gian thực, hoặc đo thay đổi dòng điện.

Các nền tảng phổ biến nhất của phương pháp này

  • Illumina Nền tảng phổ biến nhất thế giới và tại Việt Nam.
    • Nguyên lý: Sử dụng nucleotide huỳnh quang có thể đảo ngược. Mỗi chu kỳ, một bazơ được gắn và phát sáng màu đặc trưng, máy chụp ảnh để xác định bazơ, sau đó loại bỏ chất chặn để tiếp tục.
    • Ưu điểm: Độ chính xác rất cao >99,9%, throughput lớn lên đến hàng nghìn tỷ bazơ mỗi lần chạy, chi phí thấp cho WGS. Short-read 150 đến 300 bp.
    • Ứng dụng: Toàn bộ gen, exome, panel ung thư, NIPT, sàng lọc dân số.
  • Ion Torrent
    • Nguyên lý: Đo sự thay đổi pH ion H+ khi nucleotide được gắn vào chuỗi tổng hợp. Không dùng huỳnh quang, mà dùng chip cảm biến như máy đo pH nhỏ nhất thế giới.
    • Ưu điểm: Tốc độ nhanh vài giờ trên mỗi lần chạy, chi phí thiết bị thấp, phù hợp lab nhỏ. Short – read 200 đến 400 bp.
    • Nhược điểm: Lỗi cao hơn ở vùng đồng nucleotide. Ứng dụng: Targeted sequencing, chẩn đoán nhanh, vi sinh.

giải trình tự gen phổ biến

  • PacBio SMRT Công nghệ lđọc dài.
    • Nguyên lý: Quan sát polymerase tổng hợp ADN thời gian thực trong giếng nano SMRT cell, nucleotide huỳnh quang gắn vào bazơ được phát hiện liên tục. Phiên bản HiFi có thể đạt độ chính xác >99,9%.
    • Ưu điểm: Đọc dài 10 đến 20 kb thậm chí hơn với Revio, giải quyết vùng lặp phức tạp, biến thể cấu trúc, methylation.
    • Nhược điểm: Chi phí cao hơn, throughput thấp hơn Illumina.
    • Ứng dụng: Assembly bộ gen phức tạp, phát hiện SV, bệnh di truyền.
  • Oxford Nanopore Công nghệ long read đọc dài, linh hoạt nhất.
    • Nguyên lý: ADN đơn sợi đi qua lỗ nano nanopore trong màng, thay đổi dòng điện đặc trưng cho từng bazơ được đo thời gian thực. Có thể đọc trực tiếp ADN hoặc RNA mà không cần khuếch đại.
    • Ưu điểm: Đọc siêu dài lớn hơn 1 Mb dung lượng, thiết bị cầm tay MinION, PromethION 2 Solo, phân tích thời gian thực real time, phát hiện methylation và sửa đổi bazơ tự nhiên.
    • Nhược điểm: Độ chính xác gốc thấp hơn 95 đến 99%, nhưng cải thiện liên tục với basecalling AI. Ứng dụng: Field research, theo dõi virus, metagenomics, lâm sàng khẩn cấp.

Tìm hiểu về quy trình cơ bản của Giải trình tự Gen

Bước 1 Thu thập mẫu

Đây là bước đầu tiên và rất quan trọng, vì chất lượng mẫu quyết định 80% thành công của toàn bộ quy trình.

  • Các loại mẫu phổ biến:
    • Máu ngoại vi thường 2 đến 5 ml, lấy vào ống EDTA chống đông: Dễ lấy, chứa ADN từ tế bào bạch cầu.
    • Nước bọt dùng kit chuyên dụng như Oragene: Không xâm lấn, tiện lợi cho sàng lọc cộng đồng hoặc trẻ em.
    • Mô sinh thiết khối u, mô đông lạnh, FFPE – mô cố định paraffin: Dùng cho ung thư, cần xử lý cẩn thận vì ADN dễ bị phân hủy.
    • Dịch ối hoặc máu mẹ cho xét nghiệm trước sinh: Chứa ADN thai nhi tự do cfDNA rất ít nhưng đủ để làm NIPT.
    • Các mẫu khác: Tinh trùng, tóc, nước tiểu, phân .
  • Lưu ý dễ hiểu: Mẫu phải được lấy sạch, bảo quản lạnh 4°C hoặc -20°C hoặc -80°C tùy loại, vận chuyển nhanh đến lab trong vòng 1 đến 2 ngày để ADN không bị hỏng. Nếu ADN bị phân hủy, kết quả sẽ sai lệch hoặc thất bại.

Quy trình và ứng dụng của giải trình tự gen

Bước 2 Chiết xuất và tinh sạch ADN

Mục tiêu: Lấy ra ADN “sạch” từ tế bào, loại bỏ protein, lipid, RNA, muối… để chỉ còn ADN nguyên vẹn.

  • Quy trình cơ bản:
    • Phá vỡ tế bào: Dùng hóa chất và enzyme để vỡ màng tế bào, giải phóng ADN.
    • Loại bỏ tạp chất: Dùng cột silica, từ tính hoặc phenol-chloroform để bắt ADN và rửa sạch tạp chất.
    • Kiểm tra chất lượng: Đo nồng độ, độ tinh sạch, độ nguyên vẹn.
  • Dễ hình dung: Giống như bạn rửa rau thì bạn phải loại bỏ đất cát, lá úa để chỉ giữ lại phần rau sạch. Trong trường hợp nếu còn bẩn, máy sequencing sẽ đọc sai hoặc không đọc được.
  • Thời gian: 1 đến 4 giờ, tùy vào kit chất lượng, bạn có thể tham khảo và tư vấn thêm từ Lintech JSC

Bước 3 Xây dựng thư viện ADN

Có thể nói đây là bước phức tạp nhất, chuyển đổi ADN tự nhiên thành dạng mà máy NGS có thể đọc được. Thư viện là tập hợp hàng triệu đoạn ADN nhỏ đã được chuẩn bị sẵn.

  • Các bước con chính:
    • Fragmentation cắt nhỏ ADN: Cắt ADN thành đoạn ngắn 150–500 bp phù hợp với short-read như Illumina. Cách làm: Cơ học sonication – siêu âm, enzyme tagmentation với transposase, hoặc hóa học.
    • End repair & A-tailing: Sửa đầu đoạn làm phẳng, thêm đuôi A để dễ gắn adapter.
    • Adapter ligation: Gắn adapter chuỗi DNA ngắn nhân tạo vào hai đầu mỗi đoạn. Adapter chứa:
      • Mã vạch để nhận diện nhiều mẫu cùng lúc.
      • Để máy sequencing đọc.
      • Để bám vào chip hoặc flow cell của Illumina.
    • Size selection chọn kích thước: Dùng beads hoặc gel để giữ lại đoạn có độ dài lý tưởng, loại bỏ đoạn quá ngắn hay quá dài.
  • Dễ hiểu: ADN gốc dài như sợi dây thừng hàng km. Bạn cắt thành miếng ngắn như cắt dây thành khúc 20 đến 30 cm, rồi gắn “nắp hai đầu” adapter có mã vạch và “móc treo” để máy có thể đọc và phân biệt từng khúc.
  • Thời gian: 4 đến 8 giờ, có kit tự động hóa.

Bước 4 Khuếch đại thư viện

  • Mục tiêu: Tăng số lượng đoạn ADN để có đủ lượng cho sequencing thường cần hàng ngàn đến hàng tỷ phân tử.
  • Phương pháp chính:
    • Bridge amplification Illumina: Trên flow cell, các đoạn ADN bám vào bề mặt, polymerase sao chép tạo “cụm” cluster hàng nghìn bản sao giống nhau giúp đọc đồng thời.
    • Emulsion PCR: Tạo giọt nước nhỏ chứa một phân tử + bead, khuếch đại trên bead.
    • PCR thông thường: Dùng primer để nhân bản thư viện trước khi nạp máy.
  • Lưu ý: Khuếch đại phải cẩn thận để tránh bias (một số đoạn được nhân bản nhiều hơn, dẫn đến kết quả lệch).
  • Dễ hình dung: Giống như “in photocopy” một cuốn sách, bạn cần hàng triệu bản để mọi người cùng đọc cùng lúc.

Bước 5 Sequencing trên máy NGS

  • Đây là bước đọc trình tự thực sự.
  • Máy NGS nạp thư viện vào chip/flow cell.
  • Máy đọc từng bazơ một (A, C, G, T) qua các chu kỳ:
    • Illumina: Sequencing by Synthesis, gắn nucleotide huỳnh quang, chụp ảnh màu để xác định bazơ, lặp lại hàng trăm lần.
    • Nanopore: Đo thay đổi dòng điện khi ADN đi qua lỗ nano.
  • Thời gian chạy: Từ vài giờ đến 1 tới tận 3 ngày.
  • Kết quả thô: Hàng triệu đến hàng tỷ “reads” (đoạn đọc), mỗi read là chuỗi ACGT dài 100–300 bp Đọc ngắn hoặc hàng chục kb Đọc dài.

Bước 6 Phân tích dữ liệu sinh tin học

Đây là “bộ não” của phương pháp để giúp biến dữ liệu thô thành thông tin hữu ích.

  • Các bước chính:
    • Quality control: Kiểm tra chất lượng reads, loại bỏ reads kém.
    • Mapping hay Alignment: So sánh reads với bộ gen tham chiếu để tìm vị trí từng đoạn.
    • Variant calling: Phát hiện biến thể dùng GATK, FreeBayes, DeepVariant.
    • Annotation: Gắn thông tin chức năng cho biến thể: nằm ở gen nào, gây hại không, liên quan bệnh gì.
    • Diễn giải lâm sàng: Bác sĩ di truyền đọc báo cáo, kết hợp triệu chứng để chẩn đoán.
  • Dễ hiểu: Dữ liệu thô giống như hàng tỷ mảnh ghép tranh. Ghép tranh lại, tô màu, ghi chú để bạn thấy bức tranh hoàn chỉnh bộ gen của bạn có gì bất thường.

Ý nghĩa và ứng dụng của giải trình tự gen trong y học

Giải trình tự gen, đặc biệt với công nghệ thế hệ mới NGS, đã trở thành một trong những công cụ quan trọng nhất của y học hiện đại. Phương pháp này cho phép đọc và phân tích toàn bộ hoặc một phần thông tin di truyền của cá nhân, từ đó hỗ trợ chẩn đoán chính xác, điều trị cá nhân hóa, phát hiện sớm bệnh tật, phòng ngừa và theo dõi hiệu quả. Dưới đây là các ứng dụng chính, được trình bày rõ ràng theo mức độ phổ biến và tầm quan trọng trong thực hành lâm sàng hiện nay.

Phát hiện sớm và điều trị ung thư chính xác Giải trình tự gen giúp xác định các đột biến driver những thay đổi gen then chốt thúc đẩy sự phát triển của ung thư. Các gen thường được phát hiện bao gồm trong ung thư phổi, đại trực tràng, u não, ung thư máu, ung thư vú, buồng trứng,….

Chẩn đoán bệnh não, thần kinh Nhiều rối loạn thần kinh có nền tảng di truyền rõ ràng. Giải trình tự gen hỗ trợ phát hiện sớm các đột biến.

Kết quả giúp chẩn đoán xác định, tư vấn di truyền cho gia đình, dự đoán tiến triển bệnh và tham gia thử nghiệm thuốc mới.

Ý nghĩa và ứng dụng của giải trình tự gen

Chẩn đoán bệnh di truyền và dị tật bẩm sinh Giải trình tự gen là công cụ vàng để phát hiện các rối loạn di truyền từ đơn gen đến lệch bội nhiễm sắc thể.

Ứng dụng giúp chẩn đoán bệnh hiếm, tư vấn nguy cơ cho thế hệ sau và hỗ trợ lập kế hoạch sinh sản.

Sàng lọc trước sinh không xâm lấn NIPT phân tích ADN tự do của thai nhi  trong máu mẹ, không cần chọc ối nên an toàn hơn các phương pháp truyền thống.

Xác định kháng nguyên bạch cầu Gen HLA nằm trên nhiễm sắc thể 6, kiểm soát phản ứng miễn dịch.

Theo dõi biến chủng virus, vi khuẩn, nấm Giải trình tự toàn bộ gen.

Tại Việt Nam, công nghệ này đã được sử dụng rộng rãi trong đại dịch COVID-19 và giám sát bệnh truyền nhiễm.

Dược gen học Giải trình tự gen dự đoán phản ứng cá nhân hóa với thuốc, giúp điều chỉnh liều lượng và tránh tác dụng phụ nghiêm trọng.

Ứng dụng này đang ngày càng phổ biến trong điều trị tim mạch, ung thư và rối loạn tâm thần.

ý nghĩa thực tế của giải trình tự gen

Tầm soát ung thư đa cơ quan bằng máu Phân tích ADN khối u lưu hành trong máu để phát hiện sớm ung thư trước khi có triệu chứng.

Xác định huyết thống, pháp y và nhân chủng học

Sàng lọc người mang gen bệnh thể ẩn Trước khi kết hôn hoặc sinh con, kiểm tra người mang gen lặn để đánh giá nguy cơ con mắc bệnh di truyền.

Nhiều gói NIPT hiện nay đã tích hợp carrier screening cho hàng trăm gen bệnh phổ biến ở người Việt, giúp các cặp đôi lập kế hoạch sinh sản an toàn.

Giải trình tự gen đã và đang thay đổi hoàn toàn cách chúng ta chẩn đoán, điều trị và phòng ngừa bệnh tật. Với sự phát triển không ngừng của công nghệ NGS, long-read sequencing và trí tuệ nhân tạo, phương pháp này ngày càng trở nên dễ tiếp cận, chính xác và hữu ích hơn.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *