■ NGS序列难以被恢复成完整基因组
NGS测序读长较短导至部分位点信息缺失。利用NGS测序时,待测DNA序列被随机地打断成较短的等长序列片段(<150bp),并被制作成单片段模板(Fragment Templates)或双片段模板(Mate-Pair or Pair-end Templates)。由于测序过程需多次重复以保证整个基因组序列被多次测序,所以制作好的模板被固定在球形支撑物上,通过Emulsion PCR方法进行扩增,每个碱基平均被覆盖的次数称为测序覆盖深度(Sequencing Coverage Depth)。最后,对上百万个模板进行并行测序。
通过NGS得到的短序列无法提供基因组上关于SV、CNV的具体信息,导至肿瘤诊断与治疗、遗传病风险评估和辅助生殖等领域部分应用受限。分析测序数据时,需要根据序列片段与参照基因组的相似度,将测得序列定位到基因组染色体对应位置。这样带来两个问题:(1)待测基因组与参照基因组来自不同个体,二者基因组存在差异,恢复待测基因组时导至误差;(2)当待测样本发生大范围的碱基突变时,如SV、CNV等,突变序列片段无法被定为回基因组,而这些信息恰恰对分析疾病与基因组的关系至关重要。
图21. 将NGS序列恢复为完整基因组过程中导至的部分信息缺失
图22. 随着三、四代测序技术的发展,基因组样本量需求降低,解读能力增强
|