“揭开新病毒的一把钥匙” 第一作者、博士后研究人员David Paez-Espino解释,这涉及采用了一种非针对性的宏基因组学方法,参考了分离病毒和手动监管的病毒蛋白模型,他将其描述为是“迄今为止最大、最多样的数据集”。 研究小组分析了从DOE JGI综合微生物基因组与微生物组样品(Integrated Microbial Genomes with Microbiome Samples)数据管理和分析系统获得的,来自10个不同类型生境、世界各地3,042个样本的超过5万亿碱基(Tb)的序列。他们努力筛查大堆的数据集,生成了包含279万个蛋白的125,000多个病毒序列。 研究小组将病毒序列与多个生境中的多个样本进行了匹配。例如,他们发现一个病毒组存在于海洋过渡区95%的样本中——这一区域定位在海面下200-1,000米之间,在没有充足的阳光照射供微生物进行光合作用。 通过分析一个CRISPR-Cas系统,研究人员生成了一个包含350万间隔序列(spacer sequence)的数据库。然后利用这些间隔序列检测了病毒和噬菌体宏基因组,寻找这些片段有可能最初来自何处。利用这种方法,该研究小组还计算确定了近10,000种病毒的宿主。他们报告说:“大多数的这些联系都是从前未知的,包括在以往未发现病毒的16个原核生物类群中鉴别出了充当病毒宿主的生物。”
|