新工具可快速分析冠状病毒序列并追踪变体
全球科学家使用基因组测序来追踪SARS-CoV-2病毒新变种的传播,冠状病毒基因组序列的快速积累为追踪全球和地方的传播动态提供了新的机会,但分析如此多的基因组数据是具有挑战性的。现在有超过一百万的SARS-CoV-2的基因组序列。
冠状病毒基因组序列的绝对数量及其快速积累使得很难将新序列放置在“家族树”上,以显示它们之间的关系。但是,加州大学圣克鲁斯分校基因组学研究所的Corbett-Detig研究小组开发了一种新方法,以前所未有的速度实现了这一目标。在5月10日发表于《自然遗传学》上的一篇论文中对这种功能强大的工具进行了描述,该工具称为“在现有树上放置超快样本”(UShER)。

UShER通过将用户新测序的病毒基因组和所有已知的SARS-CoV-2病毒基因组添加到现有的系统发育树中来鉴定它们之间的关系,该分支树就像家族树一样,显示了该病毒在积累时如何在不同谱系中进化突变。
研究人员能够维护超过120万个冠状病毒序列的综合系统树,并实时更新新序列。没有其他工具能够以可比的效率处理这种规模的树。
这种序列分析可用于发现新的病毒株,并追踪其进化和传播动态。它也可以用于识别冠状病毒感染的个别病例之间的联系并追踪传播链,这种方法被称为基因组接触追踪。
方法比其他方法快了几个数量级,将新样本的放置时间降低了十分之一秒。
UShER和相关的数据可视化工具可通过UCSC SARS-CoV-2基因组浏览器提供给研究团体,该浏览器还提供对正在进行的病毒科学研究的广泛数据和结果的访问权限,包括特别关注的新变体。
它包括了世界上最全面的系统进化树,涵盖了该病毒的不同谱系,并且该树每星期都会以新数据出现的速度增长。
像所有病毒一样,SARS-CoV-2在复制和传播时也会获得突变。这些基因组序列中的大多数随机变异对病毒的行为没有影响,但是研究人员仍然可以使用它们来识别病毒的不同变异或毒株,了解它们之间的关系,并确定两个样本是否属于病毒的一部分。
科学家已经鉴定出一些重要的突变,这些突变似乎使该病毒更具感染力。具有这些突变的SARS-CoV-2变异体比其他变异体传播得更快。
已经开始使用UShER研究一种新变种,这种变种已经在印度出现,并且似乎正在印度迅速传播。被称为B.1.617的这种病毒谱系具有两个可能引起科学家关注的突变。
常规方法每次添加新序列都必须重新计算整个树,而当存在成千上万个序列时,这将非常耗时。UShER几乎立即将样本放置到现有的全局系统发育中,并且它提供了所添加样本及其最近邻居的局部子树,以便可以直观地查看和详细检查它们之间的关系。获取更多前沿科技 研究访问:https://byteclicks.com
用户可以通过UCSC基因组浏览器(https://genome.ucsc.edu/cgi-bin/hgPhyloPlace)使用UShER 。https://github.com/yatisht/usher上提供了有关如何编译和运行UShER的源代码和详细说明。用于统计分析和生成数字的代码可从https://github.com/bpt26/USHER_ANALYSES 获得。