内源性突变过程的识别和表征改变了我们对癌症基因组的理解,改善了基因组不稳定性癌症的预后和治疗分层。然而,突变过程通常是从大量全基因组测序(WGS)中推断出来的,它从数百万个细胞组成的DNA池中产生聚集信号。因此,由于基因组不稳定性而导致的同时期有丝**后细胞间的变异在批量测序中无法检测到,并且一直没有得到充分的研究。
但如果宿主细胞幸运的话,病毒也许只是暂时安顿在这个舒适的前哨——要么处于休眠状态,要么将它的小基因组反向整合到宿主的基因组中——然后等待时机。
根据我和我同事最近发表的新研究,位于我们基因组中的病毒DNA序列(即那些在古代病毒大流行之后仍残留在基因组中的部分)可能仍然活跃在如今的健康人群之中。
测序覆盖度:指测序获得的序列占整个基因组的比例。由于基因组中的高GC、重复序列等复杂结构的存在,测序最终拼接组装获得的序列往往无法覆盖有所的区域,这部分没有获得的区域就称为Gap。例如一个细菌基因组测序,覆盖度是98%,那么还有2%的序列区域是没有通过测序获得的。
作者从权威数据库中收集全基因组测序数据,共获得来自2509位病人的2622个癌症基因组,涵盖29种不同癌症类型。作者对每种类型癌症分别进行分析,使用EHdn方法检测短读长测序数据中超过测序读长长度的TR序列【4】。EHdn法使用非参数的统计测试进行病例对照,以确定肿瘤基因组中的重复长度是否超过常规基因组中的长度,该方法类似于联合群体水平的基因分型。
9.6