摘要:Savana使用机器学习算法来识别长阅读DNA测序数据中的癌症特异性结构变化和拷贝数畸变。癌症基因组的复杂结构意味着标准分析工具会产生虚假阳性的结果,从而导致对肿瘤生物学的错误临床解释。 Savana大大减少了此类错误。 Savana提供了快速可靠的基因组分析,以更好地分析临床样本,从而为癌症的诊断和治疗干预提供了信息。...
长阅读测序技术分析了长长的连续DNA。这些方法具有提高研究人员检测癌症基因组复杂遗传改变的能力。但是,癌症基因组的复杂结构是指标准分析工具,包括专门为分析长阅读测序数据而开发的现有方法,通常会降低,从而导致虚假阳性结果和对数据的不可靠解释。这些误导的结果可能会损害我们对肿瘤如何发展,对治疗的反应以及最终如何诊断和治疗的理解。
为了应对这一挑战,研究人员开发了一种新算法Savana,他们最近在期刊上描述了该算法自然方法。Savana使用机器学习来准确识别结构变异 - 大型基因组改变,例如插入,删除,重复或重排 - 以及癌症基因组中所得的拷贝数畸变 - 使用长阅读测序数据。
拥有合适的工具很重要。例如,您可以用叉子吃汤,但结果不像使用汤匙那样有效。像勺子一样,Savana是为任务量身定制的,旨在有效地提供可靠的结果。
EMBL的欧洲生物信息学研究所(EMBL-EBI)的研究人员在99个人类肿瘤样本中开发并测试了该算法,并与伦敦大学学院(UCL)的临床合作伙伴(UCL),皇家国家(ROLTHOH)儿童(RNOH),Instito deito deo Medicine and Bosteron and botlost and Bosteron and Bosteron and Bosteron and Bosteron and Bosteron and Bosteron and Bosteron and Bosteron and botern and botern and botlotal,
Embl-Ebi的小组负责人Isidro Cortes-Ciriano说:“由于没有开发出其他分析工具来说明癌症基因组数据的特殊性,因此它们通常会发现可能导致临床和生物学解释不正确的误报。” “ Savana改变了这种情况。通过直接在癌症样品中训练算法,我们创建了一种新方法,可以判断出真正与癌症相关的基因组改变和测序工件之间的差异,从而使我们能够使用未经固定的分辨率进行长期测序的癌症来阐明突变过程。”
优化用于临床用途
“当我们开发Savana时,我们的重点很清楚:创建一种足以表征复杂癌症基因组的工具,但足以临床使用。”
EMBL-EBI的博士后研究员Carolin Sauer补充说:“因此,Savana可以准确区分体细胞结构变异,拷贝数畸变,肿瘤和倍增感 - 这都是理解肿瘤生物学和指导临床治疗决策的关键。”
它的快速分析和可靠的错误校正使Savana非常适合临床使用。该方法最近被应用于研究骨肉瘤,这是一种罕见而侵略性的骨癌,主要影响年轻人,在那里它帮助研究人员发现了新的基因组重排,从而提供了有关骨肉瘤如何发展和进步的新见解。该团队还将长阅读数据的结果与使用全基因组测序数据分析管道分析的相同样本进行了比较的结果,该样品用于提供临床报告。这些发现在整个技术中都高度一致,表明Savana与当前的临床标准相同,同时揭示了其他与癌症相关的改变。
RNOH顾问组织病理学家UCL教授Adrienne Flanagan说:“准确检测结构变异的能力是临床诊断的变化性。” “ Savana可以帮助我们自信地识别与诊断和预后相关的基因组改变。最终,这意味着我们将更加有利于为癌症患者提供个性化治疗。”
英国对临床基因组学的投资
作为NHS基因组医学服务的一部分,英国正在大量投资基因组测序技术。该计划是世界上第一个提供整个基因组测序作为常规护理的一部分的计划。通过将基因组学嵌入日常临床实践中,它旨在提高诊断准确性并支持个性化的癌症治疗。
但是,只有准确解释基因组数据,并且依赖于专门的分析工具,才能对临床基因组学进行投资。英格兰基因组学探讨了Savana作为其工作的一部分,以研究长阅读测序技术的临床潜力,以支持更早,更快地诊断癌症的临床潜力。
“使用Savana将确保临床医生获得准确,可靠的基因组数据,从而使他们能够确保将高级基因组测序方法(例如长阅读测序)纳入常规患者护理,” Genomics England Genomics R&D主管Greg Elgar说。
Savana也被部署为全国倡议的一部分,例如由英国癌症研究所资助的英国分层医学儿科项目和Cortes-Ciriano共同领导。该项目的重点是使用先进的测序技术为儿童癌症开发更有效,毒性更少的治疗方法,以更好地了解肿瘤生物学并监测疾病复发。
此外,Savana还用于社会,血统,分子和生物学分析(SAMBAI),这是一个癌症挑战的项目,旨在解决最近非洲遗产人群的癌症差异。