近日,西北农林科技大学姜雨锻真金不怕火团队在基因组结构变异(Structural Variations,SVs)准确分型的究诘领域获得遑急破损。最新恶果以《SVLearn: a dual-reference machine learning approach enables accurate cross-species genotyping of structural variants》为题,在外洋期刊Nature Communications上在线发表。西北农林科技大学博士究诘生杨发蒙、牛津大学博士后孙鉴锋为该论文共同第一作家,西北农林科技大学姜雨锻真金不怕火和蔡钰东博士后为共同通信作家。西北农林科技大学信息学院刘全中副锻真金不怕火,德国亥姆霍兹究诘中心汝锦龙博士后参与联系究诘使命。
姜雨锻真金不怕火团队恒久死力于于基因组结构变异(Structural variations,SVs)联系究诘。曾开辟了可在动植物大群体中快速检测基因组拷贝数变异的软件CNVcaller。连年来,跟着越来越多高质料结构变异数据集的产生,大畛域群体究诘大量禁受短读长测序数据进行结构变异基因分型。但是,受限于短读长和参考序列的偏差,结构变异的分型准确度仍然面对挑战。
为有用处分这一问题,团队转换性地提议了基于双参考基因组的机器学习计谋,开辟出SVLearn软件。该用具通过同期使用原始参考基因组和包含变异序列的替代基因组,全面整合了基因组特征、比对特征和基因型特征,差异在东谈主、牛、绵羊数据麇聚会诞生了高精度的结构变异机器学习分型模子。
究诘团队讹诈三个物种共六个高质料结构变异数据集,对SVLearn与四种外洋主流用具进行了全面的性能评估。适度败露,SVLearn合座性能发扬存5%-10%以上的提高,将最终分型准确率提高到90%左右,AG百家乐有什么窍门在复杂的基因组通常区域,结构变异的分型准确性提高尤为显赫。值得谨防的是,针对测序深度较低的数据,团队荒芜进行了模子优化,使得SVLearn在低袒护度下也曾能保合手与30倍测序深度异常的分型效果,大大提高了大畛域结构变异究诘的经济性和可行性。此外,通过跨物种交叉考证,进一步说明了该用具的普适性,标明其在不同物种中具有较强的基因分型智商。这一转换体式的提议,为结构变异究诘提供了全新的分析用具,并有望激动东谈主类疾病究诘、动植物育种等领域的快速发展。
本究诘得到国度重心研发诡计(2023YFD1300402,2022YFF1000100)、国度当然科学基金(U21A20120)、陕西省畜禽育种双链会通重心花样(2022GD-TSLD-46-0401)的资助。感谢西北农林科技大学高性能规画平台提供规画资源。
论文同一:
https://www.nature.com/articles/s41467-025-57756-z
姜雨,1983年生,男,二级锻真金不怕火,博导。西北农林科技大学动物科技学院院长,农业农村部畜禽资源评价讹诈重心履行室主任。
起原:西北农林科技大学