4 / 2026-01-16 09:25:40
基因组学算法开发与应用
基因组组装,泛基因组,算法
摘要待审
潘玮华 / 中国农业科学院深圳农业基因组研究所
     高质量的基因组组装是系统解析生物遗传信息结构与功能的基础,对理解生命过程、遗传变异及其生物学意义具有重要支撑作用。近年来,测序技术的进步大幅提高了真核生物基因组的组装质量,大量物种的端到端级别参考基因组和染色体级别泛基因组被成功构建。然而,基因组复杂区域的组装需要高覆盖度多类型测序数据,并辅以大量人工操作,其高测序价格和高工作量严重限制了大规模端到端群体基因组的组装。大量多倍体物种仍然难以产生高质量分型组装结果。此外,组装完成之后,包含大量复杂重复序列的端到端级别基因组的质量评估,以及关键复杂区域的识别、分析等方面还缺乏有效的算法工具。这些问题严重限制了包含各种复杂基因组和复杂区域的大规模群体基因组的高质量构建、评估和分析。申请人针对这些领域内的痛点,开发了一系列创新性方法:1)开发了基于参考指引的复杂基因组区域组装算法TRFill(Genome Biology,2025,最后通讯)和人工空当填补交互式辅助工具Gap-Aid和Gap-Graph(Advanced Science,2026,最后通讯),大幅降低复杂区域组装所需的测序代价和工作量,并应用这些工具的初始版本完成了首个包含全部复杂区域的水稻端到端参考基因组构建(Molecular Plant,2023,共通讯);2)基于Hi-C和组装图信息,开发了多倍体基因组分型组装算法GPhase,将组装的序列缺失率和错误率分别降低数十倍和一个数量级(Nature Plants返修,最后通讯),并应用其完成了首个月季亚属泛基因组构建(Nature Genetics原则接收,最后通讯);3)开发了基于特异性字串的组装结果评估方法(Genome Research,2024,最后通讯)和整合多种信息的着丝粒识别算法CentIER(Plant Communications,2024,最后通讯),为高质量基因组的评估和着丝粒识别提供了可行的解决方案。
重要日期
  • 会议日期

    03月27日

    2026

    03月29日

    2026

主办单位
中国生物信息学会基因组信息学专业委员会
承办单位
西湖大学
联系方式
  • 谭向宇
  • 159*********
移动端
在手机上打开
小程序
打开微信小程序
客服
扫码或点此咨询