• 首页
  • 实验室概况
    • 实验室介绍
    • 实验室管理
    • 学术委员会
    • 实验室组成
    • 规章制度
  • 科学研究
    • 研究方向
    • 研究进展
    • 学术论文
    • 科研项目
  • 研究队伍
    • 序列分析
    • 生物网络分析
    • 医学影像分析
    • 生物数据挖掘
  • 研究生教育
    • 招生指南
    • 导师信息
    • 活动展示
  • 合作交流
    • 学术会议
    • 学术报告
  • 开放课题
    • 通知
    • 申请指南
    • 管理办法
    • 经费细则
    • 申请表格
  • 新闻中心
    • 资讯动态
    • 新闻公告
  • 开源软件
  • 联系我们
当前位置: 首页 >> 科学研究 >> 研究进展 >> 正文

生物信息学湖南省重点实验室主任王建新教授团队在二倍体组装研究中取得重要进展

2024年04月09日 15:43  点击:[]

    本网讯 4月5日,国际权威期刊Nature Communications在线发表了中南大学计算学院、生物信息学湖南省重点实验室主任王建新教授团队和美国克莱姆森大学罗峰教授、中山大学中山眼科中心肖传乐副研究员合作的最新研究成果“De novo diploid genome assembly using long noisy reads”。该论文提出了基于第三代测序数据的二倍体组装新方法。中南大学计算机学院聂藩、倪鹏为论文共同第一作者,中南大学计算机学院王建新教授为论文共同通讯作者,中南大学为第一署名单位。本研究受国家重点研发计划、国家自然科学基金、湘江实验室科研项目等多个项目支持。

 

第三代测序技术(牛津纳米孔测序和PacBio单分子实时测序)的迅速发展产生了更长和更准确的读数,给基因组组装研究带来了新的机遇和挑战。对于二倍体组装来说,第三代读数依然含有较高的测序错误,组装算法很难将测序错误与单倍型差异信息区分,从而生成单倍型混合的组装结果,其含有大量的单倍型切换错误, 并且丢失了很大一部分遗传信息。

针对这一局限,王建新教授团队等在近日发表于 Nature Communications 的研究论文中,通过深入分析第三代长读数携带测序错误与单倍型差异特性的区别,提出了保留单倍型差异信息的长读数纠错算法,避免单倍型差异信息被当成测序错误被移除,保证了单倍型差异信息的一致性,其纠错读数的单倍型一致性可达到99.4%。在此基础上设计了基于局部单倍型聚类的二倍体组装算法,在第一轮组装中实现单倍型混合的组装结果。在第二轮组装中,将读数比对到混合组装结果上,识别读数携带的SNP信息,通过局部聚类方式识别单倍型不一致的重叠关系,过滤不一致的重叠关系再次组装实现单倍型组装结果。在多个测试数据上,PECAT获得更连续的单倍型组装结果。其中,在纳米孔R9的公牛数据上,PECAT实现了单倍型几乎解决的组装结果。而在纳米孔R10的HG002上,PECAT实现了phase block NG50为59.4/58.0Mb 的组装结果。

 

PECAT组装算法框架图

 

上一条:RedNano: 基于纳米孔测序信号和碱基识别特征的RNA m6A检测计算方法
下一条:DISHyper: 基于超图神经网络整合注释基因集识别癌症基因

【关闭】

版权所有 生物信息学湖南省重点实验室 Copyright ©2020 http://bio.csu.edu.cn/

湖南省长沙市岳麓区麓山南路932号, 410083 电话/传真:(0731)- 88830212 电子邮件:hunan_bio@csu.edu.cn