• 首页
  • 实验室概况
    • 实验室介绍
    • 实验室管理
    • 学术委员会
    • 实验室组成
    • 规章制度
  • 科学研究
    • 研究方向
    • 研究进展
    • 学术论文
    • 科研项目
  • 研究队伍
    • 序列分析
    • 生物网络分析
    • 医学影像分析
    • 生物数据挖掘
  • 研究生教育
    • 招生指南
    • 导师信息
    • 活动展示
  • 合作交流
    • 学术会议
    • 学术报告
  • 开放课题
    • 通知
    • 申请指南
    • 管理办法
    • 经费细则
    • 申请表格
  • 新闻中心
    • 资讯动态
    • 新闻公告
  • 开源软件
  • 联系我们
当前位置: 首页 >> 科学研究 >> 研究进展 >> 正文

Fec:一种基于两轮比对和缓存的快速纠错方法

2022年08月23日 17:51 张俊 点击:[]

中南大学计算机学院、生物信息学湖南省重点实验室成员2019级博士张俊在第三代序列纠错领域取得重要研究成果。该研究成果以Fec: a fast error correction method based on two-rounds overlapping and caching为题,在国际生物信息学权威期刊《Bioinformatics》(IF=6.937)上在线发表。


第三代测序技术以其长读长的特点加速了基因组分析,但其高错误率的特点会给下游分析带来偏差,因此纠错是一个很重要的步骤。纠错是一个非常耗时的过程,尤其是在测序深度较高的时候。在对具有重叠关系的两条读数纠错时,现有基于POA的纠错方法需要两次碱基级别的比对。然而,这两次的比对结果是可以相互推断出来的。课题组提出并开发了一种基于两轮比对和缓存的快速纠错方法Fec。Fec既可以作为纠错工具单独使用,也可以作为组装流程的纠错步骤使用。在第一轮比对中,Fec快速地找到足够多的重叠关系来纠错大部分的读数。在第二轮比对中,Fec为在第一轮比对中找到的重叠关系不足以纠错的读数找到尽可能多的重叠关系。在对具有重叠关系的两条读数进行碱基级别的比对时,Fec首先搜索缓存,如果缓存中存在这两条读数的比对结果,就将其提取出来并根据这个比对结果推断出第二个比对结果。否则,Fec就进行碱基级别的比对并将比对结果保存到缓存中。与现有的多种纠错方法对比,Fec实现了1.16-38.56倍的加速且准确率相同甚至更高。

缓存和比对结果推断图


王建新教授团队长期致力于计算机算法与优化、生物信息学、医学影像分析等方面研究。该研究工作得到国家重点研发计划、国家自然科学等基金支持。


上一条:NIHGCN:一种基于领域交互的并行异构图卷积模型预测癌症药物反应
下一条:IIFDTI: 一种基于独立特征和交互特征的药物-靶标相互作用预测

【关闭】

版权所有 生物信息学湖南省重点实验室 Copyright ©2020 http://bio.csu.edu.cn/

湖南省长沙市岳麓区麓山南路932号, 410083 电话/传真:(0731)- 88830212 电子邮件:hunan_bio@csu.edu.cn