• 首页
  • 实验室概况
    • 实验室介绍
    • 实验室管理
    • 学术委员会
    • 实验室组成
    • 规章制度
  • 科学研究
    • 研究方向
    • 研究进展
    • 学术论文
    • 科研项目
  • 研究队伍
    • 序列分析
    • 生物网络分析
    • 医学影像分析
    • 生物数据挖掘
  • 研究生教育
    • 招生指南
    • 导师信息
    • 活动展示
  • 合作交流
    • 学术会议
    • 学术报告
  • 开放课题
    • 通知
    • 申请指南
    • 管理办法
    • 经费细则
    • 申请表格
  • 新闻中心
    • 资讯动态
    • 新闻公告
  • 开源软件
  • 联系我们
当前位置: 首页 >> 科学研究 >> 研究进展 >> 正文

SACall: 基于自注意力机制的新型纳米孔测序basecalling方法

2020年11月26日 18:45  点击:[]



中南大学计算机学院、生物信息学湖南省重点实验室成员黄能在第三代牛津纳米孔测序领域取得重要研究成果。该研究成果以“SACall: a neural network basecaller for Oxford Nanopore sequencing data based on self-attention mechanism”为题,在国际生物信息学权威期刊《IEEE/ACM TRANSACTIONS ON COMPUTATIONAL BIOLOGY AND BIOINFORMATICS》(IF=3.015)在线发表。



第三代牛津纳米孔测序仪的因其便携性,低成本,实时测序等优势,在基因组学研究方面取得了许多突破。但是,相比于第二代短读数测序99%的准确率,纳米孔测序的主要缺陷是它的高错误率。尽管近几年纳米孔测序的化学试剂和basecalling工具在不断地更新和发展,但是测序的错误率仍然在5%~15%。极高的错误率使得纳米孔测序在许多下游分析中存在诸多局限性和不可靠性。该研究提出了一种新型的端到端的basecalling方法SACall。在模型中组合了卷积神经网络,Transformer自注意力网络。多层卷积网络用于下采样测序信号并捕获局部模式。自注意力网络用于计算原始信号序列中任意两个位置上信号的上下文关系。最后,采用束搜索的方法计算最终的DNA序列。该研究在多个标准测试数据上对SACall和纳米孔测序公司官方工具Albacore,Guppy进行评估。SACall从reads准确度,基因组组装质量和共识序列准确度等多个方面都要比官方basecalling工具有明显提升。该研究为提高纳米孔测序精度提供了新的方法。


CCDD

Nanopore原始测序信号翻译为DNA核苷酸序列的主要流程





上一条:HGIMC:基于矩阵填充和异构图推理的药物重定位方法
下一条:MSBMF:基于多相似性矩阵分解的药物重定位方法

【关闭】

版权所有 生物信息学湖南省重点实验室 Copyright ©2020 http://bio.csu.edu.cn/

湖南省长沙市岳麓区麓山南路932号, 410083 电话/传真:(0731)- 88830212 电子邮件:hunan_bio@csu.edu.cn