• 首页
  • 实验室概况
    • 实验室介绍
    • 实验室管理
    • 学术委员会
    • 实验室组成
    • 规章制度
  • 科学研究
    • 研究方向
    • 研究进展
    • 学术论文
    • 科研项目
  • 研究队伍
    • 序列分析
    • 生物网络分析
    • 医学影像分析
    • 生物数据挖掘
  • 研究生教育
    • 招生指南
    • 导师信息
    • 活动展示
  • 合作交流
    • 学术会议
    • 学术报告
  • 开放课题
    • 通知
    • 申请指南
    • 管理办法
    • 经费细则
    • 申请表格
  • 新闻中心
    • 资讯动态
    • 新闻公告
  • 开源软件
  • 联系我们
当前位置: 首页 >> 科学研究 >> 研究进展 >> 正文

基于多头自注意力和双向长短期记忆条件随机场的中文临床命名实体识别方法

2022年04月09日 16:52  点击:[]

中南大学计算机学院、生物信息学湖南省重点实验室成员安莹在临床命名实体识别领域取得重要研究成果。该研究成果以“Chinese clinical named entity recognition via multi-head self-attention based BiLSTM-CRF”为题,在国际医学人工智能权威期刊《Artificial Intelligence In Medicine》(IF=5.326)上在线发表。

临床命名实体识别 (CNER) 是临床自然语言处理的基本步骤之一,旨在从临床自由文本中识别出疾病、症状、检查、身体部位以及治疗等临床实体。由于文本结构和语言等方面的特殊性,现有的基于深度学习的命名实体识别方法往往难以充分地挖掘中文临床文本中的全局信息和多层次的语义特征。该研究成果设计了一种改进的字符级特征表示方法,集成字符嵌入和字符标签嵌入来增强特征表示的特异性和多样性。在此基础上,提出了一种基于多头自注意力的双向长短期记忆条件随机场(MUSA-BiLSTM-CRF)模型,通过引入多头注意力机制并结合医学词典来更有效地捕获字符之间的权重关系和多层次语义信息,进而提升中文临床命名实体识别的准确性。在两个基准数据集(CCKS2017 Task 2和CCKS2018 Task 1)上的验证结果显示,该研究成果超过现有的其他方法获得了更好的识别性能。


王建新教授团队长期致力于计算机算法与优化、生物信息学、医学影像分析等方面研究。该研究工作得到国家重点研发计划、国家自然科学、湖南省自然科学等基金支持。


上一条:一种基于中介查询器重构{C≥5}-free图的分治法
下一条:IsoCell:一种利用正交投影整合异构体级表达以增强单细胞聚类效果的方法

【关闭】

版权所有 生物信息学湖南省重点实验室 Copyright ©2020 http://bio.csu.edu.cn/

湖南省长沙市岳麓区麓山南路932号, 410083 电话/传真:(0731)- 88830212 电子邮件:hunan_bio@csu.edu.cn