中南大学计算机学院、生物信息学湖南省重点实验室成员李君健在基于迁移学习的病理图像分类领域取得重要研究成果。该成果以“DARC: Deep Adaptive Regularized Clustering for Histopathological Image Classification”为题,在国际医学人工智能权威期刊《Medical Image Analysis》(IF=13.828)上在线发表。
深度学习在病理图像分析领域取得了巨大成功,利用深度学习来对病理图像中的病症进行检测分类等任务,具有重要意义。然而,目前大多数深度学习方法的性能都依赖于大量的标注数据,其效果受到标注数据质量和数量的严重影响,而数据的标注需要由有经验的病理学专家手工标注,这是非常耗时费力的。目前无标注的病理数据是很容易获得的,所以,如何有效的利用无标注病理数据来缓解标注数据的迫切需求,从而去提高病理图像分析的性能依旧是一个挑战性的问题。针对这一问题,本文提出了一种深度自适应正则聚类(Deep Adaptive Regularized Clustering,DARC)的自监督学习方法预训练神经网络。DARC迭代地对学习到的表征进行聚类,并将聚类分配作为伪标签来学习网络的参数。本文中设计了一个聚类损失去使得在同一个簇中的样本尽可能接近。此外,本文还设计了一个自适应正则因子来结合网络损失和聚类损失,自适应正则因子在整个训练过程自适应的更新,以便学习可行的表征。实验结果显示,和随机初始化权重相比,使用DARC预训练的权重微调的模型可以显著提高组织病理图像分类模型的性能。
王建新教授团队长期致力于计算机算法与优化、生物信息学、医学影像分析等方面研究。该研究工作得到国家重点研发计划、国家自然科学、湖南省自然科学等基金支持。