中南大学计算机学院、生物信息学湖南省重点实验室成员在蛋白质结晶预测研究领域取得重要研究成果。该研究成果以“CLPred: A sequence-based protein crystallization predictor using BLSTM neural network”为题,被生物信息学领域Top会议《European Conference on Computational Biology》录用,该会议论文将直接在期刊《Bioinformatics》(IF=5.610)上在线发表。中南大学计算机学院、生物信息学湖南省重点实验室研究生宣文静为论文的第一作者,王建新教授和黎耀航教授为通讯作者,中南大学为第一通讯单位。
基于晶体学的X射线衍射技术是测定蛋白质结构的主要实验方法,是了解蛋白质生物学功能的关键。然而,获得晶体的实验过程是昂贵和费时的,并且有较高的损耗率。因此,在进行晶体实验之前首先通过计算方法筛选出具有较高结晶倾向的蛋白质,将大大降低蛋白质结构分析的成本。该研究成果仅使用原始蛋白质序列,通过具有长短期记忆的双向循环神经网络来有效地捕获氨基酸之间的高阶、远距离相互作用模式,在多个数据集上预测的准确度得到提高,并证实其具有实际的生物指导意义。
王建新教授团队长期致力于计算机算法与优化、生物信息学、大数据应用等方面研究。该研究工作得到国家自然科学、湖南省科技计划和NSFC-浙江省两化融合联合等基金支持。
CLPred模型架构图