中南大学计算机学院、生物信息学湖南省重点实验室成员刘祎玮博士在剪接异构体功能预测领域取得了重要研究成果。该研究成果以“IsoFrog: a reversible jump Markov Chain Monte Carlo feature selection-based method for predicting isoform functions”为题,在国际生物信息学权威期刊《Bioinformatics》(IF=5.8)上在线发表。
单个基因可以通过选择性剪接(alternative Splicing, AS)产生多个剪接异构体(isoform),后者可能包含不同的编码序列,从而翻译成具有不同生物功能的蛋白质。因此,准确识别异构体功能是研究基因组功能多样性的关键。近年来,许多计算方法被开发用于剪接异构体功能预测,然而,现有方法没有考虑到每个特征与特定功能的相关性,且忽略了由不相关特征引起的噪声。本研究提出了一种基于特征选择的方法IsoFrog对剪接异构体功能进行预测。IsoFrog采用基于可逆跳跃马尔可夫链蒙特卡罗的特征选择框架来评估特征对基因功能的重要性,并采用循序特征选择过程筛选出与功能相关的特征子集。上述特征子集被输入到我们改进的域不变偏最小二乘法中进行剪接异构体功能预测。在来自人和小鼠的三种数据集上,相较于六种最先进的剪接异构体功能预测方法,IsoFrog取得了更好的预测性能。同时,我们提出的特征选择框架优于三种经典的特征选择方法。我们期望这一方法将促进剪接异构体功能的识别,并进一步激发新方法的发展。
王建新教授团队长期致力于计算机算法与优化、生物信息学、医学影像分析、医疗数据挖掘等方面研究。该研究工作得到科技创新2030-重大项目、国家自然科学基金等基金支持。