2021年8月16日,由深圳国家基因库主办,深圳华大生命科学研究院、深圳市华大基因学院、深圳市猛犸公益基金会协办,DataCastle承办的"数源杯"百万单细胞基因表达数据算法大赛落下帷幕。本次大赛吸引了国内外100余家知名高校和近90家企事业单位的专业技术人员参与,包括北京大学、清华大学、波士顿大学、费城儿童医院、中科院计算所、解放军总医院、华为、腾讯、百度、平安科技等。经过初赛、复赛的严格评审筛选,10支队伍从300余个参赛团队中脱颖而出。计算机学院20级博士研究生徐云佩,在王建新、李洪东老师的指导下获得二等奖。
参赛选手与评委专家合影
获奖名单
本届大赛鼓励相关领域的研究人员和从业者以国家基因库生命大数据平台(CNGBdb)存储的百万单细胞数据资源为基础,针对“聚类”这一单细胞数据分析的重要步骤,进行单细胞聚类算法的开发和优化,进而打造能够降低内存占用、提升运算速度的优质计算工具;与此同时,为生命科学、医学、计算机科学等多领域的专业人才提供跨领域、跨学科的技术交流平台。决赛评委有浙江大学医学院郭国骥教授、清华大学古槿副教授、哈工大(深圳)-奇安信数据安全研究院韩培义副院长、深圳华大生命科学研究院刘石平博士等领域权威专家。中南大学团队使用了分级聚类方案,结合局部聚类结果进行抽样分析,通过与抽样数据聚类结果进行比对,提出了新的类别合并方法,得到最终聚类结果。该方案可以为百万级单细胞测序数据聚类分析提供参考,具有很强的学术价值。