News
中国科大团队在第二届全球数智教育创新大赛中荣获银奖
2025年11月,第二届全球数智教育创新大赛圆满落幕。本届大赛由中华人民共和国教育部、数智教育发展国际大学联盟及北京深势科技有限公司联合主办,重点聚焦“AI for Science”主题,旨在推动人工智能在科学计算与科研软件中的深度应用,形成面向未来的新型科研范式。比赛吸引了来自国内外数百支高校队伍,竞争激烈程度远超往届。
在“AI for Science赛道 — 科学计算软件高性能优化挑战赛”的文献分子目标检测模型优化任务中,中国科学技术大学人工智能与数据科学学院 Moldet 高性能优化团队——“但丁真会测你们的分子式队”凭借系统化的工程优化方案与卓越的团队协作能力脱颖而出,最终荣获银奖,再度展现出中国科大学子在AI for Science领域的创新实力。
参赛团队成员包括:王子成(汇报人)、冯筱璐、秦雪建、张晓晨(山东大学)、杨沛豪、陈明珠、温博宇,指导教师为中国科学技术大学人工智能与数据科学学院 钟志诚教授。
在现代科研中,从PDF文献中自动识别分子结构是化学信息学的重要基础环节,然而文献格式多样、图像质量参差、噪声复杂,使得模型在实际场景中的稳定性与效率面临严峻考验。本赛题要求参赛队伍对官方提供的 MolDet 模型进行 端到端全链路高性能优化,实现推理加速、资源压缩和系统级吞吐提升,同时保持检测精度不下降,是一次对科研计算软件工程能力的全面检验。
为解决文献分子目标检测中“结构复杂、瓶颈多点”的工程难题,团队以系统工程视角对整个推理链路进行模块化拆分与统一优化:在预处理阶段,通过灰度判断、轮廓面积和形状过滤三重规则有效筛除无效图像,大幅减少推理负载;在数据构建中使用“三模型投票 + 人工校正”的机制,显著提高标注一致性与数据质量;在推理阶段引入 FP16 混合精度以充分利用 GPU Tensor Core,实现速度与显存的全面提升;在后处理模块中根据分子结构检测的二分类特性定制化裁剪 NMS,移除冗余逻辑以加速处理;最关键的是,团队将传统串行流程重构为“CPU 多进程预处理 + 独立 GPU 推理 + 多进程后处理”的异步并行流水线,并通过队列和事件调度实现 CPU/GPU 全链路解耦,大幅提升系统整体吞吐效率。凭借这一整合优化策略,团队在比赛中取得了显著的性能领先优势。
凭借对模型结构、系统瓶颈和软件工程的深刻理解与创新式优化,我院团队在最终排名中取得优异成绩,荣获本赛道银奖。团队不仅展现了扎实的技术功底,更展现了面向真实科研任务的系统思维与工程实践能力。