同步辐射海量衍散射数据在线解析的AI for Science研究取得进展

FUTURE远见| 2023-04-17

Future|远见

Future|远见future选编

近日,面向高能同步辐射光源(HEPS)海量衍散射图像降噪、实验数据在线解析的迫切研究需求,HEPS光束线软件系统张一团队与中科院高能物理研究所赵丽娜AI研究团队密切合作,取得对应的AI for Science研究阶段性进展,研究成果在领域重要学术期刊 IUCrJ 与 npj Computational Materials 上在线发表。

撰稿 | 张一、赵丽娜

高通量多维度表征代表了同步辐射衍射与散射技术发展的重要方向与趋势。随着HEPS等新一代同步辐射光源的涌现,X射线的亮度与探测器的性能均获得了极大提升。百万帧衍射与散射图像的采集时间将被压缩到一小时之内,给数据在线解析带来巨大挑战。作为在大数据时代发展起来的新兴技术,人工智能技术已经并将继续保持其对传统算法的优势,将突出体现在海量实验数据的在线分析以及高效采集上。

衍散射是表征材料显微取向的重要研究手段,聚焦其传统方法中多参数迭代、时效性差、无法在线解析的研究问题,研究人员利用全连接神经网络,高效准确地提取了二维衍射图像中隐藏的三维纤维取向分布信息(图1)。该方法以衍散射数据解析为切入点,建立了同步辐射机器学习在线数据解析的统一流程框架,并实现解析效率的万倍提速,为未来HEPS海量数据的在线处理奠定底层基础。该工作日前在国际晶体学TOP期刊 IUCrJ 在线发表¹(赵丽娜研究员、张一副研究员为通讯作者,博士生孙明辉、博士后董政为共同第一作者),中科院高能所是本工作的唯一通讯单位。

图1: 机器学习用于海量衍射图像高效分析

在高通量多维度海量数据的快速解析研究中,充分意识到高效数据采集、样品辐射损伤降噪的方法学研究重要性。因此,基于卷积神经网络,研究人员构建了一套专用于衍射与散射图像降噪的深度学习网络SEDCNN (Small Encoder-Decoder Convolutional Neural Networks),实现了低曝光时间衍射与散射图像的降噪(图2)。基于研究人员提出的方位角积分计算的降噪指标,该模型成功做到了训练速度与降噪结果稳定性远超现有SOTA模型。低曝光时间的数据采集不仅可以大幅度提升数据采集效率,还可以降低样品所受的辐照剂量,更加适合生物样品等不耐辐照损伤样品的原位实验。该工作日前在 npj Computational Materials 在线发表²(董宇辉研究员为通讯作者,博士生周中正、博士后李纯为共同第一作者),中科院高能所是本文唯一通讯单位。

图2: SEDCNN网络架构与降噪效果

上述研究工作是在中科院高能所先后部署的「基于虚拟束线的自动化与智能化同步辐射实验数据采集软件研究(E25455U210,负责人:张一)」与「物理嵌入机器学习驱动高能同步辐射物质解析新发现(E35457U210,负责人:赵丽娜)」科技创新项目支持下开展完成,HEPS已初步形成人工智能在实验过程控制与数据采集、海量数据分析与信息挖掘应用研究的新模式。未来,在董宇辉研究员发表于Nature Reviews Physics期刊的「大型科学软件框架 + AI for Science」先进科研理念³指导下,HEPS光束线软件系统还将联合计算与网络通信系统,进一步加强与线站科学家、人工智能领域专家的科研合作,共同解决HEPS的科学大数据挑战,推动科学大发现。

HEPS是中科院、北京市共建怀柔科学城的核心装置,由国家发展改革委批复立项,中科院高能所承担建设。建成后,HEPS将是世界上亮度最高的第四代同步辐射光源之一,也将是中国第一台高能量同步辐射光源,将和我国现有的光源形成能区互补,对提升我国国家发展战略与前沿基础科学和高技术领域的原始创新能力具有重大意义。HEPS工程自2019年6月启动建设,建设周期6.5年,预计将于2024年发出第一束光,2025年下半年启动试运行,2025年底建成。日前,HEPS直线加速器满能量出束、光束线站前端区启动试安装,HEPS进入科研设备安装、调束并行阶段。

论文链接:

[1] Sun, M.,‡ Dong, Z.,‡ Wu, L., Yao, H., Niu, W., Xu, D., Chen, P., Gupta, H. S., Zhang, Y.,* Dong, Y., Chen, C. & Zhao, L.*, Fast extraction of three-dimensional nanofiber orientation from WAXD patterns using machine learning. IUCrJ, 10, 3 (2023). https://doi.org/10.1107/S205225252300204X

[2] Zhou, Z.,‡ Li, C.,‡ Bi, X., Zhang, C., Huang, Y., Zhuang, J., Hua, W., Dong, Z.,* Zhao, L., Zhang, Y.,*Dong, Y.,* A machine learning model for textured X-ray scattering and diffraction image denoising. npj Comput. Mater., 9, 58 (2023). https://doi.org/10.1038/s41524-023-01011-w

[3] Dong, Y.,* Li, C., Zhang, Y. ,Li, P. and Qi, F. Exascale image processing for next-generation beamlines in advanced light sources. Nat. Rev. Phys., 4:427–428 (2022). https://doi.org/10.1038/s42254-022-00465-z