新晋诺奖得主,Nature Synthesis!
2025-11-26
3766


研究背景
网状材料(包括金属有机骨架MOFs、共价有机骨架COFs和沸石咪唑骨架晶体ZIFs)具有高度有序的多孔结构,对于水收集和CO₂捕获等重要社会应用至关重要。晶化过程不仅创造了这些结构,也通过单晶X射线衍射(SCXRD)实现了原子级精确结构确定,从而指导进一步的材料开发。
关键问题
当前网状材料的发现主要存在以下问题:
1、高度依赖经验和试错
尽管网状合成的构建块可以基于几何原理进行设计,但确定哪些组合以及在何种特定条件下会结晶仍然主要依赖于试错法。这种低效性导致了广阔化学空间的未被探索。
2、发现目标与优化目标不匹配
现有计算和机器学习方法擅长于寻找优化条件,但它们与最大化独特晶体发现数量这一目标不匹配。发现挑战要求一种能同时学习跨化学系统的晶化模式并战略性分配实验资源的新方法。
新思路
有鉴于此,加州大学伯克利分校Omar M. Yaghi、Zichao Rong、 Laurent El Ghaoui和莫纳什大学Mario Boley等人引入了算法迭代网状合成(AIRES)定制算法决策制定,以最大化独特晶体的发现数量,而非优化单一目标。在沸石咪唑骨架晶体(ZIFs)上的应用表明,AIRES的发现速率是随机探索的两倍,使10种新的连接体结晶成不同的ZIF拓扑结构,并将单连接体Zn-ZIF库扩展了三分之一。通过将网状合成从经验过程转变为系统探索,AIRES为加速材料发现提供了可扩展且高效的蓝图。
技术方案:
1、整理了初始 ZIF 合成数据集
研究人员通过高通量实验建立ZIF合成数据集,训练ML模型筛选晶体结构,发现不同连接体晶化区域复杂且独特,证实了ML方法在捕获复杂关系中的必要性。
2、开发了ML指导的发现方法
研究将ML预测模型与自动化实验整合,通过定量描述符编码连接体结构和反应条件,采用贪婪选择策略和数据增强优化,AIRES算法在约700次实验中发现新结构,效率是随机搜索的两倍。
3、描述了所发现 ZIFs
AIRES系统探索发现11种新晶体,涵盖7种拓扑结构,突破了单连接体Zn-ZIFs十年停滞,扩大了已知库三分之一,并发现了4种新层状ZIFs。
技术优势:
1、首创了AIRES系统并设计了发现目标导向的算法
AIRES是一个集成了自动化、计算机视觉和SCXRD的完整循环,关键在于其定制的算法决策制定。该方法明确以最大化独特发现数量为目标,与传统优化方法形成鲜明对比,并证明了贪婪策略在发现任务中的高效性。
2、显著提升了材料发现效率并突破领域瓶颈
AIRES在ZIFs这一成熟领域取得了突破性进展。它以随机探索两倍的效率(约700次实验对比1,400次)发现了所有新的ZIF晶体,使单连接体Zn-ZIF库扩大了三分之一,揭示了该领域未开发的潜力。
技术细节
初始 ZIF 合成数据集的整理
为了克服文献报道数据有限且存在偏差的问题,研究人员首先通过高通量实验建立了一个初始ZIF合成数据集,用于训练ML模型。实验聚焦于由单一连接体构建的Zn-ZIFs,选择了8种具有不同官能团的起始连接体(如IM、2mIM、bIM等)。通过对总浓度、连接体与金属比的对数和反应温度这三个主要反应参数进行网格采样,共生成了2,688次反应数据。实验平台包括机器人液体处理系统和等温烘箱。产物首先通过自动化光学显微镜进行筛选,并使用在专家分类图像上训练的EfficientNetV2-S卷积神经网络进行晶体识别,模型召回率达到0.88,大大减少了研究人员审查图像的时间。最终结果通过SCXRD分析进行确认和标签化,例如bIM连接体形成了两种不同的晶体结构:已知的ZIF-7(菱形十二面体)和一种新的二维结构Zn₅(bIM)₆(HCOO)₄(DMF)₂(非全同晶板)。结果可视化显示,随机搜索的成功率仅为25%±16%,且不同连接体表现出复杂且独特的晶化区域,这证实了利用ML方法来捕获这些复杂关系的必要性。

图 AIRES循环及其组成部分示意图

图 初始ZIF合成数据集
ML指导的发现方法
研究采用的发现方法论是将ML预测模型与自动化实验整合在一个迭代循环中。为了使ML模型有效学习化学规律,研究人员将连接体结构和反应条件编码成定量描述符。连接体编码涵盖四个关键方面:官能团计数、连接体尺寸、中性和去质子化连接体的量子力学性质,以及关键预成核物种的量子力学性质。该方法将晶化视为二元结果(成功或失败),并采用贪婪选择策略,始终选择预测成功概率最高的候选者。为了解决训练集数据不平衡和数据增量累积的挑战,研究对随机森林分类(RFC)模型实施了数据增强和动态超参数优化。通过对48种新连接体进行1,728次反应的全面数据集模拟验证,结果显示,AIRES(使用RFC)在约700次实验中发现了所有新结构,发现效率是随机搜索(RS)的两倍。此外,为了充分利用高通量实验能力,研究开发了一种批量选择算法,通过条件概率估计来避免简单选择高预测概率候选者所导致的严重冗余,成功保持了发现效率。

图 AIRES加速ZIF发现的性能
所发现 ZIFs 的描述
通过AIRES的系统探索,10个成功连接体产生了11种新晶体,分属于7种不同的拓扑结构。发现的拓扑结构包括SOD (ZIF-A1)、ANA (ZIF-A4)、DFT (ZIF-A7)、RHO (ZIF-A8)。特别是5BrIM连接体产生了crb拓扑结构(ZIF-A5)和一种前所未有的双层fes拓扑结构(ZIF-A6),其中ZIF-A6展示了一种新的ZIF结构基序,具有两层金属节点共价桥接的新排列。苯并咪唑类连接体(如6mhbIM、5BrbIM和6mbIM)产生了ykh拓扑结构(ZIF-A9、ZIF-A10、ZIF-A11),而这种结构此前仅通过混合连接体方法才能获得。这些发现突破了单连接体Zn-ZIFs领域长达十年的发现停滞,并将已知库扩大了三分之一。此外,AIRES还发现了四种新的层状ZIFs(LZIFs),其中金属配位中心出现了溶剂或辅助配体(如DMF或二甲基氨基甲酸酯)的竞争配位,这表明ML模型捕获了基本的配位化学原理。

图 AIRES从新连接子中发现的ZIF和LZIF的拓扑分类和晶体结构
展望
算法迭代网状合成(AIRES)成功将沸石咪唑骨架晶体的发现过程从经验试错转变为高效、系统的探索。通过集成自动化实验平台和基于机器学习的贪婪选择算法,AIRES在Zn-ZIFs领域取得了重大突破,以随机探索两倍的效率发现了11种新晶体,将单连接体库扩展了三分之一。这一系统和方法为未来的网状化学以及更广泛的晶体材料发现提供了加速和系统化的通用蓝图。
参考文献:
Rong, Z., Chen, Z., Luong, F. et al. Algorithmic iterative reticular synthesis of zeolitic imidazolate framework crystals. Nat. Synth (2025).
https://doi.org/10.1038/s44160-025-00939-9
