很多朋友之前问我, 机器学习在化学上有用吗? 怎么用?
因为之前太忙, 也没有看到什么特别重磅的文章, 所以一直不理不睬, 最近看到两篇非常好的工作, 分享给大家
首先是最近的 Science.
- "Predicting reaction performance in CN cross-coupling using machine learning"
- Science 15 Feb 2018: DOI: 10.1126/science.aar5169
- Predicting reaction performance in CN cross-coupling using machine learning
- science.sciencemag.org
作者自己是这么写的
机器学习方法正在成为众多学科科学研究的组成部分 在这里, 我们证明机器学习可以用来预测在多维化学空间中使用通过高通量实验获得的数据的合成反应的性能 我们创建了脚本来计算和提取原子, 分子和振动描述符, 用于钯催化的 Buchwald-Hartwig 芳基卤化物与 4 - 甲基苯胺在各种潜在抑制 / 添加剂存在下的交叉偶联反应 使用这些描述符作为输入和反应产量作为输出, 我们表明随机森林算法提供了比线性回归分析显着改进的预测性能 随机森林模型也成功地应用于稀疏训练集和样本外预测, 表明其在促进采用综合方法论方面的价值
我不打算花太多篇幅普及什么是钯催化的 Buchwald-Hartwig 偶联反应, 什么是随机森林算法, 这两者在相关领域都是如雷贯耳的存在, 自行百度或者 Google 即可
简而言之, 作者们首先使用 Merk 的高通量反应仪, 做了 4608 个偶联反应然后这些数据作为机器学习的训练数据集, 主要是考虑不同的钯催化剂配体对产物的影响
结果还是非常震撼的, 让人激动
这个工作的意义无疑是巨大的, 相信每一个做偶联反应, 人肉筛过条件的小朋友们都会瑟瑟发抖更重要的是, 这篇文章还只是捡了 Buchwald-Hartwig 偶联这个神级反应 (软柿子) 捏, 其它大量问题显然也可以用同样的思路来解决
另一篇文章是来自 JPC Letter, 也很漂亮
- Accelerating Chemical Discovery with Machine Learning: Simulated Evolution of Spin Crossover Complexes with an Artificial Neural Network
- J. Phys. Chem. Lett., 2018, 9 (5), pp 10641071
- DOI: 10.1021/acs.jpclett.8b00170
- Accelerating Chemical Discovery with Machine Learning: Simulated Evolution of Spin Crossover Complexes with an Artificial Neural Network
- pubs.acs.org
老规矩, 先看作者怎么写的
机器学习 (ML) 已经成为对材料发现的模拟的有力补充, 它通过缩短与第一原理方法相竞争的精度来评估能量和性质我们使用遗传算法 (GA) 优化来发现非常规自旋交叉复合物, 并结合预测无机复合物自旋态分裂的人工神经网络 (ANN) 的高效评分我们探索了由 8 种金属 / 氧化态组合和 32 配体池组成的超过 5600 种候选材料的复合空间我们通过限制 GA 远离最近的 ANN 训练点, 同时使属性 (即自旋分裂) 适应性最大化, 从而导致发现全部化学品的 80%的线索, 引入用于错误感知 ML 驱动发现的策略空间枚举在 51 个复合子集上, 平均无符号误差 (4.5 千卡 / 摩尔) 接近人工神经网络基线 3 千卡 / 摩尔误差通过在几秒钟内从训练好的人工神经网络获得线索, 而不是从 DFT 驱动的遗传算法获得数天, 该策略证明了 ML 加速无机材料发现的力量
这篇文章作者主要是想发现新的无机材料, 高自旋和低自旋态之间的 energy gap 比较小的那些材料显然一个一个材料合成然后来测试是费时费力的, 需要先从理论上预测, 然后合成验证, 这样才可以节约大量时间
传统方法可以用 DFT 来算, 但是用过 DFT 的人都知道, 准是准, 就是太太太太慢了
所以作者想发展一类机器学习算法, 使获得在和 DFT 差不多精度的前提下, 大幅提升计算速度
具体算法不提了, 总之, 作者最后搞定的这个算法, 用 372 分钟算完了, 要是用 DFT 要 4 天多, 精度对比如上图所示, 完全在可接受的程度
如果这个方法可以进一步发展, 那么作者完全有可能在短时间内实现对百万量级的候选材料的理论计算, 前景可想而知
每天学习, 多一点进步, 这个世界让我瑟瑟发抖
来源: http://www.tuicool.com/articles/go/fuQfIbU