西雅图的奇胡利花园和玻璃展览以戴尔·奇胡利的玻璃艺术品为特色。它有一个美丽的花园、温室和室内展品。玻璃巧妙地结合在树木、植物和美丽的蕨类植物之间,使漫步变得壮丽。

通过反复试验的方法寻找最佳的玻璃成分需要很长时间。机器学习算法可以加速这一过程。信贷:迪克汤普森, Flickr (CC BY-SA 2.0)


对于玻璃科学家来说,元素周期表就是他们的牡蛎——如果淬火足够快,几乎所有的元素都会变成玻璃。然而,有了这么多的选择,要在本质上无限的可能性中找到“珍珠”(最佳玻璃成分),依靠反复试验的方法是极其困难的。

为了加速发现最佳玻璃组成,科学家有时使用基于物理的建模。

基于物理的模型利用我们对玻璃的物理和化学理解,预测了一系列有前景的成分。拓扑约束理论分子动力学模拟——两个基于物理模型的例子——有效地减少了达到一个有价值的组成所需的反复试验的数量。

但这些模型都有局限性。拓扑约束理论根据原子结构预测玻璃的性质,不能轻易预测某些性质(如断裂韧性)另一方面,预测玻璃中原子运动的分子动力学模拟需要大量的计算成本来估计少量的原子。

除了基于物理的建模,预测玻璃成分的另一种方法是数据驱动建模。

数据驱动的模型纯粹基于对现有数据的分析,而不了解控制给定玻璃行为的基础物理。数据驱动建模的一个例子是机器学习,它通过识别数据集中的模式“通过示例学习”。

许多最近的研究使用机器学习来预测玻璃成分。这些研究共同教会了我们什么,并为未来的研究提供了什么,是一个新的开放获取的主题审查论文加州大学洛杉矶分校的研究人员进行了研究。

审查的主要观点是民事化工程助理教授马修·鲍奇他的学生徐信义,杨凯,傅子鹏和刘汉在下面的章节中被强调。

机器学习技术:回归、分类和聚类

机器学习算法完成两类任务:有监督的(数据集包括输入和输出)或无监督的(数据集仅包括输入).有监督机器学习将输出预测为输入的函数,而无监督机器学习识别现有数据中具有相似特征的集群。

许多有监督的机器学习技术基于回归。回归通过拟合数据集中的已知数据点,在功能上关联输入和输出。回归通常分为两类:

  1. 参数回归,这将产生一个用输入变量表示输出的分析公式。
  2. 非参数回归,它根据输入位置与其周围已知点之间的相关性计算给定输入的输出。

回归用于数值(连续)输出的问题。对于离散(分类)输出的问题 - 诸如“玻璃是透明或不透明”的分类。

在有监督机器学习中,可以用于回归和分类问题的算法示例包括:

  • 人工神经网络(ANN),一个复杂的非线性功能算法映射输入和输出之间的关系;
  • 支持向量机,一种算法,该算法依赖于一个函数公式,表示在分类问题中划分为不同类别的数据;
  • 决策树,一种基于由序列分割节点的若干并行树路径的集合的算法;和
  • 提高的方法,一种算法,其输出基于从一系列顺序添加的弱学习器/分类器(如决策树、支持向量机或其他分类器)集成的所有输出的加权平均。

相比之下,无监督机器学习通常在数据集中使用聚类方法。在这种情况下,根据输入空间内数据点之间的距离来识别聚类,不需要先前识别的聚类示例来训练模型。

当前的应用和物理模型

机器学习在玻璃科学领域的首次应用可能是由布劳尔等。2007年,关于玻璃在系统P中的溶解度2O5–CaO–MgO–Na2O-TiO2.从那时起,大多数研究人员都研究了开发的组成性回归模型,特别是ANN算法。在审查纸上预测玻璃化转变温度突出的一个特定的ANN研究 - 是一个焦点结论帖子去年11月。

尽管最近的文献关注机器学习,Bauchy和他的学生注意到它不是所有情况的答案。“尽管‘盲机器学习’和人工神经网络可以提供可靠的预测,但这种方法需要存在大量的数据,而这些数据并不总是可用的,”他们在报告中写道

解决这一局限性的一种方法是“基于物理的机器学习”

物理知识的机器学习将基于物理和数据驱动的模型结合在一个模型中。在A.开放获取的纸上个月出版,鲍奇和他的学生与来自丹麦的Aalborg大学的研究人员合作,在法国的Cea Marcoule和Cea Marcoule在法国开发了一个依赖于三件事的物理知情机器学习模型:

  1. 具有良好解释性的简单的解析模型公式;
  2. 基于对预测性质的物理和化学理解,线性化输入和输出之间的关系;和
  3. 识别捕获玻璃原子结构的相关减尺寸描述符。

在开放获取论文中,研究人员将物理信息模型与盲机器学习算法进行了比较。综述总结了开放获取论文结果的影响:“总的来说,这项工作表明,在机器学习中嵌入一些物理知识提供了一条有希望的途径,可以克服准确性、简单性和可解释性之间的权衡……在传统的、盲目的机器学习模型中,这三者往往是相互排斥的。”

未来方向:MD模拟和协作

一般来说,大量的实验数据集并不总是可用于进行机器学习。因此,高通量分子动力学模拟——前面提到的基于物理的建模示例——提供了一种构建大型玻璃特性数据集的方法,可作为机器学习算法的训练集。Yang等人研究了这是一种新的方法吗开放获取的纸出版于科学报告今年6月。

该综述研究人员还强调了在实验、理论、模拟和数据分析方面的研究小组之间合作的重要性,以进一步在玻璃科学中使用机器学习。

“[S]机器学习建模的Uccessful未来应用可能需要闭环集成方法,其中(i)实验或仿真数据用于训练机器学习模型,(ii)机器学习模型用于确定有前途的玻璃组合物他们写的是验证这些预测或细化数据驱动模型的实验。

鲍奇在一封电子邮件中说,他的团队计划继续模糊基于物理和数据驱动的模型之间的边界。“我们的理由是我们生活在信息时代:完美的模型应该理想地利用所有可用的信息,即它应该在现有的实验数据上建立和我们对玻璃物理学的理解,”他说。“我们目前正在努力应用这种范式来预测眼镜的机械性能。”

这篇开放获取的论文发表在非晶体固体杂志:X,是“玻璃科学与工程的机器学习:综述“(内政部:10.1016/j.nocx.2019.100036)。

分享/打印