佛罗里达州塔拉哈西——想象一下放大一滴干燥的盐溶液——每一个图案都是独一无二的杰作,让人联想到抽象艺术,但大小却不大于一分钱。
佛罗里达州立大学化学与生物化学系科学家的新研究利用干盐溶液形成的模式来训练机器学习算法,该算法可以识别不同盐的化学成分。该研究成果将发表在《美国国家科学院院刊》上。
“我们正在采集不同盐的化学指纹,”科特雷尔化学教授奥利弗·斯坦博克 (Oliver Steinbock)说道。“以氯化钠或食盐为例——在所有此类样品中,它们看起来总是相似的。样品之间有差异,但所有样品都与其他类型的盐有足够区别,因此我们可以判断它属于哪种盐。”
当盐溶液干燥时,各种力量都会发挥作用。化学家们研究了流体运动、晶体生长、环境因素和其他过程如何相互作用来确定沉积模式。佛罗里达州立大学的研究人员从相反的方向来解决这个问题:如果给它们展示一滴干燥溶液的模式,他们能确定它是什么类型的盐吗?
为此,研究人员记录了 42 种不同类型盐渍的 7,500 张照片。他们使用一种新的软件方法,将每张图像转换成 16 个参数,这些参数可以通过机器学习方法快速分析。这些参数捕捉沉积面积、致密性和纹理等特征。每张图像都被转换成数字,这些数字以微妙的方式编码了环状、针状和叶状微小晶体的图案排列。
为了测试他们的程序预测成分的能力,研究人员分析了不属于初始数据集的其他图像。这些程序在 90% 的尝试中成功识别了正确的盐。
“我们对这种方法的效果感到惊讶,”斯坦博克说。“谁会想到从一张照片就能分辨出氯化钠和氯化钾的区别?它们在照片上看起来非常相似。但这种方法非常好。”
研究人员计划通过分析数十万张新图像来扩充训练数据集,这将使他们的工具更加准确和通用。如此庞大的数据量需要实验室自动化,而 Steinbock 的团队目前正在测试这种机器人液滴成像仪。
“人类和计算机之间的区别在于,计算机和我们的软件可以定量地做到这一点,”斯坦博克说。“如果我给你看 7,500 张图像,你会感到困惑。但计算机会随着图像越来越多而变得越来越好。”
通过照片快速了解样本化学成分的能力具有许多潜在应用。例如,为探索另一颗星球的探测车配备一个完整的化学实验室会很困难且成本高昂,但相机提供了一种廉价而轻便的替代方案。其他场景,例如测试材料以确保实验室安全、快速筛查可疑药物或在没有医院的地方进行低成本血液分析,也提供了其他潜在应用。
这种方法的另一个好处是只需要极少量的材料。只需几毫克的盐沉积物,用户就可以了解他们可能接触的是什么,并决定如何进行。
“如果你想大致了解实验台上的污渍或溢出物是什么,你可以用这个作为粗略的第一步分析,”斯坦博克实验室高级研究员兼论文第一作者布鲁诺·巴蒂斯塔 (Bruno Batista) 说。
这篇论文的合著者包括 Steinbock 实验室的本科研究员 Semhare Tekle、鲍伊州立大学计算机科学系教授 Jie Yan 和佛罗里达农工大学化学系副教授 Beni Dangi。该项目得到了 NASA 的支持。