用可见光识别有机化合物

发布时间:2023-03-18 17:09:58 编辑: 来源:
导读 智利圣地亚哥大学和圣母大学的研究人员利用机器学习设计了一种基于单个光学波长折射率识别有机化合物的方法。该技术可以用于自动化学分析的

智利圣地亚哥大学和圣母大学的研究人员利用机器学习设计了一种基于单个光学波长折射率识别有机化合物的方法。该技术可以用于自动化学分析的研究和工业应用,更便宜,更安全,并且需要更少的专业知识来操作。

在发表在《物理化学杂志A》上的论文“使用可见光对有机化合物进行机器学习识别”中,研究人员记录了他们获得独特数据集的创造性和新颖方式,以及他们用于构建概念验证有机化学检测器的步骤。

机器学习是在公开的过去光学实验数据库上进行训练的,该数据库包含可追溯到 1940 年的科学文献中的已发表数据。在这个数据库中,研究人员发现了编制61个有机分子的鉴定谱所需的所有参数;群速度和群速度色散、测量波长范围和样品的物质状态、宽波长范围内的折射率和消光系数。总共应用了194种有机化合物和聚合物的折射率和消光曲线的816,61个光谱记录。

在典型的红外(IR)分子分类检测器中,分子身份通过吸收和拉曼散射峰确认,从而创建与数据库匹配的组合特征的指纹。有机化合物的静态折射率是单值特征,不具有相同的编码信息。这同样适用于远离紫外线和红外吸收共振的单波长的折射率数据库,这也许就是为什么可见光没有被用来对有机分子进行分类的原因。

对原始数据的初步测试达到了80%,研究人员试图从那里增加它。最初的数据库并不是为了优化机器学习,因为其中大部分来自第一台家用计算机发明之前进行的研究。有大量关于紫外和红外波长的信息,人工智能正在交叉训练这些信息。因此,研究人员决定采取更有针对性的方法。

采用了几种数据预处理策略来模拟人工智能更理想的学习环境。目标是创建一个平衡的数据集,以便人工智能不会仅仅通过信息量优先赋予某些特征而不是其他特征的权重。使用过采样和欠采样以及基于数据物理的增强技术来从根本上减少整个数据集中红外波长的影响。通过使用预处理的平衡数据进行训练,研究人员在可见区域实现了优于98%的分子分类测试精度。

研究人员指出,需要额外的工作来扩展和推广分类器,以确定折射率数据库中存在的分子的结构和其他化学特征。总之,他们写道,这项工作是开发远程化学传感器的良好起点。

免责声明:本文由用户上传,如有侵权请联系删除!

热点推荐

精选文章