基于可见-近红外高光谱技术的红花籽油掺假鉴别与分析

本研究利用可见-近红外高光谱结合机器学习对红花籽油掺假进行定性与定量分析,探索光谱信息与样品化学成分之间的相关性。主要研究内容包括以下几部分:(1)以红花籽油为研究目标,利用可见-近红外高光谱结合机器学习对葵花籽油、玉米油、大豆油分别与红花籽油制备5种体积分数的混合油样以及四种纯植物油进行定性鉴别。使用可见-近红外高光谱采集19种油样平均光谱数据,使用四种预处理方式对光谱数据进行数据预处理,构建数据集。建立多种机器学习模型定性鉴别多种油样。最终得到MF-GBDT-GBDT的组合,实现了对四类油样快识别率,识别率为100%。(2)可见-近红外高光谱结合机器学习对不同油样中的红花籽油含量进行定量分析。使用可见-近红外高光谱仪采集油样光谱数据,构建具有7种体积分数的光谱数据集https://www.selleck.cn/products/chir-99021-ct99021-hcl.html。建立多种机器学习回归分析模型,来鉴别不同样品油中红花籽油的含量。得到最佳的回归模型MF-Ridge-Stacking(使用Ridge、PLSR作为基础模型,Light GBM作为元模型)。当输入特征个数大于等于46后,其测试集R~2稳定在0.95以上,其R_(cv)~2维持0.93附近,模型结果进入稳定。(3)使用气相色谱质谱法检验19种油样中亚油酸、油酸以及棕榈一烯酸的含量与浓度。Emerging marine biotoxins探究三种脂肪酸含量与光谱数据存在的内在关系。结果表明,掺杂浓度与亚油酸含量具有较强的相关性;结合机器学习进行定量分析,得到最佳模型MF-Ridge-Stacking(使用Light GBM、GBDT作为基础模型,Cat Boost作为元模型),当输入特征个数为40时,其测试集R~2为0.87,R_(cv)~2为0.664。结果表明,研究提出使用C59可见-近红外高光谱结合机器学习可以对掺假红花籽油进行快速定性与定量分析。