您好,欢迎来到中国测试科技资讯平台!

偏最小二乘近红外光谱模型中潜变量个数对模型传递性能的影响

摘要:

以玉米中水分、蛋白质、脂肪和淀粉4种主要成分含量以及烟叶总植物碱的偏最小二乘近红外光谱(PLS-NIRs)模型传递为例,考察了模型中潜变量个数(nLVs)对模型传递误差的影响。研究发现,根据累积贡献率大于99.9%确定的玉米、烟叶样品PLS-NIRs模型的nLVs分别为1和13,nLVs=1时建立的玉米模型对两台从机样品4个成分的预测值和主机预测值的重现性指标均满足国标要求;nLVs=13时建立的烟叶总植物碱模型经分段直接校正(PDS)后,可使4台从机样品的平均相对预测误差(MRE)小于6%。采用留一交叉验证或四折交叉验证确定的玉米、烟叶PLS-NIRs模型的nLVs分别为5~10,16与19,在这些nLVs下建立的玉米PLS-NIRs模型对从机样品的预测误差显著增大,超过许可的误差范围,且模型即使经PDS校正后,从机样品预测值与主机样品预测值的重现性指标大多不满足国标要求;nLVs>13时所建烟叶总植物碱PLS-NIRs模型的转移误差随nLVs增大而增大,且PDS校正后不能保证模型对所有从机样品的MRE小于6%。根据累积贡献率大于99.9%或接近99.9%为准则选取nLVs,可有效避免过拟合,提高NIRs模型的传递性能。

关键词: 近红外光谱模型传递; 偏最小二乘; 潜变量个数; 玉米; 烟叶;

作者: 李永琪,洪士军,黄雯,张立国,葛炯,栾绍嵘,倪力军,

作者单位: 1. 华东理工大学化学与分子工程学院2. 上海烟草集团有限责任公司技术中心理化实验室

刊名: 《分析测试学报》

Journal: Journal of Instrumental Analysis

年,卷(期): 2020, (10)

在线出版日期: 2020年10月25日

页数: 8

页码: 1231-1238