红外光谱数据集划分比例及预处理方法研究

朱思聪 高西娅 张朱珊莹 曹汇敏 郑冬云 张莉 谢勤岚 撒继铭

引用本文: 朱思聪, 高西娅, 张朱珊莹, 曹汇敏, 郑冬云, 张莉, 谢勤岚, 撒继铭. 红外光谱数据集划分比例及预处理方法研究[J]. 分析化学, 2022, 50(9): 1415-1424. doi: 10.19756/j.issn.0253-3820.221001 shu
Citation:  ZHU Si-Cong,  GAO Xi-Ya,  ZHANG Zhu-Shan-Ying,  CAO Hui-Min,  ZHENG Dong-Yun,  ZHANG Li,  XIE Qin-Lan,  SA Ji-Ming. Partitioning Proportion and Pretreatment Method of Infrared Spectral Dataset[J]. Chinese Journal of Analytical Chemistry, 2022, 50(9): 1415-1424. doi: 10.19756/j.issn.0253-3820.221001 shu

红外光谱数据集划分比例及预处理方法研究

    通讯作者: 张朱珊莹,E-mail:syzhu@mail.scuec.edu.cn
  • 基金项目:

    国家自然科学基金项目(Nos.61501526,61178087)和中南民族大学中央高校基本科研业务费专项资金项目(No.CZQ22006)资助。

摘要: 血红蛋白浓度是人体的一项重要生理指标,其异常将导致多种疾病。近红外光谱分析技术可以快速、无试剂检测人体中血红蛋白的含量。但是,红外光谱重叠严重、有效信息弱、易受外界噪声干扰,因此通常需要对光谱数据进行数据集划分和预处理,建立定量模型,以去除干扰信息对预测模型的不良影响。如何选择最佳划分方法、最佳划分比例和最佳预处理方法仍是一个问题。针对此问题,本研究以190份不同浓度血红蛋白血液样本和150份不同浓度血红蛋白仿体溶液样本的近红外光谱数据为研究对象,研究等间隔划分法、K_S法(Kennard Stone)、SPXY法(Sample set partitioning based on joint x-y distances method)以及双向算法(Duplex)在41种不同划分比例下偏最小二乘(Partial least squares,PLS)模型的预测能力;将小波变换(Wavelet transform,WT)、标准正态变量变换(Standard normal variate,SNV)、直接正交信号校正(Direct orthogonal signal correction,DOSC)、S_G (Savitzky Golay)一阶求导这4种单独预处理方法(考虑顺序)组成65种预处理方法组合,研究这65种预处理组合对PLS定量分析模型预测精度的影响。实验结果表明:两种数据集的PLS模型最优数据集划分方法均为SPXY法,血液样本最佳划分比例为0.48,仿体溶液最佳划分比例为0.90。65种预处理方法中,血液样本的最佳预处理组合为S_G1+WT,此时预测集相关系数(Correlation coefficient of prediction set,Rp)为0.9808,预测集均方根误差(Root mean square error of prediction set,RMSEP)为0.2701;仿体溶液样本的最佳预处理组合为SNV+WT,此时Rp为0.9952,RMSEP为3.8154。预处理组合时,两种算法叠加的效果最好。本研究结果为此类光谱数据的处理提供了一种新的思路和方法。

English


    1. [1]

      YUAN Jing-Ze, LU Qi-Peng, WANG Jing-Li, DING Hai-Quan, GAO Hong-Zhi, WU Chun-Yang, LI Wan-Xia. Chin. J. Anal. Chem., 2017, 45(9):1291-1296. 袁境泽, 卢启鹏, 王静丽, 丁海泉, 高洪智, 吴春阳, 李晚侠. 分析化学, 2017, 45(9):1291-1296.

    2. [2]

      HE Si-Yang, LI Meng, TANG Chao-Chen, ZHOU Fang-Yuan, XIE Guang-Hui. J. China Agric. Univ., 2021, 26(12):34-44. 何思洋, 李蒙, 唐朝臣, 周方圆, 谢光辉. 中国农业大学学报, 2021, 26(12):34-44.

    3. [3]

      ZHANG Fu, CUI Xia-Hua, ZHANG Ya-Kun, WANG Yong-Xian. Spectrosc. Spectral Anal., 2021, 41(10):3064-3068. 张伏, 崔夏华, 张亚坤, 王永县. 光谱学与光谱分析, 2021, 41(10):3064-3068.

    4. [4]

      FU H Y, LI H D, XU L, YIN Q B, YANG T M, NI C, CAI C B, YANG J, SHE Y B. Food Chem., 2017, 227:322-328.FU H Y, LI H D, XU L, YIN Q B, YANG T M, NI C, CAI C B, YANG J, SHE Y B. Food Chem., 2017, 227:322-328.

    5. [5]

      LONG W J, HU Z K, WEI L N, CHEN H Y, LIU T K, WANG S Y, GUAN Y T, YANG X L, YANG J, FU H Y. Spectrochim. Acta, Part A, 2022, 271:120932.LONG W J, HU Z K, WEI L N, CHEN H Y, LIU T K, WANG S Y, GUAN Y T, YANG X L, YANG J, FU H Y. Spectrochim. Acta, Part A, 2022, 271:120932.

    6. [6]

      HUBER M, KEPESIDIS K V, VORONINA L, BOZIC M, TRUBETSKOV M, HARBECK N, KRAUSZ F, ZIGMAN M. Nat. Commun., 2021, 12(1):1511.HUBER M, KEPESIDIS K V, VORONINA L, BOZIC M, TRUBETSKOV M, HARBECK N, KRAUSZ F, ZIGMAN M. Nat. Commun., 2021, 12(1):1511.

    7. [7]

      SUN Dai-Qing, XIE Li-Rong, ZHOU Yan, GUO Yu-Tao, CHE Shao-Min. Spectrosc. Spectral Anal., 2021, 41(9):2754-2758. 孙代青, 谢丽蓉, 周延, 郭煜涛, 车少敏. 光谱学与光谱分析, 2021, 41(9):2754-2758.

    8. [8]

      LIU Wei, ZHAO Zhong, YUAN Hong-Fu, SONG Chun-Feng, LI Xiao-Yu. Spectrosc. Spectral Anal., 2014, 34(4):947-951. 刘伟, 赵众, 袁洪福, 宋春风, 李效玉. 光谱学与光谱分析, 2014, 34(4):947-951.

    9. [9]

      GAO T, HU L N, JIA Z Z, XIA T N, CHAO F, LI H Z, HU L H, LU Y H, LI H. Cluster Computing, 2019, 22(2):3069-3078.GAO T, HU L N, JIA Z Z, XIA T N, CHAO F, LI H Z, HU L H, LU Y H, LI H. Cluster Computing, 2019, 22(2):3069-3078.

    10. [10]

      TIAN H, ZHANG L N, LI M, WANG Y, SHENG D G, LIU J, WANG C M. Infrared Phys. Technol., 2019, 102(1):103003.TIAN H, ZHANG L N, LI M, WANG Y, SHENG D G, LIU J, WANG C M. Infrared Phys. Technol., 2019, 102(1):103003.

    11. [11]

      SUN Jing-Jing, YANG Wu-De, FENG Mei-Chen, XIAO Lu-Jie. Agric. Technol. Equip., 2020, 367(7):10-12. 孙晶京, 杨武德, 冯美臣, 肖璐洁. 农业技术与装备, 2020, 367(7):10-12.

    12. [12]

      ENGEL J, GERRETZEN J, SZYMANSKA E, JANSEN J J, DOWNEY G, BLANCHET L, BUYDENS L M C. TrAC, Trends Anal. Chem., 2013, 50:96-106.ENGEL J, GERRETZEN J, SZYMANSKA E, JANSEN J J, DOWNEY G, BLANCHET L, BUYDENS L M C. TrAC, Trends Anal. Chem., 2013, 50:96-106.

    13. [13]

      RINNAN S, BERG F, ENGELSEN S B. TrAC, Trends Anal. Chem., 2009, 28(10):1201-1222.RINNAN S, BERG F, ENGELSEN S B. TrAC, Trends Anal. Chem., 2009, 28(10):1201-1222.

    14. [14]

      GERRETZEN J, SZYMANSKA E, BART J, DAVIES A N, MANEN H J, HEUVEL E R, JANSEN J J, BUYDENS L M C. Anal. Chem. Acta, 2016, 938:44-52.GERRETZEN J, SZYMANSKA E, BART J, DAVIES A N, MANEN H J, HEUVEL E R, JANSEN J J, BUYDENS L M C. Anal. Chem. Acta, 2016, 938:44-52.

    15. [15]

      DIWU Peng-Yao, BIAN Xi-Hui, WANG Zi-Fang, LIU Wei. Spectrosc. Spectral Anal., 2019, 39(9):2800-2806. 第五鹏瑶, 卞希慧, 王姿方, 刘巍. 光谱学与光谱分析, 2019, 39(9):2800-2806.

    16. [16]

      ZHANG Xu, BAI Xue-Bing, WANG Xue-Pei, LI Xin-Wu, LI Zhi-Gang, ZHANG Xiao-Shuan. Spectrosc. Spectral Anal., 2021, 41(11):3377-3384. 张旭, 白雪冰, 汪学沛, 李新武, 李志刚, 张小栓. 光谱学与光谱分析, 2021, 41(11):3377-3384.

  • 加载中
计量
  • PDF下载量:  6
  • 文章访问数:  612
  • HTML全文浏览量:  111
文章相关
  • 收稿日期:  2022-01-02
  • 修回日期:  2022-06-07
通讯作者: 陈斌, bchen63@163.com
  • 1. 

    沈阳化工大学材料科学与工程学院 沈阳 110142

  1. 本站搜索
  2. 百度学术搜索
  3. 万方数据库搜索
  4. CNKI搜索

/

返回文章