DOi:10.13590/j.cjfh.2018.01.015
多元统计分析在小麦粉产地溯源中的应用
王晶,黄伟雄,李敏,许秀敏,梁旭霞,黄泓耀

(广东省疾病预防控制中心 国家食品安全风险监测重金属参比实验室,广东 广州 511430)

收稿日期:2017-10-30

作者简介:王晶 男 副主任技师 研究方向为元素分析毒理学 E-mail:metallicman@126.com
通信作者:黄伟雄 男 主任技师 研究方向为食品理化检验 E-mail:huangwx0321@163.com

基金项目:广东省医学科学技术研究基金(A2015214)

摘要:目的 筛选小麦粉产地溯源特征元素,为深入挖掘食品安全风险监测数据,开发成熟有效的食品溯源技术积累基础。方法 采用电感耦合等离子体质谱法测定河北省、新疆维吾尔自治区和江苏省共计173份小麦粉样品中的10种无机元素含量,利用主成分分析(PCA)、偏最小二乘判别分析(PLS-DA)、正交偏最小二乘判别分析(OPLS-DA)建立模式识别模型,考察建模效果。结果 PCA模型可以将新疆维吾尔自治区样品与其他两省实现分离;PLS-DA可以实现3个地区样品的分离;河北省和新疆维吾尔自治区、江苏省和新疆维吾尔自治区均在OPLS-DA模型中得到良好分离。结论 利用PCA、PLS-DA和OPLS-DA三种多元统计分析方法对河北省、新疆维吾尔自治区和江苏省3个地区小麦粉中10种无机元素进行分析,筛选出铜(Cu)、铁(Fe)和砷(As)三个特征元素,这些特征元素有望被应用于小麦粉产地溯源。
关键词: 小麦; 产地; 溯源; 主成分分析; 偏最小二乘判别分析; 正交偏最小二乘判别分析; 多元统计分析
文章编号:1004-8456(2018)01-0068-06     中图分类号:R155     文献标志码:A    
The application of multivariate data analysis to determine the geographical origin of wheat flour
WANG Jing, HUANG Wei-xiong, LI Min, XU Xiu-min, LIANG Xu-xia, HUANG Hong-yao
(Reference Laboratory of Heavy Metals of National Food Safety Risk Monitoring, Center forDisease Control and Prevention of Guangdong Province, Guangdong Guangzhou 511430, China)
Abstract:Objective The change and regularity of spatial pattern distribution of pesticide residues in vegetables were analyzed, the gathered hot region was found, for the monitoring, and it could provide scientific basis for supervision.Methods The pesticide residues in vegetables in 2014-2016 was analyzed by spatial statistical method for spatial distribution and spatial clustering.Results The detection rate and violation rate of pesticide residues in the vegetables were in the same distribution pattern in 2014-2016. However, the change in the past three years was relatively large. The areas with high detection rate were concentrated in the southwest and the northeast. The violation was distributed in the southwest and north. In 2014, the detection rate had an overall positive correlation in the monitoring area (P<0.05, Moran's I=0.410), and the local correlation was mainly distributed in the southwest, north and south. The violation rate had an overall positive correlation (P<0.05, Moran's I=0.111) in 2016, and the local correlation was mainly distributed in the southwest region. In 2016, the detection rate had a negative correlation (P<0.05, Moran's I=-0.087), and the local correlation was mainly distributed in the central region. The time and space scan statistics analysis showed that the violation rate and detection rate in the monitoring area were clustered. There was a clustering area (LLR=27.11, P<0.05, RR=20.04). The detection rate had two clustering areas. Class I cluster area (LLR=43.24, P<0.05, RR=6.9) was distributed in the northeast and south counties. Class II clustering area (LLR=19.13, P<0.05, RR=4.13) was distributed in the southwest area and counties.Conclusion The detection rate and violation rate of pesticide residues in vegetables showed a consistent decline during 2014-2016. The result of spatial autocorrelation and space-time scanning statistics showed the existence of aggregation. The gathering area was mainly located in the northeast and southwestern neighboring counties. The relative risk of the gathering area was greater than 4, indicating that the risk of pesticide residues in these districts was higher than that in other counties, which was a hot area for regulators to pay close attention.
Key words: Edible vegetable oil; aflatoxins; peanut oil; food contaminants; enzyme linked immunosorbent assay; ultra-performance liquid chromatography; detection
 近年来,各类食品安全事故频发,引发人们对于食品安全的普遍担忧。如何提升政府日常食品安全监管水平,防患未然,已成为目前各国政府在食品安全监管领域亟待解决的重大问题。食品可追溯性作为食品安全监管体系重要内容之一,特指在生产、加工和流通环节任何指定阶段对于食品的追溯能力[1-3]。国内外学者针对此类问题已开展相关研究[4-6],部分发达国家已经建立起较为完善的食品可追溯体系。
        《中华人民共和国食品安全法》规定国家建立食品安全风险监测制度,从2009年正式颁布实施至今,我国逐步建立起覆盖全国的食品安全风险监测网络,通过对主要食品中的污染和有害因素进行连续监测,积累了大量基础数据,这些基础数据为了解我国食品安全整体状况提供了重要参考,同时也为先进的食品溯源技术的开发,并应用于追踪食品污染因子来源、污染水平的分布及其变化趋势提供了用武之地。
        本研究拟以食品产地溯源作为切入点,以中国北方主要的粮食作物小麦粉为研究对象,借助现代无机分析技术电感耦合等离子体质谱(ICP-MS)法同时测定小麦粉中多种无机元素,获取小麦粉中的无机元素成分信息,借助多元统计分析技术[7-12]建立产地溯源分组模型,筛选分组模型中的特征元素变量,为深入挖掘食品安全风险监测数据,开发成熟有效的食品溯源技术积累基础。    
1材料与方法     
1.1材料     
1.1.1样品来源与采样要求
        本研究的样品由2014年采集于河北省、新疆维吾尔自治区和江苏省小麦主产区的小麦粒样品加工而成,全部由国家粮食局提供。小麦粒样品要求小麦籽粒完整、饱满、无霉变、无虫蚀等现象,对符合要求的小麦粒在各采样地区统一指定的加工机构或实验室进行脱粒制粉,出粉率按我国标准粉要求控制在60%~70%的范围内,每份小麦粉样品10~20 g。制样时在样品记录单上记录样品编号、制样日期等信息。制备好的样品放在清洁的聚乙烯食品塑料袋中,封口良好,避免受潮和污染,并使用不易破损的容器运输样品,样品保存在阴凉通风、干燥的环境中。最终收集到来自河北省、新疆维吾尔自治区和江苏省3个地区的小麦粉样品数量分别为80、39和54份。     
1.1.2主要仪器与试剂
        Agilent7700x ICP-MS仪、MassHunter工作站软件均购自美国Agilent,密闭高压罐装置(含耐高压聚四氟乙烯内罐和不锈钢外罐),Direct-Q3超纯水处理系统,FD53热风循环烘箱,EH-20 A Plus数显电热板(可控温度范围为常温至200 ℃),XPE204电子天平,50 ml带刻度塑料试管,10、20、50、100、200 μl精密微量移液器。
        硝酸、氢氟酸、高纯氩气(纯度>99.999%)、有证参考物质为小麦成分分析标准物质(GBW10011,30 g/瓶,国家标准物质中心)。多元素混合标准溶液(CFGG-160435-01-01,美国O2si):基体为2% HNO3,其中铁(Fe)、锌(Zn)、铬(Cr)、铝(Al)、锰(Mn)、铅(Pb)、铜(Cu)、砷(As)、镉(Cd)、铊(Tl)元素的浓度均为10.0 μg/ml;多元素内标混合溶液(5183-4680,美国Agilent):基体为5% HNO3,其中锂(Li)、钇(Y)、钪(Sc)、锗(Ge)、铋(Bi)、铟(In)、铽(Tb)元素的浓度均为10 μg/ml。     
1.2方法     
1.2.1样品前处理
        准确称量适量小麦粉样品置于耐高压聚四氟乙烯内罐中,加入5 ml优级纯浓硝酸和0.5 ml优级纯氢氟酸,盖上内盖并将内罐装入不锈钢外罐中,旋紧外罐盖后置于烘箱中,升温至180 ℃维持4 h,消化完毕后,打开烘箱自然冷却至室温,取出内罐并用少量去离子水冲洗内罐盖,洗液合并至罐内溶液中,内罐置于电热板上180 ℃赶酸至约1 ml,将消化液转移至50 ml BD塑料试管中,分别用去离子水少量多次洗涤内罐并合并洗涤液与消化液,最后定容至刻度,摇匀,待测。同时制备样品空白。     
1.2.2多元素混合标准曲线溶液与混合内标使用液的配制
        多元素混合标准曲线溶液:用5% HNO3将多元素混合标准溶液逐级稀释成系列多元素混合标准曲线溶液,Fe、Al、Mn、Cr、Cu、Cd、Zn、As、Pb、Tl元素对应的溶液浓度为0.00、1.00、2.00、5.00、10.0、20.0、50.0、100、200 ng/ml。
混合内标使用液:用5% HNO3将浓度为10 μg/ml的Li、Sc、In、Ge、Tb、Y、Bi多元素内标混合溶液稀释为1.0 μg/ml混合内标使用液。     
1.2.3质量控制方法
        将GBW10011按照1.2.1同样的制备流程,同时上机测定,测定结果与标示值进行比对,若测定值位于标示值不确定度范围内则采用的分析方法符合测定要求,否则需优化分析方法。     
1.2.4仪器条件
        设置仪器参数条件,IF射频功率为1 550 W,样品锥采样深度为8.5 mm,等离子体流量为15 L/min,氦气流量为4.5 ml/min,载气流量为1.14 L/min,推荐同心雾化器,雾化室温度为2 ℃,蠕动泵转速为0.1 r/min,谱图(spectrum)模式采集数据,虚拟内标校正。    
1.2.5样品测定
        仪器点火后待采集信号稳定即用质谱调谐使用液调谐灵敏度、双电荷、氧化物、分辨率等仪器指标,使各项指标满足检测要求,编辑分析方法,选择合适的待测元素同位素与内标元素、采集模式、积分时间等,本方法测定各元素均采用氦气碰撞消除多原子离子干扰模式。将标准系列、样品空白、样品溶液、质控样品依次上机进行检测,外标法定量,内标法保证仪器稳定性,采集数据并计算浓度。     
1.3统计学分析
        将数据集导入SIMCA-P软件进行多元统计分析,包括主成分分析(principal component analysis,PCA)、偏最小二乘判别分析(partial least squares discriminant analysis,PLS-DA)、正交偏最小二乘判别分析(orthogonal partial least-squares discriminant analysis,OPLS-DA)等,利用得分图和载荷图分析无机元素变量在不同产地小麦粉分组中的权重影响,并借助权重值(VIP)和S形图(S-plot)筛选出特征元素变量。    
2结果与分析    
2.1不同地区小麦粉中的无机元素含量
        整体观察3个地区小麦粉中10种无机元素含量分布(如表1所示),可以看到这10种元素在3个地区的小麦粉样品中含量相当,但来自同一地区的样品,同一元素含量分布跨度相对较大,个别元素在不同地区出现较大差异,这些特征与小麦的生长环境关系密切,存在成为区分小麦粉产地来源的特异性指标可能性。GBW10011对应元素的测定结果均在标示值不确定度范围内,说明本研究采用的检测方法准确可靠。
表1不同地区小麦粉样品及GBW10011中无机元素含量测定结果(±s)
     Table 1Results of inorganic elements concentration in GBW10011 and wheat flour from different regions    
2.2PCA方法分析小麦粉中的无机元素含量
        将来自3个不同地区的共计173份小麦粉样品所测定的10种无机元素含量导入SIMCA-P软件,利用PCA方法建立PCA模型,模型计算出2个主成分,建模后模型的输出参数分别为:R2X(cum)=0.821(代表模型的拟合能力)、Q2(cum)=0.439(代表模型的预测能力),模型的输出参数均>0.5,表明拟合效果及预测能力良好,所得得分图和载荷图见图1。
图1不同地区小麦粉样品PCA得分图(左)和各无机元素变量主成分载荷图(右)
     Figure 1Score chart (left) and loading char (right) of PCA based on wheat flour from different regions    
         PCA相对于传统的统计方法的优势是能够从 整体的角度对数据集进行分析,并且是其他多元统计分析方法的基础。新疆维吾尔自治区的小麦粉样品能够与河北省和江苏省的小麦粉样品实现很好的区分,但不能区分河北省和江苏省两个产地,新疆维吾尔自治区与其他两省的区分主要分布在第二主成分的方向,由于主成分是由10个无机元素变量线性组合而成,可以从无机变量的载荷图中进一步分析得出特征元素与各主成分之间的相关关系:Fe与两个主成分都呈较强的正相关关系;Al与第一主成分呈正相关,但与第二主成分呈负相关;Cu与第一主成分呈弱正相关,与第二主成分相关性不大。新疆维吾尔自治区的小麦粉样品Fe的含量范围为(1.51±0.710)mg/kg,河北省和江苏省则分别为(24.5±11.9)和(22.8±10.4)mg/kg,因此,PCA得分图中新疆维吾尔自治区与其余两省的区分主要是产地的小麦粉含铁量较低导致的。     
2.3PLS-DA方法分析小麦粉中的无机元素含量
        将3个不同地区的小麦粉样品数据集设为X集,并依次给各地区的样品分别赋予分类变量Y值1、2、3,然后重新导入SIMCA-P软件,利用PLS法建立PLS-DA模型,模型计算出5个主成分,各模型参数为:R2X(cum)=0.747、R2Y(cum)=0.821、Q2(cum)=0.784,拟合效果良好,所得得分图和各无机元素变量所得VIP分值图见图2。
 图2不同地区小麦粉样品PLS-DA得分图(左)和各无机元素变量VIP分值图(右)
     Figure 2Score chart (left) and VIP value (right) of PLS-DA based on wheat flour from different regions   
         为了更好的区分3组不同产地的小麦粉,可以采用样品集对分类变量的回归进行建模,即PLS-DA,该方法相对PCA的优势是能够将已知的分类信息综合进行分析,以便于寻找隐藏于噪音信号、共线性等损害模型稳健性因素中的分类特征变量。从图2的PLS-DA得分图中可以看到,原本在PCA得分图中无法区分的江苏省、河北省两地样品实现了很好的分离,在该回归模型中,将各无机元素变量按其VIP得分高低排序,筛选出得分最高的Fe、As、Cu三个元素,即是导致三产地样本分开的主要因素,这在表1中也进一步得到验证,比如除了Fe之外,江苏省小麦粉样品As含量比其他2个地区低,河北省小麦粉样品Cu含量较其他2个地区高。     
2.4OPLS-DA法分析河北省和新疆维吾尔自治区小麦粉样品
        助OPLS-DA分别对河北省和新疆维吾尔自治区小麦粉样品建立OPLS-DA模型,此模型拟合出2个与分类变量正交的变量to1和to2,一个与分类变量相关的主成分t1,各模型参数为:R2X(cum)=0.649、Q2(cum)=0.964,以t1、to1所得得分图以及S-plot见图3。
图3河北省和新疆维吾尔自治区小麦粉样品OPLS-DA得分图(左)和各无机元素变量S-plot图(右)
     Figure 3Score chart (left) and S-plot (right) of OPLS-DA based on wheat flour from Hebei and Xinjiang        
2.5OPLS-DA法分析江苏省和新疆维吾尔自治区小麦粉样品
        对江苏省和新疆维吾尔自治区小麦粉样品建 立OPLS-DA模型,此模型拟合出3个与分类变量正交的变量to1、to2和to3,一个与分类变量相关的主成分t1,各模型参数为:R2X(cum)=0.684、Q2(cum)=0.968,以t1、to1所得得分图以及S-plot见图4。
图4江苏省和新疆维吾尔自治区小麦粉样品OPLS-DA得分图(左)和各无机元素变量S-plot图(右)
     Figure 4Score chart (left) and S-plot (right) of OPLS-DA based on wheat flour from Jiangsu and Xinjiang    
         PLS-DA已经实现了三地样品的区分,但在实际应用中,江苏省和河北省仍然有部分样品重叠,主要原因在于样品测定过程中的系统偏差等因素时刻存在并影响整个测定过程,但这一类因素构成的变量分量与分类变量正交,因此在数据分析过程中应当事先分离,然后再进行模型拟合,即OPLS-DA。鉴于新疆维吾尔自治区自然条件相对江苏省、河北省差异较大,该地区样品最先得到分离,在后续的分析策略中,采用其余两省对新疆维吾尔自治区进行分别建模,找出相应的特征元素,再借助SUS-plot图将两个模型进行综合分析。在河北省和新疆维吾尔自治区的样品比较中,Fe、Cu和Zn在样品分类中起关键作用(图3);在江苏省和新疆维吾尔自治区的样品比较中,Fe、As和Tl在样品分类中起关键作用(图4);结合SUS-plot图(见图5),进一步验证Fe可以作为区分三地样本的特征元素变量,同时As、Tl两变量是区分江苏省和新疆维吾尔自治区小麦粉样品的特征变量,从表1也可以看出新疆维吾尔自治区和河北省样品中As、Tl含量均高于江苏省。 
图5河北-新疆与江苏-新疆的OPLS-DA模型SUS-plot图
     Figure 5SUS-plot of OPLS-DA based on wheat flour 
    from three regions        
3小结
        本研究利用PCA、PLS-DA、OPLS-DA技术对河北省、新疆维吾尔自治区、江苏省的小麦粉样品无机元素含量进行分析,分析结果表明3个地区的小麦粉样品对应的特征元素分别为Cu、Fe和As,这些特征元素有望被应用于小麦粉产地溯源。
参考文献
[1]白云峰, 陆昌华, 李秉柏. 畜产品安全的可追溯管理[J]. 食品科学,2005,26(8):473-477.
[2]方炎, 高观, 范新鲁,等. 我国食品安全追溯制度研究[J]. 农业质量标准,2005(2):37-39.
[3]孔洪亮, 李建辉. 全球统一标识系统在食品安全跟踪与追溯体系中的应用[J]. 食品科学,2004,25(6):188-194.
[4]林金莺, 曾庆孝. 可追溯体系在食品中的应用[J]. 现代食品科技, 2006,22(4):189-192.
[5]吕青, 王海波, 顾绍平. 可追溯体系及其在水产品安全控制中的作用[J]. 渔业现代化, 2006(3):7-9.
[6]黄志勇, 杨妙峰, 王小如,等. 利用铅同位素比值判断丹参不同产地来源[J]. 分析化学,2003,31(9):1036-1039.
[7]BONER M, FORSTEL H. Stable isotope variation as a tool to trace the authenticity of beef [J]. Analytical and Bioanalytical Chemistry, 2004,378(2):301-310.
[8]BRICOUT J, KOZIET J. Detection of the addition sugar to orange juice by isotopic analysis [J]. Science Aliment,1985(5):197-204.
[9]BRESCIA M A, CALDAROLA V, BUCCOLOERI G, et al. Chemometric determination of the geographical origin of cow milk using ICP-OES data and isotopic ratios: a preliminary study [J]. Italian Journal of Food Science,2003,15(3):329-336.
[10]BETTINA M F, GREMAUD G, HADORN R, et al. Geographic origin of meat-element of an analytical approach to its authentication [J]. European Journal of Food Technology,2005,221(3/4):493-503.
[11]郭波莉, 魏益民, 潘家荣. 同位素指纹分析技术在食品产地溯源中的应用进展[J]. 农业工程学报,2007, 23 (3):284-289.
[12]孙淑敏, 郭波莉, 魏益民,等.多矿物元素分析在羊肉产地溯源中的应用[C]//中国农业工程学会.农业工程学会2009年学术年会论文集,山西,2009.