因此本研究旨在利用电子鼻系统采集不同冻藏前状况和不同冷冻储藏期猪肉的气味信号数据,应用主成分分析(PCA)、重复测量的方差分析对其数据特点进行分析,再分别利用线性判别分析(LDA)和基于多层感知器的人工神经网络(ANN)等模式识别算法建立预测模型,从而建立针对猪肉冷冻储藏期和冻藏前是否经过长时间冷藏的电子鼻快速无损检测方法。该方法对于加强冷冻肉品监督管理,保证广大消费者的食品安全提供了一种可行的检测手段。
电子鼻检测
样品冻结后,分别在第0、25、80、134、161、200、250天对样品进行电子鼻检测。样品每次检测完成后,迅速用保鲜膜重新密封烧杯放回 -20 ℃继续冷冻储藏,检测过程中保持低温使样品不发生解冻。
数据处理
分别选用主成分分析(PCA)、重复数据的方差分析和独立样本的非参数检验来观察电子鼻区分不同冷冻储藏时间和冻藏前是否经过长时间冷藏的能力,同时通过线性判别分析(LDA)和人工神经网络(ANN)算法来建立猪肉冷冻储藏时间和冻藏前是否经过长时间冷藏的预测模型,并对预测模型的性能进行验证。
结果与讨论
电子鼻检测数据的主成分分析与重复测量的方差分析
在多元数据的统计分析中,PCA是一种常用的降维分析方法,不仅可以解决多个实验指标的共线性问题,还可以通过产生“主成分”来降低指标维度并利用主成分得分进行 2D 或 3D 作图来反映样本间的分布情况。本研究通过对电子鼻检测数据的 PCA 分析共提取2个主成分 (特征值 >1),总贡献率为 85.04%,其中第一主成分贡献率为 59.37%,主要代表芳香类化合物的变化;第二主成 分贡献率为 25.67%,主要代表氢气、烷烃等小分子的变化。利用主成分得分数据绘制散点图见图 1。

但是通过第一、第二主成分的 2D散点图并不能明显区分相同冻藏时间的 A,B两组样品。由于在现实中存在将过期冷鲜肉回收转为冻藏肉的情况,为进一步了解 A,B两组样品的多指标结果是否具有显著的差异,利用 A,B两组样品电子鼻检测数据的第一、第二主成分得分计算所得综合主成分得分作为因变量,进行重复测量的方差分析,结果见表 1,表 2。从表 1可知,由于不满足 Mauchly的球形度检验(P<0.05),故采用 Greenhouse-Geisser、Huynh-Feldt、下 限等 3种方法矫正的组内效应检验均表明冻藏时间对 检测结果影响显著,而A,B分组的因素对检测结果随冻藏时间的变化影响不显著(即冻藏时间与 A,经正态分布检验发现,在第 80,134,250天的数据并不服从正态分布(p<0.05)。为了解在不同冻藏时间点 A,B两组间检测结果的差异是否显著,采用两独立样本的非参检验对数据进行分析,结果见图 2。



从图 2可见,在第 0,80,134,161,250天时 A,B两组间检测结果差异显著,而第 25 和 200 天时 A,B两组间检测结果差异不显著(p>0.05)。这表明经过 7d冷藏后再冻藏的猪肉与新鲜冻藏的猪肉相比可能已经发生了变化,但在冻藏过程中发生劣变可能又掩盖了其本身的差异,但随着冻藏时间的增加其气味成分的差异又逐渐加大。尽管 200d 时的差异也不显著,则是可能是由于组内变异过大掩盖了组间差异造成的,其平均值之间的差异仍在增大。
通过这一系列分析发现,不同冻藏前状态和不同冻藏时间的猪肉样品的电子鼻检测数据,在整体上均有显著的差异,这为利用这些数据建立针对猪肉冻藏前状态和冻藏时间的预测模型提供的基础条件。
电子鼻检测数据的线性判别分析
为建立相应的预测模型,采用 LDA方法对数据进一步分析。LDA一种常用的分类方法,立足与找到反映两类物体或事件特征的一个线性组合,以特征化或区分不同的样本集。对冷冻储藏 0、25、80、134、161、200、250d共 420 个猪肉样品数据按照分组方式和冻藏时间分为 14 个类别进行 LDA分析,结果如图 3所 示。用 于 作 图 的 判 别 函 数 其 总 贡 献 率 为 78.7%,其中第一判别函数贡献率为 53.3%,第二判别函数贡献率为 25.4%。由图 3可知,经过 LDA分析后,除了冻藏第 0 和 25 d的数据重合度较高外,其余第 80~250d的数据都能较好区分,说明在冻藏 1个月内猪肉样品的劣变几乎没有发生,但随着冻藏时间的增加冻藏猪肉的变化越来越显著。同时在第134,161,200和 250d处 A、B组样品的组质心分离明显,与主成分得分的非参检验结果类似。


为建立更好的猪肉冻藏时间及冻藏前冷藏时间的预测模型,采用基于多层感知器的人工神经网络算法对数据进行进一步分析。ANN是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型,目前已被广范的应用于多元数据的估计或预测。在 处 理 中 将 420 个样品利用随机函数分 为 3组,其中训练样品 219 个,测试样品 132 个,支持样品 69 个。最终生成包含 10个协变量(即电子鼻 10 个传感器的数据)的输入层,1 个含有 11 个单元的隐藏层和包含冻藏时间和 A,B组分类的输出层。该模型对支持组数据的冻藏时间预测的相对错误仅为 0.008 ,对冻藏前是否经过长时间冷藏的分组错误率仅 7.2%(即预测正确率为 92.8%,由于支持组数据不参与建模,其给出的误差可比较真实的反映模型的预测能力。)模型对冷冻储藏时间和冻藏前是 否经过长时间冷藏的预测结果见图 4。从图 4中可知,该模型对猪肉冻藏时间和 冻藏前是否经过长时间冷藏均有较好的预测能力。由于 ANN生成的预测模型对冻藏时间生产的是一个回归模型具有更大的预测范围,而对冻藏前是否经过长时间冷藏的分组也有更高的准确率,因该 ANN模型与 LDA模型相比具有更好的预测性能。

(1)通过电子鼻无损顶空检测及 PCA和重复测量的方差分析对电子鼻检测数据进行分析发现,不同冻藏前状态和不同冻藏时间的样品均表现出不同的多元数据分布特点。这为通过电子鼻检测数据的模式识别算法建立猪肉冻藏时间和冻藏前是否经过长时间冷藏的预测模型提供了基础条件。
(2)线性判别分析和基于多层感知器的神经网络算法均能建立猪肉冻藏时间和冻藏前是否经过长时间冷藏的预测模型。不过采用基于多层感知器的神经网络算法所建立的预测模型对冻藏时间预测的线性更大,回归函数的相关性更好,对冻藏前是否经过长时间冷藏也有更高的分组预测的准确率。
(3)本研究所建立的无损顶空检测电子鼻检测方法,使整个检测过程无需解冻样品和进行复杂的前处理,快速高效可实现现场检测。