熵最小算法详细

1:熵最小算法 (BTEM,tBTEM和MREM)

数据采样:当一个样品,经过GC-MS后,经计算机采样得到一套数据Ak×v,其中k是计算机采样次数,例如从出峰时间10-12分钟之间,每隔0.1秒采样,共采样21次。υ是数据通道数,例如被采样质谱的质量电荷比(m/z)是10-100,间隔是1个m/z,共91个数据通道。下面,我们将算法的标准程序按照先后次序列出:

1)将数据集 Ak×u按照方程(1)进行奇异值分解(SVD), 然后将右奇异矩阵VTv×v没有物理意义的部分除去,将对角矩阵Sk×v中的全零部分去除,得到VTk×v 和 Sk×k,矩阵U我们没有用到。Fun1

2)对矩阵 VTk×v 中的每个行向量进行观察,那些看起来像背景噪声的行向量我们可以去除,例如从第j行向量以后看起来都是噪声,我们就把(j+1-k行向量都去掉,得到 VTj×v.

3)从那些保留下来的VTj×v中,通过检视这些j个行向量,使用者可能对某一个或几个峰,或者是某一区间有兴趣。例如峰m/z=91,或者m/z= 90-100感兴趣。使用者就可以将这些峰或区间锁定(Target),并开始运算。

4)首先,一个随机向量T1´j由计算机生成,该T向量将由所使用的优化算法自动更新,直到找到最优值。通过T,一个和纯谱有关的向量 aest 通过方程(2)得到。aest将根据T的变化而变化,直到优化结束方程;最后得到的aest我们认为就是纯谱。方程(2)中的S矩阵(见步骤1)可用,也可不用,根据实际需要而定。Fun2

5)将 aest 用锁定的峰或区间中的最高峰,按照方程(3)单位化。单位化后的向量,我们叫 。这个过程就是我们的“锁峰”过程。其中,a’ 和 a”是锁定的峰和区间。Fun3

6)利用的得到的ahat构建优化方法的目标函数和罚函数,方程(4)是总的目标和法函数,具体目标函数和罚函数,根据不同类型的谱图,有不同的表达方式,详细请参考相关文献。其中P函数是罚函数。通过方程(5),计算得到伪浓度信息。Fun4 Fun5

7)检测目标函数的值,看是否已经达到优化终点?如果达到了,那么就输出纯谱aest,和伪浓度Ckx1。如果没有达到优化终点,那么就将由优化方法,重新生成一个T1xj,返回到步骤4到7重新计算,直到优化结束。

重复步骤3到7,就可以锁定不同的峰或区间,运行算法,得到不同的纯谱和相关浓度,然后就可得到混合谱中的其他,或者是全部纯谱信息。

2:优化方法的使用

熵最小系列算法(BTEM,tBTEM和MREM),都需要用到优化方法(得到T)。首先,熵最小方法利用SVD后的VT数据,利用优化方程(4),构建一个多维值空间;然后利用优化方法,在这个值空间里搜索纯谱。对于锁住的不同峰或区间,其构建的多维值空间不同。

图:值空间和优化方法示例:在一次优化中,BTEM/tBTEM熵最小算法方法只会找到最下面的一个纯谱。而MREM算法方法就会找到全部的多个谱图

图:值空间和优化方法示例:在一次优化中,BTEM/tBTEM熵最小算法方法只会找到最下面的一个纯谱。而MREM算法方法就会找到全部的多个谱图

如下图所示,在搜索方式上,BTEM/tBTEM认为全局最小点是纯谱的位置,所以用的是全局优化方法,每次优化,只能得到一个纯谱。后来张华俊发现,在值空间中的各个局部最小点,都对应一个纯谱,所以研发了MREM; MREM使用局部优化方法,每次优化,在每个局部最小点,都有一个纯谱。所以一次优化,能够得到多个纯谱,所以速度大大加快,能力大大加强。将BTEM,tBTEM,MREM方法混合使用,效果更强。能够找到100%被其他谱图淹没的谱图,而且能够应用于紫外这样的高难度体系。

实际的运算过程中,如果需要自动运行,并有较好的结果,还需要很多专家方法协同作用。

3:文献

1. Chew, W., E. Widjaja, and M. Garland, Band-target entropy minimization (BTEM): An advanced method for recovering unknown pure component spectra. application to the FTIR spectra of unstable organometallic mixtures. Organometallics, 2002. 21(9): p. 1982-1990.
2.Zhang, H., W. Chew, and M. Garland, The multi-reconstruction entropy minimization method: Unsupervised spectral reconstruction of pure components from mixture spectra, without the use of a Priori information. Applied Spectroscopy, 2007. 61(12): p. 1366-1372.
3.Zhang, H. and M. Garland, MREM: An enhanced method for reconstructing pure component spectra from multi-component mixture automatically without prior information. Abstracts of Papers of the American Chemical Society, 2006. 231.
4.Gao, F., et al., Application of the BTEM family of algorithms to reconstruct individual UV-Vis spectra from multi-component mixtures. Chemometrics and Intelligent Laboratory Systems, 2009. 95(1): p. 94-100.