技术简介

该技术能做什么:

      该技术是源头型的技术,必将对非常多的产业产生深远的影响!

  1. 对含有很多未知组分的复杂混合物体系,例如中药和天然产物等做组分全分析,速度快,通用性强。该技术效率是现有分析技术的几十到几百倍。
  2. 对已知组分,可提供非常快速的鉴定方法。由于只需要利用色谱柱做最小的分离,得到样品的混合物谱图,所以该方法不受组分体系变化的干扰,同时分析速度非常快.
  3. 制定各种有效成分的标准,因为我们能够快速方便的分析出组分中的成分,所以我们能够提供标准。
  4. 提供中药和天然产物的各种组分信息,指导中药厂家和天然药物厂家的生产,研发等,生产高附加值的产品。

该技术特征:

该技术是利用化学计量法的一种算法,数学的从混合谱数据里提取每个纯谱的谱图和浓度。该方法主要基于统计学上的熵最小理论(Entropy Minimization),利用优化方法,在每次自动构建的值空间中找到最优点。和最优点对应的谱图就是纯谱,和实际浓度相关的伪浓度也一起计算出来。基于以上理论和算法,本技术不需要任何纯谱作为参照,也不需要提供信息,就能从混合物中计算提取出纯谱来。

关 键 词:

熵最小:Entropy Minimization;
锁峰熵最小方法:Band-Target Entropy Minimization (BTEM);
加权多出锁峰熵最小方法:Weighted two-band Target Entropy Minimization (tBTEM);
多重建熵最小方法:Multi-reconstruction Entropy Minimization (MREM);
化学成分分析; 通用成分全分析方法; 数学提取纯谱; 不需要任何信息。

技术优势:

  1. 色谱柱分离被大大简化,所以大量的为得到好分离结果而坐的工作可以免除,好的仪器也不需要了。所以投资,人才,运行成本大大降低,对技术人员的依赖性也大大降低。
  2. 本技术是通用的,无论对于什么混合物,方法,仪器和操作流程是一样的。现有方法对于不同的混合物需要做不同的实验设定,需要不同的实验仪器,费事费力,不能通用。例如分析姜的方法,就不能去分析蒜。而本技术对分析姜或者蒜没有任何区别。
  3. 和现有技术兼容。本技术可以结合现有分析技术,只是对没有分离好的部分做处理。所以可以和现有技术无缝结合。
  4. 本技术主要是处理数据,用计算机解谱,所以基于网络的分析中心成为可能。现有分析中心,只能在有限的地理范围内提供分析服务;本技术可以为世界各地的客户服务,而且是全年无休,每天24小时的服务。
  5. 多次分析和返溯分析成为可能。由于我们只是对数据分析,同一套数据能够做不同的分析,就是样品销毁了,我们也能利用数据做各种原来没有做过的分析。

本技术分析流程:

本技术分析流程

本技术分析流程

从左到右:从样品中提取混合物;→ 利用计算机对色谱分离后的混合物数据做采样,得到混合物谱图数据;→ 利用熵最小方法,从混合物中提取出纯谱的谱图和浓度。

技  术  详  细

技术基础:

  1. 本技术是基于熵最小方法,其中加入很多专家方法和经验参数。本技术在做完奇异值分解的混合谱数据上,利用优化方法,在构建好的n维值空间上搜索最优值。在n维空间的最优值对应的谱图,我们认为就是纯谱,同时和该纯谱相对应的 伪浓度也一起计算出来。
  2. 在同一套混合谱数据上,锁定不同的峰或者区间,后构建不同的值空间,每次就会搜索出不同的纯谱。在一次搜索中,不同的优化方法,会得到一个,或者是多个纯谱。
  3. 重复锁定不同的峰或者区间,就会构建出不同的纯谱。在重复足够多的运算后,混合物中的整个纯谱(可观测到的)就能被都重构出来。
  • 奇异值分解: Singular Value Decomposition, SVD。
  • Shannon 熵: Shannon 熵是(统计)信息科学的重要部分,它在1948年在Shannon的论文中被首次提出。Shannon 熵也是衡量体系不确定性的一个值。
  • 优化方法: 我们使用不同的优化方法,全局优化方法有模拟退火(simulated Annealing)和多起点单纯型法 (Mulit-Start Simplex),用于局部优化的有单纯型法(Simplx)和模拟退火等。不同的优化方法能够得到类似的结果,但是速度有差异。
优化方法的区别

优化方法的区别

  • 混合物数据:从分析仪器上采集到。利用计算机采样方法,在不同的时间点,每次采样得到一个混合物谱图。多次采样后,得到一组混合物数据。数据通常格式是Ak*v, 其中k是采样的次数(例如:从t=1s 开始,每隔一秒采样,到t=100s 结束采样。总共采样了100次,k =100),v 是数据通道的数目(例如:质谱采样从 m/z 10到 100,数据间隔是 1 m/z, 所以有 v= 91 个数据通道)。
  • 锁住的峰/区间:是由用户或者是计算机程序决定的,用户可以查看混合物数据,或者SVD结果后的数据,然后发现感兴趣的峰或者区间。计算机程序可以利用专家方法,自动寻找峰或者区间。例如用户发现质谱峰 在 m/z = 91的地方有成分信息,就可以将这个峰锁住。用户也可以同时锁住多个峰(建议不超过两个),或者简单的将整个区间都锁住。
  • 专家方法:光有熵最小方法是不够的,还需要很多专家方法,才能使程序自动运行。例如:判断组分数,自动锁住峰,对不同的数据做不同的参数设定等。

流程:从混合物谱图中重建纯谱数据

  1. 从实验仪器中采样得到混合谱数据 → 对混合谱数据做奇异值分解 → 得到SVD后的数据 → 选择一个或多个峰或者区间, 优化方法 和 优化函数 → 建立一个搜索值空间 → 在值空间中反复搜索最优值 → 得到最优值 → 利用SVD结果,混合谱数据和最有值的数据 → 计算得到相对应的纯谱和其伪浓度
  2. 为了发现找到了什么成分的纯谱,可以将得到的纯谱和已有的数据库比较,找到该纯谱对应的纯组分的信息。例如,可以利用EI-MS的NIST谱图数据库,找到纯谱所代表的组分信息。.
  3. 所以,本技术非常明显的,是不需要任何参照物或者纯谱数据,就能从混合谱中找到纯谱。当然本技术需要数据库,对我们已经重建出的纯谱进行比对,得到组成信息。所以本方法对含有非常多未知物的体系非常适用,例如中药,天然产物等体系。

技术发展过程:

本技术最早的发明者是Marc Garland博士,他在新加坡国立大学的团队,在1998年开始就研究熵最小方法(EM)在分析化学中的应用。从最早的熵最小技术上发展起来,经历了多个过程:

  • Squre-Problem EM: 不需指定峰或区间,但需猜测混合物中的组分数,一次优化,得到全部的结果。速度慢,难度大。
  • BTEM: 需指定峰或区间,一次优化得到一个纯谱,不需猜测组分数,优化速度快。用户需要专业知识,需要人操作,主要应用于研究领域。
  • tBTEM: 基于BTEM, 本来主要针对非连续谱,例如质谱。可以指定多个峰,同时给原始信息加权,对噪声抑制明显。后来的应用证明tBTEM对非常重叠的谱图,例如UV,也非常有用。
  • MREM:和所以其他EM算法不一样,MREM利用局部优化代替了全局优化,一次优化过程,能够得到非常多的纯谱,同时选择峰或区间也变得不是很重要了。所以MREM可以不需人为干预,自动运行。
  • 专家方法: 在运行熵最小方法的时候,需要很多专家方法同时运行,才能使得用户需要很少的知识,就能运用。我们的MREM商业软件就能做到。

参 考 文 献

[1] Chew W, Widjaja E, Garland M. Band-target entropy minimization (BTEM): An advanced method for recovering unknown pure component spectra. application to the FTIR spectra of unstable organometallic mixtures. Organometallics. 2002;21(9):1982-90.

[2] Li CZ, Widjaja E, Garland M. Spectral reconstruction of in situ FTIR spectroscopic reaction data using band-target entropy minimization (BTEM): application to the homogeneous rhodium catalyzed hydroformylation of 3,3-dimethylbut-1-ene using Rh4(CO)12. Journal of Catalysis. 2003;213(2):126-34.

[3] Zhang HJ, Garland M, Zeng YZ, Wu P. Weighted two-Band Target Entropy Minimization for the reconstruction of pure component mass spectra: Simulation studies and the application to real systems. Journal of the American Society for Mass Spectrometry. 2003;14(11):1295-305.

[4] Zhang H, Chew W, Garland M. The multi-reconstruction entropy minimization method: Unsupervised spectral reconstruction of pure components from mixture spectra, without the use of a Priori information. Applied Spectroscopy. 2007;61(12):1366-72.

[5] Gao F, Zhang H, Guo L, Garland M. Application of the BTEM family of algorithms to reconstruct individual UV-Vis spectra from multi-component mixtures. Chemometrics and Intelligent Laboratory Systems. 2009;95(1):94-100.