流量计主导相判别的主要任务是判别油水两相流的三种流动状态:1)水为主导相(油含率≤40%),2)过渡状态(40%<油含率<60%),3)油为主导相(油含率≥60%)。本文利用16电极阵列式电导传感器来获取油水两相流的电导信息,并进一步采用二乘支持向量机(LS-SVM)和偏二乘法(PLS)等数据挖掘方法来对两相流主导相进行实时判别。
流量计基于电导测量值判别油水两相流的主导相本质上是一个多分类问题,可通过设计多个两类分类器并结合“一对一”的多类分类策略来得以解决。根据“一对一”策略,在每两类之间均设计一个两类分类器,三种流动状态(主导相)总共设计三个分类器。对于待测试样本通过投票法确定其归属某一种流动状态。实际的主导相判别过程如图2(a)所示,首先通过阵列式电导传感器获得电导测量值,然后利用每一个分类器逐一对所获得的电导值进行测试。如果某一分类器指出当前主导相属于第i类流动状态,则向第i类流动状态投一票。终得票多的流动状态就作为当前主导相的辨识结果。
上述用于解决流量计主导相多分类问题的两类分类器可通过模式分类方法得以实现。支持向量机(SupportVectorMachine,SVM)是新近发展起来的基于机器学习的模式分类技术,它基于结构风险化原则,能有效解决过学习问题,具有较好的泛化能力,已经在很多领域得到了成功应用。二乘支持向量机(Least-SquaresSupportVectorMachine,LS-SVM)是SVM的改进形式,其求解速度优于普通SVM。因此,本文选用LS-SVM建立油水两相流主导相分类器。
基于LS-SVM设计油水两相流主导相分类器需要考虑以下两点:1)为了尽可能实现高效准确的分类,用于设计分类器的特征量(输入数据)应尽可能少。2)如果输入数据存在多重相关性或者在输入数据中存在着与输出不相关的冗余信息,则LS-SVM的泛化能力将受到不利影响。因此,有必要对LS-SVM的输入数据进行特征提取。偏二乘方法(PartialLeastSquares,PLS)能在有效提取数据特征量的同时消除数据的多重相关性及与输出不相关的冗余信息。因此本文采用PLS来提取油水两相流电导测量信息的特征,然后以所提取的特征量作为LS-SVM的输入来建立主导相分类器(如图2(b)所示)。
4.1 阵列式电导传感器
本文采用的流量计电导传感器为16电极阵列式电导传感器。传感器结构如图3(a)所示。16电极电导传感器共可获得104个电导测量值。电导测量硬件系统结构如图3(b)所示,包括阵列式电导传感器、激励信号发生模块、数据采集模块、时序控制模块、数字信号处理模块和通信模块。其中,激励信号发生模块产生双极性脉冲激励信号,并采用相邻激励模式来获取电导测量值。数据采集模块采集电导测量值并将其转换为相应的数字信号,提交给数字信号处理模块进行后续处理。数字信号处理模块以ADSP2188N数字信号处理器为,通过通信模块(采用USB2.0技术)将数据终发送给上位机。此外,激励和测量过程中涉及一些时序控制,均通过以复杂可编程逻辑器件(CPLD)为的时序控制模块来实现。
4.2 主导相分类器设计
如前所述,采用偏二乘(PLS)法提取电导测量值的特征,以所提取的多个特征量作为二乘支持向量机(LS-SVM)的输入来设计主导相分类器,则主导相分类器的设计过程主要包括两个步骤:基于PLS提取电导特征量和基于LS-SVM建立主导相分类器。
4.2.1 基于PLS的电导特征量提取
设自变量(电导测量值)为R,因变量(油水两相流主导相)为Y。PLS提取电导特征量的主要步骤为:
(1)分别从R和Y提取隐变量t1和u1,这两个隐变量需要满足以下两个约束条件:1)t1和u1尽可能多地包含R和Y的方差信息,2)t1和u1之间的相关性达到。如此获得电导测量值的个特征t1。
(2)分别将R和Y对t1进行回归,
其中p1和q1是载荷矩阵。
(3)分别以R1和Y1代替R和Y,重复步骤(1)~(2),逐个提取电导特征量,直到满足终止准则。终可得提取的多个电导特征量t1,t2,t3,…,tm,这些特征量均是104个被测电导值的线性组合,即:
T=RH (8)
其中R是电导测量值矩阵,H是变换矩阵。
参与分类的电导特征量的个数通常应少于原始的电导测量值个数。本文采用交互验证法计算分类误差平方和,并认为当分类误差平方和时所对应的电导特征量个数。
利用PLS所提取的电导特征量彼此不相关,但保留了尽可能多的与两相流主导相的相关性,因此,这些特征量可为两相流主导相判别提供尽可能多的有意义的信息。