新二乘法

 

主题词:数据回归、多维、非线性、模型、应用

摘要:“新二乘法”是“最小二乘法”的改进法,它在数据回归计算时,不只计算模型的常数和系数,还计算模型中变量的幂值,使得非线性数据回归计算更简单结果更准确。

 

一、前言

“最小二乘法”在非线性数据回归时,要对模型进行数学替代和转换,回归结果也不是很准确。针对这些问题,我们对“最小二乘法”进行了改进,称之为“新二乘法”。

二、“新二乘法”原理

当研究两个变量  之间的相互关系时 ,实测得到一系列成对数据, 将这些数据描绘在x - y直角座标系中,可得到(1)所示散点图,观察散点在一条曲线附近,设这条曲线的拟合方程(1)为:

 

                                

 1

                   1

 

式中: 是任意实数

为建立拟合方程,就要确定 值,用实测值 减计算值,即

在计算的平方和如(2)

 

                          2

 

(1)代入(2)中,如式 3

 

                3

 

用函数分别对 求偏导数,令这三个偏导数等于零即:

 

            4

 

                                            5  

 

     6  

 

推导发现方程组无解析解,利用计算机程序,对方程组做数值解,可以得出 和相关系数,相关系数越趋近于 1 ,模型拟合越好。

 

模型选择

一、机理研究法 

1.  机理研究法是研究某过程的内在联系,对过程假设后,而建立的两个或两个以上因素之间关系的数学方程式;对数学方程式做数学变形处理,找出与预设模型(数学方程式)相对应的元和目标函数,在利用数据回归计算机理模型的系数。 

  2.  机理研究法适合:采集数据的量少,数据的精度低,需用机理模型弥补这些不足。

二、数据研究法 

1.   数据研究法是对两维数据,以两维数据分别为目标函数和因素,因素 X 的变化引起目标函数 Y 变化,这种变化可分为六种情况如(1)(6) 

2. 第一种 线性增加,随因素 X 增加,因素 Y 匀速增大。 
  
第二种 线性减少,随因素 X 增加,因素 Y 匀速减小。 
  
第三种 非线性增加,随因素 X 增加,因素 Y 加速增大。 
  
第四种 非线性增加,随因素 X 增加,因素 Y 减速增大。 
  
第五种 非线性减少,随因素 X 增加,因素 Y 加速减小。
  
第六种 非线性减少,随因素 X 增加,因素 Y 减速减小。 

3.  假设此六种情况方程式为(1): 
                          
            1

 

   第一种情况显然 a0 > 0 时,a1 0k
  
第二种情况显然 a0 > 0 时,a1 0k 1
  
第三种情况显然 a0 > 0 时,a1 0k 1k
  
第四种情况显然 a0 > 0 时,a1 00 k
  
第五种情况显然 a0 > 0 时,a1 00 k
  
第六种情况显然 a0 > 0 时,a1 0k 1 k 0

4.  通过上述分析总结,确定回归参数(即每一元)的数学式,第三、六种情况,曲线上凹,与指数曲线相似,可选指数形式 eX ; 第四、五种情况,曲线上凸,与对数形式相似,可选对数形式 LOG(X)(对数底为e);若选择幂形式 Xk,可根据上述第一种情况至第六种情况中 a0a1a2 k 之间的关系选择 k 值。

  5.  数据研究法适合:采集数据较多,数据的精度较高。

三、选择回归参数注意问题 

 

  1.  当一因素数据中有 0 值时, 此因素数据不可作除数和取对数;可把此维数据加上一个数,使它大于零。
  2.  
当一因素数据中有负数都有时,此因素数据不可做回归计算;可把此维数据乘上一个负数,使它大于零。
  3.  
某因素数据取幂时,不可太大和太小,否则回归计算机会中断溢出;有时回归出的模型,不能逆运算。  

 

 

新二乘法 和 最小二乘法 比较

 

新二乘法”和“最小二乘法”比较

 

一、若对任意数据用 (1) 拟和

                                        1

二、新二乘法”和“最小二乘法”比较表:

最小二乘法

新二乘法

拟和式

Y = a0 + a1 X

Y = a0 + a1 Xk

优化判据

(Yi - Y)2

(Yi - Y)2

回归计算结果

a0       a1

a0 a1 和  k

新二乘法中的 k = 1 时就是最小二乘法最小二乘法是“新二乘法”的特例

 

1. “新二乘法计算了因变量的幂值 ,“最小二乘法”把幂值默认为 1

2新二乘法利用计算幂值,使拟合式任意弯曲,能更好的拟和非线性数据。

新二乘法数据回归一因素数据可有若干个元(2),可使回归模型拟和非线性数据更准确。

         2

 

在式2

 

变量

函数

(2)

—  常数

系数

 

四、 新二乘法利用特殊拟合式(3),可对多维非线性数据回归,并且拟合的相关性非常高。

用“新平方法”对多因素非线性数据的回归,可在计算机程序中用式 3 进行回归。该方程考虑了因素对目标函数的贡献,还兼顾回归计算时因素之间的相互作用,这使得拟合模型具有很高相关性。

 

   3

 

在式3 :

变量

函数

(3).

 

常数

系数

 

说明:式9是以三维数据为例,他可做曲面类数据的回归。