流域年均含沙量的PP回归预测(李祚泳 邓新民 侯宇光)

热度212票 浏览78次 【共0条评论】【我要评论 时间:1999年1月01日 14:33

流域年均含沙量的PP回归预测

"{#N|)fv6Ov(gnX+X0
李祚泳 邓新民侯宇光
(成都气象学院)(四川联合大学)

摘 要应用投影寻踪回归技术,建立了流域年均含沙量的预测模型。用降雨量和年平均径流等4个因子建立的某流域平均含沙量的PPR预测结果的拟合合格率达100%,预留检验样本报准率为75%,表明PPR用于泥沙输移规律的预测研究是可行的。

a g;^yn]~D-B0

关键词流域 输沙量 投影寻踪回归 预测水利论文KFY+k9]

1 引言

d)B n4R X0

  我国是一个水土流失严重的国家。严重的水土流失给工农业生产和国民经济建设造成巨大危害。产沙量是反映水土流失的一个重要指标。而气象要素、地形、土质状况、植被系统及人类活动均对产沙量有重要的影响。国内外不少学者针对不同的地域特征,对流域的产沙机理,泥沙输移规律及其防治对策等进行了大量的研究[1,2],但对诸多因子与产沙量之间的定量研究进行得较少。考虑到引起泥沙流失的诸多因子与产沙量之间的关系具有高维和非线性的特点,而传统的统计预报方法是采用“从某些假定出发,按照一定准则,找出最优拟合”这样一条途径,难以适应千变万化的客观世界,也就无法真正找出数据的内在规律。这种传统的预报方案往往是还原拟合较好,但预留实况检验的精度很差。近20年来,在统计学中提出了一条“审视数据,模拟,预报”称为探索性数据分析(EDA)新途径。本文正是采用基于这种新思路,应用投影寻踪回归技术(PPR),建立流域产沙量的多因子预报模型。水利论文H%g!s:l"P2M|r0?

2 PPR原理及算法简介

R*Gce m7i1r0

     投影寻踪是国际统计界70年代兴起的高新技术,是应用数学,统计学和计算机技术的交叉学科,属前沿领域。

8Q0O G q5C9R-['G0

     PP是用来分析和处理高维数据,尤其是来自非正态总体高维数据的一类新兴统计方法[3]。其基本思想是:利用计算机技术把高维数据通过某种组合投影到低维子空间上,寻找出能反映原高维数据结构或特征的投影,在低维上对数据结构进行分析,以达到分析研究高维数据的目的。

i_vP1^z0

     传统的诸多线性模型通常局限于正态分布,但多数实际问题却不呈线性,因此勉强用线性手段进行辩识和预报,很难取得好的效果。而PP与其它非参数法一样,它可用来解决某些非线性问题。它虽然是以数据线性投影为基础,但它寻找的是线性投影中的非线性结构。因此,它可用来解决一定程度的非线性问题。PPR模型如下:设X=(X1\:\:XP)是一P维随机向量,Y=f(X)是一维随机变量,为了避免线性回归不能反映实际非线性情况的矛盾,PPR采用一系列岭函数的和来逼近回归函数的方法,即水利论文E-cC2n/y7`#mQ

990112e1.gif (1513 bytes)水利论文;Zy&yslV+u

(1)水利论文1Z._Bw1P*PRw?$[

式中Gm(Z)表示第m个岭函数,Z=(990112e2.gif (928 bytes))为岭函数的自变量,它是向量990112e3.gif (888 bytes)990112e4.gif (879 bytes)方向上的投影,990112e4.gif (879 bytes)也为某方向的P维向量,M为岭函数的个数。

qE+P2B9nH(cw0

Friedman和Stuetzle提出了实现PPR的SMART多重平滑回归技术,SMART模型具有如下形式水利论文VO-SrMx;H

990112e5.gif (1470 bytes)

g3f `7p/e QJ$V0

(2)

+^ vE,p9sg0

  它实际上是采用分层分组迭代交替优化方法对式(2)中的参数α,β,Mu和岭函数Gm寻优。实现步骤为

|;n7Y#~'|[a0

  ①给定一个初始模型;

:R\.h*who4B:QF6]0

  ②把数据投影到一个低维空间上,找出数据与现有模型相差最大的投影,这就表明在这个投影中含有现有模型中没有反映的结构;

B A0K-Z(p'C0

     ③把上述投影中所包含的结构并到现有模型上,得到改进了的新模型;

xQ!|uQ*c6Z0

     ④再从这个新模型出发,重复以上步骤,直到数据与模型在任何投影空间都没有明显的差别为止。水利论文1P(Ta0QY$SsW

     模型的关键是最终估计出式(1)的参数:岭函数最优化项数Mu,岭函数Gm,系数αjm,βm。其判别准则仍是:选择适当的参数组合,使式

t#R*b L2n5Kt0

990112e6.gif (1600 bytes)水利论文2p8qT R)|&Q

(3)水利论文:Y o+G'B*]`"x!Vl

具体作法是:把全体参数分成几组,除其中一组外,都给定一初值,然后对留下的一组参数寻优。得到结果后,把这一组参数的极值点作初值,另选一组参数在这一初值下寻优。多次重复直到参数收敛为止,即将αjm,j=1,2…………P,βm及岭函数Gm划入一组,m=1,2,………M,共有M组。固定其中的M-1组,而对这一组ajm,βm,Gm优化求解。此时,又将其分成三个子组,分别固定其中的两个子组,对第3子组优化。然后重复这一过程,直到收敛为止,即L2不再减小为止。

t$WD4EG Dk0

     用SMART计算软件进行PPR计算时,实际操作十分简单,因为模型只有岭函数的光滑系数S,岭函数个数的上限M及最优个数Mu3个参数需要调整。光滑系数S确定着数据平滑窗口的大小,其取值范围S∈[0.1,0.9],考虑到在满足一定精度条件下,尽可能缩短模型运行时间,要求Mu≤M≤9,通常取下面这些组合:“M,Mu”为“5,3”;“6,5”;“6,4”和“9,6”等,其最佳值最终由计算结果分析确定。此外,样本容量值N可在不超过500范围内自行指定,屏显值与指定值N之差由程序自动视为预留检验样本数。PPR的理论分析及算法详见文献[4,5]。水利论文&CN1St~){

3 某流域的年均含沙量的PPR回归预测

2[ G S L){0

     一般说来,流域的年均含沙量受多种因素影响,但对具体流域必须具体分析。其因子选择原则应尽可能选择那些与年均含沙量相关性好,而又比较稳定的有明确物理成因的因子作为PP回归建模因子。经分析,引起该流域含沙量增加的突发性偶然因素发生的可能性较小,年均含沙量比较稳定。该流域含沙量与气象、水文要素和下垫面植被状况关系密切。因此,选择了采伐面积(X1),采伐量(X2),降雨量(X3)和年平均径流(X4)等4个因子作该流域产沙量的预报因子。水利论文Qa6wY+TmY.y)q

     该流域的年均含沙量及有关的4个因子的历史监测数据见表1,数据取自文献[6]。水利论文3WJx)q&r V9~}

     用PPR的SMART软件建立该流域年均含沙量的预测模型时,用表1中的前14组数据建模,后4组数据预留检验。将表1中全部18组数据输入PPR计算程序,在固定因子数P=4和建模样本数N=14情况下,反复调试模型中3个参数S.M和Mu的不同组合,使模型计算输出的拟合检验效果达最佳。由于式(2)中的岭函数Gm(Z)不是解析函数,而是数值函数表,因此,PP回归最终只给出达效果最佳时的模型参数组合值为S=0.1,M=6,Mu=4,此时年均含沙量的拟合和预留样本检验效果见表2。表2的后两行为4个预留样本检验结果。由于用PP回归计算的拟合值是多重平滑后的结果,因此,拟合值不是时序值,它与时序值有一个差异。不过这种拟合差异如用相对误差绝对值的平均值表示,不超过4%。用SMART计算软件实现该流域年均含沙量预测建模过程中,还同时给出如表3所示的各因子对年均含沙量的贡献大小的相对权值。这些相对权值就反映了这些因子对流域年均含沙量的影响程度。从表3可见,4个因子对年均含沙量影响从大到小依次是年径流量>降雨量>采伐面积>采伐量。水利论文(b;`2l$K0H(d]i1WI

表1 某流域年均含沙量及有关因子实测值水利论文;{sX'lYZr/T0UA

Yearly average sediment concentration and measured data of related factors

x&AnG,B0

序号

Z3|;m ^^1g0

年份水利论文*a^Z+]2q*B}P

采伐面积

;y x aG}+u1u#c7]f} @0

X1(M2

.Y&fG4R%M1A `Su1p,o+f0

采伐量

!R(H E V(uGe-Z6Y!~0

X2(M3

|#aay+id0

降雨量水利论文D*eR)\%E

X3(mm)

5W)lL3D0{ T"Q0

年平均流量

#Y#xlG7Epy3k0

X4(m3/s)

0FLd/lu3T!\;L0

年平均含沙量水利论文Y0Kh:_*iM9L-r!\

Y(kg/m3

MhK!H| V)a0

1

^r.c _8r0av0

1961

I1A(u Ykt/\%X[4?0

15100水利论文UwH _d7z

29000

+_Q{u%S KMc0

508.0

q\I/K`/f])}0

180

"n4K{W k d*S}i0

3.40

6VbA+r${Y }0

2

tfrq%\(d6vm:n0

1962水利论文} Y(\P8x3t

20500水利论文3WkM^&l0B

43350水利论文+n([L"Hg-V

453.7水利论文@L${yb lD

141水利论文 ?|JE$C5ki y

3.00水利论文!g P9ntRB*|"iOt0|4p

3水利论文KHyy6tvXep

1963

}!C:sJ9d0

80000水利论文KzS svQG

92610水利论文w^O9TW9S9D

487.9水利论文M;J9{D(t7|l9f

132

{[s4I7d4V p j0

2.70

H2t!M)D,vgA0

4水利论文a5HM(V2Sf$Oo

1964

+h#[6p B-dD$["pU0

91500

i O/tt z7O)i0

142775

V l"\+js@s0

572.3水利论文 ~f,Q2j/qOU:nQ_

182

(F:u-I-G9|^3HWp&R\0

3.37水利论文)n],P6M:O3cV8Bc

5

G"S$K nJ6z.v0

1965水利论文0L-YKG+SrJ

82500水利论文F{\/o.R:[W bq

2123160水利论文g5O'ZrQ

455.7水利论文-tT3I(b-O9Ig

113水利论文o7I)Pc$m,zP#^

6.894水利论文0V!f-x?2L

6

&qj4ALV,Vp1?M|u0

1966

IC4R2x }0

20000

2N;vK+n8| I)nZm0

227800水利论文6qE:XG9foi6[(P,[)r

481.3

C-R5e+N Ht:c*jQ6}0

170

l5}4Lx.o3o6k'dk0

5.03水利论文/}0^|7jP

7水利论文!Qy9r|*n

1967水利论文.c G?s~:sQ$_$A

17800

M.X1tb9[p0

140000

3];]"b ~#J0

541.3

%Q#? z q2l`+Tf ^0

199水利论文*P!ssAPt |aY

3.55水利论文9\&p$D4J;uf!Gw

8水利论文r O jCG2W0uk

1968水利论文b U7e)@[YL

3900

`4dk8O+gn w0

15980

o*vVm3[,J9c1y0

538.6水利论文goq,O.I!T q7G

186水利论文L8LO(H(EZF#a^

2.72水利论文^@`E&t

9

xm DE;] aS0

1969

@g ^_i7_,p9P0

17300

};_n3HI0

223200

)_7{c"A%lz0

460.6水利论文8Pc:n)w8l

99.8

VX2[]v zkR#j[1L0

4.05

BT2PS8M!vi,V0

10

;X Gg'O bmh f0

1970

7fd8?!z WHB0

25700

/{WoE!\ [6P%Dz?0

229400

O,nc {z1\B0

393.1水利论文,q1U z2_#j3Jcl-W

133水利论文:R7V!w{|z5a

3.22

u1uB+Q$O\b0

11

(zp{9A-SSTM6jn#bHn Z1C0

1971

,C k(] NpI j0

49400水利论文z?g wW

424500

/DP-S:W&C$W0

373.9

'QZyxl9~0

106

#uFi6Y5WkE!y*Y0

2.65

!H#e-i*h J'SY9hA0

12

9o)g ENKm;C(U0

1972水利论文huu6D,J:uy%I5t,w"U

40700水利论文$W]/z,ja ]$Pqg;e

561700

-zJ n/E Kk"|PE0

428.8

C9pe;N#Dfe s'Kp0

107

KjA'o!} ry-WZ0

1.91

0TP6QC"T)T([8E0

13

4J+L6P+w_b0

1973

M j)R)F b0

77000水利论文Q;s @ N%?+c4yF'y

563600水利论文l$_u:IU

482.1水利论文8t&J_1r/N

140水利论文:M;uE2{+w lx

3.00水利论文r/yk&H`;r O'M Bm ]

14水利论文W4ks'd#D

1974水利论文7[l+n#ce*fX

72900

DJz jC0

557600水利论文'@9h*Z;V;sa

415.1水利论文[(oY6k0nN8a lkR

121

qE#KKp9ffe0

1.31水利论文e8M|Lza w]G

15

6]'H+J6])d0

1975水利论文)Ux3EUKv{sA:H

63300

tk lp2|)b9a0

528300水利论文a2_(R#vwA2Lz

536.7水利论文pw#]#u+Kufe

144

h0x ` oRd0

2.33水利论文 i3zE!qv

16

uTu+u1R0NI,z5k"pC0

1976

2R jo2m.uU9f0

51600水利论文\t,I j1fV1vn(}

488940

&Ci9H J$c T0

385.1

q.Lf7^xTRP0

154

#r#C-NK4i.M)QX9w'?0f0

3.55

0nlR+H#~ X^,k0

17水利论文F F%Z.{h%E

1977水利论文/K"Nhc.n~

60000水利论文*Zf"Pp Xh)XX

480500

4anE'o{0

412.2水利论文 f"Z ~ U |@;Z2KF

111水利论文0KZ'H/Uuk

3.35

{jVh*a:_0yic0

18

-k5oa&@4ecQ'?$L0

1978

E eH0Fo0

70000

{h4TsRG H0

530500水利论文8u YS@2]6ARl~ oz

567.1

G5f4E3lZ0

139水利论文~,a n"vci)Ot

2.55水利论文 em%r_ET8Z#D


表2 年平均含沙量PPR模型拟合和预留检验结果水利论文2K zI6NkJ

Results of fitting verification of yearly average concentration by using PPR model

j0w'}B%r;K"JNv0

实测值水利论文x+Qsjl5Z+v:]#xZ

计算值

.|-Ig P M4y0

绝对误差水利论文T)H.k yD1R Sc

相对误差(%)水利论文$TS ax8}L

实测值

[IX!P-A-U0

计算值

Iz!\\A4H$I.YJE6O0

绝对误差水利论文?AM!`^%p

相对误差(%)水利论文:x Ci)ex'N


3.40水利论文#MS9Y ~b2s0ml(K`r5[

3.131水利论文&m!o:|JU;fY+z*r'BG

-0.087水利论文lRm(Q_8`.rj6D

-2.5

4lkYWLS0

2.72水利论文j8\"}c2\]

2.934水利论文%Tn4MPg!} p D)ce

0.214

'{s'Xn e} e0

7.9

!T!Dn(wH!knl0

3.00水利论文,Mw~zf~z9g/t

2.738

E`;zHd0

-0.262水利论文B-M;cQ ])d d

-8.7

o2oq([ |I2|T0

4.05

1z y6Y8},\%xx*P%g0

3.996

L#PPAI0

-0.054

[7Y4N!y6dj/jr0

-1.3水利论文J\(W}|I

2.70水利论文7D3{!}?[*l9E Y

2.659

r[e ~m0

-0.041

aWN&[+Z2znXG0

-1.5水利论文[S]4K)s'|L

3.22水利论文*Z e7_7Qr{Z:M;sN

3.214水利论文#^G2msu^ _.`u-F7S

-0.006

@z$o1~ F5}k~0

-0.2

Ou!k9~e0

3.37

i@d7e%w\D9N @+^0

3.400水利论文3F1a!\ y2B

0.030

|B3y)B+| c-H0|h0

0.9

*N-{x&w'w b^L0

2.65水利论文(`.Z/}1q Wg)X['w'q9n/m

2.628水利论文8x)F9Mk*o7h

0.022

[0f vZ2b:Bp0

-0.8

g^#Q$Au0

6.894

JhB'zg0

6.926水利论文 V A4rAAs

0.032

3E;?.F:G#WV0

0.5

}l:w H+VM&[0

1.91

1`lduq#b*B d0

2.135

l'l4GT)l'c }a"O_0

0.225

B2e/P%H+i&v*Dm0

11.8

%@@` yJ0

5.03水利论文~n M D-{p&x

4.729水利论文QKk:e^d*{7A-O

-0.301水利论文{/LDic2Y

-6.0水利论文%MT!v ea(~[

3.00

-oq)A,^.VROHI0Wth0

2.987水利论文.{3~^!nB

-0.013

zD(d0O.G_^3y~:f ^0

-0.4水利论文8M2?o/g9y&m

3.55

8~v1P.u&d/TY0

3.826

'I!x.R,NVL0G M@0

0.276水利论文uD` C&p4kv

7.8

%z&j,l e2P2['rEv@0

1.31水利论文BN"~`g-V%P

1.319

F`)c T9~#W ? h^0

0.009水利论文l:WG g!~Ht'j!a6w

0.7

*K-JYRe.A|5f ~0

2.33水利论文]s%E)s| Ly

2.461

5^'g4EpZ2Q:i0

0.131

vMEt"d,W3A["u0

5.6

|/i[s*k.S2DE0

3.35水利论文S:AFb;V?"E,K'y

2.780

&t8p!RS&Fvg0

-0.570

| x~(pG)x p!l0

-17.0水利论文 w'Y(y1cOC

3.55

Mas%H U0

2.869

T2E yKV @0

-0.681水利论文 I#O/Pco/L!FU

-19.2

#Q9K)rg3m2}0

2.55

|%@|_QL0

4.305

/m9I!}@1e D.zcLT0

1.755

&{ Q;J d']#dU#q:N~;D0

68.8

hT%pNs$L0

拟合合格项数:14 拟合率:100% 预留检验合格项数:3 合格率:75%

表3 各因子的相对权值水利论文%S%~-TOo P"~?

Relative weighted values of factors水利论文"ay\U{2o l[


权序水利论文Z4U s? Q&w

1

3x:e7U.m(R KhrW0

2

3i-s ]7@ L-r"S0

3

;Fl1k5|~oQ"C(~j0

4

Kf%tN-G.}h0

因子水利论文7{z/e4fdwp

X4水利论文:@ G&t+Qx

X3

+OJg2j3{,?Z5c0

X1水利论文tC4UM1n.W6y)K0J

X2

I{)Lp@/{^'O0

相对权值

},[T.a?0`0

1.00000水利论文N"{ {ru~-j| `

0.85190

0}5t&PAD0

0.71617

P tKAUl0

0.29765水利论文 Pp.R0vc W


     若以相对误差δ<20%算合格,从表2可见,年均含沙量PPR预测模型拟合样本数为全部合格,其拟合合格率为100%,而预留4个检验样本合格率为75%,其拟合和预留检验效果如图1所示。   水利论文M\&kuL

  应用PP回归技术建立该流域的年均含沙量预测模型的拟合精度较高,但预留的4个检验效果不太理想。这是因为流域年均含沙量除了受上述几个比较稳定的关系密切的因子影响外,也会受到某些突发性偶然因素比如特大暴雨,滑坡等灾害事故及人为因素的影响。而用PP回归建模时,无法考虑这些偶然因素作用。第18个预测值与实况值相差较大,有可能就是某些突发性因素影响的结果。

tJey)|5]j,s4d ]3?S0

4 结论水利论文AW ob eaD2J

990112t1.gif (1658 bytes)

E{GNh Sx M%O0

图1 某流域产沙量的PP回归拟合及预留检验效果

,_X1wl;J$xO7X0

Effects of fitting and verification of sediment yield

h#]hID;n0

in a watershed by using PPR model

*f/ZD*O!Gy@/T0

     1.PP回归采用了“审视数据—模拟—预测”探索性数据分析新途径,建立的模型稳健性和抗干扰性好,因而预测模型有较高的精度。水利论文HVkI e2L!S!dUN9Z2F

     2.PP回归无论对于正态或偏态分布,线性或非线性,独立或非独立分布的数据都能有效地处理。因此,它适用于分析和处理流域含沙量等非正态和非线性等有关问题。水利论文0n"Ie2PF f

     3.PP回归用于流域输沙量等预测建模,只需直接使用原始监测数据,不需要对数据作预处理,避免了人为干预,客观性好。水利论文{ `Y?-h*j6Zd

     4.PP回归也可用于水土流失中其它指标的预测建模。水利论文x'} F9?T1GA

   5.本文用PP回归技术建立了流域年均含沙量的预测模型,求得年均含沙量S后,只要将年径流量QT×年均含沙量S就可得到流域的年输沙量QsT。

I| @4dz5? vGJK0

     6.本文用PP回归建立的流域年均含沙量预测模型未考虑对含沙量有影响的突发性因子在内,只适用于对含沙量有稳定影响因素的预测建模,如何把这些影响考虑在内,还有待进一步研究。水利论文]1J J+|w(Gw3OA

参 考 文 献

3M{0v6z:|!@0

1 陈浩。水土保持学报。1992,6(2):17-23.

z;hV.O,}zl0C0

2 张醒。泥沙研究。1991,(1):15-19.

r2eC]'CKq0

3 Friedman J.H.&. Stuetzle W.,J. Amer. Statis. Assoc. 1981, 76:817.

aS/BQ&k:B0

4 Huber P.J..Ann. Statistics, 1985,13:435.

9f!UY(i._h1Ff)H0

5 郑祖国。水文。1994,(4):6-10.水利论文mt;oV3P

6 吴建明编著。环境统计学。北京:中国环境科学出版社,1991:504.

.S2j7I+z5Q7F+^tt1c0

 

L;N Wm!ZyH t?0
TAG: 含沙量 邓新民 侯宇光 李祚泳 流域
顶:33 踩:26
【已经有143人表态】
23票
极差
14票
很差
9票
较差
24票
稍差
26票
稍好
21票
较好
11票
很好
15票
极好
下一篇:海滦河流域水系分形(冯金良 张稳)
上一篇:垂线平均含沙量两种表述方法之比较(黄才安 梅小文)
查看全部回复【已有0位网友发表了看法】

广告投放

广告投放