一種基于可變誤差的非線性系統(tǒng)自適應(yīng)最優(yōu)控制方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及智能控制技術(shù)領(lǐng)域,尤其涉及一種基于可變誤差的非線性系統(tǒng)自適應(yīng) 最優(yōu)控制方法。
【背景技術(shù)】
[0002] 在當(dāng)今的社會(huì)生活和工業(yè)領(lǐng)域存在著大量的復(fù)雜系統(tǒng),如電力系統(tǒng)、交通系統(tǒng)、制 造系統(tǒng)、化工過程系統(tǒng)、通信網(wǎng)絡(luò)系統(tǒng)等,都需要被控系統(tǒng)在有限的資源條件下完成控制目 標(biāo)。最優(yōu)控制是使控制系統(tǒng)的性能指標(biāo)實(shí)現(xiàn)最優(yōu)化的基本條件和綜合方法,可概括為:對一 個(gè)受控的動(dòng)力學(xué)系統(tǒng)或運(yùn)動(dòng)過程,從一類允許的控制方案中找出一個(gè)最優(yōu)的控制方案,使 系統(tǒng)的運(yùn)動(dòng)在由某個(gè)初始狀態(tài)轉(zhuǎn)移到指定的目標(biāo)狀態(tài)的同時(shí),其性能指標(biāo)值為最優(yōu)。
[0003] 隨著科技的發(fā)展,人們對控制系統(tǒng)的性能也提出了越來越高的要求。而這些復(fù)雜 系統(tǒng)通常具有高度的非線性、未知的動(dòng)態(tài)特性、模型的不確定性等,難于建立精確的數(shù)學(xué)模 型。而自適應(yīng)控制可以看作是一個(gè)能根據(jù)環(huán)境變化智能調(diào)節(jié)自身特性的反饋控制系統(tǒng),以 使系統(tǒng)能按照一些設(shè)定的標(biāo)準(zhǔn)工作在最優(yōu)狀態(tài)。因此,如何設(shè)計(jì)出一種非線性系統(tǒng)自適應(yīng) 最優(yōu)控制方法顯得尤為重要。
【發(fā)明內(nèi)容】
[0004] 有鑒于此,本發(fā)明的主要目的在于提出一種基于可變誤差的非線性系統(tǒng)自適應(yīng)最 優(yōu)控制方法,以便滿足對復(fù)雜系統(tǒng)的自適應(yīng)控制。
[0005] 為了實(shí)現(xiàn)上述目的,本發(fā)明提出了一種基于可變誤差的非線性系統(tǒng)自適應(yīng)最優(yōu)控 制方法,包括以下步驟:
[0006] 步驟1、選擇隨機(jī)初始狀態(tài)Xtl;選擇任意半正定函數(shù)Ψ(Χ??)彡0 ;選擇收斂精度ζ ; 給定參數(shù)序列{qj,其中〇<1<1;給定兩個(gè)常數(shù)〇<f<l,〇< ξ <1分別表示可變 誤差的衰減率;令迭代參數(shù)i = 〇 ;
[0007] 步驟2、令初始性能指標(biāo)函數(shù)4(?) = = vF(Xh),并求得參數(shù)Ytl,使其滿 足VJF(xk,Uk))彡YtlUUk, uk),其中F(xk,uk)是系統(tǒng)狀態(tài)方程,Vtl(X k)為初始性能指標(biāo)函 數(shù),U(xk,uk)是系統(tǒng)的效用函數(shù),Ψ (Xk)為半正定函數(shù);
[0008] 步驟3、計(jì)算得到初始控制律
【主權(quán)項(xiàng)】
1. 一種基于可變誤差的非線性系統(tǒng)自適應(yīng)最優(yōu)控制方法,包括以下步驟: 步驟1、選擇隨機(jī)初始狀態(tài)Xtl;選擇任意半正定函數(shù)Ψ (Xk)彡O ;選擇收斂精度ζ ;給 定參數(shù)序列{qj,其中〇<1<1;給定兩個(gè)常數(shù)()<?~<?,0< ξ <1分別表示可變誤差 的衰減率;令迭代參數(shù)i = 〇 ; 步驟2、令初始性能指標(biāo)函數(shù),并求得參數(shù)丫〇,使其滿足 V0(F(xk,Uk))彡yoUUk,uk),其中F(x k,uk)是系統(tǒng)狀態(tài)方程,Vci(Xk)為初始性能指標(biāo)函數(shù), U(xk,uk)是系統(tǒng)的效用函數(shù),Ψ (Xk)為半正定函數(shù); 步驟3、計(jì)算得到初始控制律之(?) = argmiiiWh為)+丨 Uj. 及初始迭代性能指標(biāo)函數(shù)以)=仍a A (?)) +之Λ (?)))+疋。(?).其中, Po(Xk)為迭代控制近似誤差,JI0(Xk)為迭代性能指標(biāo)函數(shù)近似誤差; 步驟4、定義單步迭代的目標(biāo)迭代性能指標(biāo)函數(shù)為 1^(') = 111叫"〇:(,?() +之(.Υ?+1)};定義全局迭代目標(biāo)函數(shù)為 Ujc 6(?) = + 5(?+!)};計(jì)算獲得參數(shù) 〇1使其滿足 . uk 9 yn +1 給定任意0<4彡1,如果σ i滿足-,其中Ytl可由步驟2得到,則估計(jì) Yo 參數(shù)丫1使其滿足^1$(115,1115))彡丫 111(115,1115),并令1 = 1+1,繼續(xù)執(zhí)行下一步;否則,令 A(^) = 5^0(?)和 31Ci(Xk) = ^ π〇 (?),返回步驟 3 繼續(xù)執(zhí)行; 步驟5、對于任意i = 1,2, …,計(jì)算得到迭代控制律 AU)) = argmin(i/U·,為.)+ 丨%\+1)) + u-k 0+1〇^) = [,〇1-,仏〇^)) +『/;(廠〇;^〇;;-))) +疋/<^);其中^(~)為迭代控制近似誤差, π i (Xk)迭代性能指標(biāo)函數(shù)近似誤差; 步驟6、定義全局迭代目標(biāo)函數(shù)為4(?) = ,力)+ 根據(jù)目標(biāo) uk 迭代性能指標(biāo)函數(shù)「.+i(A) = min丨〃(七為)+ ^仏+1)!,計(jì)算獲得參數(shù)。屑其滿足 uk ^+1(^)^σΙ+1Γ;+1(χ,). 9 1. Jr \ 給定任意(Xqi彡1,如果σ i滿足則估計(jì)yi+i使其滿足 Ti vi+1(F(xk,uk)) ^ j pi{xk)'=<^pi{xk)^ ^i(Xk)= ξ π i (Xk),返回步驟5繼續(xù)執(zhí)行; 步驟7、如果|?^+1〇^:)-ζ是收斂精度,即可獲得最優(yōu)性能指標(biāo)函數(shù)和最 優(yōu)控制律;否則令i = i+Ι繼續(xù)返回步驟5執(zhí)行。
2. 如權(quán)利要求1所述的非線性系統(tǒng)自適應(yīng)最優(yōu)控制方法,其特征在于,在步驟5中采用 兩個(gè)神經(jīng)網(wǎng)絡(luò),即執(zhí)行網(wǎng)絡(luò)與評判網(wǎng)絡(luò)分別逼近迭代控制律與迭代性能指標(biāo)函數(shù)。
3. 如權(quán)利要求2所述的非線性系統(tǒng)自適應(yīng)最優(yōu)控制方法,其特征在于,所述評判網(wǎng)絡(luò) 與執(zhí)行網(wǎng)絡(luò)均采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行構(gòu)建。
4. 如權(quán)利要求1所述的非線性系統(tǒng)自適應(yīng)最優(yōu)控制方法,其特征在于,在步驟6中獲得 參數(shù)γ i的步驟為: 步驟1-1、令μ (xk)為任意給定的容許控制; 步驟1-2、對于i = 1,2,…,根據(jù)μ (Xk)構(gòu)造新的性能指標(biāo)函數(shù)Pi (Xk),滿足Pi+1 (Xk) =U (xk,μ (xk) KPi(Xw),其中 Pci(Xk) = Vci(Xk) = W(Xk); 步驟1-3、給出只使其滿足對/(? ,Mi )乏乃, )); 步驟1-4、令K = 。
5. 如權(quán)利要求1所述的非線性系統(tǒng)自適應(yīng)最優(yōu)控制方法,其特征在于,在步驟6中獲得 參數(shù)γ i的步驟為: 步驟π-i、對于Vf = Ijv..,迭代性能指標(biāo)函數(shù)可以通過下式獲得 K+l (?) = " (-V 1〕乂'.)) + 丨':(廠(? 戍(Λ^ 步驟11-2、令I(lǐng) JIi(Xk) I為L(Xk)的上界,定義新的迭代性能指標(biāo)函數(shù)為 Vi+l(Xk) = U(?,{xk )) + ν{(Fixl^vj(xk))) + π?(xk)+1 πι (xk) \ 步驟 11-3、令 = ; 步驟II-4、由以/(?,七)2 0(/7(?,?))得出只, 步驟11-5、令匕=六。
6. 如權(quán)利要求1所述的非線性系統(tǒng)自適應(yīng)最優(yōu)控制方法,其特征在于,在步驟6中獲得 參數(shù)γ i的步驟為: 步驟ΠΙ-1、記錄3〕,色,…,$_!和乙。,乙,…,心―1; 步驟m-2、通過t (Xt)="(~從rA.)) + 0(/'?%?))) + TTi(A)獲得迭代性能 指標(biāo)函數(shù),通過?!?ι (Λ))=ninKy(\,\)+6(七 +1))獲得目標(biāo)迭代性能指標(biāo)函數(shù) Γ i (Xk); 步驟111-3、對于V/ = 根據(jù)如下不等式0(?)之g;r;(X)獲得^;如果 ^(?) 2 Γ;(々),則s = I;根據(jù)如下不等式對/(X/t,W/t) k g(F(X,W/t))獲得允;
通過下式解出乙: r =A- -Δ; 步驟II1-5、令A(yù) =乙。
【專利摘要】本發(fā)明公開了一種可變誤差的非線性自適應(yīng)控制方法,通過引入合適的近似誤差來逼近性能指標(biāo)函數(shù)和策略控制函數(shù),并使得指標(biāo)函數(shù)能最終一致收斂。本發(fā)明結(jié)合神經(jīng)網(wǎng)絡(luò),由于神經(jīng)網(wǎng)絡(luò)的良好的逼近性能,通過同時(shí)調(diào)節(jié)評價(jià)網(wǎng)絡(luò)和策略網(wǎng)絡(luò)的近似誤差,使最終的性能指標(biāo)函數(shù)能夠收斂到最優(yōu)評價(jià)函數(shù)的一個(gè)鄰域內(nèi)。
【IPC分類】G05B13-04
【公開號】CN104834221
【申請?zhí)枴緾N201510272090
【發(fā)明人】劉德榮, 魏慶來, 林漢權(quán), 李超
【申請人】中國科學(xué)院自動(dòng)化研究所
【公開日】2015年8月12日
【申請日】2015年5月25日