異步電機(jī)的矢量控制因其穩(wěn)定可靠、響應(yīng)速度快等優(yōu)點(diǎn),在工業(yè)場合中得到了大量應(yīng)用。近年來,異步電機(jī)的間接矢量控制(Indirect Field Orient Control, IFOC)在電動汽車領(lǐng)域的使用越來越廣泛。由于IFOC是采用基于轉(zhuǎn)差角頻率的轉(zhuǎn)矩控制,本質(zhì)上是一種前饋控制方法。電機(jī)的參數(shù),特別是轉(zhuǎn)子時(shí)間常數(shù)的變化,會導(dǎo)致異步電機(jī)轉(zhuǎn)子磁鏈定向不準(zhǔn),從而嚴(yán)重影響電機(jī)的輸出轉(zhuǎn)矩和輸出效率。因此,有必要對電機(jī)參數(shù),特別是轉(zhuǎn)子時(shí)間常數(shù)進(jìn)行辨識。
與傳統(tǒng)工業(yè)應(yīng)用不同,在電動汽車用電機(jī)控制中,希望電機(jī)在任意轉(zhuǎn)速下盡可能輸出最高的轉(zhuǎn)矩。為達(dá)到這一目的,有必要對任意轉(zhuǎn)速下的電機(jī)進(jìn)行基于轉(zhuǎn)矩最優(yōu)的參數(shù)辨識,稱之為電機(jī)參數(shù)標(biāo)定。國內(nèi)外文獻(xiàn)采取了一些控制方法對電機(jī)參數(shù)進(jìn)行辨識,例如模型參考自適應(yīng)方法、擴(kuò)展卡爾曼濾波器方法、滑模觀測法、最小二乘法等。
上述方法的共同點(diǎn)是算法極大地依賴于電機(jī)的數(shù)學(xué)模型,被稱為模型驅(qū)動法。模型驅(qū)動法主要存在以下四種缺陷:
①模型驅(qū)動法的辨識精度受模型誤差影響大。例如,文獻(xiàn)[5]提出了一種基于擴(kuò)展卡爾曼濾波器的電機(jī)參數(shù)辨識方法,但該方法在高噪聲的狀態(tài)下無法適用,因?yàn)樵肼晻B加至系統(tǒng)模型成為模型誤差,從而降低了算法的精確性。
②模型驅(qū)動法存在穩(wěn)定性問題,在某些狀態(tài)下導(dǎo)致系統(tǒng)發(fā)散。例如,文獻(xiàn)[6]提出了一種基于模型參考自適應(yīng)的參數(shù)辨識方法,但在低頻狀態(tài)下,定子電阻的擾動會造成系統(tǒng)的不穩(wěn)定。
③模型驅(qū)動法只能在某些特定的狀態(tài)適用,無法擴(kuò)展到全狀態(tài)場合。例如,文獻(xiàn)[7]采用最小二乘法進(jìn)行參數(shù)辨識,但只能適用于恒轉(zhuǎn)矩狀態(tài),無法擴(kuò)展到弱磁狀態(tài),因此無法適用于電動汽車用電機(jī)的參數(shù)辨識。
④模型驅(qū)動法的目標(biāo)是跟蹤正確的物理參數(shù),而電動汽車用電機(jī)參數(shù)辨識的目標(biāo)是搜索到在任意給定轉(zhuǎn)速和給定電流的條件下能使轉(zhuǎn)矩輸出最大化的參數(shù)值,兩者的辨識目標(biāo)仍存在著差異性。
近年來人工智能理論的發(fā)展使得基于數(shù)據(jù)驅(qū)動的電機(jī)參數(shù)辨識方法成為可能。數(shù)據(jù)驅(qū)動的電機(jī)參數(shù)辨識方法的主要特征為:基于大量的實(shí)驗(yàn)數(shù)據(jù),采用人工智能的方法對電機(jī)的參數(shù)模型進(jìn)行訓(xùn)練。較為成功的方法包括基于人工神經(jīng)網(wǎng)絡(luò)的參數(shù)辨識方法、基于支持向量機(jī)的參數(shù)辨識方法、基于遺傳算法的參數(shù)辨識方法以及基于粒子群算法的參數(shù)辨識方法等。
相比于模型驅(qū)動方法,數(shù)據(jù)驅(qū)動方法具有更高的辨識精度和算法魯棒性,同時(shí),可以在給定轉(zhuǎn)速及電流下給出基于轉(zhuǎn)矩最優(yōu)的參數(shù)解,從而適用于電動汽車用電機(jī)參數(shù)辨識的要求。然而,數(shù)據(jù)驅(qū)動方法最大的缺陷在于:成功的數(shù)據(jù)驅(qū)動方法往往需要大量的帶有標(biāo)簽的訓(xùn)練數(shù)據(jù),但在實(shí)際的工業(yè)應(yīng)用中,這種數(shù)據(jù)往往難以獲取。
文獻(xiàn)[12]采用神經(jīng)網(wǎng)絡(luò)對異步電機(jī)轉(zhuǎn)子時(shí)間常數(shù)進(jìn)行辨識,但使用電壓模型作為標(biāo)簽訓(xùn)練神經(jīng)網(wǎng)絡(luò),本質(zhì)上仍屬于模型驅(qū)動方法。文獻(xiàn)[13]使用支持向量機(jī)進(jìn)行電機(jī)參數(shù)的訓(xùn)練,但沒有闡述訓(xùn)練數(shù)據(jù)的獲取方法。文獻(xiàn)[14]采用多目標(biāo)粒子群算法對電機(jī)參數(shù)進(jìn)行辨識,但使用的是電機(jī)銘牌數(shù)據(jù)作為標(biāo)簽數(shù)據(jù),其可靠性有待商榷。
鑒于上述問題,本文研究了一種Actor-Critic框架下的數(shù)據(jù)驅(qū)動電動汽車用異步電機(jī)離線參數(shù)辨識方法,其特點(diǎn)為:①訓(xùn)練數(shù)據(jù)可以自動生成,無需從外界獲??;②數(shù)據(jù)的獲取和訓(xùn)練同時(shí)進(jìn)行,從而縮短了訓(xùn)練時(shí)間;③辨識結(jié)果為概率解而非確定解,從而提高了算法的抗干擾性;④可以實(shí)現(xiàn)任意給定轉(zhuǎn)速及給定電流下基于轉(zhuǎn)矩最優(yōu)的無偏估計(jì),從而適用于電動汽車用異步電機(jī)的參數(shù)辨識要求。
圖5 基于Actor-Critic框架的電機(jī)參數(shù)辨識的數(shù)據(jù)流圖
圖6 實(shí)驗(yàn)平臺示意圖
傳統(tǒng)的基于模型驅(qū)動的電機(jī)參數(shù)辨識方法的缺點(diǎn)為易受模型誤差的影響、抗干擾能力差、無法實(shí)現(xiàn)全轉(zhuǎn)速范圍轉(zhuǎn)矩最優(yōu)等?;谏鲜鋈秉c(diǎn),本文研究了一種數(shù)據(jù)驅(qū)動的新思路,即完全采用實(shí)際數(shù)據(jù)進(jìn)行電機(jī)參數(shù)辨識的方法。
針對傳統(tǒng)數(shù)據(jù)驅(qū)動方法中需要大量標(biāo)簽數(shù)據(jù)的問題,研究了一種基于Actor-Critic框架的電動汽車用異步電機(jī)參數(shù)辨識方法,使得電機(jī)可以在數(shù)據(jù)訓(xùn)練的同時(shí),自動產(chǎn)生訓(xùn)練數(shù)據(jù)的標(biāo)簽值,從而解決了數(shù)據(jù)驅(qū)動電機(jī)參數(shù)辨識方法中標(biāo)簽數(shù)據(jù)難以獲取的問題。實(shí)驗(yàn)結(jié)果表明了與傳統(tǒng)的模型驅(qū)動法相比,本文方法的優(yōu)勢為:
1)基于模型驅(qū)動的電機(jī)參數(shù)辨識方法受到模型誤差和模型穩(wěn)定性的影響,在某些工況下辨識精度較低;而本文方法完全基于實(shí)際數(shù)據(jù),辨識的參數(shù)不會受到模型誤差和穩(wěn)定性的影響,同時(shí),使用概率解而非精確解保證了該方法具有很強(qiáng)的抗噪聲性。
2)基于模型驅(qū)動的電機(jī)參數(shù)辨識方法只能辨識出電機(jī)實(shí)際參數(shù),不能保證全轉(zhuǎn)速范圍的轉(zhuǎn)矩和效率最優(yōu);本文方法辨識的是使電機(jī)輸出轉(zhuǎn)矩最優(yōu)的參數(shù),而并非實(shí)際物理參數(shù),可以使電機(jī)的轉(zhuǎn)矩和效率更高。
必須注意的是,本文提出的方法仍然受到某些方面的限制,后續(xù)的研究工作有:
1)由于本文采用轉(zhuǎn)矩作為獎勵值,因此,需要在帶有轉(zhuǎn)矩儀的對拖臺架上才能實(shí)現(xiàn),限制了本文方法的應(yīng)用場合。因此,如何改進(jìn)獎勵值是今后需要研究的內(nèi)容。
2)基于Actor-Critic框架的參數(shù)辨識方法本質(zhì)是“試錯(cuò)”方法,具有一定“破壞”性,因此無法適用于電機(jī)參數(shù)的在線辨識,只能適用于電機(jī)參數(shù)的離線辨識。事實(shí)上,可以將基于Actor-Critic框架的參數(shù)辨識方法作為電機(jī)的“數(shù)據(jù)產(chǎn)生器”,同時(shí)使用另一種數(shù)據(jù)建模方法對其數(shù)據(jù)進(jìn)行訓(xùn)練,再將最終數(shù)據(jù)模型送入電機(jī)控制器,從而實(shí)現(xiàn)電機(jī)參數(shù)的在線辨識。具體內(nèi)容會在后續(xù)的工作詳細(xì)闡述。