關鍵詞:自適應共振,神經網絡,信用風險
摘要:自適應共振模型是為了能夠分類任意次序模擬輸入模式而設計的,它可以按任意精度對輸入的模擬觀察矢量進行分類,較好地解決了前穩定性和靈活性問題,同時能夠避免對網絡先前所學的學習模式修改。本文將ART2模型應用于信用風險評估,通過實證比較研究,結果顯示應用自適應共振模型進行信用風險評估在精度和準確性上,都優于其他神經網絡模型和統計方法。
1統計方法用于信用風險分類評估存在的局限性
對信用風險評估一類主流方法是基于分類的方法,即把信用風險分析看成是模式識別中的一類分類問題—將企業劃分為能夠按期還本付息和違約兩類。其具體做法是根據歷史上每個類別(如期還本付息、違約)的若干樣本,從已知的數據中發現其規律,從而總結出分類的規則,建立判別模型,用于對新樣本的判別,這樣信用評估就轉化為統計中的分類問題。傳統的統計模型主要基于多元統計分析方法,根據判別函數的形式和樣本分布的假定不同,主要的模型有:多元回歸分析模型、多元判別分析模型(MDA)、Logit分析模型、近鄰法等。其中以多元判別分析模型和Logit分析模型應用最為廣泛,已有大量商業化軟件。
盡管這些方法在國外有大量應用,但是大量實證研究(Altman,1983;Tam & Kiang,1992;Altman,et al,1994)結果發現:(1)企業財務狀況的評價可以看作是一類基于一系列獨立變量基礎上的分類問題;(2)企業財務狀況好壞與
財務比率的關系常常是非線性的;(3)預測變量(財務比率)可能是高度相關的;(4)大量實證結果表明,許多指標不成正態分布。而統計的方法卻不能很好地解決以上問題。由此可見統計模型的最大優點在于其具有明顯的解釋性,存在的缺陷是過于嚴格的前提條件。如多元判別分析模型(MDA),它要求數據服從多元正態分布、等協方差、已知先驗概率和誤判代價等要求,而現實中大量數據嚴重違背了這些假定(Eisenbeis,1997)。引入對數變化可在一定程度上改進數據的非正態分布,但一方面變換后的變量可能失去經濟解釋含義,另一方面仍沒有滿足等協方差的要求;應用二次差別分析(QDA)雖可解決等協方差問題,但一方面沒有滿足正態性假設,另一方面當數據樣本小、維數高(指標多)時二次差別分析的性能明顯下降,而樣本少、維數高正是我國信用數據的顯著特點。實證結果還表明二次差別分析對訓練樣本效果較好,而對測試樣本并不理想。除此以外,多元判別分析模型適用于成熟行業的大中型企業,因為這些企業具有較強的穩定性和規范性,其發展有一定的規律可循,參數統計方法易于給出較準確的結果及合理的解釋。然而這類方法是靜態的,需要根據地區、行業經濟情況的變化不斷地調整參數,甚至進行變量的調整。
為了解決這些問題,引入了Logit分析模型和近鄰法。Logit分析模型不需要假定任何概率分布,也不要求等協方差,但是當樣本點存在完全分離時,模型參數的最大似然估計可能不存在,模型的有效性值得懷疑,另外該方法對中心區域的差別敏感性較強,導致判別結構的不穩定。近鄰法不要求數據正態分布,但當數據的維數較高時,存在所謂的“維數禍根(Curse of dimensionality)”——對高維數據,即使樣本量很大,其撒在高維空間中仍顯得非常稀疏,絕大多數點附近根本沒有樣本點,這就使得“利用空間中每一附近的樣本點來構造估計”的近鄰法很難使用[4]。
2應用神經網絡進行信用風險評估的意義
商業銀行信用風險評估是復雜的過程,除了對企業的財務狀況的各種特征的評估外,還須對企業的非財務狀況進行評估,而且又涉及宏觀經濟環境和產業結構、產業周期的影響;除了客觀的評估外,還依賴于專業人員依據經驗進行主觀評估。神經網絡是一種具有模式識別能力,自組織,自適應,自學習特點的計算機制,它的知識編碼于整個權值網絡,呈分布式存儲且具有一定容錯能力。神經網絡對數據的分布要求不嚴格,也不必要詳細表述自變量與因變量之間的函數關系,神經網絡的這些特征使之成為信用風險分析方法的一個熱點。
建立商業銀行信用風險評估模型必須依賴于一組已知的函數集合。要求這種函數集合在任意精度上可以逼近實際系統,從數學上講,這就要求這個集合在連續函數空間上是致密的。目前已經從理論上嚴格證明了只用一個隱藏層的神經網絡就可以唯一地逼進任何一個連續函數。多層神經網絡為系統的辨識和建模,尤其是非線性動態映射系統提供了一條十分有效的途徑。非線性動態映射系統的神經網絡建模被認為是應用神經網絡的最成功的范例。
影響商業銀行信用風險評估的機理很復雜,無法建立精確的非線性動態模型,而人工神經網絡擅長處理非線性的、關系不確定的十分復雜以至于數學模型難以描述的問題。對于分析時間序列數據,由于人工神經網絡能識別和模擬數據間的非線性關系,不需要正態分布和先驗概率等條件的約束,能針對新增樣本靈活的訓練再學習,因此優于其他統計方法,同時由于網絡本身具有自學習的功能,預測結果相對精度較高而且穩定性好,因此應用神經網絡可以通過對網絡的訓練,掌握借款人的財務特征的非線性函數關系。神經網絡是由許多神經元構成的,它對系統特性的記憶表現為各個神經元之間的連接權值,單個神經元在整個系統中起不到決定性作用,一個經過訓練的神經網絡可以按相似的輸入模式產生相似的輸出模式,當商業銀行信用風險評估系統因某些非財務風險因素和判斷誤差過大的財務風險因素造成輸入模式變形時,網絡仍可以保證穩定的輸出。
神經網絡可以逼進任意復雜的非線性系統,神經網絡的轉換函數能夠非線性地響應沖擊,例如,像覆蓋比率這樣的財務比率超過最低水平(如AAA級)時,超過這個閥值的增加值不會對信用質量有什么影響。線性回歸不能以這樣的方式限制響應程度,神經網絡的轉換函數卻能實現。神經網絡以并行的方式處理信息,具有很強的信息綜合能力,因此神經網絡理論在商業銀行信用風險分析和實施對信用風險的主動控制中將會發揮更大的作用。
由神經網絡構成的非線性模型具有較強的環境適應能力。在根據多個訓練樣本企業的財務特征建立神經網絡非線性系統后,如果企業類型、財務特征和非財務特征發生變化,神經網絡可以通過學習,建立企業信用的非線性函數關系,并且不需要改變網絡的結構和算法。
綜上所述,對于那些無法建立精確的動態判別函數模型的非線性商業銀行信用風險評估,可以將神經網絡理論應用于風險評估當中,撇開企業財務因素、非財務因素和企業信用狀況復雜的非線性機理,建立起非線性風險映射近似的動態模型,使這個模型盡可能精確地反映風險映射關系非線性動態特征。通過該系統我們能夠計算對各種輸入的響應,預估商業銀行信用風險狀況及其發展趨勢,進而能夠使用各種信用工具對風險進行主動控制,促進商業銀行的智能化風險管理系統的建設和發展完善。
3基于自適應共振理論的信用風險評估模型
一個公司財務狀況的好壞往往是企業自身、投資者和債權人關注的焦點。因為一個營運良好、財務健康的公司可提高自身在市場上的信譽及擴展籌資渠道,以使投資者信心倍增。相反,一個陷入財務困境和瀕臨破產的企業不僅乏力吸引投資,還讓原有投資者面臨巨大的信用風險。
由上文的分析中我們知道,對企業財務指標的分析,傳統的分類方法盡管有它的優點但本身也存在一些局限性。作為研究復雜系統的有力工具,神經網絡能處理任意類型數據,這是許多傳統方法無法比擬的。通過不斷學習,能夠從未知模式的大量復雜數據中發現其規律。神經網絡方法克服了傳統分析過程的復雜性及選擇適當模型函數形式的困難,它是一種自然的非線性建模過程,毋需分清存在何種非線性關系,給建模與分析帶來極大的方便。該方法用于企業財務狀況研究時,一方面利用其映射能力,另一方面利用其泛化能力,即在經過一定數量的帶有噪聲的樣本訓練之后,網絡可以抽取樣本所隱含的特征關系,并對新情況下的數據進行內插和外推以推斷其屬性。
目前我國銀行機構主要使用計算貸款風險度的方法進行信用風險評估——在對企業進行信用等級評定的基礎上,考慮貸款方式、期限以及形式因素,進而確定貸款的風險度。其中作為核心的信用等級評定,是通過對企業的某些單一財務指標進行評價,而后加權平均確定的。該方法的最大缺陷在于指標和權重的確定帶有很大的主觀性,使得評級結果與企業的實際信用狀況有很大出入,因此需要引入科學方法來確定有效指標,并建立準確的定量模型來解決信用評估問題。
針對這種形勢,根據我國商業銀行的具體情況,結合國際上目前較為流行人工神經網絡技術,本文設計了一種基于自適應共振理論的信用風險評估方法。
3.1自適應共振理論(ART)介紹
自適應共振理論(Adaptive Resonance Theory)簡稱ART,是于1976年由美國Boston大學S. Grossberg提出來的。他多年來一直潛心于研究用數學來描述人的心理和認知活動,試圖為人類的心理和認知活動建立統一的數學理論,ART就是這一理論核心部分,又經過了多年的研究和不斷發展,至今已經提出了ART1、ART2和ART3共三種結構。ART網絡作為模式分類器較好地解決了前面提到的穩定性和靈活性問題。使用ART網絡及算法具有較大的靈活性以適應新輸入的模式,同時能夠避免對網絡先前所學的學習模式修改。ART是一種能自組織的產生對環境認識編碼的神經網絡理論模型,由于橫向抑制是自組織網絡的特性,ART采用了MAXNET子網結構,該網絡采用橫向抑制方法增強并能選擇具有最大值輸出的一個節點。
ART模型的算法過程如下:
第一, 將一個新樣本X置入節點;
第二,采用自下而上的過程,求得: ;
第三,運用MAXNET網絡,找到具有最大輸出值的節點;
第四, 通過自上而下的檢驗,判斷X是否屬于第j類,即如果有 ,則X屬于第j類, 是警戒參數。如果上式不成立,轉到第六步,否則繼續。
第五, 對于特定的j和所有的i更新 和 ,設t+1時刻 , , , 。
第六, 無法判斷X是否屬于第j類,抑制該節點返回到第二步,執行另一個聚類的處理過程。
本文所使用的神經網絡模型就是ART2神經網絡模型。ART2神經網絡是為了能夠分類任意次序模擬輸入模式而設計的。它可以按任意精度對輸入的模擬觀察矢量進行分類。
3.2應用ART2神經網絡進行信用風險評估的可行性分析
通過上文對ART2神經網絡的介紹,筆者認為將ART2神經網絡應用于信用風險評估具有統計方法和其他神經網絡算法無法比擬的優勢。首先,ART2神經網絡較好地解決了穩定性和靈活性問題,它可以在接受新模式的同時對舊模式也同樣保持記憶,而其它類型神經網絡所記憶的樣本個數有限,由此可見,ART2神經網絡隨著輸入樣本數的增加,它作為模式分類器分類的精度也越高,所覆蓋的樣本空間也越大。其次,ART2神經網絡是邊學習邊運行的無監督學習,所以它不存在像BP算法那樣需要進行幾小時甚至更長時間的訓練過程,也就是說ART2網絡具有較高的運行效率和較快的學習速率,這一點對于解決像信用風險評估這樣的復雜問題來說是相當具有優勢的。再次,ART2神經網絡與人腦的某些功能類似,能夠完成識別、補充和撤銷的任務。這三種功能在英文中稱為Recognition,Reinforcement和Recall,可簡稱為3R功能。識別功能在上文已經介紹過,下面對補充、撤銷功能做些簡單介紹。補充功能包含有以下幾方面的內容:(1)每當ART2系統對輸入矢量的類別作一次判決即是給出矢量所屬類別的輸出端編號,根據此判決,系統可以采取一種“行動”或者作出某種“響應”。這和人總是根據對外界情況的判斷來決定自己的行動相似。(2)人在識別時對于所有被識別的類并不是一視同仁的,識別過程受到由上向下預期模式的很強制約。這樣就會使得人們在某些情況下只關心幾種類別,而對其他類別則“不聞不見”,這種集中注意力的本領可以使人們在混亂的背景中發現目標。在客體發生某種變形或缺損或者有強噪聲情況仍能對其正確分類。我國商業銀行進行信用風險分析的起步較晚,有關的信息往往殘缺不全,ART2網絡的這種在混亂中集中注意力發現目標的功能更適合我國的現實數據情況。撤消功能的作用與補充功能相反,這是指某些不同的觀察矢量在初步分類時被劃分成不同的類別,但是通過系統(主體)與客體相互作用的結果,又應判定它們屬于同一類。由此可見基于ART2網絡的這些功能,應用ART2神經網絡進行信用風險評估相當于人類專家進行信用風險評估的建模過程,而且ART2神經網絡與人類專家相比進行的評估更客觀、更有效、更精確。最后,ART2神經網絡可通過調整警戒線參數 (門限值)來調整模式的類數, 小,模式的類別少(對分類要求粗), 大,模式的類別多(對分類的要求精細),這一點是其他方法無法比擬的,我們可以通過調整 值對輸入網絡的財務數據進行傳統的兩級分類(即違約、非違約兩類),也可以通過提高 值對輸入網絡的財務數據進行國際通用的五級分類(即正常、關注、次級、可疑,損失五類)。Altman、Marco和Varetto與意大利銀行聯合會合作在其經濟和金融信息系統中首次進行了將神經網絡應用于企業的經濟和金融問題診斷的試驗,試驗的研究結果表明,將企業的財務狀況分為正常、關注和次級三類比分為正常和問題兩類困難得多,而ART2神經網絡卻可以通過 值的調整靈活地實現該功能。
綜上所述,筆者選擇算法復雜的ART2神經網絡進行信用風險評估。并且設計了一個自適應共振網絡,對信用風險分析進行了實證研究。
3.3基于ART2模型的信用風險分析的實證研究
下面以某國有商業銀行提供的90多家企業客戶為對象,應用自適應共振理論對這些企業客戶的財務數據進行信用風險評估。對于輸入到神經網絡的財務比率的選擇,參照國內財政部考核企業財務狀況及國外用于信用風險評估所使用的一些經典財務比率指標,一共挑選出包括企業盈利能力、企業營運效率、企業償債能力及企業現金流量狀況等二十余個指標,考慮到指標間的相關性,利用SAS統計分析軟件進行回歸分析,得出以下幾個比率:
經營現金流量/資產總額(流動性)
保留盈余/資產總額 (增長性)
息稅前利潤/資產總額 (贏利性)
資產總額/ 總負債 (償債性)
銷售收入/資產總額 (速動性)
某國有商業銀行提供的樣本數據有90多家企業的財務數據,數據質量不高,有些企業財務數據缺失嚴重,經過對樣本數據的初步審查,刪除了不合格的樣本40多個,最終得到有效的樣本為55個,其中能夠償還貸款的企業34個,不能償還貸款的企業21個。
評估的準確程度用兩類錯誤來度量,在統計學中,第一類錯誤稱為“拒真”,第二類錯誤稱為“納偽”。在信用風險評估中把第一類錯誤定義為把不能償還貸款的企業誤判為能償還貸款的企業的錯誤,第二類錯誤定義為把能夠償還貸款的企業誤判為不能償還貸款的企業的錯誤。顯然,第一類錯誤比第二類錯誤嚴重得多,犯第二類錯誤至多是損失一筆利息收入,而犯第一類錯誤則會造成貸款不能收回,形成呆帳。
在應用自適應共振模型進行信用風險評估的同時,筆者也使用了統計方法和經典的BP神經網絡模型對同樣的樣本數據進行了信用風險評估,以便比較驗證自適應共振模型的評估準確性。
統計方法使用的是可變類平均法,可變類平均法是由Lance和 Williams(1967)發展的,計算距離的組合公式為:
Djm=(Djk+DjL)(1-b)/2+DkLb (1)
參數b介于0到-1之間,DkL——是類Ck與CL之間的距離或非相似測度。筆者使用SAS統計軟件中提供的可變類平均法對樣本數據進行了聚類分析。
BP神經網絡的結構包括輸入層5個節點,用來輸入5個財務指標比率,輸出層1個節點(取值為1表示能償還貸款,取值為0表示不能償還貸款),另外還有一個隱層,隱層包括5個隱節點。網絡的有效性采用K組交叉檢驗的方法進行驗證,也就是將樣本分為K組,其中K-1組為訓練數據,第K組為檢驗數據,這里將樣本數據分為兩組,第一組用于訓練網絡,包括11個違約的企業和16個非違約的企業,第二組作為檢驗數據,包括10個違約企業,18個非違約企業。該方法使用MATLAB語言編程實現。
ART2模型包括輸入層為5個節點,用來輸入5個財務指標比率,輸出層3個節點,分別表示信用風險的三個級別(正常,關注,可疑),這里應用ART2模型將信用風險分為三個級別有如下幾個原因:(1)將信用風險分為三個級別,比前面使用統計方法和BP模型方法將信用風險簡單分成兩類(違約、非違約)更容易把握風險的程度,更接近實際信用風險評估的需要,也更貼近于國際通用的五級分類標準。(2)通過ART2網絡門限值參數的調整可以將信用風險分為國際通用的五級分類標準,這也正是ART2模型的優勢所在,但是ART2網絡是信用風險分析混合專家系統的組成部分,它的評估結果要作為輸入,輸入到專家系統中,以便信用風險評估專家系統進行定性及定量的綜合評估,考慮到專家系統的規則的數量和知識庫的規模對系統執行效率的影響,因此這里將信用風險分為三類。有關專家系統的詳細說明,將在下一節討論。下面給出ART2模型網絡的參數設置:a=10,b=10,c=0.1,d=0.9, =0.2, 。由于ART2模型是無教師指導的網絡,因此不用訓練,直接輸入數據,網絡自動進行信用風險評估。其中評估的結果:正常、關注兩類屬于非違約企業,可疑為違約企業。該方法使用C語言編程實現。
下面給出三種方法的最后評估結果見表1
表1 訓練樣本和測試樣本的誤判
訓練樣本 測試樣本
第一類錯誤 第二類錯誤 總誤判 第一類錯誤 第二類錯誤 總誤判
統計模型 8(38.01%) 9(26.5%) 17(30.9%)
BP模型 2(18.1%) 1(6.1%) 3(11.1%) 3(30.0%) 4(22.2%) 7(25.0%)
ART2模型 4(19.1%) 5(14.7%) 9(16.3%)
通過表1的比較結果可以看出對于統計方法和BP模型自適應共振模型的誤判率是最低的,說明了該方法的有效性和可靠性。
另外需要說明的一點是,這里所使用的企業樣本數據偏少,而且噪聲過多,數據的質量不是很好,這樣的數據作為初始數據輸入網絡對網絡的評估的準確性有一定的影響,雖然ART2這種集中注意力可以在混亂的背景中發現目標的特性使得它的評估的準確性比其它兩種方法要高,但是筆者相信如果初始輸入網絡的數據質量再提高一些,網絡的誤判率會更低。
參考文獻:
[1] 張維,李玉霜,商業銀行信用風險分析綜述,《管理科學學報》[J],1998年第3期,20-27。
[2] 朱明,楊保安,基于知識的銀行貸款分類系統,CJCAI2001[C],231-235。
[3] 黃娟,馮玉強,王洪偉,基于聯接歸納推理的信貸風險評估集成智能系統,《計算機應用研究》[J],1999年第9期,74-16。
[4] 王春峰,萬海暉,張維,商業銀行信用風險評估及其實證研究,《管理科學學報》[J],1998年第1期,68-72。
[5](美)約翰.B.考埃特,愛德華.I.愛特曼,保羅.納拉亞南著,石曉軍等譯,《演進著的信用風險管理》[M],機械工業出版社,2001。
[6] 李志輝,《現代信用風險量化度量和管理研究》[M],中國金融出版社,2001年。
[7] R.R.Trippi and E.Turban, Neural networks in finance and investing[M], chicago: Irwin professional publishing,1996。
[8] Dick San-Cheong cheung, Kwok-Wa Lam and Sheung-Lun Hung, neural networks for credit scoring model, intrlligent data engineering and learning perspectives on financial engineering and data mining[M], published by Springer,1998,55-62。
[9] Christine Guilfoyle and Judith Jeffcoate, Expert Systems in Banking and Securities[M], published by Ovum Ltd 7Rathbone Street London W1p 1AF England,1990,81-88。
[10] Paul R. Watkins, Expert Systems For use in finance, Applied Expert Systems[M], edited by E. turban and P. R. Watkings, Elsevier Science Publishers B. V., 1998,159-167。
(華東理工大學商學院,上海,200237)
作者:馬海英 文章來源:華東理工大學 商學院