時間:2023-11-15 11:14:50
序論:速發表網結合其深厚的文秘經驗,特別為您篩選了11篇統計學決策規則范文。如果您需要更多原創資料,歡迎隨時與我們的客服老師聯系,希望您能從中汲取靈感和知識!
中圖分類號:F830.5 文獻標識碼:A 文章編號:1003-5192(2009)05-0032-06
Credit Risk Evaluation Based on Fuzzy Cluster and Variable Precision Rough Set
GUO Jun-hua1,2,LI Bang-yi1
(1.School of Economics and Management, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China; 2.School of Economics and Management, East China Jiaotong University, Nanchang 330013, China)
Abstract:Credit risk evaluation is one of the most important problems in the finance field. Fuzzy cluster and variable precision rough set theory are introduced to evaluate credit risk. Fuzzy cluster is applied to discriminate sample data. Then, decision rules are extracted by variable precision rough set theory. The result indicates that sample datacan be classifiedcorrectly by the decision rules which have the character of anti-interference.
Key words:credit risk; fuzzy cluster; variable precision rough set; decision rule
1 引言
信用風險評價是商業銀行貸款的重要依據。世界銀行對全球銀行業危機的研究表明,導致銀行破產的主要原因就是信用風險[1]。隨著2007年我國銀行業的全面放開,我國商業銀行面臨的競爭更加劇烈,如何科學、合理地對企業做出正確的信用風險評價,是一個值得研究的問題。傳統的信用評價方法存在某些不足,必須引入新的理論,對信用評價方法加以改進。粗糙集理論作為研究不確定知識表達、學習、歸納的新型數學工具,其重要特點是不需要預先給定某些特征或屬性的數量描述,而直接從給定問題的描述集合出發,在信息不確定情況下,仍可挖掘出大量對決策有幫助的知識信息[2]。粗糙集理論提供了一整套比較成熟的樣本學習式決策方法。由于標準粗糙集理論在某些條件下具有一定的局限性,缺乏對復雜系統的處理機制,對于不確定性概念的邊界區域,刻畫過于簡單,缺乏對噪音數據的適應能力。而在實際應用中,噪音是難免的,因此Ziarko提出了變精度粗糙集(Variable Precision Rough Set,簡稱VPRS)模型[3],增強粗糙集合模型的抗干擾能力。本文利用變精度粗糙集理論,根據2007年我國部分上市公司公布的年報數據,以部分財務指標作為基本屬性,從中篩選出能反映評價指標本質關系的重要屬性,從而挖掘出數據間的關系而形成信用評價決策規則。通過這些由訓練數據抽取的決策規則對測試數據進行判別表明,該方法具有良好的分類判別能力。
2 文獻回顧
在信用風險評價的文獻中,主要存在三類不同的方法。第一類是統計分類方法,第二類是神經網絡方法,另一類是支持向量機方法。
2.1 統計分類方法
早在1966年,Beaver[4]首次運用單變量判定分析法來研究公司財務危機問題,但該方法因財務比例的選取不同而觀測結果相差很大,所以很快被多變量分析法所取代。1968年,Altman率先將判別分析法應用于財務危機、公司破產及違約風險的分析,建立了Z-Score模型[5],該模型只適用于短期的預測。Altman在1977年及1983年又在Z-Score模型基礎上進行了改進,建立了ZETA模型[6,7],研究結果表明ZETA模型優于Z-Score模型。Martin、Ohlson、Maddala[8~10]等人分別在1980年前后將Logistic模型應用于信用風險分析,并認為Logistic模型優于Z-Score模型和ZETA模型。
國內學者在統計分類方法應用于信用風險評價的研究上也做出了具大貢獻。陳靜[11] 、張玲[12]分別利用線性判別分析法對企業信用風險進行了研究。唐曉岸、孟慶福[13]、姜天、韓立巖[14]、陳曉虹、戴靜[15]、宋榮威[16]等人分別運用Logit模型對企業進行了財務預警分析。研究表明,線性判別分析法和Logit模型對企業信用風險評價有一定的準確性。
2.2 神經網絡方法
從20世紀90年代開始,國內外學者將神經網絡方法應用于信用風險的評價,方法大致有多層感知器(MLP)、BP算法網絡、徑向基函數(RBF)網絡、概率神經網絡(PNN)等幾種,其中用得最多的是BP算法網絡。Altman、Marco和Varetto運用MLP神經網絡技術對意大利公司進行財務危機預測[17]。West分別建立MLP網絡結構和RBF網絡對德國和澳大利亞的銀行貸款企業的財務數據進行兩類模式分類[18]。Jensen、Tam、Coats等人[19~21]則分別應用BP算法針對財務狀況進行了評價。Yang和Marjorie利用PNN技術建立公司破產預警模型,對美國122家石油公司進行財務困境預警研究[22]。
在國內,學者龐素琳[23~25]對神經網絡的幾種模型分別進行了研究。陳雄化、林成德、葉武[26]、勝、梁[27]等研究了BP算法在信用評價中的應用。從國內已有文獻來看,國內研究對BP算法及其改進模型在信用評價中的應用較多。
2.3 支持向量機方法
支持向量機(SVM)方法是1995年Vapnik根據統計學習理論提出的一種學習方法,研究如何根據有限學習樣本進行模式識別和回歸預測等,使在對未知樣本的估計過程中,期望風險達到最小[28]。該方法提出后,國內外很多學者把SVM模型應用到信用評價分析。Fan和Palaniswami利用SVM對企業破產進行預測[29]。姚奕和葉中行[30]利用SVM研究銀行客戶信用評估系統。鐘波等[31]建立了基于LS-SVM的信用評價模型。肖文兵、費奇、萬虎[32]也對支持向量機的信用評價模型進行了分析。
以上各種方法各有其優缺點。線性判別分析法最大的優點是解釋性強,且簡單明了,但其假定條件過于嚴格,如要求每組數據滿足:(1)服從多元正態分布。(2)協方差矩陣相同。(3)均值向量、協方差矩陣、先驗概率和誤判代價已知。而現實中這幾個條件難以滿足。Logit模型的優點是不需要假定任何概率分布,也不要求等協方差性,但當樣本點完全分離時,模型參數的最大似然估計可能不存在而導致該方法完全失效。人工神經網絡是一種對數據分布無任何要求的非線性技術,它能有效解決非正態分布、非線性的信用評估問題,但其結構確定困難,且解釋性差。支持向量機方法的最大優點是能有效解決小樣本問題,并且無須樣本數據滿足正態性和齊次方差的條件,但其分類準確率和預測準確率依賴于核函數的選取,其參數的選取都是通過反復的試驗,人工選擇出令人滿意的參數,這種方法需要人的經驗做指導,并且它的選取需要付出較高的時間代價,這樣限制了支持向量機的發展。目前這三種方法中哪種方法的綜合效果較優還存在一些爭論,考慮到粗糙集理論在數據推理方面的強大功能,本文嘗試引入變精度粗糙集理論構造信用評價模型,并對我國2007年部分上市公司進行分類。
3 數據選取和模型介紹
3.1 指標體系說明
企業信用風險的形成主要取決于企業財務狀況,因此,企業信用評級通常將對企業信用風險的測度轉化為對企業財務狀況的衡量。而影響公司財務變化的主要因素包括公司的盈利能力、營運能力、償債能力、成長能力等指標。結合已有相關文獻[2~31],本文擬采取如下指標體系,見表1。
3.2 樣本數據選擇
考慮到不同行業的生產經營特點不一樣,在信用評價時如果采用相同的評價方法難免有失公允,在數據選取時應盡量選取具有相同特點的行業板塊。本文在滬深證券交易所2007年年報公布的按照CSRC行業分類中的所有制造業板塊中隨機抽取40家企業為樣本,其中ST類10家,不虧損公司30家。從其中10家ST公司中隨機選擇5家作為訓練樣本,另5家作為測試樣本;同理,從30家不虧損公司中隨機選擇15家作為訓練樣本,另15家作為測試樣本。主要數據采自中國上市公司資訊網上市公司財務報表及《上海證券報》、《中國證券報》上刊登的上市公司相關公告。
3.3 模型說明
變精度粗糙集是對標準粗糙集理論的一種擴展,它通過設置閾值參數β,放松了標準粗糙集理論對近似邊界的嚴格定義,允許概率分類。與標準粗糙集相比,當對象在變精度粗糙集中分類時,在它的正確分類中有一個置信度,這一方面完善了近似空間的概念,另一方面也有利于根據粗糙集理論從認為不相關的數據中發現相關信息。當對象按變精度粗糙集分類時,需定義一個正確分類的閾值β。Ziarko稱β為分類誤差,定義區域為0≤β
(1)模糊聚類法(Fuzzy Cluster,簡稱FC)離散化決策表
粗糙集理論分析要求數據必須以類別的形式出現。因此,連續數據必須首先進行離散化處理,離散的結果可能會減小原始數據的精度,但將會提高它的一般性。數據離散方法一般分為專家離散與自動離散。專家離散指由某領域的專家根據他的判斷或使用該領域確定的專家進行離散;自動離散方法可分為有監督離散法和無監督離散法,其中無監督離散法可視為一個簡單的聚類過程,本文使用模糊聚類分析法分別對每個指標進行離散化處理。
在實際問題中,一組事物是否屬于某一類常常帶有模糊性,即問題的界限不是很清晰,對該類問題,模糊聚類分析能做出“在某種程度上是”的回答,用該方法能較好地對決策表進行離散化。假定待分類的對象集合為X={X1,X2,…,Xn},集合中的每個元素具有m個特征,設Xi中的第j個特征值為xij(j=1,2,…,m),本文中對每個指標分別進行分類,故m=1。離散步驟如下:
當β=1時,aprβp(X)、aprβp(X)與標準粗糙集模型的上近似和下近似相同,則標準粗糙集模型就變成了變精度粗糙集模型的特殊情況。對于標準粗糙集意義下的不一致規則,根據設定的閾值β,若不一致性較弱,則可以認為這種不一致性是由于數據中存在少量噪聲引起的,因此仍可把這部分規則或者主要部分看作一致性規則,若不一致性較強,則可認為據此不能得到任何確定性的信息,而將每個數據對象看作一條隨機規則。
(3)變精度粗糙集的分類質量
變精度粗糙集的分類質量為
4 實證分析
首先使用模糊聚類分析法分別對訓練樣本中的每個指標進行離散化處理,每個指標分為三類,產生的決策表如表2所示,其中“1”表示該指標“好”,“2”表示該指標“中等”,“3”表示該指標“差”,可表示為123。對于決策屬性本文沿用國內文獻的研究習慣,采用兩類模式分類,即非ST類上市公司視為“信用好”企業,用“1”表示, ST企業視為“信用差”企業,用“2”表示,表中的D為決策屬性。
由表3所述的決策規則一表明,如果上市公司每股收益至少為中等,并且主營業務利潤率至少中等,同時滿足主營業務增長率至少中等,則該企業可視為“信用好”的企業;如果在每股收益、主營業務利潤率及主營業務增長率之間有一個為差,則該企業視為“信用差”的企業。其中每股收益和主營業務利潤率反映的是企業的贏利能力,主營業務增長率反映的是企業的發展能力,這三者分別表明了該企業的贏利能力及持續發展能力。表4所述的決策規則二表明,如果上市公司每股收益至少為中等,并且凈資產收益率至少中等,同時滿足凈資產增長率至少中等,則該企業可視為“信用好”的企業;如果在每股收益、凈資產收益率及凈資產增長率之間有一個為差,則該企業視為“信用差”的企業。其中每股收益和凈資產收益率反映的是企業的贏利能力,凈資產增長率反映的是企業的發展能力,這三者同樣表明了該企業的贏利能力及持續發展能力。這兩條決策規則都反映了上市公司的贏利能力及上市公司的成長性,是企業信用評價的重要依據。
分別用表3及表4中的決策規則對測試樣本中的20家公司進行判別表明,在抽取的兩類決策規則中各有一例ST公司誤判為信用好的公司,誤判率為5%,分類準確率為95%(見表5),這充分說明了變精度粗糙集在信用風險評價上的可行性。
由生成的決策規則一和決策規則二對20個測試樣本分析結果可知,變精度粗糙集方法能很好地識別樣本企業的信用等級,證明了該方法的有效性。并且該方法具有一定的抗干擾能力,對偶然因素導致的異常數據也能較好地識別。比如某ST公司每股收益為0.13元,該指標雖然為“中等”,但由于其主營業務利潤率為負并且呈下降趨勢,故該公司仍然存在財務風險,從而信用風險較大,變精度粗糙集方法能夠識別這種異常數據,排除干擾;另外兩家ST公司雖然凈資產增長率指標都為“好”,但這主要是因為這兩家公司實施了資產注入或投資收益導致的,其主營并沒發生很好的改觀,所以其經營仍然存在較大的風險,存在一定的信用風險,則利用生成的決策規則能很好地排除這種異常數據的干擾,能夠識別出這類公司的信用風險。
5 結束語
在當前的分類評價決策問題中,由事例導出規則是人工智能中的一個典型的方法。本文先利用模糊聚類方法對原始數據進行離散化處理,然后將變精度粗糙集理論應用于企業信用評價中,獲得了一些有益的規則和知識。獲取的規則能夠對企業財務狀況進行科學地分類評價,并且能有效地排除異常數據的干擾。這種規則數量較少、解釋性較強,能夠為企業信用評價提供一些指導性的決策建議。變精度粗糙集理論無需任何假定條件,避免了統計分類方法的弊端;由變精度粗糙集理論生成的決策規則解釋性強,彌補了神經網絡方法的不足;變精度粗糙集理論的應用也能排除支持向量機理論反復選取核函數的較大的時間代價?;谏鲜鰞烖c,變精度粗糙集理論在信用評價中必然具有廣闊的應用前景。需要指出的是,由于本文所研究的決策表較小,所以能較容易地搜索到所有約簡,并對其進行系統地分析,若決策表很大,則搜尋所有的約簡是一個NP難問題,在實際應用中,只需選擇其中的一個約簡進行分析即可。由于β值與分類精度是逆相關的,隨著β值的增大,分類精度減小,X的正域與負域將縮小,而邊界將擴大,這意味著只有少數對象被分類;而隨著β值的減小,分類精度增大,X的正域與負域將擴大,而邊界將縮小,這意味著大多數對象被分類,但可能被誤分;在實際運用中應該根據精度要求對β作合理的設置。
參 考 文 獻:
[1]世界銀行.新興市場經濟中的商業銀行[M].北京:中國經濟出版社,1997.
[2]Pawlak Z. Rough sets theory and its applications to data analysis[J]. Cybernetics and Systems, 1998, 29: 661-668.
[3]張文修,吳志偉,梁吉業,等.粗糙集理論與方法[M].北京:科學出版社,2001.
[4]Beaver W H. Financial Distress: a complete guide to predicting, avoiding, and dealing with bankruptcy[M]. Brain-Brum Field Inc., 1982.
[5]Altman E I. Financial ratios,discriminant analysis and the prediction of corporate bankruptcy[J]. Journal of Finance, 1968, 9(4): 589-679.
[6]Altman E I, Heldeman R G, Narayanan P. ZETA analysis: a new model to identify bankruptcy risk of corporations[J]. Journal of Banking and Finance, 1977, 1: 29-54.
[7]Altman E I. Corporte financial distress[M]. New York:John Wiley & Sons, 1983.
[8]Earky M D. Warning of bank failure: a logit regression approach[J]. Journal of Banking and Finance, 1977,1(3): 249-276.
[9]Ohlson J. Financial rations and the probabilistic predcition of bankruptcy[J]. Journal of Accounting Research, 1980, 1: 109-130.
[10]Maddala G S. Limited-dependent and qualitative variables in econometrics[M]. Cambridge: Cambridge University Press, 1983.
[11]陳靜.上市公司財務惡化預測的實證分析[J].會計研究,1999,(4):31-38.
[12]張玲,張佳林.信用風險評估方法發展趨勢[J].預測,2000,19(4):72-75.
[13]唐曉岸,孟慶福.上市公司信用評價模型[J].預測,2002,21(2):39-43.
[14]姜天,韓立巖.基于Logit模型的中國預虧上市公司財務困境預測[J].北京航空航天大學學報(社會科學版),2004,17(1):54-58.
[15]陳曉虹,戴靜.基于Logit模型的中小企業成長危機預警[J].系統工程,2007,25(1):72-77.
[16]宋榮威.信貸風險度量的Logit模型檢驗[J].電子科技大學學報(社會科學版),2007,9(5):18-21.
[17]Altman E I, Marco G, Varetto F. Corporate distress diagnosis:comparisons using linear discriminant analysis and neural netwoeks(the Italian experience)[J]. Journal of Banking and Finance, 1994, 18: 505-529.
[18]West D. Neural network credit scoring models[J]. Computer & Operations Research, 2000, 27: 1131-1152.
[19]Jensen H L. Using neural networks for credit scoring[J]. Managerial Finance, 1992, 18(6): 15-26.
[20]Tam K Y, Kiang M. Predicting bank failures: a neural network approach[J]. Management Science, 1992, 38(7): 927-947.
[21]Coats P, Pant L. Recoganizing financial disstress patterns using a neural network tool[J]. Financial Management, 1993, 22(3): 142-155.
[22]Yang Z R, Marjorie B, Platt H D. Probabilistic neural networks in bankruptcy prediction[J]. Journal of Business Ressearch, 1999, 44: 67-74.
[23]龐素琳,王燕鳴.多層感知器信用評價模型研究[J].中山大學學報(自然科學版),2003,42(4):118-122.
[24]龐素琳,黎榮舟,徐建閩.BP算法在信用風險分析中的應用[J].控制理論與應用,2005,22(1):139-143.
[25]龐素琳.概率神經網絡信用評價模型及預警研究[J].系統工程理論與實踐,2005,(5):43-48.
[26]陳雄華,林成德,葉武.基于神經網絡的企業信用等級評估[J].系統工程學報,2002,16(6):570-575.
[27]勝,梁.遺傳算法優化神經網絡及信用評價研究[J].中國管理科學,2004,12(1):68-74.
[28]Vapnik V N. The nature of statistical learning theory[M]. New York: Springer-Verlag, 1998.
[29]Fan A, Palaniswami M. Selecting bankruptcy predictors using a support vector machine apporach[A]. Proceedings of the International Joint Conference on Neural Network[C]. USA:IEEE Computer Society Washington,DC, 2000. 354-359.
一、引言
群體決策的研究涉及多個學科,不同學科對群體決策的研究所采取的方法和著重點不一樣。在經濟學、政治學、管理學領域對群體決策的研究側重于偏好的集結,較少考慮影響偏好形成的潛在背景信息。其中社會選擇理論與公共選擇理論利用數學分析的方法和福利經濟學的一些基本原理,研究如何“公平合理地”將群體成員的偏好集結為群體的偏好并據以作出群體的選擇,這方面的研究源于Condorcet投票悖論的提出,從20世紀50年代開始經過Arrow、Sen、Gibbard和Satterthwaite等人的進一步發展,已形成完整的理論體系,通過對理性社會選擇本質的剖析,促進了人們對選舉、立法以及政治機構運作等問題的理解。
在管理科學領域,對群體決策的研究主要強調如何通過對群體成員以不同形式表達的偏好的集結,使得群體成員就最終決策達成某種程度上的一致,而一致性則意味著“正確性”,這方面最具代表性的是社會決策圖式理論。
在社會心理學領域對群體決策的研究主要采用實驗性方法,通過對群體成員之間交互過程的分析研究群體決策的信息集結有效性,一般假定群體成員具有共同的目標,很少考慮決策過程中的策略,心理學研究的主要成果是對群體思維和群體極化現象的分析。
近年來國外出現了不少用博弈論作為理論工具研究群體決策信息集結問題的文獻,這些文獻主要發表于經濟學、政治學與政治經濟學期刊,通過對群體決策過程中群體成員的動機和理的分析,給出了一些與人們的直覺完全相反的結論。筆者將對此領域的研究進展從決策信息的獲取、審議過程中信息的披 露、透明性的影響與最優決策規則四個方面進行評述。需要說明的是,這四個方面緊密關聯,特別是決策群體成員的信息披露動機直接受到決策過程對公眾是否透明以及最終的投票表決規則的影響,而群體成員的信息獲取動機則部分地取決于信息披露動機,但由于利用博弈論分析群體決策問題的復雜性,現有的文獻主要還是相對集中于其中的一兩個方面。
文[1]是注意到此領域較早的綜述性文章,該文發表于1999年,討論了當時出現不久的研究政治機構信息集結作用的文獻,其中對最先考慮策略性投票表決行為的文[2-5]等進行了簡要介紹。同年9月份,《美國國家科學院院刊》發文評述了研究選舉的信息集結作用及因投票者私有信息的不準確而導致的策略性投票表決行為的成果[6],其中提及的部分研究工作尚處于未發表狀態。文[7]對研究貨幣政策委員會決策過程中的動機問題的文獻進行了系統討論。文[8]總結了貨幣政策委員會決策機制設計應該考慮的各種因素,對與群體決策相關的經濟學與社會心理學理論與實驗分析文獻進行了評述,其中討論了信息集結問題。應該說文[9]是目前評述基于博弈論的群體決策信息集結研究文獻較為全面和細致的文章,該文從策略性投票、信息獲取、利益沖突和交流四個方面進行了詳細評述,并討論了此領域的研究成果對貨幣政策委員會決策機制設計的參考價值。
本研究與文[9]的差別在于:第一,文[9]的討論基本上局限于基于博弈論的群體決策信息集結研究本身,而筆者從研究方法、研究對象與研究成果等方面將基于博弈論的群體決策信息集結研究與經濟學、政治學、管理學以及社會心理學領域對群體決策的傳統主流研究進行了對比,分析了博弈論作為理論工具研究群體決策信息集結問題的優缺點,并深入探討了現有研究工作存在的不足之處,也即指出了此領域可能的研究方向,因此,筆者的深度與廣度有所超越。第二,文[9]對此領域研究成果的評述思路稍顯混亂,文獻分類較不合理。第三,筆者特別關注了研究決策過程的透明性對群體成員信息獲取與信息披露動機以及投票表決行為的影響的文獻,而文[9]對此幾乎沒有涉及。第四,文[9]發表后此領域出現了不少具有重要參考價值的文獻,筆者對這些最新的文獻給予了較為詳細的評述。
二、決策信息的獲取
(一) Condorcet陪審團定理與搭便車問題
與決策問題相關的各類信息一般以分散的、局部的形式存在于社會系統,群體決策的意義之一,是可能更充分地利用這些信息,因而更有可能作出正確的決策。不考慮其他因素,僅從信息集結的角度看,讓更多擁有信息的個體參與決策可以改善決策質量,這種觀點符合人們的直覺,其形式化證明出自18世紀Condorcet給出的陪審團定理。該定理認為:群體決策可以有效集結信息,在多數決定規則下,增加群體成員數量可以增加作出正確決策的概率,并且隨著成員數量趨于無窮,作出正確決策的概率趨于1。
Condorcet陪審團定理及其后來的很多拓展往往都有個潛在的假設:群體決策者所掌握的與決策問題相關的信息是事前外部給定的,或是以零成本獲得的[9]。但對于許多現實決策情形,信息并不是不需要投入成本和努力就能輕易得到的,如審稿專家需要付出一定的時間和精力才能決定稿件是否符合錄用標準,因此決策者必須決定是否付出以及付出多少代價以獲取信息。而在群體決策中,與決策問題相關的信息是公共物品,因而存在典型的所謂社會惰化(social loafing)現象或搭便車問題(freerider problem)。
文[10]對陪審團決策中的信息獲取問題進行了研究,認為陪審員的信息準確程度取決于陪審團的大小,更大的陪審團的陪審員具有更少的動機認真聽取審判過程,所以更大的陪審團作出正確判決的概率可能更小,從而導致陪審團定理不再成立。文[11-17]進一步研究了群體決策中的理性無知(rational ignorance)問題,對仍能有效集結信息時信息獲取成本或成本函數需要滿足的條件進行了分析,這些文獻針對多數決定規則,假定所有群體成員具有完全相同的決策偏好。其中文[11,13-15]證明,當全體或部分群體成員的信息獲取成本函數在獲取零信息處的二階導數為零,則Condorcet陪審團定理仍然有效。
另外,文[18]通過一個僅有兩個成員的群體決策模型,指出群體成員間的交流可能會惡化信息獲取中的搭便車問題。在該文中,決策成員首先收集關于一項工程實施后果的信息,然后相互交流,再投票表決是否實施該項工程。文章指出,如果交流的作用僅限于信息集結,則交流可能會減少作出正確決策的概率,特別是當高質量的信息很容易獲得時,交流會減少決策成員收集信息的動機,加劇信息收集中的搭便車問題,但當信息收集需要付出高昂的代價時,更多的交流通常會增加作出正確決策的概率。
(二)搭便車問題避免措施
因為信息獲取活動一般是不可觀測的,搭便車者可以通過提供一個虛假的信息假裝已經給予了足夠的投入,所以無法通過有效的懲罰措施以阻止搭便車問題,只能夠從決策群體的成員組成和決策規則等方面考慮避免該問題的發生。
文[19-20]的研究結論從決策群體人員組成方面為避免信息獲取中的搭便車問題提供了理論參考,指出具有極端偏好的成員相對來說更具有收集高成本信息的動機,但這兩篇文獻的研究內容不屬于嚴格意義上的群體決策,因為其中的委員會成員僅負責收集與報告信息,自身并沒有決策權。在文[19]中,委員會成員在信息收集之前相互間沒有偏好差異,在投入不可觀測的努力收集信息后形成各自不同的政策偏好,該文證明最優的委員會規模和總的社會剩余有時會隨委員會成員偏好差異期望值的增大而增大,因為預期的偏好差異為成員提供了收集信息的動機。文[20]指出,如果信息收集的成本較低,委員會成員的偏好應該與決策者的偏好類似,這是因為一方面與決策者偏好類似的成員會收集決策者想要的信息,另一方面由于偏好類似所以在報告時不會產生信息的扭曲問題;如果信息收集的成本較高,則委員會應該由具有極端偏好的成員組成,只有這些成員才具有足夠強烈的動機付出代價收集信息,但因為信任問題,他們往往只會收集硬信息,即客觀上可驗證的信息。對于在投票表決前需要對決策選項進行審議的群體決策來說,文[20]的研究結論尤其具有參考價值。
從群體決策機制設計的角度看,如果存在信息獲取問題,則機制設計者必須既要考慮如何提供充分的激勵促使群體成員獲取信息,又要考慮如何有效集結成員所獲得的信息,以最大化群體決策的期望效用。
文[21]證明,采用適當保守的決策規則可以促進群體成員收集證據,從而改善決策質量。文[22-23]對存在信息獲取時的群體決策最優規則與最優群體成員數量進行了研究。文[22]指出,盡管一致性規則使每個群體成員的投票選擇對最終結果都具有決定性影響力,但一致性規則并不能為獲取信息提供適當的激勵,而且一致性規則特別不適合于信息較不準確的情形,也即更需要群體決策的情形,在只考慮單調純策略均衡的條件下,除非群體成員的信息足夠準確,否則一致性規則或接近于一致性規則的規則不可能最優。文[23]認為,為了提供足夠的信息獲取激勵,對于相當普遍的決策情形,事前最優的決策機制事后可能是非最優的,即不必然利用了所有群體成員獲取的信息導致從統計學角度有最優的信息集結,該事前最優的決策機制是在激勵成員獲取信息與最大程度提取成員信息之間折中的產物。需要指出的是,文[21-23]均假定決策群體成員具有相同的偏好。
三、審議過程中信息的披露
決策群體,尤其是規模較小的群體,一般會在投票表決前對決策選項進行審議,交流各自的私有信息。信息的共享能引起成員信念的收斂。但群體成員通常代表著不同的利益集體,具有不同的利益追求或偏好,因而具有操縱或隱藏私有信息的動機,從而限制了信息共享的可能性,成員間策略性的信息操縱與反操縱甚至導致比純粹偏好沖突更大程度上的意見不一致。
絕大多數群體決策文獻對審議(deliberation)、交流(communication)、辯論(debate)、廉價磋商(cheap talk)等類似表述用語沒有進行明確的區分,雖然這些用語在不同場合有一些微妙甚至較大的差異,如文[24]認為審議是辯論的子集。
研究審議對群體決策的影響的文獻一般將決策過程建模為兩階段博弈:先審議后正式投票表決,通過對貝葉斯Nash均衡策略和均衡存在條件的分析,研究審議是否以及如何對群體決策發生作用。這類文獻一般假定無論是以公共利益還是以私人利益作為評判標準,好的決策選擇總是部分取決于世界的真實狀態,而世界的真實狀態對決策群體成員來說無法確切知道,他們僅不對稱地掌握了有關世界真實狀態的部分信息。在正式投票表決之前的審議過程可以使群體成員有機會告訴其他成員他們所掌握的私有信息,然后,根據各自已掌握的關于世界真實狀態的部分信息,群體成員形成自己對世界真實狀態的判斷,進而根據自己的評判標準形成各自的決策選擇偏好,如果他們的決策選擇偏好不一致,就有可能在審議的過程中不披露自己的真實信息,或提供虛假的信息以誘導其他成員作出對自己有利的決策選擇。因此,此類文獻注重從信息集結角度對完全信息披露均衡和完全信息集結均衡的分析。
Coughlan在文[25]中認為,當所有群體成員的決策偏好完全相同或足夠接近,在審議過程中每個成員都具有真實披露私有信息的動機。文[26]則進一步證明,只要群體成員主觀上認為多數成員與他擁有共同偏好具有較大的可能性,客觀上的偏好差異不會影響信息的真實共享。然而,該文同時指出,審議并不總是能有效集結信息,特別是當群體成員沒有較強的先驗信念認為自己的價值取向就是群體主流的價值取向時,可能出現有意的相互欺騙。需要說明的是,在文[26]給出的模型中,所有群體成員的偏好或者完全相同,或者完全相反,與此相符的現實群體決策情形很少,甚至幾乎沒有。文[24,27-28]證明一致性規則在很多情況下為群體成員在審議過程中策略性地隱藏信息提供了動機,多數決定規則比一致性規則能引導出更多的信息共享。文[28]還證明,在相當一般的條件下,審議使得除一致性規則以外的所有其他規則具有相同的序貫均衡集合,也即審議使得所有的無否決權規則在序貫均衡方面等價,從而說明如果群體成員在投票表決前有向所有成員公開宣布各自私有信息的機會,那么采用除一致性規則以外的其他任何決策規則,都會產生相同的決策結果。文[29]對陪審團在審議階段信息的披露進行了實驗研究,以無約束力的意向性投票形式實現信息的交流,實驗結果與理論分析基本近似。
另外,文[30]給出了一個兩成員的交流與決策模型,兩個成員投票表決是否組成具有不確定回報的合伙關系,他們的偏好不一致且為私有信息。文章分析了均衡的特征,發現在均衡時僅有部分信息被傳遞,交流對于雙方的福利是有益的。
對于很多現實決策問題,決策者可能擁有客觀上可驗證的信息,即所謂硬信息(hard information)。文[31]對硬信息在具有偏好沖突的委員會中的交流進行了研究,證明完全信息集結均衡在偏好為私有信息的情況下比在偏好為常識情況下更有可能存在,即允許更大程度上的偏好差異;另外該文證明,如果信息可驗證,完全信息集結均衡的存在條件等同于完全信息披露均衡的存在條件。文[32]指出,在審議階段群體成員共享私有信息的動機一定程度上取決于其私有信息的可驗證性,如果決策成員能夠為自己的信息提供驗證材料,則一致性規則比其他規則提供了更強的信息共享激勵,更有可能實現完全信息共享。文章給出了在一致性規則下審議階段存在完全信息披露均衡的充分必要條件。
文[33]指出,盡管偏好與信息的差異可能使得部分成員在審議過程中具有錯誤表達私有信息的動機,但給予群體成員適當的外部激勵能消除此類動機,促進信息與偏好的完全集結,而且隨著群體規模的擴大,外部激勵的強度可以很小,外部激勵的具體措施包括對成員決策能力的肯定等。
四、透明性的影響
隨著社會的進步,公眾對涉及自身利益的重要決策過程的透明性提出了越來越高的要求。透明的決策過程意味著公眾可以評價決策群體成員的偏好、能力與貢獻,從而引起決策者對自身聲譽的關注,而對聲譽的關注既可能促進信息的獲取和真實信息的披露,但也有可能導致信息傳遞與投票表決行為的扭曲。
在文[34]中,委員會成員在前一時期表現出的決策能力影響了他在后一時期能否獲得連任,而作為委員會成員可為其帶來一定的效用。該文證明公開個人投票記錄可以促進委員會成員努力獲取信息。文[35]認為,僅公布最終決策結果,不公開個人投票記錄,會誘導委員會成員按照現有偏見作出投票選擇,因此,委員會的決策傾向于保守化,向公眾公開成員的投票記錄則能夠減少現有偏見對決策的影響。該文同時認為,群體決策機制的設計應該不僅考慮決策過程的透明性,也要考慮決策規則的適當性,如果決策規則選擇合適,則不透明的決策過程可能比透明的決策過程得到更好的決策結果。在文[34-35]所給出的模型中,都沒有考慮委員會成員在投票表決前可能會相互交流各自的私有信息。
在文[36]中,委員會代表公眾對一項新工程的實施與否進行表決,委員會成員既關心工程的實際價值,又關心委員會在公眾中的聲譽,如果維持現狀,不實施新工程,則暴露出委員會成員意見的不一致,從而給委員會的聲譽帶來負面影響,而公眾僅能注意到委員會的決策結果,事后不能觀測到工程的實際價值。該文證明,在審議階段,部分成員對聲譽的過分關注可能使他們不愿真實披露私有信息,而是夸大工程的價值,導致更容易采取實施新工程的決策。文[37]認為,公開委員會的具體審議記錄可能會降低決策質量。由于委員會成員關心公眾對其決策能力的判斷,使得他們在正式會議交流過程中可能隱藏內部存在的意見分歧,公眾對于決策過程透明性的要求,可能導致委員會在正式會議之前組織秘密的非正式預備會議,將真正實質性的討論從公開的正式會議階段轉移到秘密的預備會議階段,從而對公眾消除委員會內部意見的不一致,而非正式的會議更具有不穩定性,因此,透明性要求并不一定能增加社會福利。
在文[38-40]中,外部利益關聯者可以觀察到公開委員會每個成員的具體投票記錄和決策結果,但對于秘密委員會則只能看到最終決策結果,而委員會成員既關心決策結果又關心外部利益關聯者所給予的回報。文[38]和[39]認為,不公布委員會成員的個人投票記錄可以減少外部利益關聯者對決策的影響,在某些情況下秘密委員會優于公開委員會。文[39]還特別指出,由于隨著群體成員數量的增加,單個成員的投票對最終決策具有決定性影響的概率減小,對單個成員而言不誠實投票的代價隨之減小,所以對于公開委員會來說,其成員更容易因外部利益關聯者承諾給予的回報而不誠實投票,因此Condorcet陪審團定理可能不再成立。在文[40]中,對于秘密委員會,外部利益關聯者可以根據投票表決規則的閾值和最終決策結果對委員會成員的投票作出推斷。文章分析了秘密委員會的最優決策規則,指出決策規則中增加選擇某一選項需要的投票比例可能會導致該選項更容易成為最終決策結果,傳統看法認為降低決策規則的閾值可以防止委員會過于保守的看法未必正確,但對于公開委員會則不存在此問題。文[41]雖然不是直接研究透明性,但其研究結論與此處內容相關,該文通過一個博弈模型,說明在特定情況下,外部利益集團可以不用付出任何代價就能操縱委員會的決策。
另外,不少文獻從理論與實證兩方面研究了決策過程的透明性對貨幣政策委員會決策的影響。文[7,42]對這方面的文獻進行了綜述。文[42]區分了三種類型的透明性:決策目標透明性;知識透明性,這里的知識指決策所依據的經濟數據或經濟模型等;操作透明性,包括委員會會議記錄與投票記錄的透明性以及決策結果的透明性等。該文評述的文獻有部分運用了博弈理論作為分析工具。文[7]專門討論了貨幣政策委員會決策過程中的動機問題,指出貨幣政策委員會的最優規模與透明性等仍有待進一步研究。
類似于文[34],研究透明性對貨幣政策委員會決策信息集結有效性的影響的文獻,一般認為委員會成員希望得到社會公眾對其決策能力或決策偏好的正面評價,從而獲得連任的機會,如文[43]假設委員會成員希望公眾認為他是通貨膨脹的強硬抵制者,而最近的文獻如文[44-46]等,則假設委員會成員希望公眾認為他是具有較強決策能力者。文[44]認為,公開審議過程的詳細記錄會使得貨幣政策委員會成員不愿意表達不同的意見,該文通過對美聯儲聯邦公開市場委員會在被要求公開會議記錄之前和之后的會議記錄的分析說明了理論結果的有效性。文[45-46]分析了投票記錄的公開對委員會成員投票表決行為的影響,認為投票記錄對公眾的透明帶來的負面效應占主導地位,透明性不能增加社會福利。
五、最優決策規則
顯而易見,不同的決策規則極大地影響了群體決策的信息集結效率,尤其是決策群體成員的偏好或能力不完全一致時,決策規則更是直接影響了群體成員的投票選擇行為,進而影響了決策結果的正確性。前述文獻大多不同程度地討論了決策規則的比較和選擇,除此以外,另有部分文獻對各種情況下的最優決策規則進行了研究。
文[47-48]從最大化期望效用的角度對固定規模的委員會形式集體決策的最優決策規則進行了分析,文[49-50]研究了在特定約束條件下的最優決策規則。然而,這些早期的文獻都有個潛在的假設:決策成員僅按照自身獲得的信息作出投票選擇。文[2,51]等指出,即使決策群體成員的偏好完全一致,也不能保證一定能夠如Condorcet陪審團定理所預測的那樣有效集結各成員的信息,因為群體成員僅根據自身信息作出非策略性的選擇不符合理性要求,當且僅當所使用的決策規則為集結群體成員私有信息的最優規則時,所有群體成員僅按自身信息投票才是Nash均衡,而最優決策規則則取決于特定的決策情形。
文[52]證明,當采用文[48]所定義的最優決策規則時,所有成員僅按照自身獲得的信息投票表決形成Nash均衡,但僅按自身信息投票可能不是有效的,因為部分成員聯合決定策略性投票可以增加期望效用。文[53]討論了投票者對不同決策選項具有可用基數表示的效用時的誠實投票問題,試圖給出當決策機制允許多種消息類型時誠實投票的準確定義。為使投票者具有誠實投票的動機,文[54]提出了一種在隨機選擇的投票表決集合上運用多數決定規則得到最終決策的方法,在對所有投票者的表決結果運用多數決定規則和僅對投票表決結果的隨機抽樣子集運用多數決定規則之間進行隨機選擇,可以激勵投票者誠實投票,從而得到Condorcet陪審團定理的有效性收斂結果。
文[55]基于陪審員的私有信息和策略性表決行為構建了一個陪審團決策模型,證明一致同意規則可能會導致無辜被告得到有罪判決和有罪被告得到無罪判決這兩種錯誤的概率都增加。文[56]分析了決策群體所投票表決的決策選項不獨立于投票表決規則的情形:給定決策群體的投票表決規則,提案者向決策群體提出一個要么完全接受要么完全拒絕的議案,群體投票表決是接受還是拒絕該議案。該文證明由于一致同意規則能促使提案者提出更有吸引力的議案,所以增加了決策群體的期望效用,在某些情況下,一致同意規則甚至是Pareto最優的表決規則,因為它也增加了提案者的期望效用,即使提案者與決策群體的利益追求可能完全相反。總結考慮一致性規則的文獻[22,24,27,28,32,55,56],可見博弈分析得到的結論往往與人們直觀上的認識截然相反,一致性規則是不是合適的決策規則完全取決于特定的決策情形。
既然投票表決規則直接影響了投票者的投票選擇行為,那么,對于群體決策機制的設計者來說,他在選擇投票表決規則時是否需要考慮投票者在各種表決規則下的投票行為,換言之,機制設計者關于投票者在各種規則下的博弈行為的信念是否會影響到最優決策規則的選擇。文[57-58]對此問題進行了研究,其中假設群體成員的決策偏好完全一致。文[57]分析了決策成員的能力存在差異且這種差異是常識的情況下的投票表決規則,指出最優的匿名單調投票規則并不取決于成員是否按照自身信息投票或策略性投票。類似于文[57]的結論,文[58]認為,決策機制設計者對最優投票表決規則的選擇與機制設計者關于投票者在不同表決規則下的投票行為的信念無關,在該文中,機制設計者為決策群體選擇投票表決規則,其目的是為了最大化決策群體的期望福利,文章證明,僅從信息集結的角度看,關于投票者在各種表決規則下的投票行為的不同假設對于最優決策規則的選擇來說,結論是一樣的,不同的行為假設導致相同的結論。對于具有相同偏好的決策群體來說,文[57-58]的研究結論大大簡化了決策規則的選擇。
現實中的決策群體往往存在具有極端偏好的成員,這些成員的存在為信息的有效集結帶來較大的困難。文[59]對存在極端偏好者和中立者的群體面對二分決策問題時的最優決策規則進行了研究,考慮了決策成員之間存在轉移支付的情況,指出最優投票表決規則相對于轉移支付可能性的大小來說是非單調的。文[60]對由兩類具有完全相反的偏好的成員所組成的委員會決策進行了分析,對比了一致性規則與非一致性規則的信息集結效率。文[61]給出了一個現實中較難接受的非單調性決策規則――超多數懲罰(supermajority penalty)規則,當選擇某一選項的投票過多時,將該選項作為群體決策最終結果的概率反而會下降,該文證明,當對于每個選項都存在極端偏好者時,超多數懲罰規則是最優匿名激勵相容規則。
前述文獻都假定群體成員的偏好相互獨立,而文[62]對群體成員具有相互關聯但不完全相同的偏好的情況進行了分析,其中的決策選擇空間是連續的,該文分別討論了采用平均規則與中值規則時所對應博弈的對稱貝葉斯Nash均衡的存在性問題,并比較了這兩種規則在不同偏好關聯程度下的性能。
由于從眾心理,群體成員經常會根據對其他成員行為的觀察相應調整自己的行為。文[63-64]對從眾心理對群體決策的影響進行了研究,其中假定群體成員一方面希望選出好的決策選項,另一方面又希望自己成為勝出的一方。文[63]分析了群體規模較大時同時投票機制與順序投票機制的均衡特征和信息集結質量,文[64]指出這種從眾心理導致同時存在多個均衡,而且對于這些均衡中的多數,信息不能被有效集結。文[64]從某種程度上說明了最優決策規則設計的困難。
六、現有研究工作的不足之處
其一,社會選擇理論與公共選擇理論以及管理學領域對群體決策的研究,主要考慮偏好集結的有效性,而其中的偏好則是指對決策選項的偏好,這種偏好取決于決策者對最終結果的更根本意義上的偏好和對世界真實狀態的信念。在現實社會中,純粹以偏好的有效集結為終極目標的重要群體決策問題幾乎不存在,例如社會選擇理論與公共選擇理論最重要的應用領域――選舉,既是偏好集結(這里指更根本意義上的偏好),更是信息集結。僅考慮偏好的集結問題,不考慮偏好的形成過程以及信息在偏好形成過程中的潛在作用,無法分析群體內外部交流與互動等對決策的影響,無法解釋現實中的很多現象,因而對相關決策機制設計的指導作用較為有限。
其二,社會心理學從認知的角度研究群體決策,其結論出自于對實驗和經驗數據的統計學分析,易于為人們接受。但由于從實驗或經驗數據中利用統計學方法推導出群體的偏好分布參數極為困難,所以無法深入研究群體決策過程中因偏好不一致而導致的隱藏與扭曲私有信息等策略。
其三,與社會選擇理論和公共選擇理論一樣,用博弈論研究群體決策信息集結問題的文獻也是以理性選擇假設作為判斷與決策的微觀基礎。盡管所有群體成員嚴格按照貝葉斯規則更新自己的信念等完全理性假設對于心理學家和普通人來說都是難以接受的,但博弈論文獻還是以其數學分析的簡潔與嚴謹顛覆了很多直覺上的認識,通過對群體決策者動機的分析,有助于我們理解決策機制的哪些方面可能會引起不利于決策目標實現的策略,進而有助于決策機制的改進。隨著群體成員偏好差異程度和決策問題重要程度的增加,審議方式和決策規則趨向于書面化和正規化,群體思維與群體極化現象將很少出現,決策結果也將更接近于博弈分析的預測。
目前對群體決策信息集結問題的研究尚處于起步階段,還有很多不完善之處,在某些方面甚至存在根本性的缺陷。
第一,可能是受到信息經濟學研究的誤導,本領域的很多理論與實驗分析文獻,包括一些奠基性的文獻,混淆了信息與在信息基礎上形成的判斷。真實信息的披露不會引起其他群體成員以及公眾對自己決策能力的負面評價,更不會如判斷的披露那樣引起認知上的從眾,如果決策者掌握了確鑿可靠的信息,則其不會因為其他人基于其他信息產生的不同看法而輕易改變自己的信念。
除個別文獻外,現有研究群體決策信息集結問題的文獻幾乎都是將審議完全等同于信息經濟學領域的廉價磋商,將交流限制為每個群體成員同時向所有其他成員發送一輪公開的消息。在現實群體決策過程中,審議至少包括對各方面提供的信息的真實性的審議,以及對信息與世界真實狀態之間的邏輯關聯(即潛在的決策模型)的審議。因此,將審議建模為完全的廉價磋商的現實意義極為有限,對于偏好差異較大的群體更是如此。
第二,客觀上難以驗證的信息的可接受性,取決于接收者對于信息發送者的偏好的信念,例如,人們有充分的理由懷疑壟斷企業單方面提供的企業運營成本數據的真實性。另一方面,在很多情況下,信息的軟硬程度(可驗證程度)與信息獲取者和信息接收者的成本投入相關。因此,群體成員獲取可驗證信息與不可驗證信息的動機,以及群體成員對信息軟硬程度的投入,既取決于是否有審議階段以及審議方式和決策規則,也取決于群體成員的偏好和群體成員關于群體偏好差異程度的先驗信念。諸如此類問題現有文獻幾乎沒有涉及。
群體決策在現代社會無處不在,如政府部門對重大戰略性問題的決策、公司董事會對重要項目投資與實施問題的決策、審判委員會對犯罪嫌疑人的判決、專家對科學基金項目申請書的評審等。從組織或社會的目標出發,針對特定的決策問題,為了盡可能作出正確的決策,應該如何組成決策群體,選擇何種決策規則?此類群體決策的科學化與民主化問題很久以來一直是管理、政治、法律和經濟等領域討論的中心,其研究結果對于各類政治、社會、經濟組織的運行機制設計具有重要的意義。
中國學者對群體決策的理論與方法進行了大量的研究,提出了不少新的概念和方法,作出了很多重要貢獻,國家自然科學基金委員會對群體決策理論與方法研究也較為重視,曾將其列為優先資助領域。但根據現有的各類文獻和歷年的基金項目研究摘要,總體感覺國內對決策群體成員的動機和理考慮較少,到目前為止還沒有發現國內其他學者利用博弈論研究群體決策信息集結問題。
筆者試圖利用不完全信息博弈論和機制設計理論,研究決策群體成員的策略性信息獲取、信息傳遞和投票表決行為,揭示決策群體人員組成、審議方式、決策規則、透明性等決策機制的各個方面對群體決策的信息集結有效性的具體影響。并試圖從信息集結角度,為一些典型公共決策情形優化決策機制。
參考文獻:
[1] PIKETTY T. The informationaggregation approach to political institutions[J]. European Economic Review, 1999, 43(4-6):791-800.
[2] AUSTENSMITH D, BANKS J. Information aggregation, rationality, and the Condorcet jury theorem[J]. American Political Science Review, 1996, 90(1):34-45.
[3] FEDDERSEN T, PESENDORFER W. The swing voter’s curse[J]. American Economic Review, 1996, 86(3):408-424.
[4] FEDDERSEN T, PESENDORFER W. Voting behavior and information aggregation in elections with private information[J]. Econometrica, 1997, 65(9):1029-1058.
[5] MYERSON R. Extended Poisson games and the Condorcet jury theorem[J]. Games and Economic Behavior, 1998, 25(1):111-131.
[6] FEDDERSEN T, PESENDORFER W. Elections, information aggregation, and strategic voting[J]. Proceedings of the National Academy of Sciences of the United States of America, 1999, 96:10572-10574.
[7] FUJIKI H. The monetary policy committee and the incentive problem: A selective survey[J]. Monetary and Economic Studies, 2005, 23(S1):37-82.
[8] VANDENBUSSCHE J. Elements of optimal monetary policy committee design[EB/OL]. IMF Working Paper No. 06/277, 2006. (2006-06-30) 省略/external/pubs/ft/wp/2006/wp06277.pdf.
[9] GERLING K, GRNER H, KIEL A, SCHULTE E. Information acquisition and decision making in committees: A survey[J]. European Journal of Political Economy, 2005, 21(3):563-597.
[10] Mukhopadhaya K. Jury Size and the Free Rider Problem[J]. The Journal of Law, Economics, and Organization, 2003, 19:24-44.
[11] MARTINELLI C. Would rational voters acquire costly information?[J]. Journal of Economic Theory, 2006, 129(1):225-251.
[12] MARTINELLI C. Rational ignorance and voting behavior[J]. International Journal of Game Theory, 2007, 35(3):315-335.
[13] KITAHARA M, SEKIGUCHI Y. Condorcet’s jury theorem under costly information acquisition[EB/OL]. Working Paper, University of Tokyo, 2004. (2004-04-25).e.utokyo.ac.jp/cemano/research/DP/documents/coef54.pdf.
[14] KITAHARA M, SEKIGUCHI Y. Aggregate accuracy under majority rule with heterogeneous cost functions[J]. Economics Bulletin, 2006, 4(25):1-8.
[15] KITAHARA M, SEKIGUCHI Y. Condorcet jury theorem or rational ignorance[J]. Journal of Public Economic Theory, 2008, 10(2):281-300.
[16] BAG P, LEVINE P, SPENCER C. A note on: Jury size and the free rider problem[J]. Economics Bulletin, 2006, 4(3):1-12.
[17] TRIOSSI M. Costly information acquisition. Better to toss a coin?[EB/OL]. Working Paper, Collegio Carlo Alberto, 2010.(2010-03-15).webmanager.cl/prontus_cea/cea_2010/site/asocfile/ASOCFILE120100127120554.pdf.
[18] SWANK O, WRASAI P. Deliberation, information aggregation, and collective decision making[EB/OL]. Working Paper, Tinbergen Institute, 2003.(2003-06-20) .tinbergen.nl/discussionpapers/02006.pdf.
[19] CAI H. Costly participation and heterogeneous preferences in informational committees[J]. The RAND Journal of Economics. 2009, 40(1):173-189.
[20] BENIERS K, SWANK O. On the composition of committees[J]. Journal of Law, Economics, and Organization, 2004, 20(2): 353-378.
[21] LI H. A theory of conservatism[J]. Journal of Political Economy, 2001, 109(3):617-636.
[22] NICOLA P. Committee design with endogenous information[J]. Review of Economic Studies, 2004, 71(1):165-191.
[23] GERARDI D, YARIV L. Information acquisition in committees[J]. Games and Economic Behavior, 2008, 62(2):436-459.
[24] AUSTENSMITH D, FEDDERSEN T. Deliberation and voting rules[M]//AUSTENSMITH D, DUGGAN J. Social choice and strategic decisions. Berlin: Springer Berlin Heidelberg, 2005:269-316.
[25] COUGHLAN P. In defense of unanimous jury verdicts: Mistrials, communication, and strategic voting[J]. American Political Science Review, 2000, 94(2): 375-393.
[26] MEIROWITZ A. In defense of exclusionary deliberation: Communication and voting with private beliefs and values[J]. Journal of Theoretical Politics, 2007, 19(3): 301-327.
[27] AUSTENSMITH D, FEDDERSEN T. Deliberation, preference uncertainty, and voting rules[J]. American Political Science Review, 2006, 100: 209-217.
[28] GERARDI D, YARIV L. Deliberative voting[J]. Journal of Economic Theory, 2007, 134(1): 317-338.
[29] GUARNASCHELLI S, MCKELVEY R, PALFREY T. An experimental study of jury decision rules[J]. American Political Science Review, 2000, 94: 407-423.
[30] DORASZELSKI U, GERARDI D, SQUINTANI F. Communication and voting with doublesided information[J]. Contributions to Theoretical Economics, 2003, 3(1), Article 6.
[31] SCHULTE E. Information aggregation and preference heterogeneity in committees[J]. Theory and Decision, 2010, 69(1):97118.
[32] MATHIS J. Deliberation with partially verifiable information[EB/OL]. THEMA Working Papers No. 2006-03, (2006-08-20). ucergy.fr/IMG/2006-03.pdf.
[33] MEIROWITZ A. Designing institutions to aggregate preferences and information[J]. Quarterly Journal of Political Science, 2006, 1(4): 373-392.
[34] GERSBACH H, HAHN V. Information acquisition and transparency in committees[EB/OL]. CEPR Discussion Paper no. 6677, London, Centre for Economic Policy Research, (2009-06-20). papers.省略/sol3/papers.cfm?abstract_id=1084060.
[35] LEVY G. Decision making in committees: Transparency, reputation and voting rules[J]. American Economic Review, 2007, 97(1):150-168.
[36] VISSER B, SWANK O. On committees of experts[J]. The Quarterly Journal of Economics. 2007, 122(1):337-372.
[37] SWANK O, VISSER B. Is transparency to no avail? Committee decisionmaking, premeetings, and credible deals[EB/OL]. Working Paper, Tinbergen Institute, (2009-06-18). people.few.eur.nl/bvisser/articles/Transparency%20Dec%202009.pdf.
[38] SEIDMANN D. A Theory of voting patterns and performance in private and public committees[EB/OL]. CeDEx Discussion Paper 2009-06, (2009-10-15). nottingham.ac.uk/economics/cedex/papers/2009-06.pdf.
[39] FELGENHAUER M, GRUNER H. Committees and special interests[J]. Journal of Public Economic Theory, 2008, 10(2): 219-243.
[40] SEIDMANN D. Optimal quotas in private committees[J]. The Economic Journal, 2008, 118(525):16-36.
[41] DAL B E. Bribing voters[J]. American Journal of Political Science, 2007, 51(4):789-803.
[42] HAHN V. Transparency in monetary policy: A survey[J]. IFO Studien, 2002, 48(3):429-455.
[43] SIBERT A. Monetary policy committees: Individual and collective reputations[J]. The Review of Economic Studies, 2003, 70(3):649-665.
[44] MEADE E, STASAVAGE D. Publicity of debate and the incentive to dissent: Evidence from the US Federal Reserve[J]. The Economic Journal, 2008, 118(528):695-717.
[45] HAHN V. Committees, sequential voting and transparency[J]. Mathematical Social Sciences, 2008, 56(3):366-385.
[46] HANS G, HAHN V. Should the individual voting records of central bankers be published?[J]. Social Choice and Welfare, 2008, 30(4):655-683.
[47] NITZAN S, PAROUSH J. Optimal decision rules in uncertain dichotomous choice situation[J]. International Economic Review, 1982, 23:289-297.
[48] BENYASHAR R, NITZAN S. The optimal decision rule for fixedsize committees in dichotomous choice situations: The general result[J]. International Economic Review, 1997, 38:175-186.
[49] BENYASHAR R, KHULLER S, KRAUS S. Optimal collective dichotomous choice under partial order constraints[J]. Mathematical Social Science, 2001, 41:349-364.
[50] KRAUS S. Optimal collective dichotomous choice under quota constraints[J]. Economic Theory, 2002, 19:839-852.
[51] MCLENNAN A. Consequences of the Condorcet jury theorem for beneficial information aggregation by rational agents[J]. American Political Science Review, 1998, 92:413-418.
[52] BENYASHAR R. Information is important to Condorcet jurors[J]. Public Choice, 2006, 127(3):305-319.
[53] BALLESTER M, REYBIEL P. Does uncertainty lead to sincerity? Simple and complex voting mechanisms[J]. Social Choice and Welfare, 2009, 33(3):477-494.
[54] LASLIER J, WEIBULL J. Providing incentives for informative voting[EB/OL]. Working Paper, Ecole Polytechnique, (2006-10-10). hal.inria.fr/docs/00/24/30/42/PDF/2007-01-04-1531.pdf.
[55] FEDDERSEN T, PESENDORFER W. Convicting the innocent: The inferiority of unanimous jury verdicts under strategic voting[J]. The American Political Science Review, 1998, 92(1):23-35.
[56] BOND P, ERASLAN H. Strategic voting over strategic proposals[J]. Review of Economic Studies, 2009, 77(2):459-490.
[57] BENYASHAR R, MILCHTAICH I. First and second best voting rules in committees[J]. Social Choice and Welfare, 2007, 29(3):453486.
[58] COSTINOT A, KARTIK N. On optimal voting rules with homogeneous preferences[EB/OL]. Working Paper, Massachusetts Institute of Technology,(2009-05-25). econmit.edu/files/3732.
[59] MEHMET B, PARIMAL K B. Committee decisions with partisans and sidetransfers[J]. Theory and Decision, 2002, 52(3):267286.
[60] JAEHOON K. A model of adversarial committees[EB/OL]. Working Paper, University of Rochester, (2005-09-12).省略.rochester.edu/~jaek/Adversarial.pdf.
[61] CHWE M. Anonymous procedures for Condorcet’s model: Robustness, nonmonotonicity, and optimality[J]. Quarterly Journal of Political Science, 2010, 5(1):4570.
入侵檢測系統(IDS,Intrusion Detection System)是一種主動保護自己免受攻擊的一種網絡安全技術。作為防火墻的有效補充,入侵檢測技術能夠幫助系統應付網絡攻擊,擴展了系統管理員的安全管理能力,提高了信息安全基礎結構的完整性。本文就其幾個角度的分類加以簡單研究。
一、按數據來源進行分類
1.基于主機的入侵檢測系統
該系統通常是安裝在被重點檢測的主機上,其數據源來自主機,如日志文件、審計記錄等。該系統通過監視與分析主機中的上述文件,就能夠檢測到入侵。能否及時采集到上述文件是這些系統的關鍵點之一。因為入侵者會將主機的審計子系統作為攻擊目標以避開IDS。
2.基于網絡的入侵檢測系統
此系統使用原始網絡包作為數據源。通常利用一個運行在隨機模式下網絡的適配器來實時監視并分析通過網絡的所有通信業務。它的攻擊辯識模塊通常使用四種常用技術來識別攻擊標志:模式、表達式或字節匹配,頻率或穿越閥值,次要事件的相關性,統計學意義上的非常規現象檢測。一旦檢測到了攻擊行為,響應模塊就提供多種選項以通知、報警并對攻擊采取相應的反應。反應因產品而異,但通常都包括通知管理員、中斷連接或為法庭分析和證據收集而作的會話記錄。
基于網絡的IDS有許多僅靠基于主機的入侵檢測法無法提供的功能。實際上,許多客戶在最初使用IDS時,都配置了基于網絡的入侵檢測。
二、根據檢測原理進行分類
傳統觀點根據入侵行為的屬性將其分為異常和濫用兩種,然后分別對其建立異常檢測模型和濫用檢測模型。近年來又涌現出一些新的檢測方法,它們產生的模型對異常和濫用都適用。
1.統計分析與異常檢測
統計分析最大優點是它可以“學習”用戶的使用習慣,從而具有較高檢出率與可用性。但它的“學習”能力也給入侵者以機會通過逐步“訓練”使入侵事件符合正常操作的統計規律,從而透過入侵檢測系統。
異常檢測只能識別出那些與正常過程有較大偏差的行為,而無法知道具體的入侵情況。由于對各種網絡環境的適應性不強,且缺乏精確的判定準則,異常檢測經常會出現虛警情況。異常檢測可以通過以下系統實現。
(1)自學習系統:通過學習事例構建正常行為模型,分為時序和非時序兩種。
(2)編程系統:該類系統需要通過編程學習如何檢測確定的異常事件,從而讓用戶知道什么樣的異常行為足以破壞系統的安全。分為描述統計和缺省否認。
2.基于規則分析與濫用檢測
濫用檢測基于已知的系統缺陷和入侵模式,故又稱特征檢測。它能夠準確地檢測到某些特征的攻擊,但卻過度依賴事先定義好的安全策略,所以無法檢測系統未知的攻擊行為,從而產生漏警。
濫用檢測通過對確知決策規則編程實現,可以分為以下四種。
(1)狀態建模:它將入侵行為表示成許多個不同的狀態。如果在觀察某個可疑行為期間,所有狀態都存在,則判定為惡意入侵。
(2)專家系統:它可以在給定入侵行為描述規則的情況下,對系統的安全狀態進行推理。一般情況下,專家系統的檢測能力強大,靈活性也很高,但計算成本較高,通常以降低執行速度為代價。
(3)串匹配:它通過對系統之間傳輸的或系統自身產生的文本進行子串匹配實現。該方法靈活性欠差,但易于理解。
(4)基于簡單規則:類似于專家系統,但相對簡單些,故執行速度快。
3.混合檢測
近幾年來,混合檢測日益受到人們的重視。這類檢測在作出決策之前,既分析系統的正常行為,又觀察可疑的入侵行為,所以判斷更全面、準確、可靠。它通常根據系統的正常數據流背景來檢測入侵行為,故而也有人稱其為“啟發式特征檢測”。
參考文獻:
[1]韋文思,徐津.信息安全防御技術與實施.電子工業出版社,2009.
The users' privacy concerns about personal information arise with the emergence of the internet that also brings user's life many advantages.With a questionnaire survey, this paper investigates the personal information concerned by users and the concern level employing the statistical analysis and associative classification technology. The result indicates that Chinese internet user's concern level is still low although the concern level is much higher than ever. Moreover, the concern level for different kinds of privacy information is distinct. The concern level to specific personal information is also varied ranging from the user's age, sex and education level. The conclusions provide some useful suggestions for electronic commerce sites to effectively protect the users' personal information.
Key words:
一、引言
網絡發展到今天,已經成為人們生活中不可或缺的一種工具。只需輕輕按動鼠標,人們即可隨時隨地購買所需產品或服務、與遠在世界各地的親朋好友交流、從事一些特殊的研究、培訓或工作,還可以及時快速的了解世界各地的新聞,等等。但是,隨著網絡使用率的不斷增高以及相關技術的不斷進步,使得收集大量的用戶隱私信息變得非常容易。Federal Trade Commission (FTC) 在1999年3月所作的一次研究表明:約有92.8%的網站至少收集用戶的一項身份信息,56.8%的網站至少收集一項人口統計學方面的信息[1]。網站和個人的這些收集他人隱私信息的做法引起用戶對自己在網上活動時所留下的個人隱私信息的關心。Harris 等人在1998年所作的調查結果顯示:87%的網絡用戶“關心”在線時自己的隱私信息是否會受到威脅,56%的用戶“非常關心”這一點[2]; Jupiter 于2002年的研究結果表明:70%的美國用戶關心自己的網絡隱私[3];Harris在2004的調查分析得出:65%的被調查者稱自己由于關心自己的隱私而拒絕在電子商務網站上注冊[4]。PC world survey于2003年調查了1500網絡用戶,結果表明88%的人對于網站是否分享他們的e-mail地址非常關心,91%的人關心當自己在線時會不會被網站跟蹤[5];Statistics Canada 在2006年調查結果表明:57%的用戶在線使用信用卡時非常謹慎[6]。與用戶的隱私關注相一致,眾多學者開始從理論角度對隱私問題進行探討,得出了大量的研究成果[7-9]。
許多學者從不同的角度對隱私關心問題進行了研究。其中,大部分的研究是針對隱私關心和隱私行為之間的關系或隱私關心和信任之間的關系[9,10],這些研究僅對用戶是否關心隱私進行調查,建立隱私關心和隱私行為或信任之間的關系,并未對用戶具體關心的隱私信息及關心程度進行研究;Huberman等人使用實驗的方式對網絡用戶的隱私信息進行了定量研究,得出每項隱私信息都有一定的價值,且價值因用戶不同而不同[11],但是并未說明各類用戶的隱私價值在哪些方面存在差異。
中國在網絡隱私權方面的研究越來越多,但是在隱私關心方面卻鮮有研究。筆者針對這一情況,通過調查分析,找出網絡用戶所具體關心的隱私信息及關心程度,為后續更深入的研究網絡用戶對隱私關心程度不同的原因及其他相關問題提供參考。
筆者在此基礎上認為,在中國文化的影響下,中國網絡用戶對于各項隱私信息的總體關心程度是不同的;此外,受性別、年齡和學歷的影響,中國各類用戶對于各項個人隱私信息的關心程度存在一定的差異。因此,筆者提出兩個假設:(1)中國網絡用戶對每項隱私信息的關心程度是不同的;(2)不同性別、年齡、學歷的用戶對各類隱私信息的關心程度存在一定的差異。筆者采用問卷調查的方式,利用統計分析和關聯分類的方法,對這兩點假設進行研究。
二、研究方法
(一)問卷設計
筆者在參閱相關資料的基礎上,重點研究網絡用戶的26項隱私信息,并將其分為人口統計學信息、財務信息、偏好信息、家庭信息、社會信息等五類信息(見表1),這5類信息的劃分并沒有明顯的界限,有些信息可以同屬兩類信息,這對結果并沒有明顯的影響。
筆者采用問卷調查的方式進行研究。問卷共九個問題,每個問題都有被選項(單選和多選均有)。問卷。首先選擇30人做預調查,對預調查的結果請相關領域的專家分析后進行了相應的修改。然后進行大范圍的調查,被調查者為在校大學生、研究生、工程師、醫生、教師、公務員等各個行業一共350人,其中在校大學生及研究生占整個被調查者的三分之一,收回問卷332份,回收率為94.86%,其中有效問卷為324份,針對這324份問卷做了分析。問卷的alpha系數為0.985。
參照中國互聯網絡信息中心(CNNIC)對網民年齡的劃分標準,考慮到不同年齡段的用戶的生活背景,對網絡的認識、接觸網絡的機會以及用途均不同,因此,為了了解各類用戶對各類隱私信息的關心程度的差異性,對被調查者的年齡和學歷進行劃分,劃分結果如表2所示。
(二)數據處理方法
1.統計方法
為了驗證引言中所述的第一個假設,即網絡用戶對各項隱私信息的關心程度是不同的(網絡用戶對各項隱私信息關心程度的差異性),對調查結果進行了分析。由于個人信息項非常多,如果采用劃分等級的方法(即請被調查者針對自己的每項信息都給一個關心等級,如“非常關心”“關心”“比較關心”、“不關心”),可能會使被調查者很難選擇或者全都選 “非常關心”,因此請被調查者在所列出的26項個人信息當中選出不超過15項自己關心的信息,然后再對每項信息進行頻數統計,得出用戶對每項信息的關心程度(見表3)。
2.關聯分類方法
為了驗證第二個假設,得出不同用戶對各項隱私程度關心程度的差異性,筆者采用關聯分類的方式對數據進行了處理。
關聯分類(associative classification, AC)是一類新的面向決策表的規則獲取技術,其核心思想是利用關聯規則挖掘技術,通過頻繁項集挖掘、決策規則生成以及規則剪枝等過程獲取條件屬性與決策屬性的關聯關系,即決策規則 (稱為分類關聯規則(classification association rule) ),并利用生成的分類關聯規則構建決策系統。研究表明,AC方法能夠發現傳統方法挖掘不到的規則[12-15]。因此,筆者以關聯分類為工具,對用戶的隱私信息進行分析,以便找出用戶特征與其對隱私關心的聯系,并且根據這種聯系的強弱,得出用戶對不同隱私信息的關心程度。在掌握網絡用戶對不同隱私信息的關心程度之后,商務網站可以有針對性的重點保護網絡用戶比較關心的個人隱私信息,提高用戶對網站的信任水平,為企業創造更多的商機。
三、結果
(一)網絡用戶對隱私信息的關心程度
根據表3結果,將關心程度分為四個等級(非常關心、關心、比較關心和不關心),關心程度值大于0.7的為“非常關心”,關心程度值大于0.5的為“關心”(其中“家庭信貸情況”這項信息的關心程度值為0.494,非常接近0.5,所以將其劃分到“關心”這個等級),關心程度值大于0.2的為“比較關心”,小于0.2的為“不關心”,根據每項隱私信息的關心程度值將其放入相應位置,建立了個人隱私信息的關心程度矩陣(表4)。
雖然近幾年中國網絡用戶的隱私觀念有所改變,但從表3可以知道,中國網絡用戶對個人隱私信息的關心程度依然不高,僅對銀行卡號和身份證號這兩隱私信息的關心程度超過了0.6。這主要是受中國傳統文化的影響[16]。
為了更進一步的解釋假設一,下面筆者對每類隱私信息的關心程度進行簡要分析。
1.人口統計學信息
從表3中可以看出,網絡用戶最關心身份證號這項信息,其次是姓名和年齡,而對性別、身高、體重等信息則不關心。
在我國,身份證號是確定一個人身份的重要證件,如果此項信息泄露,可能會對個人造成非常大的損失或帶來許多麻煩,所以用戶對此項信息的關心程度非常高是符合實際情況的。由于其他五項個人人口統計學信息僅為用戶個人的信息,不涉及到他人,而且即使泄露,一般也不會對用戶本身或他人造成較大損失,所以用戶對這些信息的關心程度很低。此外,在網絡世界中,為了更好更容易地與他人交流溝通,大部分用戶都隱藏自己的真實姓名和年齡,所以對這兩項信息的關心程度要稍微要高一些。
2.財務信息
從表3中可以看出,對于各類財務信息,用戶均很關心,關心程度最高的是銀行卡號,其次是個人工資、家庭收入、配偶工資和家庭信貸情況等隱私信息。
對于財務信息,不論在中國還是其他國家,網絡用戶都都非常關心。因為這類信息涉及到用戶的經濟情況,如果泄露,會對個人經濟造成極大損失,尤其是銀行卡號,在信息技術如此發達的時代,黑客等網絡高手可能會根據用戶的銀行卡號來竊取用戶的錢財,所以用戶對銀行卡號的關心程度在所有隱私信息中是最高的。至于其他四項財務信息,相對其他類的個人信息來說,關心程度也要高一些。在這四項信息中,值得注意的是個人工資這項信息,在五年前,中國人并不關心這項信息是否泄露,甚至很多人主動告訴他人自己的這項信息,但隨著社會的進步、經濟水平的提高和用戶觀念的轉變,近幾年越來越多的用戶開始關心自己的這項隱私信息。
3.個人偏好信息
從表3中可以看出,對于個人的各項偏好信息,用戶普遍都不關心。因為這類信息僅僅是個人的興趣愛好,即使泄露,也不會對他人造成損失或傷害,一般也不會給個人帶來影響,所以用戶對這類信息的關心程度都很低。
值得注意的是,年齡在31-35歲之間的人,對自己的政治傾向和宗教信仰這兩項信息的關心程度要高出其他信息許多(其他信息關心程度在0.8以下,而這兩項信息均約為0.4)。這是因為,處于這一年齡段的用戶,工作已經進入快速發展期,生活閱歷又比較豐富,已經認識到政治問題和宗教問題可能會對自己的工作產生影響,所以對這兩項信息的關心程度相對來說要高一些。
4.家庭信息
同樣從表3來看,對于各類家庭信息,網絡用戶同樣比較關心,但相比來說,更關心庭住址和家庭電話這兩項信息。
從古至今,家庭對中國人的意義和影響都非常大,這類信息的泄露,極有可能會給用戶及其家庭帶來極大的麻煩甚至傷害,尤其是家庭住址和家庭電話這兩項信息,直接關系到家庭的安全和穩定,所以網絡用戶在對各類家庭信息都很關心的情況下,對這兩項家庭信息的關心程度要更高一些。
5.社會信息
對于個人的各類社會信息,從表3中可以看出,用戶一般比較關心自己的網絡聊天記錄和個人移動電話這兩項隱私信息,其次是個人e-mail地址,而對職業、單位地址和單位電話等隱私信息則不關心。
網絡聊天記錄這項信息,一般涉及到朋友或同事的隱私信息,如果泄露可能會給自己的人際關系帶來影響,甚至影響到自己的工作,所以用戶對這項信息的關心程度比較高。而個人移動電話的泄露會給個人帶來很多麻煩(如經常接到騷擾電話或短信息),所以用戶對這項信息的關心程度也比較高。
(二)各類用戶對各類隱私信息的關心程度比較
在(一)中我們從總體上得出了網絡用戶對個人信息的關心程度,并對各類隱私信息的關心程度進行了簡要分析。為了更進一步的了解各類用戶對個人各項隱私信息的關心情況,筆者采用關聯分類的分析方法得出了各類用戶對各項信息的關心程度的規則。
使用關聯分類分析方法會得出很多的規則,因為篇幅有限,根據網絡用戶的性別、年齡和學歷的不同,僅列出有代表性的規則,并對產生這些規則的原因進行簡要解釋,希望能為進一步研究引起這些現象的深層次原因,如文化因素、社會環境、個人偏好等,提供有益的啟發。
表格5到7中的用戶類別用年齡、性別和學歷三個屬性來來劃分,表示方法為﹡﹡﹡,左邊﹡表示年齡段,中間的﹡表示性別,右邊的﹡表示學歷,如C1Ⅰ表示年齡在25到30歲之間、性別為男性的具有本??茖W歷的用戶。
1.不同年齡用戶對隱私信息的關心程度
如2.1中所述,不同年齡段的網絡用戶的社會經歷不同,隨著年齡的增長,對事務的認識和看法也不同。針對這一現象,筆者從分析結果中找出了不同年齡的用戶對隱私信息的關心程度的差別(見表5)。
規則1 年齡在25到30歲的女性用戶比年齡在21到24歲的女性用戶更關心年齡這項隱私信息。這是因為無論在中國還是西方國家,女性對年齡這項信息都比較敏感,尤其是年齡越大的人,對這項信息越敏感,所以得出了此項規則。
規則2 同樣具有本??茖W歷的男性,年齡在25到30歲的人比年齡在21到24歲的人更關心個人工資、家庭收入和詳細健康狀況這三項隱私信息。在本問卷的被調查者中,約有三分之一的被調查者為在校學生,所以年齡在21到24歲的男性大部分為在校學生,而年齡在25到30歲的男性基本都為從事工作的人,處于這一年齡段的人一開始承擔家庭的各項經濟支出,所以對個人工資和家庭收入這兩項信息更為關心。同時,由于健康狀況可能會影響到自己的工作和家庭,所以他們對自己的詳細健康狀況這項信息的關心程度也比較高。
規則3 年齡在31到35歲的人比年齡在21到24歲的人更關心婚姻狀況和家庭電話這兩項隱私信息。由于前者基本都為成家立業的人,后者大都為在校學生,后者對婚姻和家庭尚未具體的理解和經歷,所以后者對這兩項信息的關心程度比較低是很正常的現象。
規則4 對于職業這項信息,網絡用戶都不關心,但相比來說,年齡在31到35歲的人比其他年齡段的人更關心。由于小于此年齡段的人一般都未開始工作,即使工作也是剛剛起步,而大于此年齡段的人一般工作年限已比較長,工作已經有了一定的基礎并且比較穩定,而處于31到35歲的人正處于工作的重要階段,所以對于這項信息比較敏感,關心程度也較高。
2.不同性別用戶對隱私信息的態度
一般來說,男性和女性在人生觀、世界觀、價值觀方面的差異都比較大,為了了解不同性別的用戶對隱私信息的態度存在哪些方面的差異,筆者對結果進行了分析,得出以下規則(見表6)。
規則5 女性比男性更關心年齡、體重、詳細健康狀況和家庭情況。如前所述,中西方國家的女性對年齡、體重這些信息都很敏感,所以對這兩項信息的關心程度比男性要高,至于更關心詳細健康狀況這項信息,是因為女性一般體質弱于男性,所以對該項信息更為敏感。此外,在中國,女性的家庭觀念更強,所以對家庭情況這項信息也比男性更關心。
規則6 男性比女性更關心姓名、性別、家庭住址、家庭電話。一般來說,在網絡世界里,女性要比男性更容易與他人溝通交流,而從姓名可以大致判斷性別,所以為了更方便的在網絡世界里與他人溝通,男性一般都隱瞞自己的性別,即對姓名和年齡這兩項信息的關心程度比女性高;此外,無論在中國還是西方國家,男性一般要承擔起保護保護家人的責任,而家庭住址和家庭電話這兩項信息的泄露可能會給家人帶來麻煩或危險,所以男性對這兩項信息的關心程度比女性高。
規則7 年齡在25到30歲之間的男性比女性更關心家庭信貸情況這項信息,但年齡在21到24歲之間的具有本??茖W歷的女性卻比男性更關心此項信息。處于前一年齡段的人一般為剛成家立業的人,在中國,歷來有男人養家的傳統思想,所以處于這一年齡段的男性要比女性更關心自己的家庭信貸情況;而處于后一年齡段的人大都為在校學生,而女性一般比男性心思更加細膩,對父母更加體貼,所以處于這一年齡段的女性更關心家庭信貸情況是出于對父母的關心。
3.不同學歷用戶對隱私信息的態度
不同學歷的人,所受的教育程度不同,一般在對問題的認識深度等方面會存在一定的差異。筆者從分析結果中找出了不同學歷的用戶在隱私信息的關心程度方面的差異(見表7)。
規則8 具有本??茖W歷的女性比具有碩士學歷的女性更關心身高這項信息,而后者更關心配偶工資和網絡聊天記錄這兩項隱私信息。一般來說,女性對身高并沒有男性關心程度高,但是對于具有不同學歷的女性來說,在學歷上具有優勢之后,對身高這項信息的關心程度自然也就沒有在學歷上具有弱勢的女性高;至于配偶工資這項信息,如果女性本身的學歷比較高,一般都希望配偶的工資能更高,所以對該項信息的關心程度也就比較高;此外,由于在校學生在本次調查中所占比例比較大,而在校本??茖W生一般將網絡用于溝通交流和娛樂,而在校研究生除了將網絡用于交流溝通娛樂外,最主要的一點是用于做研究,從網絡聊天的內容價值來看,碩士研究生的聊天內容價值更高,更需要保密,所以出現具有碩士學歷的女性比具有本專科學歷的女性更關心網絡聊天記錄這項隱私信息。
四、討論
筆者采用問卷調查的方式獲得了用戶對于自身隱私信息的關心程度,并采用關聯分類的方式分析了各類用戶對于各項隱私信息的關心程度的差別,分析結果驗證了引言中提出的兩項假設。
如前所述,對于網絡隱私問題,研究的人很多,但主要集中在隱私保護技術、隱私關心和隱私行為之間的關系或隱私和信任的關系問題或隱私權問題上。筆者主要是從用戶自身觀念出發,旨在了解用戶到底對自身的哪些信息比較關心。此結論可以為電子商務網站服務,網站在了解用戶關心的各項信息后,可以加強對這些信息的保護,從而提高用戶對網站的信任水平,給網站帶來巨大商機。但是尚存在一些問題,一是調查的信息項僅26項,有許多信息沒有調查;二是樣本僅350人,且樣本年齡跨度?。ㄈ缯{查的年齡主要集中在20-35歲之間),涵蓋的范圍不夠寬;三是在分析用戶對信息的關心程度時僅采用頻數分析,結果可能存在不合理的地方;四是關于各類用戶對各類信息的關心程度的差別僅得出一些結論性的結果和簡單的分析。
目前,關于隱私問題的研究越來越多,也越來越深入。但仍有許多問題值得進一步研究:(1)對本文未作調查的個人隱私信息需要調查研究,得出用戶對這些信息的關心程度(本文只是對小部分信息進行調查,不完全,還需要進一步做詳細的研究);(2)雖然由調查結果得出的規則可以看出用戶對于各種信息的關心程度是不同的,但是對產生這些規則的圓滿解釋還需進一步的研究;(3)得出用戶對于各項信息的關心程度之后,電子商務網站如何利用這些結果提高用戶的信任水平也是值得研究的內容之一。
參考文獻
[1] Forrester Research(1999). Post-web retail (September) [R/OL]. forrester.com/
[2] Harris and Associates Inc., Westin, A., 1998. Ecommerce and privacy: what net users want. Privacy and American Business and Pricewaterhouse Coopers. LLP. Available online at: pandan.org/ecommercesurvey.html. Accessed on 20 June 2005.
[3] Jupiter Research. Seventy percent of US consumers worry about online privacy, but few take protective action [EB/OL], 2002. jmm.com/xp/jmm/press/2002/pr_060
[4] Harris, 2004. National Survey on Consumer Privacy Attitudes. Available online at: epic.org/privacy/survey/S, accessed on 22 August 2006.
[5] PC world survey, 2003. Available online at: pcworld.com/article/id,112468-page,1/article.htmlS, accessed on August 22, 2006.
[6] Statistics Canada, 2006. Available online at: ca.today.reuters.com/news/newsArticle, accessed on August 22.
[7] Klein, S.,. The privacy debate: this time it's personal. The Guardian newspaper, April 26. 2004.
[8] Vise, D.,. Fears over Big Brother stalked Gmail. The Sunday Times news paper. Available online at:[EB/OL]business.timesonline.co.uk/article/, accessed on 8 December 2005.
[9] Carina Painea, Ulf-Dietrich Reipsb, Stefan Stiegerc, Adam Joinsona, Tom Buchanan. Internet users' perceptions of 'privacy concerns' and 'privacy actions' [J]. human-computer studies2007.65(526-536).
[10] Chang Liu, Jack T. Marchewka, June Lu, Chun-Sheng Yu. Beyond concern-a privacy-trust-behavioral intention model of electronic commerce[J]. Information & Management 42 (2005) 289-304.
[11] Huberman B, Adar E, Fine L. Valuating Privacy [J]. IEEE SECURITY&PRIVACY, 2005: 22-25.
[12] Thabtah F, Cowling P, Hammoud S. Improving rule sorting, predictive accuracy and training time in associative classification [J]. Expert Systems with Applications, 2006(31): 414-426.
[13] Liu B, Hsu W, Ma Y. Integrating classification and association rule mining [C]. Proceedings of the Fourth International Conference on Knowledge Discovery and Data Mining (KDD-98), 1998.
一、前言
教師在課堂教學中要打破傳統束縛學生思維發展的舊模式,遵循以人為本的觀念,給學生思維提供最大的空間,項目根據“應用有機化學”教學大綱,把培養學生的創新素養作為教學的重點。轉變學生的學習方式,既要讓他們“學會”,也要“會學”,因此我們在“應用有機化學”課堂教學中,基于“憤悱術”和“產婆術”啟發式教學的課堂教學策略的基本理論依據,設計了“應用有機化學”課堂教學改革的幾種模式:主動性模式、主體性模式、情感性模式、可持續性模式、舉一反三學習模式[1][2]。
“應用有機化學”“憤悱術”和“產婆術”的啟發式教學策略源于一般啟發式教學策略,是一般啟發式教學策略的應用,具有一般啟發式教學策略的特點。通過對甲班進行試驗,而乙班的教學方法保持原狀。根據期末考試成績,進行顯著性檢驗分析[3][4]。
二、以分析性統計檢驗誤差,以確認從樣本推斷總體的可靠性
(一)u檢驗和t檢驗理論依據
統計檢驗是準確解釋研究結果的前提,其方法可分為參數統計檢驗和非參數統計檢驗兩類。在中小學教育科研中,通常以參數統計檢驗為主,其中u檢驗和t檢驗是兩種最常用的檢驗方法。[5]
在教育統計中常以正態曲線分布下面積的95%或99%的理論u值為差異顯著性的臨界值,取0.05和0.01位兩個顯著水平。若樣本的u值等于或大于95%或99%的理論u值(分別為1.96和2.58),即表明樣本的平均數不超過 μ±1.96σ或 μ±2.58σ的區間。也就是說,樣本來自同一總體的可能性(即概率P小于0.05或0.01)。在統計上將P≤0.05的差異稱為顯著差異,將P≤0.01的差異稱為非常顯著差異。反之,若樣本的u值小于95%的理論z值,則表明樣本來自同一總體的概率P>0.05,統計上稱為差異不顯著。
由于u檢驗要求樣組的規模較大(n>30,嚴格地說,應以n>50為大樣本),因此,對于小樣本的檢驗通常都采用比較兩個平均數以確定它們之間的差值是真的差值而不是偶然差數的t檢驗。在同一概率下,自由度越大,t值就越小;在自由度相同的情況下,則概率越小,t值越大。
(二)本次受試樣本采用t檢驗
t檢驗方法檢驗樣本之間有無真正的差異(由操縱自變量引起的差異,而不是由抽樣誤差等引起的差異),其基本程序為:①對試驗樣本所在的總體提出假設;②確定顯著水平;③在無效假設成立的前提下,研究統計量的抽樣分布,計算出檢驗統計量;④估計相對概率P,根據小概率原理作出統計推斷。
1.建立虛無假設
差異檢驗是以“反正”為特點的邏輯推理過程。其基本思想是,為了證實各樣本均數有顯著差異,可首先假設被比較的樣本均數(或百分數)沒有顯著差異,即假定它們是來自同一總體的,它們之間的差數為0,即便有差異,也純粹屬于隨機誤差,這種假設,在統計上稱為“虛無假設”或“無效假設”(通常以H0表示)。倘若虛無假設成立的概率(通常以P表示)很?。≒≤0.05,或P ≤0.01),則根據小概率原理“概率很小的時間在一次實驗中是幾乎不可能發生的”,就可拒絕虛無假設,即原來假定的各樣本來自同一總體的可能性是極小的,從而可確定被比較的各數值之間的差異確實反映了自變量的處理效應。反之,如果P值比較大(P>0.05),我們就將接受虛無假設,認為被比較的各數值之間的差異完全是由隨機誤差造成的。
2.計算t值
計算t值首先需要考慮所檢驗的樣本是相互獨立的、互不關聯的,還是相互關聯的,并依據此選擇相應的計算公式。這就是所謂的“獨立樣本”,是指兩個樣本的抽取互不影響,即受試者隨機地被分配于兩個樣本之中,它們之間沒有成對的關系。關于“相關樣本”主要有兩種情況:一種是對同一種研究對象進行兩次檢測所得到的兩組數據;另一種是對兩個并非通過隨機抽樣組成的配對組進行同種檢測所得到的兩組結果。如果兩個配對組是通過隨機抽樣而構造的等值組,則由同種檢測所得到的兩組數據只能屬于獨立樣本,而不能視作相關樣本。
3.進行統計決策實例
即通過以t值與理論t值的比較,做出拒絕或接受虛無假設H0的決策。
如果采用的是t檢驗,則其決策程序為:
(1)根據自由度df,從t值表中查出0.05顯著性水平上的臨界值t(df)0.05和早0.01顯著性水平上的臨界值t(df)0.01。
例如,對n=40的樣組進行t檢驗,則其自由度df=40-1=39。據此,可從上表中分別查得:
t在0.05顯著性水平上的臨界值:t(39)0.05 = 2.020;
t在0.01顯著性水平上的臨界值:t(39)0.01 = 2.703。
(2)將計算所得的t值與查表所得的臨界值作比較,并根據下表進行統計決策。現在,讓我們通過實例來進一步對統計檢驗問題作出具體的說明。試分析新的教學方法在提高學生數學水平方面與原來的教學方法有無顯著差異。具體兩個班級期末考試成績數據見表1、表2。
由于n =40,為小樣本,可采用t檢驗。檢驗步驟如下:
(3)計算t值。由于乙班為沒有進行試驗的考試結果,所以以乙班為基準進行計算,計算結果為:t=(78.90-70.08)/1.49 =5.92。t檢驗統計決策規則見表3。
≤0.05在0.05顯著性水平上拒絕虛無假設H0,差異顯著。|t|≥t(df)0.01 P≤0.01 在0.01顯著性水平上拒絕虛無假設H0,差異極顯著。
(4)統計決策。將實際所得的t值與理論t值相比較。比較結果為:
t=5.92≥t(df)0.01=3.499,即P≤0.01。在0.01顯著性水平上拒絕虛無假設H0,表明差異極顯著。
三、結語
在0.01顯著性水平上拒絕虛無假設H0,表示采用“憤悱術”和“產婆術”啟發式教學方法的學生在期末考試成績方面有非常顯著的差異,且甲班學生的成績明顯優于乙班學生。
采用“憤悱術”和“產婆術”啟發式教學方法安排教學內容的教法與原來的教法相比,其教學效果在一般情況下是有極其顯著差異意義的,即這種教學方法優于原來的教學方法,因而是可行的。
參考文獻:
[1]靳乃錚.啟發式教學[M].北京:北京師范大學出版社,2002.
[2]盧小男.信息技術環境下再論數學啟發式教學[D].大連:遼寧師范大學,2010.
引言
課堂教學是教學過程的中心環節,是教師教學質量的集中體現,課堂教學質量的好壞直接關系到學校教育質量的高低。教師課堂教學質量評價是教學管理的一個重要環節,它在整個教師考核系統中占主要地位。課堂教學質量的評價方法主要有“專家評價”、“同行評價”、“學生評價”、“教師自評”等。其中以學生問卷調查形式的學生評價法最常用,對其可靠性和有效性的研究已進行了50多年。本文所述的基于web的課堂教學質量模糊綜合評價系統已在我校投入試運行,效果良好。
1 評價指標體系的建立
高校已有的課堂教學評價指標體系越來越不適合高校教學評價的要求,影響了評價質量,為此,結合高校教學新的發展和特點,我校建立了一種新的科學的課堂教學評價指標體系,即課堂教學質量評價二級指標體系模型,如表1所示。
2 評價系統的設計及開發
根據上面課堂教學評價指標體系,筆者開發了基于模糊綜合評價的課堂教學質量評估系統。
2.1 系統結構及各模塊功能
系統的總體功能結構主要分為三個功能模塊:前臺信息收集、后臺數據分析、系統維護功能。這三個主模塊中,最低層的相關功能(如圖1所示)分別用于:填寫評價信息;瀏覽評價結果;以列表的形式,為用戶提供多層次、多角度的分析結果瀏覽;瀏覽決策規則;維護用戶、評價指標和系統信息。
我們使用所述指標體系對評估對象進行評價信息的收集。本模塊學生端由純Web頁面生成。學生通過圖2所示的填寫評價問卷頁面對評價項目給出相應的評語(“優秀”、“良好”、“中等”或“差”,單選)后,點擊“提交”按鈕,即可將填寫的信息保存到系統數據庫,作為后期開展評價的依據。
2.2.2 指標權重的收集
評估體系中各指標權重設計得合理與否直接影響教學評估效果。系統將根據專家分析按照判斷結果量化規則,計算出各指標權重。如表2所示。的權重取值按判斷結果量化規則給定。
以一級評價指標取代表2中的A經專家填寫上表后,系統利用本文3.1.3中所介紹的層次分析法確定一級指標權重集w=(W1,w2,W3,w4)。同理可以獲得各個二級指標的權重集。
2.3 后臺數據分析
后臺數據分析,主要是對從學生、專家等相關評估人員收集來的數據進行科學分析――使用下面介紹的模糊數學方法,采用模糊綜合評判模型。經過模糊處理的信息可以瀏覽,瀏覽模塊以列表的形式呈現評價結果。
3 系統實現的關鍵技術
3.1 模糊綜合評價模型及算法
在課堂教學質量評價中,某些評價因子帶有一定程度的模糊性,即具有非線性特征。它沒有十分明確的界限和清楚的外延,不存在絕對的十分精確的肯定與否定。如,對某老師課堂教學質量的教學效果的優劣進行評價時,人們的認識不同褒貶程度也不盡相同,很難直接用統計學的方法確定這些因素的具體數值。
模糊綜合評價即是基于評價過程的非線性特點而提出的,它利用模糊數學中的模糊運算法則,對非線性的評價論域進行量化綜合,從而得到可比的量化評價結果。對課堂教學質量采用模糊數學的方法進行綜合評價,將更接近于實際情況。
3.1.1指標的評價因素集的確定
對課堂教學質量(u)的評估,是全面的多因素評價。主要從4個方面來評估,每個方面又包含若干個子因素。評價指標應遵 循全面整體性和相對獨立性原則,即滿足u(i≠i),設每個指標Ui=(u1 u2…un)。
3.1.2評語集
課堂教學質量評價結論分4個等級:優秀、良好、中等及差。這4個等級組成評語集。評語集對應的數值集。
3.1.3 權重集
設一級指標的權重集為w=(WI,W2,W3,w4),二級指標的權重集。本文用層次分析法確定一級和二級指標的權重數。以計算w一級指標權重數為例,算法說明如下。首先確定目標和一級評價因素集u=(Ul,U2,U3,U4),然后構造判斷矩陣A,A中元素表示指標u。對u的相對重要性數值,取值由專家判斷結果量化規則決定。A中元素滿足Aij=1/Aji,Aii=1,根據公式,求出最大特征根,一致性指標,一致性比率,其中恥為判斷矩陣的平均隨機一致性指標。當CR
3.1.4 構造隸屬度子集R
對于每一個二級指標u,根據學生評價結果,用模糊統計方法得出每個因素u,的模糊隸屬度子集。這里“指評價因素集中二級指標U對應評語集中每個v的隸屬度,一級指標U的模糊評判矩陣R。
對于每一個二級評價指標u。都可以得到一個隸屬度子集,那么re(m=4、5)個氏構成一個u×V域上的m×4模糊評判矩陣R,即對于一級指標u。的模糊評判矩陣:
3.1.6 一級指標U的模糊綜合評判值S
鑒于運用模糊矩陣相乘的取小取大法和隸屬度原則的弊端,這里按普通矩陣乘法法則綜合評價結果。到u的用隸屬度表示的模糊評判值;
3.1.7 課堂教學質量(U)的模糊綜合評價結果S
重復3.1.5 的計算過程用二級求得的所有評判值s構成。
3.2 B/S和G/S體系結構
本系統的主要用戶包括校級和院系兩級教務管理人員和學生、專家等,教務人員大多在相對固定的位置使用系統,而學生人數多,使用系統的位置也不固定。綜合分析,決定使用B/S和C/S模式交叉混合的多層體系結構方案。這樣設計可以使該系統具有信息瀏覽和信息管理與維護的功能。
3.3數據庫的設計
教學評價系統選用Microsoft的SQL Server 2000作為數據庫的開發工具,因為它不僅僅是一套功能強大的數據庫服務器軟件,而且最重要的是它具有支持數據倉庫的特性,并自帶聯機分析處理軟件包,同時可以獲得Windows平臺上各種軟件系統的支持。
3.4前臺開發工具
中圖分類號:F014.5文獻標識碼:A文章編號:1003-949X(2008)-06-01-03
個人信用評分研究從技術層次上來講,主要經歷了三個階段,從簡單的分類模型到預測評分模型,再到決策評分模型。而從評分的類型上看,主要分為四個類型,即申請評分、行為評分、利潤評分以及考慮經濟環境因素的信用評分。
一、申請評分(Application Scoring)
授信機構接受客戶信用申請時,利用客戶提交的申請表中的特征變量建立評分模型得到申請者的一個信用值,將該值與事先設定的標準值相比,判斷該申請人逾期的可能性,從而決定是否授出信用及授信額度。這樣的信用評分,稱為申請評分。
建立評分模型可以運用的方法非常多,傳統統計學方法有判別分析、線性回歸、Logistic回歸等;非參數方法有最近鄰方法等;運籌學方面則主要采用線性規劃方法。隨著信息技術的發展,近年來許多數據挖掘的新方法如神經網絡、決策樹、遺傳算法、專家系統等陸續被引入信用評分領域中。
Durand(1941)首先將判別分析方法用于信用評分,正式系統的提出使用數理統計模型輔助消費者授信決策的觀念,并將Fisher(1936)提出的判別分析法用來區分“好”的貸款和“壞”的貸款,從而對貸款的信用風險進行評價,這是個人信用評估從定性分析逐步過渡到定量分析的開端。
1958年William Fair & Earl Isaacs利用判別分析法建立了著名的FICO信用評分系統。Myers & Forgy(1963)采用判別分析和回歸分析方法,利用零售信貸領域消費者信用申請表中的數據對財務公司的信用風險進行了預測。 Orgler(1970)首次將線性回歸分析引入消費者貸款的信用風險評估,利用線性回歸分析設計了一個評價未償還貸款的評分卡。Fitzpatrick(1976) 、Lucas(1992)、Henley(1995)等也先后將這種方法用于構建個人信用評分模型。Myers & Forgy(1963)認為這兩種方法對于降低商業銀行等機構的壞賬損失有很大的幫助。Reichert (1983)也發現運用這兩種方法構建的個人信用評分模型在預測消費信貸風險時都表現出了很強的穩健性。Rosenberg & Gleit(1994)在他們的研究中也表示了與Reichert相似的贊同觀點。但Eisenbeis (1977)認為只有在客戶分類較少的時候,基于判別分析和多元線性回歸方法建立的個人信用評分模型才會有好的效果。
Wiginton(1980)首次嘗試了在信用評分模型中使用Logistic回歸方法,并與判別分析法進行了比較。但由于Logistic回歸法沒有變量正態性假設的要求,因此被學者認為是最適合發展信用評分模型的理論。并且由于該法使用的前提假設少,建立的個人信用評分模型具有相當的準確性和穩定性,因此成為了設計個人信用評分模型的主要方法,并且延續至今。
最近鄰分析方法最先是由Fix & Hodges(1952)提出的,它是一種標準的非參數分類技術,通常被用來解決概率密度函數的估計和分類問題。它的思想很簡單,就是把預測目標分為兩類,當一個新的預測目標加入時,就將其并入最鄰近一類中。Chatterjee & Barcun(1970)首次將最近鄰法用于個人信用評分模型。Hand(1981)利用家庭貸款的數據對最近鄰法與決策樹進行了比較,結果最近鄰法得到了相當高的預測精度。
Mangasarian(1965)第一個意識到可以將線性規劃方法應用于分類問題。但是直到Freed & Glover( 1981a ,b)的文章發表以后,才引起了更多人的興趣。此后,有關的研究文獻大量涌現。Joachimsthaler & Stam(1990)就這一領域的70多篇文獻進行了綜述。有些學者則對統計學方法與線性規劃方法的效果進行了比較,盡管在Nath ,Jackson & Jones(1992)的研究中認為統計學方法要比線性規劃方法好。
1990年Odom(1990) 首次將神經網絡方法引入信用風險評估中。Desai等(1996,1997)、West(2000) 等人使用神經網絡方法構造了個人信用評分模型,并通過實證分析驗證了在各種特征變量呈復雜的非線性關系的情況下,神經網絡方法具有明顯的優勢。
決策樹方法,也叫分類樹或遞歸分割法,通過使用一種分割方法,將原始樣本集遞歸分割成不相交的子集,目的是使期望損失達到最小。最早將決策樹方法用于信用評分的研究是Makowski(1985)。 Coffman(1986)將決策樹方法與判別分析方法進行了比較,發現當變量存在相關性時,決策樹方法的表現較好。Carter & Catlett(1987) , Mehta(1988)等把這一方法應用到信用評分領域。
遺傳算法是對一個問題的潛在解的種群進行系統的搜索,使得與解決問題相近的解保留在候選解中的可能性比其他解要大。遺傳算法最早是由Holland(1975) 提出的。Albright(1994)首次將遺傳算法應用于信用聯盟評分卡的開發。Michalewicz(1996)提出了一些啟發性的規則, Yobas, Crook, & Ross (1997)運用遺傳算法并使用一個不同的函數對建立信用評分模型作了探討。
專家系統是仿效專家的決策行為的過程的集合,它由自然語言組成,將專家的意見匯入計算機中,專家系統能夠提高預測“壞”客戶的準確性。主要的研究有Zocco(1985) , Davis(1987) , Leonard(l993a,b)、 Tessmer & Richey(1997) 等。Davis, Edelman & Gammerman (1992) 將Bayesian專家系統用于信用卡申請者的分類問題,并將結果與神經網絡方法的結果進行了比較。Talebzadeh, Mandutianu & Winner (1994)依據專家系統設計出了抵押貸款的個人信用評分模型。Leonard (1993)則利用專家系統成功預測了信用卡用戶的違約率。Hand, Mcconway, & Stanghellini(1997), Sewart & Whittaker(1998)等則論述了運用繪圖的方法可以更容易確定個人信用風險的全部因素。
二、行為評分(behavioral scoring)
一般信用評分模式只考慮申請者本身的條件是否良好,未考慮外在環境變化。行為評分是一種統計專門技術,它是在一般信用評分的基礎上考慮到時間因素發展而來的。研究的主要目標是通過預測現有授信客戶的未來行為幫助借貸機構在管理客戶時作出更好的決策。
行為評分模型主要分為兩種方法,一種是申請評分模型和額外信息變量的組合,另一種是建立客戶行為的概率模型。根據估計參數信息的獲取方式不同,后一種方法又分為兩類,一是從以前的客戶中抽樣,二是使用貝葉斯方法,即根據顧客自己的行為更新公司對客戶的信任度。概率模型本質上是馬爾可夫鏈,顧客可以從一個狀態跳到另一個狀態。
有關第一類行為評分的研究有:Cyert, Davidson & Thompson(1962) 用馬爾柯夫鏈方法研究在貸款到期以后的不同時期,預計不可回收的貸款數目(C-D-T模型)。后來不少學者對C-D-T模型進行了修正。Van Kuelen et al. (1981)的主要修正在于考慮了過期賬戶的部分還款事實。Corcoran (1978)指出如果對于不同特征的賬戶給出不同的轉移矩陣,系統將會更加穩定。Fryman et al. (1985)區分了移動者(movers)和停留者(stayers)這兩種客戶類型,發現后者更傾向于維持現有狀態。Banasik et al. (1996)的研究指出如果對客戶群體的分類不是足夠清晰,在實際應用中得到的信用評分并不十分有效。
關于第二類行為評分的研究,最早基于Bayesian定理的概率模型是Bierman & Hausman( 1970)提出的。這一模型中,還款概率不是根據以前客戶的樣本得出的,而是被看作一個參數滿足Beta分布的Bernoulli隨機變量。Dirickx & Wakeman(1976)以及Srinivasan & Kim (1987)分別對該模型做了擴展。Thomas (1994)將這一模型進行了修正,他不僅把還款概率作為隨機變量,還把最大可能的還款金額也作為隨機變量,根據已經還款的情況,這些隨機變量不斷被按Bayesian方法修正。
三、利潤評分(profit scoring)
個人信用評分模型的研究目標由客戶違約率最小化向公司從該客戶賺取利潤最大化轉變, 是國外個人信用評分模型研究的前沿之一,也是信用評分領域近幾年來的研究熱點。這方面正在嘗試的方法大體上可以分成以下四種。
第一種是在現有的評分模型上建立的,估計違約率、交易量、接受和損失的比例,并根據不同測度下的得分對總體進行細分,對不同的群體定義利潤。Oliver(1993)首先使用該方法,并考察如果顧客有了“交易利潤得分”和“違約得分”,那么決策規則是什么的問題。 Fishelson-Holstine(1998)討論了運用利潤的兩種類型來細分顧客的問題。Li & Hand (1997)則建議不估計最終的利潤,也不直接估計違約標準,而是估計中間變量,如節余、購買額等,然后使用這些因素估計最終的收入。Hand, McConway & Stanghellini(1997), Sewart & Whittaker(1998)認為應該根據違約率、交易量、接受和損失率來綜合考慮利潤。
第二種類似于信用評分中的回歸方法,把利潤表達成申請表格中定性變量的線性函數。Lai & Ying(1994)進行了這方面的研究。
第三種是使用馬爾可夫鏈方法來進行行為評分,以開發出更精確的消費者行為隨機模型。Cyert et al (1962)對一個產品案例的利潤進行了建模分析,當這些方法用于估計相同產品的顧客群體的壞賬準備金時,結果表明應用非常成功。
第四種是成功地處理遺失數據的一種統計建模技術。人們試圖根據有限的數據來估計消費者的長期利潤。Narain (1992)是第一個建議人們在信用評分上使用該方法的學者,而Banasik et al (1999)的論文顯示人們也可以使用競爭風險的思想來對消費者什么時候會違約和什么時候會預先付款進行估計,這樣在一個分析中可以同時考慮違約率和流失率。Stepanova和Thomas(2001)利用PHAB模型進行行為評分研究,結果顯示該模型在預測風險和預測利潤兩個方面都有很好的表現。Stepanova和Thomas(2002)研究了比例風險模型(即Cox模型)的三種擴展形式,研究表明該模型不論在預測風險還是在預測利潤方面都非常有效。他們還提出了三個改進:在變量屬性分類方面提出了coarse-classifying的分類方法;在模型擬合度的檢驗上提出了多個診斷方法;在數據處理上應反應其變化。Baesens, Stepanova和Vanthienen(2003)提出了幾種神經網絡生存模型,認為神經網絡生存模型克服了比例風險模型要求輸入函數形式是線性的缺點,并分別用神經網絡生存模型與傳統的比例風險模型的性能進行了比較。
四、考慮經濟環境因素的信用評分
一般的信用評分模型中,都沒有考慮經濟環境等外在因素的影響,但經濟周期等宏觀經濟變量無疑與客戶違約率存在著密不可分的關系。隨著信用評分技術方法的日益豐富以及計算機通信技術的迅猛發展,使得把經濟環境因素整合到信用評分模型中成為必要和可能。其研究的主要目標是通過將經濟環境變量、申請表特征變量和現有客戶行為變量三者共同引入評分模型,以使得考慮的因素更充分,模型更加穩定,生命周期更長。
Crook, Hamilton & Thomas( 1992)證實了當經濟處于衰退期時,即使信用歷史良好的顧客也會出現違約的情況。Zandi(1998)調查了美國90年代的情況,認為違約率上升的主要原因在于信用標準的降低,因為金融機構為了爭取信用卡客戶和國內的貸款人,調低了他們的授信界限。關于個人破產對經濟變量的回歸分析表明,經濟狀況的確對違約有顯著的影響。
構造同經濟環境、申請表變量和消費者行為相聯系的更嚴格的模型的一種方法是使用圖形方法和貝葉斯學習網絡。Sewart & Whittaker (1998)以及Hand et al (1997)指出這些技術對于檢驗自變量和因變量間的關系非常有用。Fung指出,使用模擬和馬爾可夫的思想對信用評分的內容可以擬合得很好,由此分析可得到一個評分模型。
五、結論
個人信用評分的研究目標和方向一直在不斷發生著變化,當前研究的重點是將風險管理目標從客戶違約可能性最小化調整到如何使公司從該客戶賺取的利潤最大化。另外,信用評分的目的也從最初的評估違約風險,逐步擴大到評估響應、使用、保持、流失、負債管理、以及欺詐評分。這也為今后這一領域的研究指明了新的方向和道路。
參考文獻:
[1]Capon, N, Credit Scoring Systems: A Critical Analysis, Journal of Marketing,1982,46:82-91
[2]Srinivasan V.and Kim, Y .H. Credit Granting: A Comparative Analysis of Classification Procedures. Journal of Finance,1987,42:665-683
[3]Hand, D. J. Discrimination and Classification. John Wiley, Chichester,U.K,1981
[4]Henley, W .E and Hand, D. J.A k-nearest Neighbor Classifier for Assessing Consumer Credit Risk,Tire Statistician, 1996,45:77-95
[5]Desai, V. S.,Crook, J. N. and Overstreet, G. A. A Comparison of Neural Networks and Linear Scoring Models in the Credit Environment. European Journal of Operational Research,1996,95:24-37
隨著電子信息技術的迅速發展和信息處理自動化需求的不斷擴大,模式識別方法和技術在信息處理領域中的重要性越來越受到重視。在吸引了眾多研究者投身到模式識別研究領域的同時,模式識別的教學也從研究生教學逐漸延伸到了本科教學。模式識別作為計算機、電子信息技術等專業的專業基礎課程,已經在越來越多的高等院校開設。本科模式識別課程主要討論以統計學為基礎的模式識別理論和方法,內容包括:貝葉斯決策理論以及參數估計方法、以誤差函數最小化為原則的線性和非線性判別、近鄰規則、特征提取和選擇、聚類分析、神經網絡、支撐矢量機、隨機方法、非度量方法、獨立于算法的機器學習等內容[1]。由于模式識別研究領域的廣泛性,模式識別本科教學的內容和側重點的安排目前尚處于探索階段。模式識別領域的發展日新月異,這就要求教師在授業解惑的同時能夠與時俱進地介紹該領域的發展前沿,從而培養學生主動探索知識的興趣。
本文將結合本科模式識別教學的實踐,分析該課程在內容設置方面面臨的問題并給出相應的解決問題的建議;結合模式識別課程的特點,提出了以應用實例為先導的教學方法,以提高學生的學習興趣;針對不同類型的學生,提出了如何培養學生實踐能力和科研興趣的方法。
1模式識別教學內容的層次劃分和講授方法
模式識別是一門理論與實踐緊密結合的學科,其理論基礎涉及高等數學、線性代數、數理統計、矩陣論、隨機過程、工程優化方法、小樣本統計學習理論、模糊數學等學科[2]。然而除了高等數學、線性代數和數理統計,其他課程都是研究生階段才會開設的數學基礎課。這就使得本科的模式識別教學面臨著尷尬的局面:既不能花過多的時間講數學基礎知識,又要把以這些數學知識為基礎的內容講清楚。面對這一難題,我們在教學實踐中總結出了一套辦法,具體做法是將教學內容劃分為基礎型、前沿型兩類;并采用弱化公式推導,強調數學表達式物理含義的方法進行講授。
基礎型教學指的是已經發展完善的模式識別原理和方法。基礎型內容包括:貝葉斯決策理論、概率密度函數估計、線性判別、近鄰規則、獨立于算法的機器學習等內容。貝葉斯決策理論和概率密度函數估計是以數理統計為基礎的[3],這一部分也是模式識別的重點內容。線性判別是以高等數學和線性代數為基礎,同時涉及工程優化方法課程的部分內容。在這部分內容中,公式推導占據了相當大的篇幅,而且推導過程是學生可以理解和掌握的。對于基礎型的內容,可以采取理論推導和實際例子相結合的講授方式。在公式推導的過程中,尤其要強調公式的物理含義,同時給出幾個有趣的例子,在增強記憶加深理解的同時提高學生的學習興趣。
前沿型教學指的是正在發展中的模式識別原理和方法。前沿型內容包括:特征提取和選擇、聚類分析、神經網絡、支撐矢量機、隨機方法等內容。這部分內容或者是數學基礎超出了本科生的能力范圍,或者處于發展前沿,很多內容正處于探討階段。對于前沿型的內容,可以忽略公式推導過程,直接講授推導的結論以及結論的物理含義,同樣結合實際例子加深學生的理解。對于發展中的模式識別方法可以適當介紹該領域的發展前沿,在開拓視野的同時激發學生的科研興趣,引導部分學生從事感興趣的科學領域的研究。
2實例先導的教學方法
模式識別方法是為了解決信息處理中面臨的識別問題而提出的。在講授方法之前,首先要明確將要介紹的模式識別方法的應用背景和使用范圍,而不是像我們通常做的那樣,先介紹方法的理論基礎和流程,最后再給出一個例子,或者通過課后練習和作業的形式讓學生掌握課程介紹的理論和方法的應用。針對本科模式識別課程的特點,我們在教學實踐中摸索出了一套以實例為先導的教學方法,并與上機實驗和課程設計相結合,大大提高了學生的學習興趣和動手能力,取得了良好的教學效果。
實例先導的教學方法是在介紹每一章或者相關的幾章內容之前首先用一個實際的例子引出要學習的內容,在相關內容的學習結束之后給出解決實例問題的模式識別方法。例如:在講授貝葉斯決策理論之前,給出根據長度和光澤度等數值特征識別鮭魚和鱸魚的例子[4];在講授決策樹之前,給出根據顏色,形狀、尺寸等非度量特征識別水果的例子等等。通過學習,找到了解決這類問題的一般方法,同時學生也通過實例記住并理解了該方法的適用范圍。又例如在講授特征的選擇與提取這一章時,先不講特征空間的映射和變換,而是從幾個實例出發,說明并不是特征越多越好,而是要選擇合適的特征向量;特征的組合變換可以使復雜的分類問題轉化為簡單的問題等。從而讓學生更好地理解特征選擇和提取的目的和重要性。
在接觸到實際的模式識別問題時,會引發學生的思考。在授課過程中,教師可以針對具體問題組織學生進行討論,看是否能夠利用已學過的模式識別方法解決該問題。若可以解決,則引導學生分析用已學方法解決該問題時存在的不足,從而引出下面將要介紹的新方法。這樣,在介紹新方法的同時,學生會很自然地將新方法與舊的方法進行比較,分析各種方法的優劣,有利于學生對教學內容的深入理解和掌握。這種方法在講授解決同一類模式識別問題的不同方法時是適用的。如在講授貝葉斯決策時,可以通過對比的方式介紹幾種決策規則的特點,又如在講授線性判別方法中各種形式的感知器算法時,也可以對比學習各種算法的優劣。若該模式識別問題不能用已學的方法解決,則引導學生分析該模式識別問題的特點,思考為何必須引入新的模式識別方法來解決該問題,學生是否能夠提出自己的解決方案。在分析和思考之后,教師再將解決該問題的思路引入到下面將要介紹的新方法上。這種方法在講授解決不同類型的模式識別問題時是適用的。如在講授非度量模式識別方法時,面對非度量語義屬性的模式識別問題是前面介紹的方法無法解決的,要引入非度量模式識別方法加以解決。
因此我們建議在教材的編寫上可以嘗試采用實例先導的方法。首先在引言部分給出一個實際例子,然后在介紹方法的部分結合理論分析給出解決實例問題的方法。這種方法有利于提高學生的學習興趣,增強記憶,加深理解。
3實踐能力和科研興趣的培養
模式識別是一門理論和實踐緊密結合的科學,該學科的發展日新月異,在計算機和信息處理領域的地位越來越重要。因此,在模式識別課程的教學過程中要注重學生實踐能力和科研興趣的培養。在教學實踐中,我們采用了上機實驗和科學報告相結合的教學方式。
掌握各種模式識別方法的原理和流程是本科模式識別教學的第一個階段。在此基礎上,我們要求學生在計算機上實現模式識別方法并用于解決實際的模式識別問題。在上機實現的過程中,學生不僅需要掌握模式識別問題在計算機中的表示方法和識別結果的展示形式,尤其重要的是學生需要對模式識別方法的每一個細節都要深入理解和掌握才能將算法實現。在上機教學中,我們采用了Matlab編程環境實現課程中介紹的模式識別方法。Matlab的編程語言簡單高效,而且提供了功能強大的圖形展示功能[5]。例如在貝葉斯決策和線性分類器的上機實驗中,學生可以利用畫圖函數用不同的顏色和符合標記不同類別的樣本,可以輕松地畫出決策面,這種可視化的分類結果展示形式不僅提高了學生的學習興趣,而且加深了學生對模式識別方法及其特點的理解。
在學生成績考核中,除了筆試成績我們還增設了上機作業成績和科學報告成績兩個部分。上機作業的內容是要求學生從若干個上機題目中選擇有興趣的實現一個簡單的模式識別系統。例如設計實現貝葉斯分類器、線性分類器、神經網絡分類器、決策樹等??茖W報告可以有兩種形式,要求學生或者在模式識別領域的主流英文期刊上選擇感興趣的英文文獻,將其翻譯為中文;或者就模式識別領域的一個感興趣的話題談談自己的看法和主張。通過上機作業和科學報告的形式,學生的動手能力得到了良好的鍛煉。不僅提高了學生的學習熱情,而且引導學生積極思考,不少同學在科學報告中提出了自己的學術看法和主張,有些內容頗具獨到的見解。
在學生成績考核中,除了筆試成績我們還增設了上機作業成績和科學報告成績兩個部分。上機作業的內容是要求學生從若干個上機題目中選擇有興趣的實現一個簡單的模式識別系統。例如設計實現貝葉斯分類器、線性分類器、神經網絡分類器、決策樹等??茖W報告可以有兩種形式,要求學生或者在模式識別領域的主流英文期刊上選擇感興趣的英文文獻,將其翻譯為中文;或者就模式識別領域的一個感興趣的話題談談自己的看法和主張。通過上機作業和科學報告的形式,學生的動手能力得到了良好的鍛煉。不僅提高了學生的學習熱情,而且引導學生積極思考,不少同學在科學報告中提出了自己的學術看法和主張,有些內容頗獨到的見解。
4結語
本科模式識別教學由于學生的數學基礎有限而面臨著兩難的境地。既要把原理和方法講清楚,又不能過多的涉及復雜的數學推導,這給教學帶來很大困難。在教學實踐中,我們把教學內容劃分為基礎型、前沿型兩類,并提出了弱化公式推導,強調公式的物理含義,以及結合實例增強記憶的教學方法。為了提高學生的學習興趣,加深理解,我們提出了實例先導的教學方法。用實際例子引導學生思考,加深學生對模式識別方法應用背景和適用范圍的理解。模式識別是實踐性很強的科學,并且該學科的發展十分迅速。在教學實踐中,我們十分重視學生動手能力和科研興趣的培養。通過上機作業和科學報告的形式引導學生積極動手,積極思考。
參考文獻:
[1] 邊肇祺,張學工. 模式識別[M]. 2版. 北京:清華大學出版社. ,2002:9-303.
[2] 顧波. 模式識別本科教學方法淺談[J]. 中國科教創新導刊.,2010(4):68.
[3] Andrew R. Webb. 統計模式識別[M]. 2版. 王萍,等,譯. 北京:電子工業出版社,2004:1-10.
[4] Richard O. Duda,Peter E. Hart,David G. Stork. 模式分類[M]. 2版. 李宏東,姚天翔,等,譯. 北京:機械工業出版社. ,2003.
[5] 楊淑瑩. 模式識別與智能計算:Matlab技術實現[M]. 北京:電子工業出版社,2008:1-300.
Teaching Practices on Undergraduate Patten Recognition Course andCurriculum Reforming
QI Yu-tao1,2, LIU Fang 1,2, JIAO Li-cheng 2
B(Bond)債券(B)是社會經濟主體為籌集負債資金而向投資人出具的承諾,并按一定利率定期支付利息,到期償還本金的債權債務憑證。如國債等。
C (Costs)成本(C)是企業為生產一定產品而發生的生產經營費用。根據成本總額與產量和銷售量之間的依存關系形成的成本習性將產品成本分為固定成本FC(Fixed Cost)、變動成本VC(Variable Cost)、半變動成本SC(Semi variable Cost)
D (Dividends)股利(D)亦稱股息,它是股東憑股票定期從公司領取的盈利,主要有現金股利CD(Cash Dividends)、股票股利SD(Stock Dividends)、財產股利PD(Property Dividends)三種形式。
E(Earnings Before Interest and Taxes)息稅前盈余(EBIT)是指支付利息和繳納所得稅前的利潤,又稱營業利潤,其計算公式為:EBIT=S-VC-FC或者(Earnings Per Share)每股盈余(EPS)是指普通股每股稅后利潤。
F (Future value)終值(F)是指資金未來的價值。計算公式:F=P(1+i)n. G (Goals of financial management)財務管理的目標又稱理財目標,是指企業進行財務活動所要達到的根本目的,它決定企業財務管理基本方向。主要有以下目標:利潤最大化(Profit Maximization)、每股盈余最大化(Earnings Per Share Maximization)、股東財富最大化(Stockholder Maximization)、企業價值最大化(Company Maximization)。
H(Historic cost Method)歷史成本法就是根據企業的成本數據,按照成本習性的原理,運用數學方法來預測成本變動的趨勢。是統計學中常用的趨勢分析法在財務管理上的具體運用。除此之外,還有比率分析法、因素分析法。
I (Interest)利息(i)是指資金在周轉使用過程中,由于時間因素而形成的絕對差額價值。計息方式有兩種:單利計息(Simple Interest)和復利計息(Compound Interest)。
或者(Invesentment)投資(I)是指投放財力于一定對象,以期望未來獲得收益的經濟行為。某項目原始投資額為I0. J (joint venture)合資企業(企業聯營)指在自愿互利的基礎上,由兩個以上具有法人地位企業,在同一個生產過程或相關的生產過程中組成的經濟聯合體。
K(Cost of Capital)資金成本(通常用K表示)是企業為籌集和使用資金而付出的代價。包括籌集費用和使用費用。
L(leverage)在公司理財中,杠桿(L)是指一個公司運用固定成本性質的資產或資金來擴張利潤的能力。當杠桿作用程度愈大時,公司利潤愈不穩定,風險越大。杠桿分二種:經營杠桿與財務杠桿;相應的風險有經營風險與財務風險。我們通過計算杠桿系數來衡量企業二種風險的強弱。在財務管理教學中,要分別計算財務杠桿系數DFL(Degree of Financial Leverage),經營杠桿系數DOL(Degree of Operating Leverage),復合杠桿系數DTL(Degree of Total Leverage)。
M(merger)兼并又稱合并,指兩家公司以上的公司組合成一家公司,原公司的權力與義務由存續(或)新設的公司承擔。與之相對應的是收購(acquisition),又稱收買,指并購公司購買目標公司的資產、營業部門或股票。二者合起簡稱并購(M&A)。
N (net present value)凈現值(NPV)是指投資項目投入使用后的凈現金流量(NCF),按資本成本(K)或企業要求達到的報酬率折算為現值,減去初始投資后的余額(I0)。
O(Owners Equity)所有者權益(O)是企業投資者對企業凈資產的所有權,包括投資者對企業的投入資本、企業存續過程中形成的資本公積、盈余公積、未分配利潤。另外還有資產A(Assets)、負債D(Debt)。
P(Present Value)現值(P)就是以后年份收到或付出資金的現在價值。計算公式:P=F(1+i)-n. PI現值指數亦稱獲利能力指數,是指項目未來投資收益現值與初始投資額的現值的比值?,F值指數法決策規則:根據PI>1,判斷該投資項目可行;PI〈1,該投資項目不可行;PI=1,投資不獲利。
Q(Economic Order Quantity)經濟批量(EOQ)是指能夠使一定時期存貨的總成本達到最低點的進貨數量。計算公式:
R(Internal Rate of Return)內部報酬率(IRR,簡稱r)又稱內含報酬率,是使投資項目的凈現值等于零的貼現率。實際上反映了投資項目的真實報酬率。
S (Stocks)股票是股份公司為籌集自由資金而發行的有價證券,是持股人擁有公司股份的入股憑證,它代表持股人在公司中擁有的所有權。按股東權利和義務分為普通股(Common Stock)和優先股(Preferred Stock)。
T(Taxes)企業所得稅(T)是對除外商投資企業以外的所有在我國境內注冊、登記的,實行獨立核算的企業或組織運用的稅種。其所得額為納稅年度的收入總額減去準予扣除項目后的余額,其稅率統一以33%計征,對應納所得款在60萬元以下的,還規定了相應的優惠稅率。
U(Units of Production)產量折舊法是將折舊總額按固定資產使用期完成的總產量或總工作量計算分攤到各期成本和費用的一種方法,是折舊計算的最基本方法。除此之外,還有雙倍余額遞減法、年數總和法。
V(Value)股票的價值(V)指預期的未來現金流入的現值。為了與股票的市價區分,有時也稱股票的內在價值,它是股票的真實價值,也叫理論價值。
W(Weighted average)加權平均是一種統計計算方法,在財務管理中經常運用。如加權平均資金成本WACC(Weighted average Cost of Capital)。
中圖分類號: TN919?34; TP391.41 文獻標識碼: A 文章編號: 1004?373X(2015)06?0101?04
New and old banknotes′ classification based on transmission images
QI Lei, REN Ming?wu
(School of Computer Science and Engineering, Nanjing University of Science and Technology, Nanjing 210094, China)
Abstract: Classification of new or old banknotes is a important function in the banknote sorter. The transmission image is adopted in this paper to detect new or old banknotes. It is different from the traditional new or old banknote detection based on reflection images. According to the new or old degree of banknotes, all banknote samples are divided into three grades. The new or old banknote detection method based on gray level image brightness and pattern recognition method are used respectively. The histogram distribute of transmission image is used as feature of new or old banknotes. The KNN and SVM classifier are employed to carry out classification. A new cascade classifier which combines SVM and KNN is put forward. Test proves the new cascade classifier is more effective than SVM and KNN in detection of new or old banknotes.
Keywords: transmission image; pattern recognition; SVM; cascade classifier
0 引 言
紙幣清分機是一種集光機電磁于一體的高端金融現金處理設備,其主要功能是對紙幣進行面值、面向、新舊程度及紙幣序列號的識別。紙幣清分機挑選適合在市場中流通的紙幣、高效地代替了人工選擇可流通紙幣的工作。當紙幣流通時間過長時,表面會出現粗糙、模糊、磨損等現象。過舊的紙幣影響了紙幣的真偽鑒別、冠字號識別等,導致貨幣在市場中的流通帶來了不便。根據中國人民銀行的《不宜流通人民幣挑剔標準》,過舊的紙幣不宜流通,因此紙幣清分機中需要具有檢測紙幣新舊的功能來滿足這樣的需求。
早期國外曾根據紙幣在清分機中與傳送帶的摩擦聲音來判別新舊[1],但該技術已被數字圖像技術[2]所代替。目前,國內紙幣清分機產品多采用基于數字圖像技術做相關研究[3]。紙幣新舊識別成為紙幣清分算法的核心和難點,而且新舊等級分的越多,難度越大。目前國內外現有的紙幣新舊檢測方法有基于紙幣反光強度的新舊判別[4?5],基于多光譜彩色圖像的新舊判別[2],基于標準圖像進行灰度直方圖匹配來判斷紙幣新舊[6] 等。目前,對于紙幣的新舊檢測大多基于反射圖像的亮度。近年來也出現了將紙幣的新舊檢測轉換為模式識別的問題,首先提取紙幣圖像上的有效特征,然后使用分類器來進行新舊識別[7?8]。
本文將紙幣的新舊程度劃分為3個等級,使用紙幣的透射圖像對紙幣進行新舊判斷,分別采用了紙幣透射圖像平均亮度劃分圖像等級和傳統的模式識別的方法,提取了紙幣透射圖像的灰度直方圖分布作為紙幣新舊檢測特征,并分別采用了KNN(k近鄰),SVN(Support Vector Machine支持向量機)分類器,并提出了一種簡單的級聯分類器。
1 圖像數據說明
本文通過人工劃分的方式將100元人民幣劃分為新舊程度不同的3個等級,并且對于新舊程度不同的紙幣分別收集了170張,其中100張作為訓練樣本,70張作為測試樣本。將所有收集得到的紙幣采用圖像傳感器進行雙面采樣,獲得兩張圖像,白背景圖像中的奇偶行分別對應紙幣的透射圖像和反射圖像,黑背景圖像中的奇偶行分別對應圖像的反射圖像和彩色圖像如圖1所示。本文只使用了紙幣的透射圖像,只需要將白色背景的圖像提取出來,無需判斷紙幣圖像的正反面。本文采集到的所有紙幣透射圖像都已確定4個角的坐標位置。
<E:\王芳\現代電子技術201506\現代電子技術15年38卷第6期\Image\14T1.tif>
圖1 原始采樣數據分割
2 基于圖像亮度的紙幣新舊檢測
目前,針對于紙幣的新舊檢測提出的大多數方法都與紙幣的亮度有關,因為新舊紙幣在圖像采集的時候反光的強弱不同,所得圖像的明暗有差異,因此可以根據紙幣圖像的亮度判定紙幣的新舊等級。常用的方法有使用紙幣空白區域的平均亮度,紙幣反射圖像某固定區域的平均灰度值。使用反射圖像進行新舊檢測時,必須先確定紙幣圖像的面向,還要定位到紙幣的固定的區域。對于紙幣透射圖像,無論采集到的圖像是紙幣的正面或反面,所得的透射圖像都一樣,所以采用紙幣的透射圖像就不需要檢測紙幣的面向。采用圖像的部分區域進行檢測時,當此區域存在涂污時,對紙幣的新舊檢測結果產生影響。本文采用完整的紙幣透射圖像亮度的平均值檢測紙幣的新舊,具有更好的魯棒性。
在所有訓練樣本和測試樣本中,已經準確標記了紙幣的4個頂點的坐標。這樣就可以得到紙幣邊緣具置,可以利用行掃描,來統計每張紙幣的所有點的灰度值的和,然后求得其平均值,根據平均值與自己設定的標準進行比較就可以得到紙幣的新舊等級。但由于紙幣在流通的過程中會出現磨損,完整的紙幣圖像經常存在一些噪聲,例如對于過舊的紙幣中往往存在細小的孔洞區域和圖像邊緣檢測并非很精確(會殘留一些白色背景區域),這就導致了所統計的透射圖像的像素點中存在白色的噪聲區域如圖2所示,因此首先統計紙幣透射圖像的灰色直方圖,然后將根據紙幣圖像的直方圖去除亮度前%α的點和后%α的點,最后計算所有剩余像素點的平均灰度值。
<E:\王芳\現代電子技術201506\現代電子技術15年38卷第6期\Image\14T2.tif>
圖2 原始圖像
基于紙幣透射圖像平均亮度檢測新舊,具體步驟如下:
(1) 統計訓練樣本中新舊程度最新的樣本(本文為等級1)紙幣透射圖像的灰度直方圖,并去除最亮的前%α和最暗的前%α,計算每張紙幣的平均亮度,最后計算所有樣本平均亮度設為[vmax]。同理計算得到訓練樣本中新舊程度最舊樣本(本文為等級3)的平均亮度設為[vmin]。
(2) 統計待檢測的樣本的灰度平均值,方法同(1),得到紙幣透射圖像的亮度為[v]。
step3判定新舊等級,根據以下公式:
[d=v-vminvmax-vmin 等級1, d>t1等級3, d<t2等級2, 其他]
式中[t1]、[t2]根據多次實驗獲得的閾值。
3 基于模式識別方法的紙幣新舊檢測
紙幣的新舊檢測除了采用圖像的整體平均亮度值,近年來也出現了將紙幣的新舊檢測轉換為模式識別的問題,例如文獻[9]基于BP?LVQ神經網絡的紙幣新舊識別算法研究,首先提取紙幣圖像的新舊特征,然后將特征送給分類器識別,得到識別結果,具體過程如圖3所示。
3.1 特征提取
紙幣圖像的新舊特征一般采用灰度直方圖的分布統計,新舊紙幣的差異不僅反映在紙幣灰度圖像的平均值上,在灰度直方圖的分布中也有所差異。越新的紙幣圖像灰度直方圖波峰靠后,越舊的紙幣圖像直方圖波峰靠前。對于紙幣透射圖像也存在同樣的表現如圖4所示,分別為新舊等級一、二、三紙幣透射圖像直方圖統計分布。統計每張紙幣透射圖像的直方圖,得到256維的特征向量。所得到的特征向量中與基于亮度檢測新舊具有同樣的問題,圖像中的最亮和最暗區域存在一定的噪聲,使用上述相同的方法去除亮度前%α的點和后%α的點后統計直方圖,得到256維紙幣新舊特征,并歸一化特征向量。
<E:\王芳\現代電子技術201506\現代電子技術15年38卷第6期\Image\14T3.tif>
圖3 模式識別方法的流程
<E:\王芳\現代電子技術201506\現代電子技術15年38卷第6期\Image\14T4.tif>
圖4 不同新舊程度的直方圖
3.2 KNN
K近鄰法(K?nearest neighbor,KNN)是由Cover和Hart在1968年提出的[10],它是最近鄰法的推廣形式,其主要的決策方法也是類似的,當k=1時就是最近鄰法。K?近鄰法是通過找到與待識別樣本點最近的k個樣本點,根據這k個訓練樣本的類別,通過多數表決等方式進行預測。因此k近鄰法不具有顯示的學習過程。k近鄰法實際上利用訓練數據集對特征向量空間進行劃分,并作其分類的“模型”[11],K近鄰法中的距離度量一般選用歐式距離。
假設訓練樣本一共有[N]個,并且分為[n]個類別分別為[w1,w2,…,wn],待識別樣本為[x],在[N]個樣本中找出與[x]最近[k]個樣本,假設這[k]個樣本中來自[w1]類的有[k1]個,來自[w2]類的有[k2]個,以此類推,來自[wn]類的有[kn]個,其中[k=i=1nki],定義判別函數:
[gi(x)=ki, i=1,2,…,n]
判別決策規則:如果
[gj(x)=arg maxi ki , i=1,2,…,n]
則待識別樣本[x∈wj]。
3.3 支持向量機
支持向量機(Support Vector Machine,SVM)是Cortes和Vapnik于1995年首先提出的[12],支持向量機就是能夠找出超平面并把空間中的樣本進行分類的問題,使其間隔最大化。該方法是基于結構風險最小化原理找到最優決策超平面從而實現分類。假設有訓練樣本集
[T={(x1,y1),(x2,y2),…,(xN,yN)},xi∈RN,yi∈{-1,+1}]
式中:[xi]為第i個特征向量,[yi]為[xi]的類標記,當[yi=+1]時,[xi]為正實例,當[yi=-1]時,[xi]為負實例,[(xi,yi)]稱為樣本點。假定訓練樣本集是線性可分的,學習的目標是找到最佳決策超平面,能將實例分為不同的兩類。分離超平面方程為:
[w?x+b=0]
分類超平面將特征空間劃分為兩部分,一部分是負類,一部分是正類,法向量[w]垂直于超平面并指向正類部分。
一般情況下,當可知訓練樣本可以線性分開的時候,則幾何空間中存在了無窮多個分類超平面可以將訓練樣本分開。但是支持向量機利兩個平行向量之間距離最大化求得了最優的分類超平面,這時的解是惟一的,圖5為樣本在線性可分情況下的支持向量示意圖。
<E:\王芳\現代電子技術201506\現代電子技術15年38卷第6期\Image\14T5.tif>
圖5 SVM線性可分
從圖5可以看出,相同的樣本訓練機可以有不同的劃分,(b)圖代表著線性可分支持向量機,其中虛線代表最優的分類超平面,與分類超平面最近的樣本點稱為支持向量。從圖5中可以看出,此時兩條實線之間的間隔最大。對于線性不可分的樣本,可引入松弛變量加以解決。對于SVM分類器進行訓練就是求解[w]和[b]的過程,具體過程參考文獻[13]。
有時分類問題不是線性可分的,這時就不能用線性可分支持向量機來解決問題,如圖6所示。
<E:\王芳\現代電子技術201506\現代電子技術15年38卷第6期\Image\14T6.tif>
圖6 SVM線性不可分
非線性問題的實質就是把能夠將其轉化成線性問題。所用的方法,就是構造一個非線性變換,將樣本點的特征從一個低維線性不可分空間映射到一個高維線性可分空間。這里,就引入了核函數的概念。
設[χ]是輸入空間,H為特征空間,如果存在一個[χ]到H的映射[φ(x):χH]對所有的[x,z∈χ]都成立,函數[K(x,z)]滿足條件
[K(x,z)=φ(x)?φ(z)]
則稱[K(x,z)]為核函數,[φ(x)]為映射函數,[φ(x)?φ(z)]為[φ(x)]和[φ(z)]的內積。
若直接將輸入數據映射到高維空間可能出現維度爆炸現象,可采用核函數在低維空間進行計算,不需要顯示的寫出映射后的結果,其處理后的結果與高維映射等效。
3.4 級聯分類器
為得到更高的紙幣新舊檢測的準確率,本文設計了一種級聯分類器SVM?KNN來判定紙幣新舊等級如圖7所示,第一級分類器采用SVM,第二級分類器采用KNN,首先使用訓練樣本對SVM分類器進行訓練,得到SVN分類器的模型參數。
當對待檢測樣本[x]進行分類時,先經過SVM分類器進行分類,獲得分類概率最大的兩類分別為[w1],[w2],概率分別為[p1]、[p1],當[p1-p2<T](其中[T]為設定閾值)進入下一級分類器KNN,分類得到分類結果,否則直接在本級分類器中分類,分類結果為[w1],[w2]中可能性最大的一類。
<E:\王芳\現代電子技術201506\現代電子技術15年38卷第6期\Image\14T7.tif>
圖7 級聯分類器
4 實驗結果與分析
本文將紙幣新舊程度人工劃分成三個等級,一共有300張紙幣透射圖像用于訓練,210張紙幣透射圖像用于測試。其中每個等級紙幣透射圖像分別有100張訓練樣本和70張測試樣本,本文分別實驗了基于透射圖像亮度的新舊判別和傳統的模式識別方法,本文采用紙幣透射圖像灰度直方圖的分布作為新舊判別的特征,使用了KNN,SVM,和級聯分類器分別實驗?;谕干鋱D像亮度檢測紙幣新舊時參數α,[t1],[t2]分別設為5,0.65,0.2。SVM分類器使用了臺灣大學LIBSVM[14],并選用RBF核,閾值[T]設為0.2。實驗具體結果如表1所示。
表1 實驗結果
實驗結果表明在檢測紙幣的新舊等級實驗中使用模式識別的方法明顯優于使用圖像亮度特征的方法,將SVM分類器和KNN線性級聯使用的效果要優于它們單獨使用,由于人工選擇紙幣新舊程度還存在一定偏差,在一定程度上也影響了新舊檢測的整體結果。經試驗分析誤識別結果一般為相鄰的兩類新舊等級之間。
5 結 語
與傳統使用紙幣反射圖像檢測新舊等級不同,本文使用了紙幣的透射圖像對紙幣的新舊等級進行檢測,分別采用了基于圖像整體平均亮度的方法和傳統的模式識別方法,選用紙幣透射圖像灰度直方圖的分布作為紙幣新舊判別特征,分別使用了KNN,SVM和SVM?KNN線性級聯的分類器。由于人工劃分紙幣新舊等級存在一定的誤差,對于具體的新舊等級判別的界定比較模糊,如何解決這些問題并提高分類等級的準確性是本文后續研究的重點。
參考文獻
[1] TERANISHI M, OMATU S, KOSAKA T. Neuro?classification of currency fatigue levels based on acoustic cepstrum patterns [J]. JACIII, 2000, 4(1): 18?23.
[2] 李朝.紙幣清分機圖像處理系統研究[D]. 湘潭:湘潭大學,2012.
[3] 譚家國.紙幣圖像高速采集系統設計[D].鞍山:遼寧科技大學,2012.
[4] 魏巍.CF1000型紙幣清分機圖像識別系統的設計與實現[D].哈爾濱:哈爾濱工業大學,2011.
[5] 郭玉佳.紙幣圖像處理技術研究[D].哈爾濱:哈爾濱工業大學,2009.
[6] 許萬征.紙幣多光譜圖像分析方法[D].哈爾濱:哈爾濱工業大學,2010.
[7] 李慶峰.基于圖像處理的紙幣清分系統關鍵算法研究[D].北京:中國科學院,2006.
[8] 魏軍.紙幣動態檢測識別算法研究[D].哈爾濱:哈爾濱理工大學,2009.
[9] 王洪,陳麗,肖思寧.基于BP?LVQ神經網絡的紙幣識別算法研究[J].光學與光電技術,2010,8(4):64?67.
[10] COVER T, HART P. Nearest neighbor pattern classification [J]. IEEE Transactions on Information Theory, 1967, 13(1): 21?27.
[11] 李航.統計學習方法[M].北京:清華大學出版社,2012.
分類號 B849:C93
網上購物是個人通過Internet購買商品或享受服務。購物者可以瀏覽網上商品目錄,比較、選擇滿意的商品或服務,通過Internet下訂單,網上付款或離線付款,賣方處理訂單,網上送貨或離線送貨,完成整個網上購物的過程。1998年以來,我國網上購物飛速發展,表現為電子商務網站的增多和上網人數的增長[1]。易觀國際《互聯網研究系列報告-電子商務(2004)》顯示,2004年中國電子交易總額達4,400億人民幣,而2005年預計將激增至6,200億人民幣。相對于傳統的購物形式來說,網上購物有七大優勢[2],如購物時間隨意安排,缺貨情況很少出現,信息充足,搜尋方便,價格相對更低等。按照決策之前進行調查分析的程度,網上購物消費者一般可分為沖動型、耐心型和分析型三種,按他們之前進行計劃的詳細性,網上購物行為一般劃分為專門計劃型、一般計劃型、提醒型和完全無計劃型[3]。其中,前兩種類型的區別在于消費者是否已經選擇好了制造商。
網上購物滿足了在線購物者的特定需求,但仍存在著許多問題。一個對用戶為什么不打算進行網上購物的調查發現[4],對產品質量不了解占34.6%,認為售后服務與廠商信用得不到保障的占33.5%,還有30.3%的人認為網上購物不安全??梢姡瑸榇龠M網上購物的發展,有必要從消費者的購物行為與網上信息行為角度作深度分析,以期加強網上購物對消費者的影響,并尋求可能的改進策略。
學術界對于消費者購物決策的研究,大多關注在傳統的購物方式的決策模型,對網上購物決策模型研究較少且零散,也較少關注兩者發展過程中的連續性和共存性?;谶@一點,筆者在介紹兩種不同的購物方式的消費者決策模型的同時,提出了綜合性的消費者購物決策模型,并認為,網上搜尋、網下購買的消費者決策過程并不是消費者從傳統購物方式到網上購物的過渡階段,而是像這兩種購物方式所涉及的決策過程一樣,是一個獨立的決策類型。
1 傳統的消費者決策模型
消費者的購買活動表面上是為了直接獲得商品,實際上是為了從商品中獲得某些滿足。因此,經濟學家將作為決策論、對策論和數理經濟學的基礎之一的效用理論(Utility Theory)應用于消費理論研究,認為消費者消費商品的數量和其獲得的效用有密切關系[5]。但是,效用理論并沒有提出消費者決策模型,只是傳達了一種思想:首先是“經濟人”假設,即假定市場中的消費者都是理性決策者。假定消費者是在一系列約束條件下(如收入等)追求效用最大化的個體,而且被假定為是合乎理性的。消費者知道自己的需要,也知道滿足需要的方法。因此,根據邊際效用遞減原理,消費者作出決策,如信息搜索、選擇性評價等,都期望達到總效用的最大化。在“經濟人”前提假設下,消費者的消費行為中也包含著大量的個人和情境變量。很多研究者從理論上提出了一些簡單的消費者購物決策模型,來解釋消費者的行為。其中,最主要的模型有三個:Nicosia模型,Howard-Sheth模型和EBM模型[6]。后來的一些研究者致力于用數學模型來研究消費者的行為,力圖在嚴格的假定下對消費者的行為做出精確度解釋和預測[7,8]。這里,只介紹3個經典的消費者決策模型。
1.1 Nicosia模型
Francesco和Nicosia(1978)提出此模式,認為消費者行為源于廠商特性與消費者特性,并把消費者的購物決策看成是一個四階段的決策過程:(1)根據廠商透露的信息形成態度;(2)信息收集與方案評估;消費者主動收集與產品有關信息作為評估標準并產生購買動機。(3)購買行動;消費者將動機轉化為實際行動,并受產品評估準則的影響。(4)信息反饋。消費者使用過產品后的印象與經驗會影響再購買行為。同時廠商根據消費者的反應,亦獲得信息反饋并調整行銷組合。
1.2 Howard-Sheth模型
Howard-Sheth(1969)首先將滿意度概念應用于消費理論上,說明一段時間內消費者對于品牌的選擇行為,其重點在于解釋是否會重復購買某一品牌的產品。該模型把顧客滿意度界定為購買者認為其購買某一產品的付出(如時間、金錢等)與其回報是否適當的一種認知狀態,這種認知狀態決定了顧客是否重復購買。因此,顧客對產品的認知過程影響了其決策,消費者決策過程事實上就是一個認知的過程,在這個意義上,Howard-Sheth模型是一個認知模型。
1.3 EBM模型
EBM模型是對EKB模型的發展。它嘗試從理論上去解釋消費者的購物決策過程,具有對不同情境的概括性和適用性,并與消費者具體的決策行為相一致。它還考慮到一些購物決策階段,如記憶、信息采集、考慮購物的后果等。當消費者的實際狀態和期望狀態不平衡時,就有了需求認知,當意識到自己的需求時,就開始搜索信息,以滿足需求。消費者根據自己頭腦中儲存的信息和從外部獲得的信息,得出自己的標準,去評價和比較可能的選擇,產生一批偏好的選擇,并從中最后確定要購買的物品,產生購買行為。購買后評價有助于制定以后的購買決策:當需要購買相似的產品時,好的經驗將提供信息,從而導致消費者購買該品牌的產品,而不滿意則會導致消費者產生購買后的心理失調。
EBM模型是一種解釋性的模型,它假定消費者都是理性的,而且考慮了購買后的效果是否與預期相一致,對預測很有用,因此,它幾乎可以用來解釋任何情境中的大量的研究結果。
1.4 三個模型對于理解網上購物決策過程的可能意義
Nicosia模型著重強調消費者與廠商之間信息交流的過程,它貫穿于消費者購買決策過程的始終,與Howard-Sheth模型相比,它更強調的是信息交流的過程是雙向的,而不僅僅是消費者單向的認知,也就是說,在消費者購物決策過程中,廠商也可以扮演主動的角色,根據消費者的信息反饋去相應的調節營銷組合,從而影響消費者的認知過程,并進一步改變消費者的行為。雖然是一個傳統的消費者決策模型,Nicosia模型對信息交流的重視也為廠家重視網上購物平臺的建構提供了理論基礎,通過這個平臺,可以使完全無計劃購物和提醒購物的消費者也能順利的作出網上購物的決策。
Howard-Sheth模型可以看作是一個認知模型,強調顧客滿意度對消費者決策過程的影響。消費者通過對付出與所得之間的對比,形成滿意或者不滿意的感覺,進而決定消費者的購物行為。而EBM模型是一個典型的問題解決模型,它把消費者的購物決策看成一個問題解決的過程。一般的問題解決模型由四個階段組成:對問題的認知、信息的尋求與評價、購買活動、購買后的反應。顯然,EBM模型只是將信息的尋求與評價這個階段分成了兩個具體的過程。因此,如果把信息的尋求這個階段的媒介具體化到網絡這個虛擬的平臺上,EBM模型就是一個簡單適用的網上消費者購物決策模型。
可見,無論是Howard-Sheth模型,還是EBM模型,都強調了消費者的認知過程,而網上消費者僅僅是通過網上商城的電子商務界面所提供的商品信息來了解商品,這種單一的視覺認知過程也提醒廠商對建構網上購物平臺的關注和重視,一方面要提供貨真價實的產品,尤其是和網上商城界面上所提供的商品圖片及相關信息相符的產品,另一方面,需要重視通過每一次的接受訂單、配送商品、售后服務的流程,使消費者感到滿意,從而提高商城的信譽。
2 網上消費者購物決策模型
傳統購物模型雖然對于研究消費者的網上購物行為具有指導作用,但是,消費者網上購物決策行為仍然具有自己的特點。研究發現,中國的網上消費者,一般都是高學歷、高收入、年齡較輕、以及喜歡新事物的[9]。一份2000年對從事計算機及相關行業的“圈內人”的調查結果表明[4],網上購物的優勢并不被“圈內人”熟悉或認可,大多數人進行網上購物并不是為了享受方便和快捷,而只是好奇或者為了跟上潮流,因此,他們的消費金額很低。還有不少消費者選擇了網上搜尋信息,網下購買的消費方式。目前,隨著家用電腦的普及,是否會有越來越多的人因為體會到網上購物所固有的方便、快捷、價格便宜、個性化等優勢而選擇這種消費方式?而傳統的注重眼見為實的購物習慣等網上購物固有的劣勢,以及曾經擔心的安全、配送、質量保證和售后服務等問題,是否仍影響著消費者的購物決策過程?消費者網上購物決策有哪些特色?已有學者在這方面進行研究并取得了一些研究結果。
2.1 兩階段模型
與傳統的購物決策過程不同,網上購物消費者在購物決策過程中,所面臨的是虛擬的、交互式的購物環境,在這樣的環境中,消費者很難去深入評價所有可能的選擇,因此,Häubl和Trifts提出了兩階段理論[10],認為網上消費者通過兩個階段的過程來作出他們的決定:第一階段,消費者瀏覽大量有用的商品,并從中找出一些最有希望的選擇;第二階段,更深入的評價這些選擇,在一些重要品質上在一些產品之間進行對比,并作出購買決策。因此,網上商店所提供的交互式的購物工具在不同的階段作用不同:在第一階段,最初對可用的產品的搜索是為了決定哪些產品值得進一步考慮,因此,交互式的購物工具被稱為RA(recommendation agent,推薦),它使消費者在網上購物環境中能夠更有效的看到大量可用的產品信息,按照消費者自身的效用評價標準,給予不同的產品不同的權重和最小的可接受的品質水平。從而使消費者產生了一個個人購物的可選擇清單;在第二階段,對已選擇出的商品進行深入對比,從而作出購買決策。因此,這一階段的決策工具被稱為CM(comparison matrix,對比矩陣),它幫助消費者在已選擇的產品中進行深入的對比,允許消費者組織產品和屬性的信息,并在產品×屬性的矩陣中得到按照屬性分類的一些選擇。
2.2 信任導向觀點和頁面導向觀點
根據行為歸因理論并將其應用到消費者網上購物行為領域,Jarvenpaa, Tractinsky, Vitale(2000)認為,消費者是否選擇網上購買主要有兩個原因:對網上購物的態度和對該網站知覺到的風險,并提出,消費者的風險認知決定了消費者的態度和意圖。但是,必須指出,這兒的風險認知是對特定網站的認知,而不是對網上購物本身的認知,為了彌補這個缺陷,持信任導向觀點的人提出,消費者對公司的信任決定了他們的態度和認知風險,信任度越高,態度越好,知覺到的風險也越低。而消費者對公司的信任由他們知覺到的公司大小和聲譽等因素決定,公司越大、信譽度越高,消費者對公司就越信任。而Chau, Au,Tam根據技術認可模型(Technology Acceptance Model, TAM)來解釋信息呈現和網上購物意圖之間的聯系,提出頁面導向的觀點,他們關注的是電子商務網站中的信息呈現,他們認為,電子商務網站的信息呈現越有效,越容易使用(如速度、使用方便等),消費者對該網站的評價就越高,從而更易產生購物意圖[11]。
2.3 態度和行為研究模型
不論是傳統的購物決策模型,還是兩階段模型,都離不開四階段的固有模式,離不開總效用最大化的理論基礎。后來的研究者著力于對消費者決策過程中一些具體影響因素的研究,試圖對這個模式進行橫向或者縱向的具體化。Bellman,Lohse和Johnson(1999)調查了人口統計學特征、人格與網上購物態度之間的關系[12],發現生活方式拘束、時間安排不自由的人更有可能經常使用網上購物。Bhatnagar,Misra和Rao(2000)調查了人口統計學因素,賣方/服務/產品特征和網頁的質量如何影響消費者的網上購物態度以及他們相應的網上購物行為[13],發現Internet所提供的方便性與態度這個因變量正相關,消費者所認識到的風險分別與行為這個因變量負相關。Jarvenpaa,Tractinsky和 Vitale(2000)調查了消費者所認識到的商店的大小和名聲是如何影響他們對商店的信任、感受到風險、態度和想要專門在這家商店買東西的意愿的[14],發現消費者對商店的信任與商店的名聲和大小有正相關。高的信任感也減少了網上購物所感受到的風險并更樂意專門在這家商店買東西。
Li Na和Zhang Ping總結了這些消費者決策的影響因素及其如何影響的研究,提出了消費者網上購物態度和行為的研究模型,著重于態度和行為及其影響因素,如外部環境、人口統計變量、人格特征、賣方/服務/產品特征、網頁質量等[15],著力于澄清這些因素和消費者最后的決策之間的關系。
2.4 與傳統購物決策模型的比較
從縱向看,傳統的購物決策模型也可以容納網上購物過程,但是,兩階段模型更強調了信息搜尋及評估的過程,而態度和行為研究模型在分析決策過程中的影響因素時,體現了網上購物的特色,信任導向觀點和頁面導向觀點更是致力于從網上購物所固有的對電子商務網站的信任和頁面特點出發,來研究消費者決策??梢姡瑹o論是傳統的購物方式,還是網上購物,消費者的決策過程都是大同小異的。但是,由于網上購物環境獨特而又功能強大的搜索引擎,個性化的服務方式,使得網上購物消費者有了更多的信息搜尋和評價的機會,增強了網絡用戶選擇商家的能力,也就更可能得到總效用最大化的結果。另一方面,由于網上購物固有的劣勢,如不符合人們的消費習慣、網絡安全問題等,習慣傳統購物的消費者在排斥網上購物的同時,可能并不排斥網上搜尋相關商品信息,因此,網上搜尋信息、網下購買的新的購物模式與傳統購物模式相比,只有信息搜尋這一階段不同,與網上購物模式相比,只有購買這一階段不同,可以說是介于傳統購物模式和網上購物模式之間的一個妥協型的嘗試。
因此,與傳統的問題解決模型相比,網上消費者購物決策模型除了吸收上述傳統購物模型的優勢外,更注重網絡這個虛擬環境,網上消費者的特點和網上購物信息搜索的獨特工具,從而在與傳統模型相兼容的同時,也與一般的消費者購物決策模型相區別。
3 綜合的消費者購物決策模型
基于以上比較,筆者以問題解決模型為基礎,結合網上消費者的特點,試著提出了整合傳統購物、網上搜尋信息網下購物、網上購物三種購物方式的消費者購物決策模型,見圖2。
受Nicosia模型和Howard-Sheth模型的啟發,綜合模型增加了影響個體對于問題的認知以及信息的尋找以及備擇物的評價過程的原因因素(外界刺激輸入)和個體因素(經驗、動機、個性、態度等)。例如,情景因素或者廠商的營銷努力可以使完全無計劃購物的消費者有了解決問題的動機,從而產生提醒購物的行為,而消費者是否有解決問題的動機還取決于兩個因素:一是期望狀態與實際狀態之間差異的大小,二是該問題的重要性。另一方面,消費者對于網上購物的態度又決定了他是否選擇網上搜尋信息,進而深入到具體的兩階段的信息搜尋與評價的過程。
在信息搜尋與評價的具體決策過程,本模型整合了傳統搜尋與評價和網上信息搜尋和評價兩種決策方式,這兒所涉及的估價,不僅僅是對商品或者商家的估價,也包括對選擇何種購物方式的估價,因此,具體的購買過程,也分為傳統購買與網上購買兩種購買方式。相應的,消費者購買后的評價也不僅僅包括傳統的對商品或者服務的評價,還包括對消費者自己所選擇的購物方式的評價,這種反饋性的評價信息不僅可以影響消費者今后對商家的選擇,而且也影響了消費者今后對購物方式的選擇。
總的來說,這個綜合的模型的優勢在于,將購買方式的選擇也納入消費者決策需要考慮的范圍中,從而適用于傳統與網絡兩種不同的購物方式,以及介于兩者之間的網上搜索信息、網下購買方式,彌補了傳統和網上購物決策模型在考慮決策時,購物方式單一的不足。但是,這個模型也存在缺陷:消費者對于購物方式的選擇也可以發生在信息搜索階段之前,而且,對于消費者的重復購買行為來說,并不需要花費許多認知努力。所以,這個模型主要適用于有限型(以購買介入程度適中,信息搜集有限,決策規則簡單,備選方案少,購后評價少為主要特征)和擴展型(以購買介入程度高,大量的信息搜集,多種備選方案,全面的購后評價為主要特征)消費者決策行為[16]。
4網上購物消費者決策過程研究的發展趨勢
綜合的購物決策模型涵蓋了傳統和網上兩種購物方式,考慮了網上搜尋信息、網下購買這種新的購物決策類型,能夠綜合的考慮各個影響因素的作用,建議未來的研究者在研究網上消費者的購物行為時,可以以此為依據,并著重于以下幾個方向:
(1)信息搜索和評價行為的定量研究 根據兩階段決策模型,可以研究RA和CM對消費者信息搜尋數量、考慮的商品系列和決策質量的影響,并與傳統的購物模式進行對比,從而幫助消費者作出更有利于達到總效用最大化的決策。
(2)消費者放棄因素研究 可以針對某一個大型網上商城,研究有過在該商城搜尋信息的行為,但最終沒有下訂單達成交易的消費者放棄在該商城購物的原因。從而對該商城的BtoC電子商務平臺的購物環境作出技術上的改善,或者對該商城的營銷策略進行改進。也可以針對那些網上搜尋信息,網下購買商品的習慣傳統購物方式的消費者,研究與之放棄行為相關的影響因素。
總之,伴隨著全球化時代下電子商務的發展,消費者的購物方式也更加多樣和復雜,因而消費者的購物決策模型也就需要考慮諸多方面的因素。傳統的購物決策模型是這些模型的核心和靈魂,以后提出的諸多模型,則是傳統模型的發展和具體化,可見,現代的購物方式,仍然離不開傳統的購物決策的步驟,廣大消費者在這個過程中的變與不變,正是后續的研究者努力的方向。
參考文獻
[1] 李大立,孫婷,李正良. 電子商務消費者不滿意因素分析.湘潭工學院學報(社會科學版),2002,4(4):36~41
[2] 熊德勇. 網上購物的思考. 商業研究,2001,(12):178~179
[3] 劉立. 信息技術條件下的消費者行為特征. 情報學報,2002,21(2):237~241
[4] 張巖. 網上購物距離我們有多遠. 服務,2000,(5):188~193
[5] 馬謀超,陸躍祥. 廣告與消費心理學. 人民教育出版社,2000. 135~156
[6] Thompson S H, Yeong Y D. Assessing the consumer decision process in the digital marketplace. The International Journal of Management Science, 2003, 31(5): 349~363
[7] Merelo J J, Prieto A, Rivas V, et al. A neural net-based model for decision making in marketing. Accounting Management and Information Technologies, 1998, 8(4): 237~253
[8] Namwoon K, Rajendra K, Srivastava, et al. Consumer decision-making in a multi-generational choice set context. Journal of Business Research , 2001, 53(3): 123~136
[9] 丁娟. 冷觀網上消費. 經濟師,2000,(9): 49
[10] Haubl G, Trifts V. Consumer Decision Making in Online Shopping Environments: The Effects of Interactive Decision Aids. Marketing Science, 2000, 19(1): 4~21
[11] Heijden H V, Verhagen T, Creemers M. Predicting Online Purchase Behavior: Replications and Tests of Competing Models. Proceedings of the 34th Hawaii International Conference on System Sciences, 2001
[12] Bellman S, Lohse G, Johnson E. Predictors of online buying behavior. Communications of the ACM (42:12), 1999. 32~38
[13] Bhatnagar A, Misra S, Rao H R. Online risk, convenience, and Internet shopping munications of the ACM (43:11), 2000: 98~105
[14] Jarvenpaa S L, Tractinsky N, Vitale M. Consumer trust in an Internet store. Information Technology and Management, 2000: 45~71
[15] Li Na , Zhang Ping. Consumer online shopping attitudes and behavior: An assessment of research.Eighth Americas Conference on Information Systems, 2002. 508~518
[16] Hawkins D J, Best R J, Coney K A. 符國群等譯. Consumer Behavior: Building Marketing Strategy. 8th ed. 北京:機械工業出版社,2003. 475~479
Shopping Decision-Making Model: An analysis of Consumer Online
Li Shuangshuang1,2Chen Yiwen1Li Jiangyu3
(1Institute of Psychology, the Chinese Academy of Sciences, Beijing 100101, China)
(2Graduate School of the Chinese Academy of Sciences, Beijing 100039, China)