時間:2023-05-26 09:00:12
序論:速發表網結合其深厚的文秘經驗,特別為您篩選了11篇數據分析的前景范文。如果您需要更多原創資料,歡迎隨時與我們的客服老師聯系,希望您能從中汲取靈感和知識!
多傳感器融合系統由于具有較高的可靠性和魯棒性,較寬的時間和空間的觀測范圍,較強的數據可信度和分辨能力,已廣泛應用于軍事、工業、農業、航天、交通管制、機器人、海洋監視和管理、目標跟蹤和慣性導航等領域。筆者在分析數據融合技術概念和內容的基礎上,對該技術在林業工程中的應用及前景進行了綜述。
一、數據融合
1.1概念的提出
1973年,數據融合技術在美國國防部資助開發的聲納信號理解系統中得到了最早的體現。70年代末,在公開的技術文獻中開始出現基于多系統的信息整合意義的融合技術。1984年美國國防部數據融合小組(DFS)定義數據融合為:“對多源的數據和信息進行多方的關聯、相關和綜合處理,以更好地進行定位與估計,并完全能對態勢及帶來的威脅進行實時評估”。
1998年1月,Buchroithner和Wald重新定義了數據融合:“數據融合是一種規范框架,這個框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數據,以獲得實際需要的信息”。
Wald定義的數據融合的概念原理中,強調以質量作為數據融合的明確目標,這正是很多關于數據融合的文獻中忽略但又是非常重要的方面。這里的“質量”指經過數據融合后獲得的信息對用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關的信息,甚至可更好地用于開發項目的資金、人力資源等。
1.2基本內容
信息融合是生物系統所具備的一個基本功能,人類本能地將各感官獲得的信息與先驗知識進行綜合,對周圍環境和發生的事件做出估計和判斷。當運用各種現代信息處理方法,通過計算機實現這一功能時,就形成了數據融合技術。
數據融合就是充分利用多傳感器資源,通過對這些多傳感器及觀測信息的合理支配和使用,把多傳感器在空間或時間上的冗余或互補信息依據某些準則進行組合,以獲得被測對象的一致性解釋或描述。數據融合的內容主要包括:
(1)數據關聯。確定來自多傳感器的數據反映的是否是同源目標。
(2)多傳感器ID/軌跡估計。假設多傳感器的報告反映的是同源目標,對這些數據進行綜合,改進對該目標的估計,或對整個當前或未來情況的估計。
(3)采集管理。給定傳感器環境的一種認識狀態,通過分配多個信息捕獲和處理源,最大限度地發揮其性能,從而使其操作成本降到最低。傳感器的數據融合功能主要包括多傳感器的目標探測、數據關聯、跟蹤與識別、情況評估和預測。
根據融合系統所處理的信息層次,目前常將信息融合系統劃分為3個層次:
(l)數據層融合。直接將各傳感器的原始數據進行關聯后,送入融合中心,完成對被測對象的綜合評價。其優點是保持了盡可能多的原始信號信息,但是該種融合處理的信息量大、速度慢、實時性差,通常只用于數據之間配準精度較高的圖像處理。
(2)特征層融合。從原始數據中提取特征,進行數據關聯和歸一化等處理后,送入融合中心進行分析與綜合,完成對被測對象的綜合評價。這種融合既保留了足夠數量的原始信息,又實現了一定的數據壓縮,有利于實時處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應用較多的一種技術。但是該技術在復雜環境中的穩健性和系統的容錯性與可靠性有待進一步改善。
(3)決策層融合。首先每一傳感器分別獨立地完成特征提取和決策等任務,然后進行關聯,再送入融合中心處理。這種方法的實質是根據一定的準則和每個決策的可信度做出最優的決策。其優點是數據通訊量小、實時性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個或幾個傳感器失效時,系統仍能繼續工作,具有良好的容錯性,系統可靠性高,因此是目前信息融合研究的一個熱點。但是這種技術也有不足,如原始信息的損失、被測對象的時變特征、先驗知識的獲取困難,以及知識庫的巨量特性等。
1.3處理模型
美國數據融合工作小組提出的數據融合處理模型,當時僅應用于軍事方面,但該模型對人們理解數據融合的基本概念有重要意義。模型每個模塊的基本功能如下:
數據源。包括傳感器及其相關數據(數據庫和人的先驗知識等)。
源數據預處理。進行數據的預篩選和數據分配,以減輕融合中心的計算負擔,有時需要為融合中心提供最重要的數據。目標評估。融合目標的位置、速度、身份等參數,以達到對這些參數的精確表達。主要包括數據配準、跟蹤和數據關聯、辨識。
態勢評估。根據當前的環境推斷出檢測目標與事件之間的關系,以判斷檢測目標的意圖。威脅評估。結合當前的態勢判斷對方的威脅程度和敵我雙方的攻擊能力等,這一過程應同時考慮當前的政治環境和對敵策略等因素,所以較為困難。
處理過程評估。監視系統的性能,辨識改善性能所需的數據,進行傳感器資源的合理配置。人機接口。提供人與計算機間的交互功能,如人工操作員的指導和評價、多媒體功能等。
二、多傳感器在林業中的應用
2.1在森林防火中的應用
在用MODIS(ModerateResolutionImagingSpectroradiometer)數據測定森林火點時的20、22、23波段的傳感器輻射值已達飽和狀態,用一般圖像增強處理方法探測燃燒區火點的結果不理想。余啟剛運用數據融合技術,在空間分辨率為1000m的熱輻射通道的數據外加入空間分辨率為250m的可見光通道的數據,較好地進行了不同空間分辨率信息的數據融合,大大提高了對火點位置的判斷準確度。為進一步提高衛星光譜圖像數據分析的準確性與可靠性,利用原有森林防火用的林區紅外探測器網,將其與衛星光譜圖像數據融合,可以使計算機獲得GPS接收機輸出的有關信息通過與RS實現高效互補性融合,從而彌補衛星圖譜不理想的缺失區數據信息,大大提高燃燒區火點信息準確度和敏感性。
2.2森林蓄積特征的估計
HampusHolmstrom等在瑞典南部的試驗區將SPOT-4×S衛星數據和CARABAS-IIVHFSAR傳感器的雷達數據進行了融合,采用KNN(knearestneighbor)方法對森林的蓄積特征(林分蓄積、樹種組成與年齡)進行了估計。
KNN方法就是采用目標樣地鄰近k個(k=10)最近樣地的加權來估計目標樣地的森林特征。研究者應用衛星光譜數據、雷達數據融合技術對試驗區的不同林分的蓄積特征進行估計,并對三種不同的數據方法進行誤差分析。試驗表明,融合后的數據作出的估計比單一的衛星數據或雷達數據的精度高且穩定性好。
2.3用非垂直航空攝像數據融合GIS信息更新調查數據
森林資源調查是掌握森林資源現狀與變化的調查方法,一般以地面調查的方法為主,我國5年復查一次。由于森林資源調查的工作量巨大,且要花費大量的人力、物力和資金。國內外許多學者都在探索航空、航天的遙感調查與估計方法。
TrevorJDavis等2002年提出采用非垂直的航空攝影數據融合對應的GIS數據信息實現森林調查數據的快速更新,認為對森林資源整體而言,僅某些特殊地區的資源數據需要更新。在直升飛機側面裝上可視的數字攝像裝置,利用GPS對測點進行定位,對特殊地區的攝像進行拍攝,同時與對應的GIS數據進行融合,做出資源變化的估計或影像的修正。
試驗表明,融合后的數據可以同高分辨率矯正圖像相比,該方法花費少,精度高,能充分利用影像的可視性,應用于偏遠、地形復雜、不易操作、成本高的區域,同時可避免遙感圖像受云層遮蓋。
三、數據融合在林業中的應用展望
3.1在木材檢測中的應用
3.1.1木材缺陷及其影響
木材是天然生長的有機體,生長過程中不可避免地有尖削度、彎曲度、節子等生長缺陷,這些缺陷極大地影響了木材及其制品的優良特性,以及木材的使用率、強度、外觀質量,并限制了其應用領域。在傳統木制品生產過程中,主要依靠人的肉眼來識別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識別起來非常困難,勞動強度大,效率低,同時由于熟練程度、標準掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識別嚴重影響了生產線的生產節拍。因此必須開發一種能夠對板材雙面缺陷進行在線識別和自動剔除技術,以解決集成材加工中節子人工識別誤差大、難以實現雙面識別、剔除機械調整時間長等問題。
3.1.2單一傳感器在木材檢測中的應用
對木材及人造板進行無損檢測的方法很多,如超聲波、微波、射線、機械應力、震動、沖擊應力波、快速傅立葉變換分析等檢測方法。超聲技術在木材工業中的應用研究主要集中在研究聲波與木材種類、木材結構和性能之間的關系、木材結構及缺陷分析、膠的固化過程分析等。
隨著計算機視覺技術的發展,人們也將視覺傳感器應用于木材檢測中。新西蘭科學家用視頻傳感器研究和測量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時準確地測量單個纖維和全部纖維的幾何尺寸及其變化趨勢,能夠區分不同紙漿類型,測定木材纖維材料加固結合力,并動態地觀察木材纖維在材料中的結合機理。
新西蘭的基于視覺傳感器的板材缺陷識別的軟件已經產業化,該軟件利用數碼相機或激光掃描儀采集板材的圖像,自動識別板材節子和缺陷的位置,控制板材的加工。該軟件還具有進行原木三維模型真實再現的計算機視覺識別功能,利用激光掃描儀自動采集原木的三維幾何數據。
美國林產品實驗室利用計算機視覺技術對木材刨花的尺寸大小進行分級,確定各種刨花在板中的比例和刨花的排列方向;日本京都大學基于視覺傳感器進行了定向刨花板內刨花定向程度的檢測,從而可以通過調整定向鋪裝設備優化刨花的排列方向來提高定向刨花板的強度。在制材加工過程中,利用計算機視覺技術在線實時檢測原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時可對鋸材的質量進行分級,實現木材的優化使用;在膠合板的生產過程中,利用計算機視覺技術在線實時檢測單板上的各種缺陷,實現單板的智能和自動剪切,并可測量在剪切過程中的單板破損率,對單板進行分等分級,實現自動化生產過程。Wengert等在綜合了大量的板材分類經驗的基礎上,建立了板材分級分類的計算機視覺專家系統。在國內這方面的研究較少,王金滿等用計算機視覺技術對刨花板施膠效果進行了定量分析。
X射線對木材及木質復合材料的性能檢測已得到了廣泛的應用,目前該技術主要應用于對木材密度、含水率、纖維素相對結晶度和結晶區大小、纖維的化學結構和性質等進行檢測,并對木材內部的各種缺陷進行檢測。
3.1.3數據融合在木材檢測中的應用展望
單一傳感器在木材工業中已得到了一定程度的應用,但各種單項技術在應用上存在一定的局限性。如視覺傳感器不能檢測到有些與木材具有相同顏色的節子,有時會把木板上的臟物或油脂當成節子,造成誤判,有時也會受到木材的種類或粗糙度和濕度的影響,此外,這種技術只能檢測部分表面缺陷,而無法檢測到內部缺陷;超聲、微波、核磁共振和X射線技術均能測量密度及內部特征,但是它們不能測定木材的顏色和瑕疵,因為這些缺陷的密度往往同木板相同。因此,一個理想的檢測系統應該集成各種傳感技術,才能準確、可靠地檢測到木材的缺陷。
基于多傳感器(機器視覺及X射線等)數據融合技術的木材及木制品表面缺陷檢測,可以集成多個傳統單項技術,更可靠、準確地實時檢測出木材表面的各種缺陷,為實現木材分級自動化、智能化奠定基礎,同時為集裁除鋸、自動調整、自動裁除節子等為一身的新型視頻識別集成材雙面節子數控自動剔除成套設備提供技術支持。
3.2在精確林業中的應用
美國華盛頓大學研究人員開展了樹形自動分析、林業作業規劃等研究工作;Auburn大學的生物系統工程系和USDA南方林業實驗站與有關公司合作開展用GPS和其他傳感器研究林業機器系統的性能和生產效率。
目前單項的GPS、RS、GIS正從“自動化孤島”形式應用于林業生產向集成技術轉變。林業生產系統作為一個多組分的復雜系統,是由能量流動、物質循環、信息流動所推動的具有一定的結構和功能的復合體,各組分間的關系和結合方式影響系統整體的結構和功能。因此應該在計算機集成系統框架下,有效地融合GPS、GIS、RS等數據,解決這些信息在空間和時間上的質的差異及空間數據類型的多樣性,如地理統計數據、柵格數據、點數據等。利用智能DSS(決策支持系統)以及VRT(可變量技術)等,使林業生產成為一個高效、柔性和開放的體系,從而實現林業生產的標準化、規范化、開放性,建立基于信息流融合的精確林業系統。
南京林業大學提出了“精確林業工程系統”。研究包括精確林業工程系統的領域體系結構、隨時空變化的數據采集處理與融合技術、精確控制林業生產的智能決策支持系統、可變量控制技術等,實現基于自然界生物及其所賴以生存的環境資源的時空變異性的客觀現實,以最小資源投入、最小環境危害和最大產出效益為目標,建立關于林業管理系統戰略思想的精確林業微觀管理系統。
[參考文獻]
[1]高翔,王勇.數據融合技術綜述[J].計算機控制與測量,2002,10(11):706-709.
[2]龔元明,蕭德云,王俊杰.多傳感器數據融合技術(上)[J].冶金自動化,2002(4):4-7.
[3]錢永蘭,楊邦杰,雷廷武.數據融合及其在農情遙感監測中的應用與展望[J].農業工程學報,2004,20(4):286-290.
1.環境監測數據的特征及重要性
1.1環境監測數據的特征
環境監測數據規定了每一次監測獲得的數據的可使用范圍,超出該范圍得出的數據就被視為是不合格的。這是因為監測數據是具有局限性的,這種局限性是為了保證監測數據的準確性與可靠性。同時,對于監測獲得的數據要求具有完整性,不應該有缺失或是遺漏的現象。對于在規定范圍內的監測數據,如果這些數據不僅具有代表性,還具備完整性,那么就達到監測的目的了[1]。
1.2環境監測數據的重要性
環境監測的重要性在于它能為環境的管理、規劃、評價等提供科學、有力的依據。出于對我國正處于經濟高速發展階段的考慮,我們對環境監測應給予更高的重視。一般來說,環境監測數據的質量以及分析能力的高低可以反映出一個監測站工作能力,也體現了該監測站在環境保護工作所處地位的高低。
2.對環境監測數據的填制及整理要求
對于監測獲取的相關圖標和原始數據,要進行適當的整理和歸類,以便后面的工作可以更加有利地開展與進行。在填制監測數據時就應該選取標準的記錄表格,在填寫時要盡量的專業化、規范化,并且要保證書寫清晰、準確。對于原始數據的檢查,要逐個地進行、確認,將那些不能真實地反映監測情況的數據去掉。這樣做的目的是為了將數據整理得更有條理,更有實用性,減免不必要的反復檢查,影響工作效率的提高。同時,還有一個問題需要注意,那就是作為監測數據確認的負責人不可以直接參與監測數據的采集工作[2]。
3.對環境監測數據的分析
環境監測是一種以環境作為對象,運用物理、化學和生物等技術手段,對污染物進行定性、定量和系統的綜合分析,它是環境評價中的重要環節,貫穿環境影響評價的整個過程。
3.1利用統計規律進行分析
環境監測是以統計學為基礎的,因此,這種分析方法經常被監測人員采用。這種分析方法包含了對環境要素的質量進行各種數學模式評價方法對監測數據進行解剖,利用它的內在規律性進行分析和利用,進而得出相關的論斷。這種方法在環境規劃、環境調查和環境評價的工作中使用較多[3]。
3.2通過對污染源的監測值來分析
監測人員可以通過對污染源的監測數據進行分析。其實,對污染物的監測對象不僅僅限于空氣、地下水、土壤等,還有一個人們經常說的工業污染源。工業污染是有多種的,不同行業的工業就會有其不同的污染物產生。比如,對于化工行業來講,它排出的有機物含量種類就較多多,而金屬物質相對就較少一些;金屬行業排出的污染物是有機物含量較少而金屬物質含量較多等。如果在一個金屬行業排除的廢棄物中監測得出的結果顯示是具有較多有機物的,那么對于這組監測數據應該重新考慮和分析,并從中找出原因。這也說明了一個問題,那就是監測人員在日常的工作當中要對管轄區內的生產企業相關情況進行了解,要根據不同的行業有針對性地選擇相應的監測項目來監測這些污染企業,實行對他們的有效監督[4]。
3.3根據事物之間的相關性原理進行分析
這種分析法主要是基于事物本身具有的相互關系的原理來來進行的。一般來說,兩個或者兩個以上的監測數據之間往往會存在某一種的固定聯系,監測人員可以根據這種固定的聯系去分析數據之間的相關聯系,也可以對單個已經實行控制質量措施的監測數據進行檢測,驗證是否正確。而對于一些例行的監測數據,則可以得出較為直觀的判斷。比如,氟含量跟硬度之間的關系。由于F與Ca、Mg形成沉淀物得容積度比較小,所以,在中性和弱堿性的水溶液當中,如果氟含量是在(mg/ L )級的,那么它的氟含量與Ca、Mg的含量就是呈顯負相關的現象,也就是說跟硬度值是負相關的。因此,在高氟區內得出的水質監測結果顯示的硬度監測值一般會比較低。如果獲得的氟含量較高,得出的硬度監測值也很高,那么這類監測數據就需要進行重新分析[5]。
4.結語
隨著我國環境保護的不斷深入,監測人員要在使用各種分析方法的同時不斷地去提嘗試新的分析方法,要在原來的基礎水平上更進一步地提高自己的綜合分析能力,對提供的監測數據要有一種精益求精的精神,爭取提供的數據更可靠更合理,業務技能不斷地有新的進步。由于獲取的環境監測數據與區域的過去和現在都有密切的聯系,因此,監測人員要對監測區域的過去和現在的環境狀況都要進行深入的了解和分析,在了解的基礎上展開全面的探討,這樣才可以保證獲取的監測數據更全面,更有說服力,質量更有保證。
參考文獻
[1]葉萍.淺論環境監測數據的綜合分析方法[J]中國環境管理干部學院學報, 2009, (01) .
[2]郭琦.環境監測在環境影響評價中的意義與建議[J].科技風, 2010, (15)
中圖分類號:F293 文獻標識碼:A 文章編號:1671—7597(2013)031-068-01
數據庫是長期存儲在計算機內有組織的大量的共享的數據信息的集合,是按照一定的數據結構來組織、存儲和管理數據信息的倉庫。信息資源是企業在生產和管理過程中產生的一切資料、數據和圖片等信息的總稱。信息管理系統是指能提供企業管理所需的信息的人機交互系統。
1 數據庫的結構與特點
1)數據庫主要有三層基本結構:①物理數據層。即數據存儲層,它是指在物理存貯設備上實際存儲的數據,是最原始的數據,是用戶需要加工的數據;②概念數據層。它是數據庫管理員概念下的數據庫,定義了每個數據的邏輯及數據間的邏輯聯系;③邏輯數據層。即用戶層,它是用戶所看到和使用的數據庫。
2)數據庫主要有七個特點:①數據的共享性。即所有用戶可可通過各種方式同時使用數據庫進行數據存取,數據庫也包含所有用戶所需求的數據,從而實現了數據的共享;②數據的簡潔性。數據共享的實現減少了文件系統中所必需的建立用戶各自的應用文件,從而減少了數據的大量重復和冗余度;③數據的一致性。數據的共享也保證了數據的一致性;④數據的集中控制性。數據庫避免了文件管理方式中的分散狀態,對數據進行集中控制和管理,便于對數據丟失或泄露的及時處理;⑤數據的獨立性。即數據庫中的邏輯結構和應用程序相互獨立和數據物理結構和數據邏輯結構相互獨立;⑥數據的安全性。防止數據丟失、錯誤更新和越權使用;⑦數據的可建設性。數據庫功能強大,技術可升級,有良好的可建設性。
2 數據庫在企業中的發展現狀
1)企業對數據庫的重視度不夠。企業對數據庫的發展建立不夠重視,目前文件系統和文件管理還是企業信息管理的主要途徑,企業沒有將數據庫當做一個企業的重要產業來建設,沒有主要的職能部門對數據庫進行管理和建設,投入的人力物力少,投入的資金也不夠,導致了企業數據的丟失,企業信息資源供應不及時,企業內部能共享的信息重復占用資源等問題,造成了企業的巨大經濟損失。很多企業只著重于眼前的利益,沒有長遠的經濟目光,對數據庫的開發建設程度不高。要想讓一個企業能長遠的立足和發展,就必須加大對數據庫和信息管理的開發力度。
2)企業對數據庫的認識不夠。數據庫的建設和信息管理系統的開發,不僅是為了科研部門的相關研究工作,同時也是為經濟、銷售、政治等其他部門提供可靠的信息資源的保證。數據庫對企業信息資源的管理功能強大,在數據庫中集中控制企業各個部門的數據,能快速地查找到數據的根源,能及時地處理數據的遺失和泄露。
3)企業對數據庫的建設水平低。數據庫技術在企業中的開發還處于初級階段,企業并沒有完全成熟的和完善的數據庫下的信息管理系統。不夠成熟的計算機開發技術也還跟不上數據庫建設的需要和社會的需求。不夠完整的數據庫體系結構,不夠成熟的數據庫開發技術,不夠充足的認識和不夠重視的發展等,這些都是數據庫在企業中的發展駐足不前的原因。
就現階段而言,還是有相當一部分的企業擁有了相對比較完善的數據庫技術和信息管理系統。企業要長足發展,信息的數量和管理力度必將加大,能解決這一系列信息相關問題的數據庫技術就是瑰寶了。因此,加大加快發展企業中的數據庫技術是想要長足發展和生存的企業現階段的主要任務之一。
3 數據庫在企業中的發展前景
1)企業對數據庫的需求增加。隨著企業發展的逐步壯大,企業信息資源也將更加復雜,信息數據量更大。傳統的文件系統和文件管理已經遠遠無法滿足企業現代化的需求。數據庫在企業中的發展意味著數據處理和信息資源管理的高效率,對企業來說,更高的效率意味著更大的利益和更廣的競爭空間。
2)企業對數據庫的技術要求加大。數據庫在企業中的開發和建設技術不夠完善,但同時也有了更大的發展空間。飛速發展的企業對數據庫技術要求越來越高,這是數據庫技術的機遇,也是企業的機遇。因此,努力開發企業數據庫技術和建設信息管理系統是企業發展的必備籌碼。
3)知識產權對數據庫的保護。信息的高速發展讓信息逐步成為了一項產業,信息也作為商品進行交易,《知識產權協定》對數據庫和信息資源進行保護,抑制了企業間的不正當競爭行為。安全的外部環境為數據庫在企業中的發展提供了良好的平臺。
4 結束語
數據庫在企業中的發展就像新長的嫩葉,沒有很完善的體系結構和技術,沒有得到很大的關注和重視,但是它卻有更廣闊的發展空間,更大的需求量,安全的環境也是它將迅速發展的有利條件之一。由數據庫技術實現的信息管理系統已經成為企業發展的重要保障,是企業信息化發展和企業競爭的必備條件之一。一個企業要想快速健康的發展,就必須發展自己的數據庫技術和信息管理系統。為了迎接二十一世紀新挑戰,在繼承傳統企業信息資源管理的優勢下,結合新興的數據庫技術和計算機科學技術,努力實現、提高和改善對數據及信息資源的使用。
參考文獻
近年來,受國內外經濟發展環境的綜合影響,國內煤炭需求不振,環渤海動力煤價格持續下行,行業虧損面不斷擴大,整個煤炭行業進入一個相對較長期間的不景氣階段。行業發展的新常態對煤炭企業的生存和發展構成了嚴峻的挑戰。如何在嚴酷的市場環境下生存并實現企業的轉型升級,成為煤炭企業不得不面對的重要課題。煤炭行業的轉型主要體現在如下方面:
(1)轉變企業發展觀念,從追求規模擴張轉變為發展質量的提升。由于煤炭行業“黃金十年”發展期間,企業產能投入快速擴張,導致近年來煤炭市場供求態勢日益惡化。為促進煤炭行業可持續健康發展,追求規模擴展的老路已經無法適應行業發展的新常態。從2014年下半年開始,以神華集團為代表的大型煤炭企業開始率先實施減產,并從企業自身管理入手,由注重結果反饋轉變為產、運、銷全過程控制,全面加強成本管控,并將“價值創造”理念深入到企業管理的方方面面。
(2.)品開發,兼顧經濟效益和社會效益。由于近年來環境污染形勢日益惡化,作為重要大氣污染源的煤炭已經日益成為國內公眾關注的焦點。煤炭企業如何選擇開發煤炭資源,不僅要考慮市場價格和經濟效益,而且要兼顧環保因素。因此,大型煤炭企業要加大煤炭洗選和潔凈煤技術的研發投入,為市場提供更多清潔優質的煤炭產品。不僅如此,煤炭企業要充分利用科技手段延伸產業鏈,促使煤炭產品由燃料向燃料和原料并舉轉變,通過煤化工和煤制油等技術手段提高煤炭在企業內部產業中的轉化率,多措并舉發揮好煤炭作為新型清潔能源和化工原料的作用。
(3)創新商業模式,從銷售型向服務型轉變。面對國內經濟形勢持續放緩導致的需求疲軟,煤炭行業競爭日益激烈,客戶對煤炭經銷商服務質量的要求也越來越高。在商業模式的創新上,最根本的途徑是樹立以客戶為中心的企業經營理念,通過增值服務為用戶創造更多價值,同時獲取收益。大型煤炭企業有充分的資源和動能,為客戶提供更多個性化的供貨方案,以滿足客戶需求,并實現企業自身的價值最大化。
2.傳統煤炭行業財務分析工作的局限性
由于財務人員專業背景及財務分析技術工具缺乏等因素的限制,傳統財務分析報告視野相對狹窄,更多關注財務要素對經營成果的影響,對于企業業務數據信息缺乏敏感性,往往是“就財務論財務”,提供的財務分析報告難以對企業經營決策提供有效支持。具體表現在如下幾個方面:
(1)財務分析基礎資料整合度不足。企業基礎資料的質量決定財務分析的質量。大型煤炭企業,特別是跨行業的綜合能源企業,其生產經營活動包括了煤炭產品的生產、運輸、銷售、轉化等各個環節。其中涉及不同行業、不同領域的海量經營數據。如何對這些海量數據進行有效整合,并從中抽取有效信息進行分析、匯總,形成具有參考價值的財務分析報告,這些都對財務分析人員的職業素養提出了較高的要求。財務人員如果沒有有效的技術工具輔助,或者缺乏對企業實際業務工作的全面了解,都會影響企業基礎資料的有效整合,進而影響財務分析報告的整體質量。
(2)財務比較分析的對比基礎相對單一,分析不深入。傳統財務分析工作大多企業自身的基于歷史數據,從生產成本、轉運成本、環節費用、貨款回收等多角度入手,結合銷售流向、銷售煤種結構、煤炭價格等重要經營指標的變動分析,為企業管理者決策提供支持。由于同行業特別是主要競爭對手的橫向對比數據來源有限,企業管理者無法站到行業的高度,全面、準確分析煤炭市場走向以實現企業資源的優化配置。
(3)財務分析測算效率較低,缺乏實時性、科學性和前瞻性。目前,煤炭企業財務分析測算主要依靠office等傳統辦公軟件。在瞬息萬變的市場形勢下,通過辦公軟件進行手工測算不僅效率低下,而且與實際業務情況偏差較大。目前,財務比較分析的對比基礎大多以預算數據為依據,以不變應多變。而預算編制多基于歷史、經驗數據,往往流于形式,數據對比缺乏準確性和科學性,很難為面向未來的決策提供有用幫助,分析能力與企業管理需求不匹配。
二、利用大數據拓展煤炭運銷企業財務分析的必要性和可行性分析
1.大數據概念簡析
隨著云計算、物聯網、電子商務等新興技術的興起,大數據概念已經越來越為現代企業管理者所重視。大數據是指由數量巨大、結構復雜、類型眾多的數據構成的集合。大數據不僅著眼于“大”,而且具有其自身的特點,俗稱“4V”特征:Volume(數據體量巨大),Variety(數據類型多樣),Velocity(數據變化速度快),Value(數據價值密度低)。
基于上述四個基本特征,對于大數據的利用不僅僅在于收集數據,而是如何分析數據,并且挖掘出數據背后的商業價值,進而服務于企業的管理經營決策。
2.大數據資源助力煤炭運銷企業財務分析的必要性
隨著煤炭行業由賣方市場步入買方市場的新常態,煤炭運銷企業間的競爭也達到了白熱化的程度。從拼價格、拼煤質,到拼成本、拼管理,企業盈利空間受到嚴重擠壓,市場參與者承受著日益嚴峻的生存壓力。面對復雜、多變的市場環境,如果企業不能快速反應,及時調整經營策略,則很容易被競爭對手搶得先機,進而使企業處于更加被動和危險的境地。
大數據資源的特點決定了,煤炭運銷企業如果能夠通過一定技術手段充分開發這一寶藏,就可以幫助企業獲取更多的途徑以應對當前不利的市場環境,具體表現在如下幾個方面:
(1)幫助企業財務分析從基于結果的分析轉向基于過程的分析。為了更好地服務于企業決策,財務分析不單是要分析結果,而是要分析產生這種結果的原因是什么。大數據資源可以幫助企業從生產經營的全過程進行細化分析,從而使得企業基于過程的成本管控和價值創造理念具有了實現的可能。
(2)幫助企業先于核算進行快速的價值反饋,由月度報告向實時報告轉變。大數據資源為企業提供了充沛的信息支持,可以幫助企業破除按月財務分析報告的桎梏,在海量歷史數據中快速提煉出有價值的財務信息,使得財務人員按時、按需出具實時報告具有更大的可操作性。
(3)幫助企業財務分析由面向歷史向面向未來轉變。大數據可以為企業提供實時更新的信息資源,對這部分資源的合理利用,可以支持企業進行更多場景的模擬預測,加強對未來市場的預判,通過高質量的分析以提高財務經營預測的效率與科學性。
3.大數據資源助力煤炭企業財務分析的可行性
(1)ERP等管理信息系統的應用,為煤炭運銷企業充分利用大數據資源提供了軟件支持。目前,神華集團等國內大型煤炭綜合能源企業已經使用ERP系統作為企業業務管理的系統工具。ERP系統具有高度的集成性,可以將業務數據、財務數據、預算數據等進行有效的整合,從而為企業開發大數據資源提供了有力的技術支持。
(2)大宗商品電子交易平臺的興起,為煤炭運銷企業提供了更為廣泛的數據來源。隨著煤炭買方市場形勢的確立,為客戶提供全方位的服務成為業內的廣泛共識,以大宗商品電子商務平臺為載體的煤炭新型商業模式隨之應運而生。通過與互聯網技術的深度融合,煤炭大宗商品電子交易平臺可以為用戶提供更多科學的選配和運輸方案,并配套相應的融資方案,對傳統煤炭購銷的商業模式形成了強烈的沖擊。
目前,大型煤炭運銷企業已開始深度參與到煤炭大宗商品交易平臺的建設和產品交易中。如果企業在這一過程中能夠主導建立相對獨立的第三方交易平臺,并且能夠吸引足夠多的第三方交易者在平臺進行在線交易,就可以幫助企業獲取更多真實的煤炭市場上下游交易信息樣本。財務人員就可以在分析企業自身數據的基礎上,結合市場其他參與方的交易信息,為領導提供更加全面、詳實的經營數據,極大地擴展財務分析的深度和廣度。
三、整合大數據資源以拓展財務分析視角的具體建議
盡管大數據資源可以作為提升煤炭運銷企業經營管理水平的重要抓手,但是如何開發并利用好企業的這一寶貴資源則需要進行慎重籌劃和穩步推進,著力解決許多實際問題。
1.全面認識大數據理念,避免陷入概念化的誤區
盡管大數據資源具有廣泛的開發和利用前景,但并不是說企業可以一步到位的找到打開這一寶庫的密匙。就國內在這一領域的研究進展來看,一般意義的常規軟件工具尚無法在一定時間內對大數據資源進行有效抓取、管理和處理,同樣也很少有大數據運用的成功案例供企業參考。盡管人們對大數據抱有很高的期待,但其高昂的研究和應用成本也讓許多企業望而卻步。
煤炭運銷企業在引入大數據應用技術前必須充分評估自身的管理基礎和技術實力,樹立正確的大數據應用理念,并制定清晰的技術推廣戰略。企業管理層要將大數據理念充分融入企業文化,在借鑒國內甚至世界先進企業成功經驗的基礎上,持續推動相關知識在企業內部的學習和宣傳。企業需要對大數據技術推廣過程中可能遇到的困難和不確定性抱有清醒的認識,并對可能出現的問題提前制定應對的預案。
2.著力提升企業基礎數據質量,培養大數據技術運用的良好土壤
ERP系統作為嶄新的現代企業管理手段,能夠幫助煤炭運銷企業有效整合供應鏈信息。企業必須以會計核算標準化和信息化建設為抓手,持續推進ERP系統的深度優化。修訂完善管理制度,加強會計信息和報表質量管理,努力實現會計核算工作的標準化、規范化、制度化,在此基礎上不斷完善業務、財務系統的一體化,全面提升財務基礎信息質量。
ERP系統的持續優化,可以幫助企業將數據顆粒度細化到業務數據層級,使財務部門可以從更豐富的、面向業務的視角進行分析與判斷,能夠清晰了解哪些生產單位、以何種煤種、經哪條運輸線路會得到更多的盈利,從而為企業提升經營業績、進行資源的合理配置提供了有力支撐。高質量的細顆粒度數據是穩步推進大數據資源建設的必要條件,也是企業運用大數據技術進行全產業鏈分析的基礎。
3.加快復合型財務分析人員的培養,為推廣大數據運用進行人才儲備
企業在推進大數據技術應用的同時,要高度重視相關知識的培訓。要以強化能力建設為主線,以提升財務人員綜合素質和職業能力為重點,大力實施骨干人才培養計劃。從數據的采集、收集、分析等方面入手,著力培養適應財務信息化發展方向、熟悉企業經營環境、具有戰略思維的復合型財務人才。要充分調動財務人員的積極性、主動性、創造性,幫助財務人員了解煤炭企業產、運、銷各個環節的業務知識,并與財務、預算等專業知識有機結合,為大數據技術的推廣應用提供充足的人才儲備。
4.結合企業經營實際,選擇合適的切入點逐步推進大數據技術運用
一、移動電子商務運營模式及特征
移動電子商務(M-Electronic Commerce)是近幾年隨著無線移動通迅技術發展,而新興起來的新型商務模式,它利用無線通訊技術和移動互聯網進行數據傳遞,通過智能手機、PAD和筆記本電腦等移動設備與企業電子商務平臺網連接來完成商務交易過程的新型商務模式。
傳統電腦平臺電子商務運營模式。傳統的電子商務運營模式以B2C、B2B和C2C為典型模式,以B2C網上商場模式為例,其運營模式如圖1所示:
圖1 B2C網上商場運營模式
移動電子商務運營模式。移動電子商務的運營模式是由移動電子商務交易參與者不同面產生不同的運營模式,具體有內容提供商運營模式、移動運營商主導模式、服務提供商運營模式、WAP移動門戶網關運營模式。下面以內容提供商移動電子商務為例說明其具體運營模式,如圖2所示。
圖2
移動電子商務運營模式區別于傳統電腦平臺電子商務運營模式的特征。移動電子商務是用戶通過移動終端設備瀏覽商品,這樣就能十分方便廣大移動商務用戶,進而撼動傳統電腦平臺電子商務的交易規模。區別于傳統電腦平臺電子商務業務,移動電子商務模式具有如下的特征:移動電子商務突破傳統電腦平臺時間和空間限制,極大地推動了電子商務銷售規模。移動電子商務由于用戶是通過移動終端設備瀏覽和選購商品,這樣就打破傳統電子商務用戶只能坐在電腦前固定時間購物時空限制,用戶能夠在象旅游乘車等任意時間任意地點通過移動商務設備實現網絡購物。移動電子商務由于用戶使用的是移動終端商務設備,交易更加方便、快捷,能夠極大提高電子商務交易效率。移動電子商務由于用戶通過移動終端設備瀏覽和選購商品,而不是只能坐在電腦面前完成交易,這樣就使電子商務從傳統單一固定電腦平臺端變為隨時隨地能方便用戶購物的移動貼身服務,從而能極大地提高電子商務的交易效率。移動電子商務由于使用移動終端設備使條碼掃描功能更為簡單,比價功能更為方便。移動電子商務用戶只要通過掃描在傳統超市中正在關注的商品條形碼,就可以通過移動設備收索該產品商場超市和超市商品報價,所以,移動電子商務通過掃描商品條形碼而實現商品的比價功能更方便實用。
二、移動電子商務運營模式面臨的問題
移動電子商務是電子商務時代新興的交易模式,各商家在風起云涌發展移動電子商務之時,也象日韓和歐美國家的移動電子商務發展一樣面臨著諸多挑戰和難題。
移動電子商務運營模式的競爭優勢。移動電子商務網絡不穩定連接不暢,服務內容不夠豐富。我國的移動無線網絡由于發展時間短,經常會出現網絡不穩定和連接不暢的問題,嚴重影響移動電子商務交易正常進行和消費者信心。移動終端設備屏幕格式多樣化和操作系統版本不統一,造成移動電子商務軟件平臺更新難度加大。移動終端設備屏幕格式多樣化和操作系統版本不統一,支付系統不統一,這些都給移動電子商務平臺軟件開發設置的一道道障礙。由于不同的移動終端設備屏幕格式和操作系統版本功能不一,這就使移動運營商搭建移動電子商務網站和商家更新移動電子商務軟件帶來相當大的難度。
三、大力發展我國移動電子商務的相關對策
加大無線網絡的建設和覆蓋力度,通力改進移動電子商務的服務內容和搜索服務功能。針對我國依托無線網絡的移動電子商務,經常會出現網絡不穩定和連接不暢的問題,應該加大無線網絡的建設和覆蓋力度;同時移動運營商和商家應通力協作,增加移動商務服務內容;真正把移動電子商務設計成界面友好,操作簡單,搜索快捷的電子商務平臺。
盡快制定移動電子商務終端設備屏幕格式和操作系統的規范標準,使移動電子商務終端設備的屏幕格式和操作系統盡可能標準化。
對移動電子商務所有交易環節設置比平臺電子商務更為嚴格安全防范措施。與傳統電腦平臺電子商務對比,移動電子商務由于采用無線通訊技術,因此可能會遭致更多諸如終端假冒、無線數據、交易擁堵等安全風險,為確保移動電子商務數據安全傳輸,就需要采用無線加密技術和無線公開密匙體系,以確保移動電子商務整個交易過程的安全可靠。
四、結語
移動電子商務是我國近幾年剛剛興起的新型商務模式,與傳統的電腦平臺電子商務相比,移動電子商務的商務環境和運營模式是明顯不同的,而我國現有的移動電子商務在發展中面臨著沒有國家統一標準,因此,必須盡快制定移動電子商務產業相關法規,使移動電子商務監管有法可依;增強移動電子商務網絡的穩定性和可靠性,并加大對移動加密技術的投入,真正發揮出移動電子商務產業蓬勃發展的優勢,使其真正能夠成為我國新的經濟增長平臺。
【摘要】 目的 探討動脈灌注介入先期化療在局部晚期宮頸癌術前的臨床應用效果。方法 選擇近期筆者所在醫院就診的92例局部晚期宮頸癌病例,觀察組52例術前行動脈灌注介入先期化療,對照組40例行常規化療,分析兩組術中病理結果、術后不良反應。 結果。觀察組與對照組術中所見組織病理結果對照顯示,切緣未見癌細胞者61.5%,宮旁單側見癌細胞者19.2%,宮旁雙側見癌細胞者、盆腔淋巴結轉移者各9.6%;顯著優于對照組(P
【關鍵詞】 動脈灌注介入; 先期化療; 局部晚期宮頸癌
宮頸癌是女性常見的惡性腫瘤之一,發病率僅次于乳腺癌,在女性惡性腫瘤中居第2位,但80%發生于發展中國家。我國宮頸癌發病率與死亡人數約占世界1/3[1]。隨著血管介入術在婦科腫瘤領域的成熟應用,動脈灌注介入先期化療在局部晚期宮頸癌手術前的應用依越來越受到臨床醫生的關注。本組研究回顧性分析本科室動脈灌注介入先期化療應用于局部晚期宮頸癌手術的臨床效果,報道如下。
1 資料與方法
1.1 一般資料 收集2009年1月~2011年2月筆者所在醫院治療的92例宮頸癌女性患者。年齡為47~72歲,中位年齡為65.9歲。病理組織類型情況:鱗癌72例(包括早期浸潤性鱗癌29例,浸潤深度≤5 mm),腺癌18例,腺鱗癌2例。癌細胞高分化者47例,癌細胞中分化者33例,癌細胞低分化者12例。臨床分期Ⅱa期40例,Ⅱb期22例,Ⅲa期者17例,Ⅲa期者11例,Ⅳa期者2例。術前接受動脈灌注介入先期化療的52例患者分為觀察組,其余40例分為對照組,術前給予常規靜脈化療。兩組患者年齡、病理組織類型及分期等一般資料差異無統計學意義(P>0.05),具有可比性。
1.2 方法 (1)觀察組術前動脈灌注介入先期化療:用泥鰍導絲引導經右股動脈置管,依據術中動脈造影顯示癌組織所在部位及血供情況,選擇癌組織血管染色較為優勢側的子宮動脈分支,抽出導絲留置導管,連接導管于輸液泵的,化療方案為:順鉑5 0 mg/m2加于1500 ml生理鹽水,紫杉醇45 mg/m2加于1000 ml生理鹽水中,滴注速度為80~100 ml/h。持續化療3天。(2)對照組常規化療:每日給予順鉑50 mg/m2加于1500 ml生理鹽水靜滴,紫杉醇45 mg/m2加于1000 ml生理鹽水靜滴,持續化療3 d。
1.3 不良或毒副反應評定 毒性反應按世界衛生組織抗癌藥物不良反應評價標準進行判定,分為0-Ⅳ度[2]。
1.4 統計學處理方法 使用SPSS 13.0統計學軟件包對數據進行處理,計量數據用均數±標準差表示,率的比較采用χ2檢驗。以P
2 結果
2.1 觀察組與對照組術中所見組織病理結果對照情況 觀察組52例患者中,術中所見組織病理結果:切緣未見癌細胞者61.5%,宮旁單側見癌細胞者19.2%,宮旁雙側見癌細胞者、盆腔淋巴結轉移者各9.6%;顯著優于對照組的40.0%、30.0%、15.0%及15.0%,差異具有統計學意義(P
2.2 兩組毒性反應對照情況 觀察組52例患者中,出現口腔粘膜炎有17例(32.7%),Ⅰ級占6例,Ⅱ級11例;惡心或嘔吐24例(46.2%),Ⅰ級9例,Ⅱ級7例,Ⅲ級5例,Ⅳ級3例;脫發20例(38.5%),Ⅰ級9例,Ⅱ級6例,Ⅲ級3例,Ⅳ級2例;白細胞減少41例(78.8%),Ⅰ級24例,Ⅱ級14例,Ⅲ級3例;血小板下降40例(76.9%),Ⅰ級22例,Ⅱ級17例,Ⅲ級1例。對照組與觀察組化療不良反應差異無統計學意義(P>0.05)。兩組不良反應也都能耐受,經對癥處理后,癥狀緩解或消失。
3 討論
局部晚期宮頸癌組織不易控制,極易發生附近淋巴結及遠處轉移,以及不良的預后因素等。如在術前進行有效的化療,減小局部癌組織體積,抑制癌細胞轉移到附近淋巴管及血管內,可大大降低手術的切除難道,同時也可降低術后遠處的轉移率。通過介入術于兩側髂內動脈置入化療管,快速灌注化療藥物。宮頸癌動脈灌注先期化療的優點包括:(1)可使局部宮頸癌組織在短期內得到較高的藥物濃度,與同等劑量靜脈通道給藥相比,藥物濃度約高數倍;(2) 藥物可直接進入腫瘤供血動脈,局部藥物濃度高,避免被肝、腎等組織破壞及首過效應,降低了藥物血漿蛋白合率;(3)縮小宮頸癌原發病灶同時,可消滅術前已存在的病灶附件的亞臨床及微小轉移病灶,縮小癌組織體積,降低手術難度,擴大了宮頸癌手術適應癥,使原無法手術切除的患者重獲手術機會[3]。
本資料結果顯示,觀察組患者術中所見組織病理結果,切緣未見癌細胞者61.5%,宮旁單側見癌細胞者19.2%,宮旁雙側見癌細胞者、盆腔淋巴結轉移者各9.6%;顯著優于對照組的40.0%、30.0%、15.0%及15.0% (P0.05),具有臨床應用價值。
參考文獻
[1] 姚志敏,佟小強,宋莉,等.宮頸癌術前動脈化療栓塞療效.介入放射學雜志,2009,18(3):189-192.
航空設備數據分析一直是一個難題,因為數據按ICD協議上傳,需要轉化為可讀數據才能分析設備的運行狀態。但是設備的上傳速率一般在毫秒級,所以設備運行一個小時可以輸出上百兆的數據,人工分析這些數據費時費力且錯誤率高,容易錯過關鍵數據。
針對這種情況,作者設計了一種專門分析設備上傳數據的軟件(簡稱數據分析軟件)。使用數據分析軟件處理百萬行的數據只需要不到一分鐘的時間,而且該軟件可以將數據制成曲線,可以更容易地捕捉到關鍵數據。
1 數據分析軟件
數據分析軟件包含兩個模塊:數據轉換模塊和數據繪制模塊。
1.1 數據轉換模塊
1.1.1 時間類
航空設備上傳的數據一般以時間為基準,因此數據轉換時需要保留原始數據的時間信息,這樣才能將數據繪制成以時間為X軸的曲線。時間類的定義如圖1:
基類Time繼承了IComparable接口,所以Time類重載了 “!=”,” ”,”==”四個操作符,這樣Time類的對象之間可以比較大小,所以轉換后的數據可以按時間前后排序。
1.1.2 數據類
在數據分析軟件中,數據是以行為單位的,每一行數據有多個域,不同行數據的域名相同,域內的數據不同。數據行類定義如圖2。
DataLine的對象代表一行轉換后的數據,ToString接口可以將DataLine里存儲的數據以文本的形式輸出。DataLine是一個抽象類,需要用他的子類實例化對象。由圖可見,MLSData集成了DataLine類,在成員變量中加入了一個MLSTime的對象_time用以表示該行數據的上傳時間,并且可以用CompareTo接口比較兩個MLSData對象的時間先后。其實MLSData的CompareTo接口只是調用了成員變量_time的CompareTo,如圖3。
1.1.3 翻譯器類
翻譯器實現的功能是將一行原始數據轉換為可讀數據,翻譯器定義如圖4。
Translator是一個抽象類,其中定義了一個抽象函數Translate,這個函數有一個類型為String的形式參數data,并返回一個DataLine類(或其子類)的對象。其中data表示一行文本格式的原始數據,返回值DataLine表示轉換后的數據。當需要分析按新版本ICD協議上傳的數據時,只需創建一個新的Translator子類,并按ICD協議重寫Translate函數即可。
1.2 數據繪制模塊
數據繪制模塊類關系圖如圖5:
父類DataDrawer是一個抽象函數,他實現了繪制曲線的一些基本功能。子類MLSDrawer集成了DataDrawer的基本功能,并添加了數據段放大功能。MD_WarningLine添加了告警線的顯示功能,分析人員可以清晰地看到數據告警的位置,并針對該段數據進行分析。MultiLineDawer添加了多曲線繪制弄能,可以將多組數據的曲線繪制在同一坐標系內,讓分析人員可以進行多組數據間的交叉比對。
2 實際應用
如圖6,設備上傳數據經數據轉換模塊處理后輸出可讀數據。
數據繪制模塊讀取分析結果數據后,可以將結果中的一組或多組數據繪制成曲線。
在曲線繪制區域內拖動鼠標可已放大局部數據,如圖9。
大數據采集是大數據能力的基礎,培養學生快速準確全面獲取數據的能力是大數據分析技能的起點。企業各種原始憑證、記賬憑證、賬簿、報表等會計資料信息采集,包括傳統紙質材料和電商電子材料等信息的采集,因為相對工整規范,采集難度不大;培養學生對企業自有數據倉庫數據抽取導出能力,將充分發揮企業歷年數據作用。
同時,企業不僅要采集企業內部核算資料,還要進行管理活動需要采集原材料價格、市場前景、同類產品銷售情況等外部數據資料,這些資料有公開的如鋼鐵價格、原油價格等,也有不公開的某企業某產品銷售情況,所以通過大數據的手段在獲取某類產品、某些特點產品的銷售情況,或者購買參考公共銷售情況數據,需要培養學生爬取數據的能力。
例如,利用八爪魚進行淘寶、天貓、京東等網站商品檢索結果抓取或者商品詳情內頁資料進行抓取,也可以自行設計或者購買規則進行特定數據抓取;利用公共平臺數據對企業商品的競爭情況有更全面的了解,也可以獲取消費者的檢索熱點;對自己產品的評論資料可以進行典型意見和關鍵詞的提取,提高CRM水平,如圖1所示。 隨著物聯網傳感器的發展,自動、實時、全面、完整、可靠、準確的數據不斷出現,每一個界面、每一個動作、每一次交互都有跡可循并被規范記錄,獲取的數據也將更加全面,企業的數據采集也更趨自動。
2 大數據清洗
培養學生通過對數據進行多方驗證、審核,將有雜質的數據剔除能力;培養學生從格式、邏輯、數值等多方面進行數據清洗和整理,處理缺失值、孤立點垃圾信息、規范化、重復記錄、特殊值、合并數據集等問題的能力。
3 大數據分析
對于企業積累數據和獲取的外部數據都要及時進行分析應用,快速充分分析數據尤為關鍵。培養學生數據分析、數據挖掘的技能尤為重要,具體需培養數據分析技能如。
(1)描述型分析:是什么?
描述性分析會提供重要指標和信息。例如,通過每月的銷售單據,可以獲取大量的客戶數據,如客戶的地理信息、客戶偏好等;也可以了解企業庫存、銷售等生產經營數據。
(2)診斷型分析:為什么?
通過評估描述型數據,診斷分析工具能夠深入的分析數據,鉆取到數據的核心,分析某種產品或者某些產品銷售量變化原因等。
(3)預測型分析:可能怎樣?
預測型分析主要用于進行預測事件未來發生的可能性、預測一個可量化的值,或者是預估事情發生的時間點。使用各種可變數據來實現預測,在充滿不確定的環境下,預測能夠幫助做出更好的決定,如預測原料價格可以輔助決定庫存、預測銷售可以輔助決定產量、預測業務量可以輔助決定資金籌集量等。
(4)指令型分析:做什么?
指令模型是基于對“是什么”“為什么”和“可能怎樣”的分析,幫助用戶決定應該采取什么措施。通常情況下,指令型分析不是單獨使用的方法,而是前面的所有方法都完成之后,最后需要完成的分析方法。例如,交通規劃分析考量了每條路線的距離、每條線路的行駛速度、以及目前的交通管制等方面因素,來幫助選擇最好的回家路線;企業考量了銷售數據的變化、分析了市場和消費者的原因、預判了產品市場前景,進而決定對產品實施哪些改進。
4 大數據可視化
大數據可視化是培養學生對大數據分析結果進行直觀呈現能力。培養學生利用企業自有數據或者外部連接數據、抓取數據等方式獲得的數據進行全方位呈現的能力,培養學生將數據的匯總、平均、交叉列聯分析等描述和分析結果,利用適當的圖形進行展示的能力。大數據可視化是非常重要的技能,具體如。
4.1各類變量適合的基本可視化效果
單一變量:點圖、抖動圖;直方圖、核密度估計;累計分布函數。
兩個變量:散點圖、LOESS平滑、殘差分析、對數圖、傾斜。
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2014)49-0248-02
隨著社交網絡的逐漸成熟,移動帶寬迅速提升,云計算、互聯網應用的豐富,更多的傳感設備、移動終端接入到網絡,由此產生的數據及增長速度將比歷史上的任何時期都要多,都要快。“大數據”時代已經來臨,它對人類的數據駕馭能力提出了新的挑戰,也為人們獲得更為深刻、全面的洞察能力提供了前所未有的空間與潛力。大數據是指海量數據集,其來源包括動漫數據、企業IT應用帶來的數據、博客、點擊流數據、社交媒體、機器和傳感數據等。它是互聯網、電子商務的又一次重大革命,對數據處理、數據挖掘、數據分析提出了新的挑戰。如今互聯網行業、電子商務行業中的數據應用及分析已經相當普遍,為了應對大數據時代的要求,同時要具備較強的統計學功底和嫻熟的計算機軟件運用能力,而今完全具備這些能力的數據分析專業人才是極其匱乏的。數據分析師便應運而生,不僅互聯網行業、電子商務行業需要大量的數據分析師,近年來項目數據分析事務所不斷涌現,而項目數據分析師因其專業技能及量化的數據分析為客戶以及所在單位控制決策風險、保證利益最大化而備受各界青睞,以待遇優厚和地位尊崇而聞名國際,也被視為我國21世紀的黃金職業。《華商報》將項目數據分析師納入了新七十二行,《HR管理世界》將項目數據分析師評為七大賺錢職業。本文就如何在統計學專業開展數據分析方向進行了闡述,首先論述了數據分析的重要意義,其次討論了數據分析方向的課程構建,最后分析了如何加強理論與實踐環節的結合。
一、數據分析的重要意義
大數據預測美國總統:美國時代周刊報道稱,數據驅動的競選決策才是奧巴馬競選獲勝的關鍵。數據分析團隊在籌集競選經費、鎖定目標選民、督促選民投票等各個環節的決策中都發揮了重要作用。這意味著華盛頓競選專家的作用極具下降,能夠分析大數據的量化分析家和程序員的地位卻大幅提升。如今從事專業數據分析工作的企業如項目數據分析師事務所、數據挖掘公司等都應市場需求而大力發展,并且受到風險投資的青睞。如美國社交數據挖掘公司Datasift于2012年宣布,獲得1500萬美元風險投資。2013年,DataSift成為Twitter的“認證合作伙伴”,主要負責海量微博社交數據分析。這是該公司今年第二筆融資,五月份其曾融資720萬美元。又如面向開發者的大數據應用軟件平臺服務提供商Continuity最近獲得1000萬美元的融資,目前融資總額已經達到1250萬美元。
數據分析的應用無處不在,那什么是數據分析呢?數據分析就是用適當的統計方法對數據進行分析,以求最大化地開發數據的功能,發揮數據的作用。是為了提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。數據分析技術不僅能通過對真實數據的分析去發現問題,還能夠通過經濟學原理建立數學模型,對投資或其他決策是否可行進行分析,預測未來的收益及風險情況,為做出科學合理的決策提供依據。在提高工作效率的基礎上,也增強企業管理的科學性。無論是在國家政府部門,還是企事業單位中,數據分析工作都是進行決策和做出工作決定之前至關重要的一個環節。因此,針對項目可行性、風險承載力、投資回報率以及相關經濟效益指標等方面的分析工作顯得格外重要。在這個工作過程中,專業的數據分析人員扮演著無比重要的角色,數據分析成果的質量高低直接決定著項目投資、企業經營決策計劃最終的方向。所以,各個行業對數據分析人員的需求之多是不言而喻的。傳統行業,如政府機構:一類是計委、經委、統計局等一些經濟綜合管理部門所設有的調研處、研究室和情報所。第二類是商業、糧食、物資、銀行等經濟主管業務部門會設有信息中心或調研室,從本系統、本部門的業務出發進行專業性調研,提供支持本部門的市場信息。而伴隨著數據分析應用的擴大,其在新興行業中也得到了發展,如計算機軟硬件及IT行業、電子商務與網絡游戲、金融保險、消費品、咨詢業與廣告媒體、大型設備與重工業以及房地產行業等對數據分析師的需求量很大,尤其是電子商務,由于利用互聯網,能夠比傳統零售業具有更好的數據收集和管理能力,能積累海量的數據,因此更看重從海量數據中挖掘出用戶偏好和市場機會。研究機構:比如市場研究公司、咨詢公司、證券公司、研究院。自主創業:取得注冊項目數據分析師(CPDA)資格證可以自主創建或就業于項目數據分析師事務所等。所以,數據分析的行業應用是極其廣泛的,并且隨著大數據時代的到來,數據分析尤其是數據挖掘將借助互聯網的發展,逐步形成人們依靠的重點,并可能成為未來發展與競爭的重點之一。由此我們可以看到數據分析師的就業前景是非常廣泛而樂觀的,無論是數學專業、統計專業,還是計算機專業的學生,都可以通過系統的學習數據分析課程來適應對數據分析人才的要求。
二、課程體系構建
1.主干課程。主干課程包含高代、數分、概率論、數理統計、多元統計分析、時間序列分析、市場調查與分析、統計預測與決策、數據結構、C語言、數據分析、數據挖掘、大數據分析與展示。理論課程的學習可以使學生了解數據分析的基本內容,學會如何對已獲取的數據進行加工處理,如何對實際問題進行定量分析,以及如何解釋分析的結果。掌握幾種常用數據分析方法的統計思想及基本步驟,并具備一定的分析論證能力。
2.實驗課程。數據分析的操作離不開計算機。目前數據分析行業常用的一些統計軟件有SAS、SPSS和R軟件。SAS軟件是一個模塊化、集成化的大型應用統計系統。它的功能包括數據訪問、數據儲存及管理、應用開發、圖形處理、數據分析、報告編制、運籌學方法、計量經濟學與預測等。SPSS軟件是一個社會科學統計軟件包,是采用圖形菜單驅動界面的統計軟件,SPSS的基本功能包括數據管理、統計分析、圖表分析、輸出管理等。R軟件是一套完整的數據處理、計算和制圖軟件系統,包括:數據存儲和處理系統、完整連貫的統計分析工具、優秀的統計制圖功能、可操縱數據的輸入和輸入等功能。這三個軟件在數據分析中針對不同行業的需求有不同方向的應用。
3.專業課程。從數據分析的行業需求出發,好的數據分析人員不僅要有較強的數據分析能力,還要有該行業的背景及相關知識的儲備,這樣才能將數據分析與行業特性聯系起來,發揮數據分析的最大功能,即所謂的“因地制宜”。同時要兼顧學生的興趣與學習的聯系,需提供多領域的課程選擇,如:經濟學、金融學、保險學、管理學、會計學等。而在軟件學習方面也要拓寬渠道,除了實驗課程安排學習的軟件,學生可根據自身發展意向再多掌握一些軟件如:SQL數據庫,熟悉office常用功能,尤其熟練運用Word和PowerPoint、Excel圖表及數據分析等。同時還應該結合對數據分析師的要求設置一些相關課程:投資數據分析、市場調研與預測、預測技術分析、現金流量表編制、風險投資項目篩選、不確定性分析、編制數據分析報告等。
三、實踐環節
培養數據分析的專業型人才目的就是為了學以致用。數據分析本身就是為了從數據中發現問題、建立模型、預測收益風險企業決策進而做出合理正確的決策判斷。因此,學習了基本的知識和技能就要運用到實際操作中。學校可以和本地的數據分析事務所,或者大量需求數據分析人員的互聯網行業建立實訓基地,進行合作式教學,使得學生在實習的過程中能夠理論聯系實際,切身體會數據分析的商業操作體系,這樣就能夠促進學生有目的、有取舍地針對自身情況學習鉆研,繼而就能夠培養出適應經濟發展,滿足市場需求的應用型人才。
四、結語
在大數據時代到來之時,數據分析在互聯網中的應用將會空前廣泛,與此同時對數據分析師的需求也將會井噴,無論是在軍事、工業、企業還是在政治上,大數據分析都將會十分緊缺。因此,目前對數據分析師的培養刻不容緩。本文從分析數據分析行業發展及其重要意義、數據分析專業課程設置以及教學實踐環節方面對構建數據分析課程體系進行了探討。不僅從教學課程的內容上予以安排,而且更加注重引導學生自主學習,特別強調理論結合實踐的合作式教學。希望能夠結合行業需求合理地構建課程,培養出專門從事數據分析的項目數據分析師,從而能夠滿足市場需求和自身發展。
參考文獻:
[1]范金城.數據分析[M].科學出版社,2010.
本專業學生主要學習數學和應用數學的基本理論、基本方法并接受數學建模、計算機和數學軟件方面的基本訓練,在數學理論和應用兩方面都受到良好的教育,具有較高的科學素養和較強的創新意識,具備科學研究、教學、解決實際問題及軟件開發等方面的基本能力和較強的更新知識的能力。
本專業畢業生應獲得以下幾方面的知識和能力:
①具有扎實的數學基礎,受到比較嚴格的數學思維訓練,初步掌握數學科學的思想方法;
②具有應用數學知識建立數學模型去解決實際問題的初步能力和進行數學教學的能力;
③了解數學科學發展的歷史概況以及當代數學的某些新發展和應用前景;
④能熟練使用計算機(包括常用語言、工具軟件以及一些數學軟件),具有編寫簡單程序的能力;
⑤具有較強的語言表達能力,掌握資料查詢、文獻檢索以及運用現代信息技術獲取相關信息的基本方法,具有一定的科學研究能力;
⑥ 師范類畢業生還應具有良好的教師職業素養,了解教育法規,掌握并能初步運用教育學,心理學以及數學教育學的基本理論,具有一定的組織管理能力。
數學與應用數學專業就業前景
應用數學專業屬于基礎專業,是其他相關專業的“母專業”。無論是進行科研數據分析、軟件開發、三維動畫制作還是從事金融保險,國際經濟與貿易、工商管理、化工制藥、通訊工程、建筑設計等,都離不開相關的數學專業知識,數學專業與其他相關專業的聯系將會更加緊密,數學專業知識將會得到更廣泛的應用。
由于數學與應用數學專業與其他相關專業聯系緊密,以它為依托的相近專業可供選擇的比較多,因而報考該專業較之其他專業回旋余地大,重新擇業改行也容易得多,有利于將來更好的就業。
本專業學生畢業后可從事科學研究、教學、軟件開發等方面的工作。
從事行業:
畢業后主要在新能源、互聯網、計算機軟件等行業工作,大致如下:
1、新能源;
2、互聯網/電子商務;
3、計算機軟件;
4、金融/投資/證券;
5、電子技術/半導體/集成電路;
6、其他行業;
7、教育/培訓/院校;
8、計算機服務(系統、數據服務、維修)。
從事崗位:
畢業后主要從事算法工程師、數據分析師、數據挖掘工程師等工作,大致如下:
1、算法工程師;
2、數據分析師;
3、數據挖掘工程師;
4、圖像算法工程師;
5、高級數據分析師;
6、數據產品經理;
Think Big公司是Teradata于2014年9月并購的大數據服務公司。Think Big公司聯合創始人兼國際業務高級副總裁里克?法內爾(Rick Farnell)介紹,成立于2010年的Think Big公司專注于開源數據服務,其愿景是幫助客戶運用新的開源技術,與現有技術優勢互補,從各種類型的數據中挖掘分析價值。
Teradata大中華區首席執行官辛兒倫(Aaron Hsin)介紹,自從成立以來,Teradata在過去40多年中一直專注做好一件事,那就是數據分析。Teradata幫助客戶通過有效的數據分析獲得業務洞察力,從而實現業務增長,提高利潤,為客戶提供更好的服務。
他強調,在過去的5到10年里,開源技術的發展和廣泛運用,使得半結構化、非結構化數據分析成為可能。為此,作為數據分析領域的全球領導者之一,Teradata積極跟進,除了自身研發以外,非常開放地融合優秀的開源數據分析技術,并形成了高效的統一數據架構(UDA)。據悉,Teradata 統一數據架構整合了Teradata 數據倉庫、Teradata Aster大數據探索平臺和開源Hadoop。
辛兒倫認為,在大數據生態系統建設中,客戶認識到需要整合不同技術架構的優勢,特別是在已有數據倉庫系統中融合開源技術,需要更好的工具來管理、訪問和利用這些平臺,尤其是需要具有實際經驗的團隊來指導Hadoop等復雜的開源系統的延伸部署。隨著客戶開始應用,或者開始嘗試應用諸多不同的技術架構或版本,它們面臨著很多技術選擇和路線圖規劃等實際問題,這往往會導致項目偏離既定的大數據戰略目標和業務目標。
“隨著各種規模的企業在落地大數據戰略時選擇不同的開源分析系統,客戶對開源系統咨詢服務的需求快速上升。我們致力于實現最新開源技術同現有成熟技術的優勢互補,借助我們優秀的數據科學家、數據工程師和咨詢團隊,幫助全球的客戶更快速、高效和便捷地獲取大數據價值。”里克?法內爾表示。
據悉,目前包括Intel、Facebook、NetApp、納斯達克(NASDAQ)、美國運通公司(American Express)和eBay等在內的知名企業,均是Think Big公司的客戶。正因為如此,Teradata收購了Think Big公司。
“Teradata擁有完整的大數據分析生態系統,借助統一數據架構實現Hadoop等開源分析系統、Teradata Aster大數據探索分析技術和數據倉庫環境的完美整合。”辛兒倫說,“借助Think Big專業的咨詢服務,Teradata將能夠向客戶提出多元化大數據的卓越咨詢建議,降低大數據分析系統部署和應用的難度,進一步強化統一數據架構的優勢,推動大中華地區客戶數據驅動轉型的實現?!?/p>
提供四大核心服務
記者在溝通會上了解到, Think Big在大中華區將廣泛支持廠商中立的開源解決方案,根據客戶實際的業務需求,推薦基于現有技術和解決方案的最佳技術和方案組合。Think Big致力于幫助客戶通過應用最新數據分析技術來獲得大數據的價值,提升競爭力和利潤。其核心咨詢業務包括:
其一,大數據戰略咨詢服務。根據客戶業務需求和戰略目標,制定符合企業需求優先等級和能力的大數據戰略,幫助企業更快地獲取大數據價值。里克?法內爾認為,現在很多客戶制定大數據戰略時有個誤區,就是盡可能采用最新的開源技術,事實上企業應該先考慮建立一個平臺,然后在這個平臺上建立、充實相關的能力。辛兒倫介紹,Think Big可給客戶制定一個為期6周的啟動數據分析應用的路線圖,幫助客戶確定流程和數據選擇的優先級,及其對業務的影響,并幫助客戶構建最佳數據架構;在此基礎上,還可給客戶提供為期12個月的發展路線圖,其中涵蓋Think Big的方法論。
其二,數據工程服務。根據客戶的業務目標,設計、開發和交付最適合的解決方案,提供現有分析架構優化和數據湖治理等服務。Think Big可提供數據湖的優化服務,以滿足客戶對生產系統、生產環境的數據服務需求。
其三,分析和數據科學服務。通過廣受認可的數據分析方法論,幫助客戶解決現存的業務問題,通過創新的數據分析方法,發掘全新的業務機會。
其四,管理服務和培訓。提供大數據分析系統的管理和優化,助力企業提高數據分析效率和洞察力,通過各種形式的培訓幫助企業真正獲得能力,提高數據和分析系統的采用和普及。人才短缺是客戶應用大數據的一大挑戰,而Think Big特別重視大數據戰略和專業技能的培養,尤其強調培養優秀的團隊是大數據戰略的最佳實踐。Think Big擁有強大的專家團隊資源和“Think Big大數據學院”,致力于為客戶和合作伙伴提供全面的人才培養服務,通過授人以漁的方式幫助企業實現數據驅動的業務成功。
已經有具體項目在開展
辛兒倫表示,Teradata在大中華區推出Think Big的全面服務,不僅體現了公司對高速發展的大中華區市場的重視,而且反映出客戶對Teradata和Think Big服務和能力的高度認可。
“自從有了Think Big團隊之后,客戶跟我們合作得更加緊密了?!毙羶簜惐硎?,Teradata已經在華發展了20多年,積累了很多合作時間長達15年甚至20年的客戶,Think Big的業務能夠讓Teradata引入更多開源技術和解決方案,幫助客戶解決更多的業務痛點。