時間:2023-11-06 09:58:18
序論:速發表網結合其深厚的文秘經驗,特別為您篩選了11篇信息資源分類范文。如果您需要更多原創資料,歡迎隨時與我們的客服老師聯系,希望您能從中汲取靈感和知識!
高校圖書館信息資源整合是指將高校圖書館中各種類型、各種形式和各地分布的多樣化的信息資源進行有效組織,通過一定的方式形成統一的資源布局和服務模式,發揮各種信息資源的優勢,形成更加高效的信息服務體系。
(一)信息資源組成現狀
隨著高校圖書館規模的不斷擴大,收藏的資源種類也在不斷豐富,信息資源的種類、載體和文獻介質也變得更加復雜化、多樣化,紙質文獻資源在不斷持續增長的同時,各種電子資源,如音像、光盤、電子期刊、網絡知識數據庫、電子圖書等也在不斷增長,這些資源構成了高校圖書館信息資源的重要部分。
(二)信息資源整合必要性分析
結合本校圖書館的實際情況,由于館舍、管理模式、歷史傳統等方面因素,造成了信息資源的相對分散,館內資源與資料室彼此獨立、紙質文獻與電子文獻檢索資源相對獨立的現狀,這種情況對信息資源的有效利用產生了影響?,F如今,各館文獻資源的多樣化要求高校圖書館人對信息資源進行合理布局、有效整合,也就是對其內容和對象進行擴展,方便信息分類研究,提高資源利用效率,便于為讀者提供更優質的檢索服務。
鑒于在實際中上述問題的存在,高校圖書館有必要對信息資源進行整合。
二、高校圖書館信息資源整合中存在的實際問題
(一)信息資源整合存在效率低的問題
針對存在問題,需要有一個行業類的統一標準和規范來規整信息資源整合方式;其次,就是對整合后的資源導航設置沒有明確的界定,使得人員使用時出現混淆,降低使用效率;另者,缺乏引導性的交互功效。
(二)缺乏專業技術人員
雖然現階段高校圖書館人員的整體素質在不斷提高,但是與信息資源整合這一學科相交互的人員卻很少,對信息資源整合方面的研究產生了直接影響。
(三)信息資源整合服務對讀者的宣傳力度不夠
高校圖書館進行信息資源整合需要花費大量的時間和精力,但是不是閉門造車式的整合,需要更多地聽取本校讀者的意見,擴大讀者對信息資源使用的熟知度,了解他們的閱讀習慣,走訪各院系,結合本校的特色信息資源使開發出的系統適合本校實際,充分發揮高校圖書館在高校教書育人中所起的重要作用。
三、本校圖書館信息資源整合的框架
(一)信息資源整合原則
1.信息資源優略互補原則。在本校圖書館現階段的信息資源可以大體分為紙質資源、電子資源以及網絡資源,這些資源之間看似相互獨立,但是又都各自發揮著自身的優勢。有的在資源檢索過程中可以被交互使用,有的則體現著相互之間補充的作用。在進行資源整合時,需要充分發揮每類資源的優勢,補充劣勢資源,達到互補的效果。
2.信息資源最大化利用原則。結合本館實際,本著“服務讀者,以書育人”的宗旨,了解讀者對資源使用的偏好,可以在各系發放問卷調查,對來訪學生進行抽樣調查,按照讀者的借閱習慣、檢索方式整合適合本校讀者的資源檢索途徑,形成統一的檢索平臺,建立具有本校特色的檢索服務。
3.信息資源整合通用性原則。擬進行的信息資源整合,應該是建立在對當前行業標準熟知,科學化、合理化研究的情況下,這樣才能保證本館各項工作有條不紊地進行。
4.信息資源整合互通性原則。擬進行的資源整合構架是建立在之前各類資源的基礎上的,具有統一檢索入口的平臺,它是對之前各類信息資源的便捷性使用,不是對各類信息資源的替代。
(二)信息資源整合方式
1.以導航條對信息資源進行整合。此種方式是將信息資源的檢索入口統一整合在一起,創建資源導航窗口,按照信息資源的名稱、摘要、關鍵字、內容、獲取鏈接方式等依次排列,使其可以更加全面地了解館內資源的情況。讀者可以根據自己的需求選擇資源類型,如紙質資源、電子資源、數據庫資源、期刊資源、會議論文、碩博士論文等資源信息。
2.以目錄對信息資源進行整合。根據本館現有圖書館信息資源逐年增加的趨勢,信息資源的種類和形式變得多元化,針對一本紙質圖書而言,它不僅有光盤、音頻資料,有的還有電子版、網絡版等,可以將它們通過現有的編目提供透明,便于讀者找到需要書籍的相關資源。
3.以數據庫形式對資源進行整合。由于各個電子資源提供商提供的信息資源都是依據自身的特點所設計的,它們所采用的數據庫類型也各有千秋,存在自建數據庫(內容有時有重復)、網絡數據庫、光盤數據庫等,它們的檢索界面不統一,檢索方式不相同,形成“信息孤島”現象??梢蚤_發相應的系統,為讀者提供一個可以進行統一檢索的界面,針對有重復的信息資源,系統可以設置操作,拼配出需要的資源,自動篩選掉,節省讀者閱讀時間,大大提高檢索效率,在很大程度上提高信息資源的利用率,使信息的增值服務達到最大化。
四、高校圖書館特色信息資源整合發展策略
針對高校圖書館在信息化建設中做出的信息資源整合策略,結合現階段所存在的問題,可以通過以下途徑對高校圖書館信息資源整合做出合理應對。
(一)快速轉變觀念以適應新的發展趨勢
對信息資源的整合是一個全新的概念,從客觀角度講,新事物在發展和實施初期會有一定程度的阻礙,因此,使之受到大家的接受和認可就需要一個過程,需要加大對這方面的宣傳和推廣力度,只有大家接受了,在以后的整合建設過程中才會得到進一步發展。
(二)加強對館員的培訓力度,使其熟知新事物
信息資源整合是目前適應新形勢下受大家關注的課題,這對館員的專業能力提出了更高的要求,需要高校圖書館在引入新技術的同時也要加強館員的在職培訓工作,使得當代圖書館人具備專業的學科水平和專業的技術水平,適應新形勢下的要求。
(三)結合本館實際,研發信息資源整合平臺
伴隨著信息資源的不斷豐富,數據庫資源也不斷增加。要結合本館實際,有針對性地研發有本校特色的信息資源整合平臺。
(四)廣泛吸取經驗,加快高校圖書館信息化建設步伐
我國高校圖書館的信息化整合起步較晚,因此,在對信息資源整合的過程中可以借鑒國外先進的整合經驗,并結合本校實際加以合理利用,做到與國際接軌,充分感受信息化建設帶給高校圖書館的便利,加快本館的信息化整合力度。
(五)對自身網絡進行兼顧,對信息資源的安全進行保障
影響信息資源安全的因素可以歸結為兩點:一是人為的對信息資源的惡意破壞;二是信息資源本身的脆弱性所致。對于外部對信息資源的侵害,可以采取在操作系統上打補丁、裝防火墻、對圖書館內的內外網進行實時監測等措施,對外來入侵進行提前預防,保證信息資源的安全。而對于信息資源本身的問題則主要是會對計算機系統產生破壞,損壞數據庫,導致數據失竊,使得工作人員權限改變等問題,針對上述問題可以采取對數據庫進行加密,對數據庫用戶進行權限分配。
〔分類號〕G250.7
Classification Schema Design in Integrated System of Information Resources and Services in Science and Technology Field
Song Wen Sun Tan Zhou Jingyi Zhang Zhixiong Xu Tan
National Science Library, CAS, Beijing 100080
〔Abstract〕Based on the infrastructure of UDDI, the authors analyze the types and characteristics of resources and services which need to be integrated in the description system of science and technology resources and services, and of the description specifications in UDDI and main classification schema in present. The authors design a classification schema of integrated system of information resources and services in science and technology field.
〔Keywords〕integrated system web service UDDI classification schema
1系統總體結構
科技信息資源和服務集成揭示系統是國家科技基礎條件保障平臺的建設項目,采用開放聯合的模式,集成揭示國家科技圖書文獻中心、國家圖書館、中國科學院國家科學圖書館、CALIS的數字資源和服務系統,向用戶提供一站式的資源發現和檢索服務。
系統采用Web Service技術體系,整個系統分4個子系統:
集成檢索門戶:提供用戶資源發現和檢索的入口。
開放登記系統:對資源進行統一規范的登記注冊,提供資源的發現服務。
Web服務封裝:對參建單位的資源按Web Service規范進行封裝和元數據映射,以便集成檢索系統的調用。
分布式集成檢索:嵌入在集成檢索門戶中,當用戶選擇資源提交檢索請求時,分布式檢索系統到資源登記系統獲取資源的入口地址和有關調用參數,向各資源服務系統提交檢索請求,對檢索結果集進行整合,返回用戶。
2UDDI登記系統中的分類思想
Web Service的關鍵技術包括SOAP、WSDL和UDDI。SOAP提供了一種應用程序與Web服務進行通訊的機制,WSDL提供了一種向其他應用程序描述Web服務的方法,而UDDI用于創建Web服務注冊中心,提供對Web服務的集中發現機制。
2.1UDDI的數據結構
UDDI對Web服務的描述由4個具有等級層次的核心數據組成[1]:businessEntity、businessService、bindingTemplate和tModel。
businessEntity是UDDI中的頂層數據結構,這一層次的元數據實現對服務的擁有者或管理者的描述,如機構名稱、通訊地址、聯系人等信息。在businessEntity數據中還包括機構提供的服務,通過該元素實現機構數據對服務描述數據的包含。
businessService結構描述一個邏輯服務單元。每個busin-essService包括服務的描述性信息,如服務的名稱、服務的分類等。businessService結構包含bindingTemplate,通過其所包含的bindingTemplate實現對服務的技術參數的描述。
bindingTemplate結構描述應用程序與web服務進行交互時所需要的技術信息,至少必須包括服務的入口地址。bindingTemplate引用tModel說明服務的類型、遵從的規范和標準等。
tModels數據描述web服務遵從的規范、協議。對tModels的引用是在bindingTemplate中,這樣tModels能被多個bindingTemplates引用。引用到完全相同的一組tModels的bindingTemplate被認為有相同的“技術指紋”。
如果一個機構需要對其Web服務進行注冊,首先需要注冊businessEntity元素,在對機構數據進行注冊后,可以注冊機構的Web服務。在UDDI系統中,一個機構只能注冊一次,對應一個businessEntity。由于一個機構可以提供多個邏輯服務,所以一個businessEntity數據可對應多個businessService。
一個Web服務可以在多個站點提供服務,一個binding-Template描述一個特定地址的Web服務的技術信息,一個businessService數據可以對應多個bindingTemplate數據。由于一個Web服務可以應用多個技術標準或協議,所以一個bin-dingTemplate數據可以包涵對多個tModel數據的引用。
tModel數據不是某個機構的特定服務專用的,在UDDI系統中,鼓勵tModel數據的共享,這樣可以促進不同的Web服務之間的互操作。
2.2UDDI中的分類數據
基于分類的實體登記、發現技術是UDDI系統的核心技術。UDDI提供了一種結構和框架,可以從多緯度對數據模型中的各個實體進行分類。
UDDI通過categoryBag元素對實體進行分類,categoryBag包含一個或多個keyedReference子元素, 一個keyedReference包含三個屬性:
tModelKey: 指向一個tModel。
keyName: 分類系統的名稱或簡短描述。
keyValue: 該實體在分類系統中的分類值。
tModel指向Web服務遵循的技術標準,在UDDI系統中,分類體系同樣使用tModel進行定義,一個tModel指向一個分類體系。tModel數據結構中,包括分類體系的簡單信息,tModel中一個重要的數據元素是overviewDoc,該元素包含一個遠程的.
【中圖分類號】G420 【文獻標識碼】B【論文編號】1009―8097(2010)04―0108―04
一 引言
在有大規模用戶參與的教育資源建設和地區級有組織的教育資源共建共享項目中,教育資源存儲都采取了服務器集群、分布式存儲等方式,以應對用戶上傳下載。但一般資源元數據信息都采取集中存儲的方式[2][3][4],在用戶規模不斷擴大的情況下,元數據信息的訪問將成為系統瓶頸。因此我們研究了一種利用資源分類信息樹來輔助教育資源元數據分布式存儲的策略,且不失集中存儲所具有的資源查全、查準特性。同時我們認為,教育資源本身的分類特性以及教育資源用戶興趣偏好的明顯存在,也支持元數據的分布式存儲。
二 資源分類信息樹
全國信息技術標準化技術委員會教育技術分技術委員會(celtsc.省略/)制定的《教育資源建設技術規范》中,利用學科、實用對象、素材類型三種基本分類方法產生了六種分類體系,根據在實踐中教師偏好,我們選擇了圖1的分類體系作為基礎:
考慮教材版本對資源內容和用戶的影響,我們將教材版本作為一種基本分類,同時為每一種分類增加一種名為“其他”的類別,以用于容納在該分類下無明確類別的資源,如一張圖片,它可能沒有教材版本的區別。這樣擴展為如圖2的形式。
這里我們對分布式系統中典型的兩類節點的定義如下:
教育資源元數據節點:為教育資源某種(些)分類下的教育資源元數據提供存儲、查詢等服務。在一個分布式系統中,教育資源元數據節點可根據需要增加。
教師節點:最主要的資源用戶,他們可能是通過普通瀏覽器或通過專有客戶端訪問教育資源。
1 資源分類信息樹的定義
參照一般數據結構教科書中對樹的定義,資源分類信息樹定義如下:資源分類信息樹是包含有n個結點的有限集合,在這個集合上定義了一個唯一的關系,它滿足下列條件:
(1) 集合中存在唯一的一個結點,它沒有前驅,稱為樹的根,這里命名為“教育資源”;
(2) 除根以外,集合中的每個結點都有且僅有一個前驅;
(3) 除根以外,集合中的任何一個結點a,都存在唯一的一個從根到a的結點序列a0,a1,a2,am,其中,a0即樹根,而am=a,在這個序列中,節點ai是ai-1(1≤i≤m)的后繼。這個結點序列稱為從根到a的路徑;
(4) 每個結點表示教育資源某種分類下的具體分類,如按學科分類下的“語文”;
(5) 沒有后繼的結點稱為葉結點,有且只有葉結點而且必須存儲至少一條元數據節點信息,表示該類元數據信息由這些元數據節點存儲。如果元數據節點信息超過一條,表示該類元數據信息有多個完全備份。
(6) 如果某種教育資源分類方法的某種類別在某結點直接后繼中,那么該分類所有類別都必須出現在該結點的直接后繼集合中。
通過擴展樹的廣義表表示法,可按照以下方式存儲資源分類信息樹:用中括號表示結點的后繼,用小括號表示元數據節點信息。則上圖可表示為:
“教育資源[語文[人教版[一年級(元數據節點A),二年級(元數據節點B,元數據節點C),六年級(元數據節點C)],蘇教版(元數據節點D),師大版[小學(元數據節點F),初中(元數據節點G)]],政治(元數據節點E),地理(元數據節點E)]”
為了便于存儲和傳輸,我們參考《教育資源建設技術規范》,對資源類別進行編碼,其中元數據節點信息是一個HTTP地址,因此經過編碼,圖3中的資源分類信息樹可進一步表示如下:
“EduRes [ GS001 [ T001 [ GO003 ( metaa.省略), GO004 ( metab.省略, metac.省略 ), GO008 ( metac.省略 ) ], T002 (metad.省略 ), T003 [ GOE001 (metaf.省略),GOE002 (metag.省略)]], GS005(metae.省略),GS007( metae.省略 ) ]”
同時,考慮資源分類信息樹的動態性,我們為其設置了版本號和校驗碼,用“V”代表版本號,“RTree”代表編碼后的資源分類信息樹,那么校驗碼“CS”由如下公式生成:
CS=MD5(Byte(V)+Byte(RTree))
顯然在應用的初期,資源分類信息樹的規模較小,元數據節點數量極少,在元數據節點上存儲了葉節點對應分類下更詳細的分類,以及相關的元數據信息。元數據節點需要定期告知自己的存儲以及訪問情況,便于系統動態調整資源分類信息樹。
2 資源分類信息樹的操作
資源分類信息樹是一棵動態發展的樹,或者說是當前系統中元數據節點的結構化映像,它對用戶上傳下載資源起著初步導航定位的作用。一般來說,對資源分類信息樹存在著以下幾種操作:
(1)資源分類信息樹的構建與獲取
根據應用系統的規模,決定需要部署元數據節點的數量,以及各元數據節點服務的教育資源類別。在系統運行過程中,元數據節點將自己元數據存儲量、檢索次數等用戶活動數據反饋給系統,然后系統給出建議決策。元數據節點首先獲得資源分類信息樹,然后將其轉發給連接上它的教師節點,過程如圖4所示。
(2)資源分類信息樹的更新
隨著系統的不斷成長,在收集到足夠元數據節點用戶行為信息后,資源分類信息樹就需要進行更新,包括增加元數據節點、合并訪問壓力小的資源分類結點、分離訪問壓力大的資源分類結點。在資源分類信息樹的變化過程中,需要符合其定義,特別需要保證有且只有葉結點能關聯元數據節點信息。下面圖示列出了資源分類信息樹更新的各種情形:
如上所示,資源分類信息樹的更新主要涉及到結點分裂、替換、合并三個操作??偟膩碚f,這個樹的更新是比較容易的。但樹的結構更新后,對應的元數據節點對其存儲的元數據信息必須做出相應的調整,而這些元數據節點是分布在網絡中的,同時為教師節點提供著服務,這需要精心設計調整策略,保證元數據節點與資源分類信息樹的一致性,并同時為教師節點提供正確服務。
通過分析“分裂、替換、合并”三個操作可以發現,對于元數據節點元數據信息的調整的核心操作是“一個或多個的過程”。例如圖6所示的分裂過程,即是:元數據節點A將除“語文、數學、英語”以外的元數據信息剪切到新元數據節點B上,同時根節點“教育資源”不再存儲元數據節點信息,成為非葉結點;圖7所示的替換過程即是:元數據節點A將“英語”類元數據信息剪切到新元數據節點C上,其他無變化;圖8所示的合并過程即是:元數據節點B將“物理”類元數據信息剪切到網絡中元數據節點C上。除去核心操作,其它操作主要是資源分類信息樹結構信息的調整以及最新信息在各節點的分發。其整體流程如圖5。
在元數據節點調整過程中,元數據節點需要暫停服務,以防止數據的不一致性。由于元數據調整非常少,可以在教師節點比較少的時候進行,如深夜調整,這樣能降低由此給教師帶來的不便。
(3)元數據節點定位
由于元數據信息分布在不同的元數據節點上,教師節點上載、檢索資源等都需要確切知道元數據所在的元數據節點。因此需要利用資源分類信息樹來定位目標信息所在的元數據節點集。其算法如下:
第一步:變量初始化,將要上載或檢索資源的分類信息按“學科-教材版本-適用對象-素材類型”排序,設序列為如下形式:ConditionStr[]={“GS001”, “*”, “GO006”, ……},其中“*”表示不區分該類別,在這里表示不分教材版本。用MPeers存儲資源分類信息樹的目標結點集合,結點信息包含路徑信息,如“EdurRes.GS001.T002”,表示“蘇教版”結點,初始將“EduRes”根結點加入集合中:MPeers = { “EduRes” };
第二步:對MPeers集合中結點進行順序訪問,如果是非葉結點,獲取該結點的所有直接后繼結點,并結合ConditionStr中對該分類的限制,用符合要求的直接后繼結點集合替代該非葉結點。以圖3所示的資源分類信息樹為例,“EduRes”結點是非葉結點,其直接后繼結點集合為{“EduRes.GS001”, “EduRes.GS002”, ……},ConditionStr中對學科類別資源限制為“GS001”,因此MPeers集合變為:Mpeers = {“EduRes.GS001”};
第三步:重復第二步直到MPeers集合中都是葉結點為止。收集該集合中所有結點所包含的元數據節點信息,即為本次上載或檢索的目標元數據節點集。
由于資源分類信息樹的規模一般非常小,因此時間復雜度可以忽略。在極端情況下,如果ConditionStr中對所有分類都不限制,形如ConditionStr = {“*”, “*”, ……},就類似廣度優先遍歷資源分類信息樹,結果包含網絡中所有元數據節點信息。
三 基于資源分類信息樹的元數據操作
1 元數據上傳
在資源分類信息樹的輔助下,元數據上傳過程比較簡單,在確定目標元數據節點后,即可將元數據信息推送到對應元數據節點上。但當教師節點無法直接訪問所確定的目標元數據節點時,需要其他元數據節點。其基本過程如圖9所示。
2 元數據檢索過程
同理,元數據檢索過程在資源分類信息樹的輔助下,也可以直接確定其目標元數據節點集,如果能直接訪問這些元數據節點,即可并行發出檢索請求,并最終合并檢索結果。但在無法直接訪問某目標元數據節點時,需要其他元數據節點。其基本過程如圖10。
四 總結
應對大規模訪問是元數據分布存儲的最重要目的,資源分類信息樹可以很好地組織元數據節點,并能比較容易地增加、備份、合并、分裂元數據節點,擴展性較好。同時在對元數據節點發起查詢前,通過資源分類信息樹預先確定目標元數據節點集,提高了系統效率。資源分類信息樹與目錄集中式(一般分布式資源網采用“目錄集中訪問,資源分布存儲”)以及一般P2P網絡(常采用Tracker或不完全DHT模式)中元數據存儲的比較情況如下表所示:
參考文獻
[1] 路秋麗,魏順平.網絡教育資源標準及標準應用的調查分析[J].中國電化教育, 2005,(7).
[2] 孫波.開放式教學資源網絡管理平臺的研究與實現[D]. 北京:北京師范大學,2002.
[3] 余勝泉,朱凌云,曹曉明.教育資源管理的新發展[J].中國電化教育,2003,(9).
1 引言
隨著國內3G網絡的規模建設和智能手機的快速市場滲透,移動網絡的數據業務流量呈爆發式增長,增長幅度明顯高于語音業務。據不完全統計,2010年國內三大運營商的移動數據業務同比增長都超過了100%。移動互聯網呈現蓬勃發展態勢,很多固網的互聯網業務也隨之遷移升級至手機,其中即時通訊類業務(如QQ、MSN、飛信)手機普及率最高。
即時通訊類業務具有小流量且長時在線的特性,傳統信道獨享的固定寬帶接入網對此沒有問題,但這種特性對多用戶共享信道資源的無線接入網的資源分配和占用帶來挑戰。實際情況是,該類業務實際占用的無線資源(業務信道和控制信道等資源)是其實際業務流量的數倍甚至數十倍,無線網絡資源利用效率明顯低下,是謂移動數據業務實際運營的“增量不增收”:同時,這也為網絡擴容帶來巨大壓力。因此,我們有必要對這類業務進行構建模型,并對無線資源占用作具體分析。
2 業務特征及其對無線資源占用特點
即時通訊類業務的用戶信息發送具有很大的離散性以及小流量特點。由于手機并非一直占用信道資源,當有數據傳輸時,系統才會發給手機并立即指配消息分配信道資源,沒有傳輸時則釋放資源,這會導致業務的頻繁建立和釋放。而在沒有信息傳送時,為了保持用戶客戶端和服務系統的信息同步更新,客戶端與服務器之間要定時發送心跳信號(keepaIive),以明確客戶端是否在線。心跳信號周期一般為幾十秒,心跳信號的頻繁發送,也會導致業務的頻繁建立和釋放,但其實用戶并沒有發出信息。
網絡的實際連接次數、連接時長、前反向流量,可以反映業務對業務信道和控制信道類無線資源的占用情況。表1為國內某地的移動網絡各類業務對無線資源的實際占用情況。前向小速率突發類業務(即時通訊類業務為主)的下行流量僅占0.64%,但其連接次數占整個網絡的79.41%,占用連接時長也達到18%。這意味著:傳輸不到1%的數據流量,卻占用了79.41%的控制信道和18%的業務信道。
由表1可知,傳輸業務流量和資源占用呈現明顯的不匹配。這種不匹配源于小流量長時在線的業務特點和模型:一方面,信息量?。毫硪环矫?,長時在線,意味著網絡必然要為其分配較多的業務信道資源,尤其該類業務頻繁連接,使CDMA 1X系統必須頻繁為其建立信道和釋放信道,占用了大量控制信道資源。因此,即時通信類業務大規模發展,導致了網絡擁塞,尤其是控制信道的擁塞,造成網絡整體資源利用效率下降。
3 業務模型
作為普及率較高且為用戶熟知的數據業務,即時通訊業務與其它傳統業務(如下載類、瀏覽類等業務)不同,業務模型相對復雜,包含多種狀態,不同狀態下的業務特征差異明顯。目前,可歸納為三類業務模型:接入登陸業務模型、信息發送模型、空閑心跳模型。
3.1 用戶發送信息業務模型
在用戶輸入信息并點擊發送時,即進入信息發送狀態,適用于用戶發送信息業務模型,該模型由用戶或系統觸發。在實際業務模型中,除了用戶可見信息外,為了上層通信和交互,還必須包含大量的控制或指示類信息。如表2所示,手機QQ每發送/接收一條信息的長度為30個漢字,有效傳輸數據量為132Bytes,加上TCP/IP包頭40字節,實際傳輸172Bytes。即實際用戶信息負荷占比僅為36%,另外64%為用戶不可見的輔助添加信息,可見實際有效負荷比較低,明顯低于下載類、瀏覽類業務的用戶信息有效負荷占比(典型的為80%-90%)。
用戶有效信息負荷比低有兩個原因:一,用戶信息是明顯的短IP包,IP頭占比大:二,每個信息要附加發送QQ號、接收QQ號、版本號等輔助信息,冗余比例高。
3.2 用戶登陸業務模型
用戶在首次登陸時,要傳送登陸賬號和密碼,信息反饋各類好友的在線狀態、用戶本身配置信息、用戶簽名、用戶個性圖片等大量信息。如表3所示,經現網測試,手機單次登陸的平均接入時長為119秒,和當時的網絡狀態關系密切。如閑時登錄時間明顯少于忙時,還與網絡是1X網絡還是DO網絡關系密切。
用戶的單次登陸數據流量平均10.5K字節。其中圖片類信息和好友信息類信息占主導,和該用戶的好友數量和一些個性化設置關系較大。
3.3 空閑心跳模型
在用戶空閑時間內,為了和系統保持信息同步,必須按照一定的周期發送系統自動刷新的信息,即所謂心跳。傳輸的信息包括:好友的登錄狀態、用戶定時向系統進行狀態更新,一些通知消息等。根據QQ版本不同,心跳時長也有所不同,如表4:
手機QQ空閑態每小時傳輸的狀態信息約為20kb,包括網絡向手機發的狀態改變信息,以及手機向網絡發的心跳信號。
3.4 業務模型小結
如圖1,即時通訊類業務顯著特點為平均每個數據包大部分為小數據包,從網絡測監控統計,約98%的前向連接速率小于4.8kbps,80%數據包小于512個字節,反向連接速率小于4.8kbps,80%數據包小于512個字節。
較之其它業務,即時通訊類的包小但發送頻繁,手機QQ典型的突發數據包主要分布在100Byte-300Byte區間:其它典型業務測試的基本模型結果如下:
電腦通過上網卡打開一個互聯網主頁(如新浪),約500kb~1000kb。
電腦下載業務:約1Mb~100Mb(典型的如下載歌曲,每首約3Mb~4Mb)。
手機終端打開一個互聯網主頁(如:新浪,分頁顯示),約100kb~300kb。
手機終端打開一個含少許圖片的網頁,約10kb~200kb。
手機終端下載小軟件,約200kb~1000kb。
手機終端打開一個WAP頁面,約5kb~80kb。
綜上可知,大部分業務的單次下載流量在數百kb為主,明顯高于即時通訊類的0.2kb水平。
4 對1X網絡資源的占用分析
1X無線資源主要包括CE、Walsh碼、功率三類。CE資源是接入信道處理單元,目前標準的信道板包括128個C已Walsh碼資源為正交碼分資源,在目前典型的無線配置3中,每個載扇最多有64個Walsh碼資源。從對1X資源的占用角度來看,業務包括四個過程或階段:
連接建立階段。占用公共信道Wlash碼與CE,此階段分配專用Walsh碼與CE,接入時間約3~4秒。
數據傳輸階段。占用1~17個專用Wlash碼,1~17個專用CE(持續時間依所傳輸數據量與數據速率而定)。
無數據傳輸休眠等待階段。數據傳輸完畢,前向無數據傳輸,只有控制信息傳輸(反向功率控制等信 息),傳輸速率較低,一般為1500bps或2700bps。持續時間依據休眠定時器設置,現網設置時間為20~60秒。
連接釋放階段。連接釋放,不再占用前向資源(C已WaIsh碼,功率)。
如表5所示,即時通訊類業務平均每次傳輸0.2kb信息,在1X網絡中的有效傳輸約為0.22秒,但休眠等待時間約20~60秒,這都要占用CE資源和walsh碼資源,加上接入建立實現的3.5秒,也要占用接入信道和無線資源。總體而言,相對于其他業務(如網頁瀏覽、FTP下載等),即時通訊類業務傳輸效率明顯底下,激活態應用層平均有效傳輸速率為0.067kbps,有效傳輸速率僅為FTP下載類業務的1660分之一。
因此,即時通訊類業務大量不斷接入和休眠等待過程要占用大量無線CE和Walsh碼資源及少量功率資源,造成網絡效率明顯低于其他業務。再加上此類業務的客戶端系統信息更新(心跳)也要周期性消耗資源,進一步降低了資源有效使用率。
5 對EV-DO網絡資源的占用分析
作為3G網絡,EV-DO網絡設計思路主要針對突發類數據業務,資源分配采用時分方式動態調度,與1X網絡的資源分配有明顯不同。EV-DO網絡前向資源分配的最小單元為時隙:1.67ms,實際應用中,業務承載包括Session建立過程,連接激活與數據傳輸過程,會話釋放過程等4個步驟:
1次會話(Session)建立流程(含UATl分配)。1次重認證流程。
多次連接激活/去激活流程(用戶數據傳輸,數十次至數百次)。
可能存在的切換流程。
1次會話釋放流程。
其中,數十次的連接激活/去激活流程占用了主要無線資源。圖2為一次連接激活/去激活流程。
對于不同的業務類型和IP包大小,EV-DO采用不同的傳輸編碼和格式。下面為幾種典型業務的編碼和格式:
(1)小流量數據
IP層數據量為200Byte
折算到MAC層在空口約需傳輸2000bit
采用(2048,1,64)編碼
(2)網頁瀏覽
lP層數據量為1 00kb
折算到MAC層在空口約需傳輸1 000kbit
采用(4096,1,64)編碼
(3)FTP下載
IP層數據量為3000kb
折算到MAC層在空口約需傳輸30000kbit
采用(4096,1,64)編碼
(4)傳輸開銷
層開銷:13%
重傳率:5%
空口傳輸效率:95%
如表6所示,即時通訊類業務包括網絡登錄過程和小流量數據傳輸過程,其中連接建立過程大約需要使用33時隙,和其他類業務一樣(如網頁瀏覽、FTP下載等)。而數據傳輸過程要根據用戶具體消費行為,典型的一個200Byte的lP包只需一個時隙即可完成。假設用戶每小時發送60次信息,在線用戶每小時總耗用前向時隙時長3.7s,在線用戶的每小時總流量22kb,可得到占用前向時隙時的等效前向速率48kbps。小流量數據業務對前向時隙資源占用效率不高,有效利用率僅是其他業務(網絡瀏覽、FTP業務)的1/30~1/40,但于1X的上千倍的差距有了明顯提升(約提高了40~50倍)。
6 對即時通訊類業務的優化建議
基于即時通訊類業務的特點,其在移動網絡上的承載效率明顯不如一些傳統業務。針對其業務特點和網絡特性,可從以下幾方面進行優化:
(1)優化即時通訊類業務的客戶端。在不影響用戶體驗的情況下,盡量擴大客戶端的心跳周期,如設置為180秒。
(2)盡量把即時通訊類業務從1X網絡遷移到EV-DO網絡,其相對效率可以提升30~50倍,絕對速率(激活態應用層平均有效傳輸速率)可以提高700~800倍。
(3)優化客戶端版本。在心跳信息更新方面進行判決,如果無重要信息需更新,可以合并多次心跳信息,或省略部分不重要的心跳信息。
7 結論
本文對移動網絡上越來越多的即時通訊類業務進行資源使用分析,并結合實際構建相關業務模型,對即時通訊類業務CDMA1X網絡的資源消耗進行定量分析,對EV-DO上的承載特點和即時通訊類業務資源消耗進行分析,并給出優化建議。對于優化即時通訊類業務在移動網絡上的體驗,尤其是減輕由其帶來的無線網絡壓力有較大的實用價值,同時對需要承載越來越多個性化業務的網絡分析有一定的借鑒意義。
近年來,我國電子政務信息化建設取得了巨大進展,信息資源總量不斷增加,質量逐步提高,在現代化建設中日益發揮重要作用。但隨著電子政務信息資源的膨脹,政務信息資源的管理和共享大都是建立在各自獨立的領域和范圍內,系統的應用僅以滿足各自領域的信息獲取為目的,相互之間沒有聯系,造成了政府部門之間所謂“信息孤島”的問題。在信息化社會里,信息已成為一種重要戰略資源。信息資源是與物質、能量同等重要的現代戰略資源。信息資源的開發利用是國家信息化的核心任務,其開發利用水平直接關系國民經濟社會信息化的全局,政府信息資源是國家資源,是全社會的公共資源和公共財富,政府信息共享是促進當前我國信息資源開發利用的重點。將元數據應用在政務領域,從各政府部門的信息系統中采集信息資源可以形成用戶資源視圖,通過元數據描述和管理技術可以構建政務信息資源元數據庫,元數據是描述某一資源的結構化數據。它提供有關資源存儲、資源分類、資源交換、資源訪問等方面的信息,便于用戶查詢、檢索和訪問相關信息資源。
1元數據庫在政務信息資源注冊管理系統中的應用
1)注冊流程和注冊規范
政務信息資源注冊的流程如下所述:提交機構按照政務信息資源提取規范收集、發現、提取本部門的政務信息資源,形成資源視圖;提交機構按照《政務信息資源統一描述規范》對注冊的政務信息資源進行元數據描述;由主管部門對政務信息資源元數據進行內容審查;提交機構將政務信息資源元數據提交到注冊機構并申請注冊;注冊機構驗證注冊申請,并決定是否受理此申請。如果受理了申請,注冊機構就給資源分配臨時的資源標識符,將注冊狀態注上“已受理”,并通知提交機構受理的情況;受理后注冊中心對政務信息資源元數據進行測試和審核,如果元數據的格式或者內容沒有通過測試和審核,注冊機構通知提交機構相關的出錯信息和處理意見;審核通過后,注冊中心給注冊資源分配正式的資源標識符,并將注冊狀態注上“合格”,注冊機構將政務信息資源注冊標識符及注冊元數據信息,錄入政務信息資源注冊數據庫,并通知提交機構和主管機構注冊成功;提交機構與其主管機構收到注冊成功通知后,要求對項目進行檢查,確認政務信息資源有效,如果查出有錯,應立即通知注冊機構。如果核實無誤,政務信息資源的注冊狀態注上“有效”,表示此申請注冊的政務信息資源處于可用狀態。對審核通過且確認有效的政務信息資源,注冊機構通過政務信息資源目錄服務系統對外。政務信息資源注冊管理中主要有資源提交者、注冊管理者和資源使用者分別完成信息資源提交、資源注冊管理和資源的檢索利用。資源提交者從本部門業務系統和數據系統中提取信息資源,編目形成資源描述元數據:資源注冊者將受理的資源元數據信息注冊到政務信息資源元數據庫中,并通過目錄服務平臺生成資源目錄,提供查詢服務。資源使用者通過政務信息資源目錄交換平臺對政務信息資源進行檢索、查詢和獲取。
2)元數據庫對注冊過程的要求
注冊過程的目的是為了將信息資源注冊保存到信息資源元數據庫中,注冊系統和元數據庫是相互支持的模塊,為了更好的管理元數據,在注冊過程中就應該做好下列工作。
(1)政務信息資源的分類分級
政務信息資源涉及面廣,覆蓋了幾乎一切國民經濟部門,跨社會各行各業,所以其數量巨大,種類繁多。為了對政務信息資源進行有效地管理,對政務信息資源進行合理的分類是至關重要的。對政務信息資源有很多種分類方法,例如根據政務信息資源所屬的政府部門劃分,根據政務信息資源服務的對象劃分,根據政務信息資源的安全等級劃分等。為了方便對政務信息資源進行注冊和管理,在政務信息資源的注冊管理系統中,采用一定的分類方案對政務信息資源進行分類,具體的分類方案可以參考國家標準《政務信息資源目錄體系第四部分》中提供的三種分類方案:按主題的分類方案,按行業的分類方案,按服務的分類方案和按資源形態的分類方案。
(2)電子政務信息資源的驗證與測試
注冊機構要對已受理的政務信息資源的元數據進行驗證和測試,驗證工作主要是進行一些基本的檢查,以減輕審核階段的工作,測試主要是對元數據的語法、格式進行檢查。其工作大致包括:檢查各個描述元素的名稱和屬性是否符合規范;檢查資源實例XML文檔元素的層次結構是否符合標準規范;檢查元素的取值是否符合標準中規定的編碼體系方案;驗證網絡資源是否可以通過信息資源元數據提供的訪問方式獲取;驗證不合格或者測試不通過,通知提交機構測試結果和修改意見,并要求提交機構修改后重新提交。
(3)電子政務信息資源的審核
對“已受理”的政務信息資源,注冊機構要進行審核。審核要作如下工作:檢查資源存放地址是否正確,即檢查資源是否存在;資源描述信息中的題目等屬性與資源實體中的屬性是否相符;資源描述信息中的關鍵字是否符合規范;審核通過,分配正式的資源標識符,并將注冊狀態注為“合格”;審核沒通過,將注冊狀態注為“不合格”,并通知提交機構審核結果和修改意見,由提交機構修改以后重新提交。
經過上述過程,注冊機構將通過驗證和測試的政務信息資源描述元數據存儲到政務信息資源元數據庫中,政務信息資源處于“有效”狀態。
2元數據庫在目錄交換系統中的應用
在政務信息律源目錄交換體系中,元數據庫擔負著及其重要的作用,公共資源目錄和交換目錄都是建立在相應的元數據庫上的。在元數據操作的基礎上將提供者所注冊的信息資源信息表示成目錄形式為使用者服務。借助信息資源目錄體系,就可以實現在政府部門分布式海量數據中的信息定位、發掘和提取,迅速地從其所涵蓋的各委辦局的信息中發現與其需求匹配的信息資源,進而獲取并利用,實現決策支持、協同辦公和信息上傳下達等作用,實現信息資源的有效整合;通過目錄體系中對各類信息資源進行描述、引用等,為分散異構(各委、辦、局)的各類信息資源的共享交換提供基礎性支撐;按照統一的規格和方式實現對不同類型的各類信息資源的分類描述。
檔案目錄是按照一定的次序編排而成的條目匯集,是檔案管理、檢索和報道的工具。①經過長期的實踐和積累,檔案機構根據豐富的館藏和多樣的檔案利用需求,形成了管理型、檢索型、報道型等多種類型、不同結構的檔案目錄。隨著相關技術的發展,檔案目錄逐漸從以卡片式、書本式為主的手檢目錄發展為機讀目錄;進入電子文件時代,檔案目錄數據庫成為了主流形式,實現并擴展了檔案目錄的各項功能。無論檔案目錄以何種形式存在和表現,其編目都是按照一定的著錄項目、著錄格式、著錄符號、著錄用文字等著錄規則,對檔案的內容和形式特征進行分析、選擇和記錄的過程,以及按照科學的規則和方法,把檔案條目組成系統的檔案二次信息系統的過程。
政務信息資源目錄體系以國家統一的電子政務網絡為基礎,通過構建覆蓋中央、省、市、縣的多級政務信息資源目錄體系技術總體構架,采用元數據對共享政務信息資源特征進行描述,形成統一規范的目錄內容,通過對目錄內容的有效組織和管理,形成部門間政務信息資源物理分散、邏輯集中的信息共享模式,提供政務信息資源的發現定位服務,支持全國范圍內跨部門、跨地區的普遍信息共享,方便用戶發現、定位和共享多種形態的政務信息資源,支持政府的經濟調節、市場監管、社會管理和公共服務。②
首先,檔案目錄和政務信息資源目錄體系的目的和作用具有一致性。它們都是運用了目錄控制的思想,將目錄作為組織管理和檢索利用信息資源的一種基本機制。它們都是通過在微觀上著錄、標引、規范控制和在宏觀上利用選擇、描述和檢索控制等手段,實現對信息資源的整合、管理、發現與定位,協調和引導信息資源的流動和有效利用,以此解決信息組織、分類、存儲、檢索、定位、獲取等問題。比較而言,政務信息資源目錄體系更偏重于檢索型目錄,是通過建立信息庫系統和目錄內容服務系統,方便用戶發現、定位所需的政務信息資源,促進信息資源的共享和利用;而檔案目錄是以檔案管理為基礎,根據檔案目錄類型的不同,相應地側重于管理、檢索和報道,或是幾種用途的組合。
其次,檔案目錄和政務信息資源目錄體系的編目內容具有內在的聯系。據統計,目前各級政府部門的政務信息資源約為全社會信息資源總量的80%,其中約50%的政府信息在辦理和使用完畢后作為檔案存入檔案保管部門,有的地區政府形成的檔案甚至達到當地檔案館藏的絕大多數。如圖1所示,在《政務信息資源目錄體系》中,檔案是政務信息資源的主要內容之一;而從檔案資源的角度看,政務信息資源是館(室)藏檔案的重要組成部分。
如果說文件與檔案表示的是同一事物的不同運動階段,那么政務信息資源與檔案也相應的存在這種同一事物先后相連的內在聯系。如圖2所示,隨著時間的推移,政務信息資源由現行利用,經歸檔過渡到檔案室保管階段,滿足一定條件后移交至檔案館保管利用。我們可以姑且將政務信息資源與文件等同理解,只不過政務信息資源在載體形態、服務對象、管理及利用方式等方面與傳統紙質文件有所不同。
政務信息資源歸檔后,在檔案室保管階段,為便于管理利用,也需按照有關標準形成室編目錄;移交進館的檔案,還須由檔案館賦予檔號等著錄內容,作為管理、檢索利用等的標識。我國檔案目錄早已有之,以檔案館編目錄為主且相當成熟穩定。室編目錄也屬檔案目錄范疇,其編目對象亦可列入政務信息資源目錄體系中。可以說這部分具有同源性的信息資源將檔案目錄和政務信息資源目錄體系緊密地聯系了起來。但我們目前通常所說的檔案目錄是指館藏檔案目錄,我國于2007年正式的政務信息資源目錄體系與之相對獨立,因而政務信息資源目錄體系與檔案目錄是對同一事物所處的不同時間階段進行的獨立編目。
由于目前這兩個目錄之間并未建立起關聯,那么,處于政務信息資源目錄體系之下的應歸檔或已歸檔的信息資源,在進入檔案館保管階段并經館編目錄加以管理和控制之后,不易再通過原利用體系獨立對其進行查找利用;檔案館也不易通過目錄控制的方式對應歸檔及尚未進館檔案進行前端控制和全程管理。
二、檔案目錄與政務信息資源目錄體系編目的比較
正因為檔案目錄和政務信息資源目錄體系之間內在的聯系,且無論是檔案目錄還是政務信息資源目錄體系,目錄編制均為核心,由此對二者進行比較。
(一)檔案目錄的著錄項目與政務信息資源目錄體系中核心元數據的比較
著錄項目是檔案目錄的基本構成單元,是編制檔案目錄的基礎和條件。元數據是描述政務信息資源特征的數據③,在政務信息資源目錄的編目、建庫、和查詢中發揮著重要的作用。因此我們將《檔案著錄規則》(DA/T18—1999)規定的著錄項目、《政務信息資源目錄體系》核心元數據及《北京市綜合檔案館目錄數據庫結構與數據交換格式》中部分數據庫的著錄項目進行比較。
1、《北京市綜合檔案館目錄數據庫結構與數據交換格式》中的文書文件、案卷目錄庫的著錄項目基本使用了《檔案著錄規則》中的著錄項目,但省去了稿本與文種項、載體形態項、附注與編號項等著錄項目中的內容,增加了開放狀態、檔案復制類型及編號等著錄內容。案卷目錄數據庫和文書檔案文件目錄數據庫同屬管理型目錄,但著錄項目也因級次的不同而有差異。所以在編制檔案目錄時,著錄項目的選定并非一成不變,而是要根據目錄類型、級次、專題、分類方法等的不同加以選擇。此外,無論是《檔案著錄規則》規定的著錄項目,還是《北京市綜合檔案館目錄數據庫結構與數據交換格式》中列出的字段名稱,都是反映文件或案卷的內容和形式特征,而不包括相應的結構和背景信息。
2、檔案著錄項目與《政務信息資源目錄體系》中核心元數據的關系:(1)交叉關系。如信息資源名稱、信息資源摘要、信息資源提供方、信息資源日期、關鍵字等核心元數據與檔案著錄信息中的題名、責任者、提要、時間項、關鍵詞等,可以通過技術等手段進行轉化。(2)不是所有核心元數據都是檔案著錄信息源,如全宗號、目錄號、案卷號、頁(件)號、縮微號、載體類型、密級、保管期限、開放狀態等明顯體現檔案專業特性的著錄項目,無法從元數據中提取,需要人工進行編制。(3)有些核心元數據,如信息資源標識符、元數據標識符等可以在文件形成與管理過程中自動形成的元數據實體及元素,目前在檔案目錄中尚未體現;對信息資源分類的有關信息、在線資源鏈接地址、服務信息、元數據維護方等核心元數據的著錄內容,也尚未列入檔案目錄的著錄信息之中。
(二)檔案著錄條目和政務信息資源核心元數據編排組織的比較
檔案目錄和政務信息資源目錄體系共有的條目編排方法是按主題類別分類編目。我們就以此對二者進行分析比較。
檔案分類標引時,應首先對檔案文件進行周密地主題分析,確定文件、案卷所論述的事物中,哪些主題應予以標引,能為利用者提供檢索途徑,然后根據主題性質,到《中國檔案分類法》中查找其所屬的類目④,并準確地給予分類標識。政務信息資源的主題分類也是通過對主題分析的結果進行分類,再確定類目名稱和類目編碼。不同的是:
1、分類依據。檔案主題分類主要依照《中國檔案分類法》,政務信息資源分類主要依據《主題分類類目表》。
2、類目設置?!吨袊鴻n案分類法》設置了19個基本大類,每一基本大類下再根據需要設置若干屬類。而《主題分類類目表》則規定了21個一級類及133個二級類。
3、標識符號。檔案分類采用漢語拼音字母與阿拉伯數字相結合的混合號碼制,用一個字母表示一個大類,以字母的順序反映大類的序列。在字母之后,采用數字編號制,用數字表示大類下類目的劃分,數字的位數一般代表類目的級位,遵循層累制原則。⑤政務信息資源目錄體系中類目代碼編制規則是:分類類別用1位大寫羅馬字符表示,“Z”代表主題分類;一級類用1位大寫羅馬字符表示;二級類用1位大寫羅馬字符及2位阿拉伯數字表示。即在主題分類中,分別用“A”至“W”標識21個一級類,用大寫羅馬字符“A”至“Z”加兩位阿拉伯數字“00”標識二級類。
4、著錄要求。在《檔案著錄規則》和《北京市綜合檔案館目錄數據庫結構與數據交換格式》中,分類號分別為必選項、可選項,且均無著錄類目名稱的規定;在《政務信息資源目錄體系》中,“信息資源分類”是必選核心元數據,其中包括分類方式、類目名稱、類目編碼等元數據元素。這在一定程度上體現了檔案分類標識和政務信息資源類目編碼在檢索利用頻次和各自目錄系統中地位的不同。
(三)檔案目錄與政務信息資源目錄體系編目技術的比較
隨著計算機技術的發展和普及應用,紙質檔案目錄逐漸淡出,檔案目錄數據庫形成規模。由于我國尚未出臺全國統一的檔案目錄數據庫結構標準,因此本文參照《北京市綜合檔案館目錄數據庫結構與數據交換格式》及《政務信息資源目錄體系》編目系統技術要求,對二者主要的編目技術進行比較。
1、檔案編目要根據目錄作用和編目對象特征、級次、序列等,有針對性地具體設定符合實際利用需要的各種檔案目錄數據庫結構表、使用說明與數據交換格式。政務信息資源的編目要根據編目對象的具體粒度采用不同的單位編目。
2、檔案目錄數據庫普遍為Xbase關系型數據庫。在編制檔案目錄時,首先根據規定,在數據庫管理系統中設定目錄字段名稱、字段名、字段類型、字段長度等,再由人工將著錄信息插入到該數據庫相應的表格中。而插入過程只能針對事先定義好的字段結構。這一過程對未被事先定義字段結構的著錄內容無能為力,除非更改數據庫結構,如增加表的字段或者新的數據庫表??缙脚_、跨系統的數據交換是通過擴展名為.DBF的Xbase關系型數據庫文件格式實現。⑥經過壓縮、分割處理的數據交換文件,應將其解壓縮、合并后再進行交換。⑦
3、政務信息資源目錄體系基于XML技術。XML應用面主要分為文檔型和數據型兩種類型。前一類型中,XML存放整個文檔的XML數據,然后XSLT將XML轉換、解析,結合XSLT中的HTML標簽,最終成為HTML顯示在瀏覽器上。而后者則是利用相關的XML API(MSXML DOM、JAVA DOM等)對XML進行存取和查詢。XML還可以作為信息傳遞的載體,主要是為分布式應用程序服務。XML文本本身不僅可包含信息內容,還涵蓋了信息結構。只要是格式正確的XML文本,都可以隨時添加到數據庫里,并可以與分布式的應用進行數據交互。比較而言,XML和數據庫的聯合兼有關系數據庫和面向對象數據庫的優勢,因此基于XML技術的政務信息資源目錄比目前的檔案目錄數據庫更具擴展功能。此外,對編目對象、分類技術等的比較前文已有表述。
三、檔案目錄體系
與政務信息資源目錄體系的交互融和
基于檔案目錄與政務信息資源目錄體系的內在聯系及上述異同點的比較,我們可以考慮在現有的檔案目錄與政務信息資源目錄體系之間建立交互渠道。具體做法是建立檔案著錄項目和政務信息資源目錄體系核心元數據的映射關系,利用已有技術,采用現階段比較流行的WEB數據庫方式進行處理,使系統可以根據用戶的檢索請求,檢索相應的目錄數據庫,并將查詢記錄,以WEB的形式反饋給用戶,同時實現多種模式檢索服務,滿足不同權限用戶異地查詢需求。在實際操作中應考慮的問題主要有:
1、檢索質量。檔案著錄項目和核心元數據在含義、編排組織、條目涵蓋范圍、特征等方面存在差異,如不能嚴格定義好映射關系,可能導致映射不清,擴大或縮小檢索范圍,從而影響查全率和查準率等檢索指標。
2、檔案館內各目錄數據庫之間的系統關聯。檔案館如不能將各層級、類別的目錄數據庫系統組織關聯起來,充分發揮、擴展如檔號等共有著錄項目功能,將不利于實現兩個目錄體系的雙向映射,還可能增加檢索的復雜度,從而影響檢索質量與效率。
3、使用權限。檔案目錄與政務信息資源目錄體系建立交互,在為利用者提供便利的同時,也可能帶來檔案內容安全的高風險,因而還應考慮對不同檔案利用者加以權限設定,設置針對立檔單位、查閱已開放檔案、查閱未開放檔案、查閱公民個人檔案信息等的不同接口,以滿足利用者通過一體化利用服務平臺,在相應權限內同時查閱檔案和政務信息資源中有關信息的利用需求,并盡可能保護好檔案安全,避免未到期或不宜開放的檔案向社會開放。
總之,我們可以嘗試利用檔案目錄和政務信息資源目錄體系之間的關系,建立交互渠道,以促進檔案和政務信息資源的共享和利用。但是,我們也不能忽視實際操作中可能出現的上述或是更多有待進一步研究探討的問題。
注釋:
①DA/T18-1999《檔案著錄規則》
②③GB/T21063.1-2007《政務信息資源目錄體系 第1部分:總體框架》
信息工程監理是最近幾年興起的保障信息化建設質量的一種約束機制。它采用“五控兩管一協調”的控制模式,對業主、承建單位的項目行為實施監督,保障信息化建設的質量,避免“豆腐渣”工程,起著不可或缺的重要作用。
一、信息化建設與知識管理
信息化建設是以知識管理為核心,信息資源為基礎,提高組織核心競爭力為目的的全面整合或再造組織業務流程的過程。知識管理是獲取、儲存、學習、共享、創新知識的管理控制過程。在信息化建設中,企業、政府等組織通過知識管理,從現有的業務流程和數據中,挖掘、獲取并確定各類知識資源,定位擁有專業知識、經驗的個體,將個體的知識、經驗、信息提升為組織的知識資源,有序傳遞、整合、規劃和有效利用知識資源,有助于提高組織的整體業務、技術和管理水平。
在承建單位實施信息化建設中,知識管理是通過公司內雇員、部門、可能的跨國公司合作、與業主的溝通協調,傳遞、整合、有效利用本單位的知識資源,運用信息技術,通過設計最優技術方案、控制施工質量,共享和創造知識價值。
在信息化建設中,對組織內各種各類知識進行評估,挖掘、獲取真正有用的知識。知識不僅僅是信息,是顯性知識和隱性知識的集合。通過評估,區分知識和信息、知識管理和信息管理,以實現資源的充分開發與應用。
整合或再造業務流程,是與知識管理密切相關的。1990年美國管理專家Michael Hammer提出了“業務流程重組”(Business Process ReengineeringBPR)的概念,它是以用戶需求為導向,信息化、知識化為基礎,對用戶的業務流程進行再思考、關鍵性的重新設計和根本的變革,從而獲得在成本、質量、服務和速度等方面業績的持續改善。在業務流程重組中,信息(知識)的獲取、分類、存儲、利用,只有與知識管理結合,才能夠發揮更有效的作用。
知識管理技術貫穿于信息化建設始終,它與信息技術相輔相成。在知識獲取、學習、共享、創新的過程中,整合各種信息技術,構建完整的知識管理體系,是知識經濟時代信息技術的新發展。
二、信息資源規劃和整合
信息資源整合(Information Resource Integrating, IRI)的前提是進行統一的信息資源規劃(Information Resource Planning, IRP),消除“信息孤島”,共享信息資源。信息資源的規劃是實施信息化工程的基礎,IRP的基礎是建立信息資源管理基礎標準,IRI的實質是通過信息技術改造、重建或重構數據環境。信息產業部的《信息系統工程監理暫行規定》中定義信息資源系統為“以信息技術為主要手段建立的信息資源采集、儲存、處理的資源系統”。
在信息化建設中,信息資源規劃是很重要的一環。在組織的生產、經營、服務活動中,會產生大量的數據、資料、指標、圖紙、報表及其它顯性資源,也存在各種各類的知識、擁有專業知識和經驗的個體等隱性資源。信息資源規劃是對實施信息化后產生、控制、使用這些資源進行識別和分類;評估、挖掘、獲取、共享各類知識;對承載信息資源的信息基礎設施進行分析、設計和指導。
(一)信息資源規劃的主要任務
信息資源規劃的任務是對支撐業務流程的邏輯相關的數據進行分類,建立具有結構化、標準化、一致性的共享數據庫。分析業務流程重組后產生、控制和使用的數據,了解各種數據的內容、范圍、可靠性等,理解數據的共享要求和應用策略以及數據使用中的問題,使信息資源規劃能夠滿足數據資源的管理要求。
(二)信息資源管理標準
信息資源管理標準是指決定信息系統質量的、進行信息資源開發利用的基本標準。威廉·德雷爾1985年在其《數據管理》專著中總結了信息資源管理的基礎標準———數據管理五項標準,內容如下:
1.數據元素標準。數據元素(Data Elements)是信息資源中最小的信息單位,是抽象的數據對象。它的質量是構建穩定的數據結構基礎的關鍵。數據元素標準包括數據元素命名標準、標數據元素識標準和數據元素一致性標準。
2.信息分類編碼標準。是信息標準中的基礎標準。信息分類編碼(Information Classifying and Coding)的對象,是一些最重要的數據元素,自動處理、檢索、存儲和傳輸信息的質量及效率與這些元素緊密相關。信息分類是根據信息內容的屬性或特征,將信息按一定的原則和方法進行區分和歸類,并建立一定的分類系統和排列順序,便于管理和使用信息。信息編碼就是在信息分類的基礎上,將編碼對象賦予有一定規律性的、易于計算機和人識別和處理的符號。信息分類編碼工作要確定每個編碼對象的編碼規則、碼表結構和代碼表。
3.用戶視圖標準。用戶視圖(User View)是一些數據元素的集合,表示用戶對信息需求和數據實體的最終解釋。用戶視圖是數據的系統外在表現形式,是系統的輸入、輸出媒介和手段。用戶視圖與外部數據流是同一詞,來自某個數據源或流向某個數據接收端的數據流。常用的用戶視圖有紙面的,如圖紙、單證、表單、報表、賬冊等;有電子的,如屏幕格式等。
4.概念數據庫標準。概念數據庫(Conceptual Database)是用戶對數據存儲的最終解釋。用戶的信息需求,應首先界定概念數據庫。概念數據庫是綜合信息資源用戶的數據要求構成的全局數據庫,表示數據庫的整體數據組織狀況和邏輯結構。
5.邏輯數據庫標準。邏輯數據庫(Logical Database)是系統分析設計人員的解釋。在關系數據庫模型中,邏輯數據庫是一組規范化的基本表(Base Table),是從概念數據庫中映射出的所需信息。邏輯數據庫表示的是局部數據的數據庫邏輯結構。
(三)信息資源規劃方案
在定義數據管理標準的基礎上,制定信息資源規劃方案,為業務流程重組提供依據,為系統設計提供基礎。
在信息資源規劃中,將隱性資源轉變為顯性資源,有序傳遞、整合、規劃和有效利用各類知識資源。因此,信息資源規劃是資源的知識管理規劃。信息技術的投資,可能不會給企業帶來明顯的效益,因為基于信息的競爭優勢正在逐漸轉變為基于知識管理的競爭優勢,以信息資源規劃為核心的信息系統規劃,如果不實施知識管理,將不會產生顯著的信息化效益。
信息資源的分類是一種從主題內容角度組織和揭示信息資源的方法,是分類方法在信息資源組織中的應用。目前對信息資源的分類主要采取兩種方式:一是以人工標引為基礎的傳統文獻分類法。二是更具網絡信息資源特點而產生的自編等級式主題分類法,又叫網絡分類法。傳統分類法主要是根據文獻信息的特點、檢索的需要和技術的支持程度,按照傳統環境的特點編制的。網絡環境的出現、計算機及其檢索技術的迅速發展與應用以及網絡環境下信息資源的幾何級數式的增長,極大地改變了分類法處理的對象和技術環境。這就為網絡中的自編等級式主題分類法的產生與發展創造了條件。自編等級式主題分類法根據網絡信息資源的結構內容特點,結合用戶使用的需要,逐步成為區別于傳統文獻分類法的網絡中通用的信息資源分類法。
1網絡分類法與傳統文獻分類法的不同
1.1建立分類體系的原則不同
文獻分類法一般是以學科為中心,對各種文獻資源以主題的方式集中于相應學科之下。在分類法發展的歷史上,曾經出現過英國布朗編制的以主題為中心的主題分類法,但由于不適合使用以及文獻資源本身的特點,所以沒有得到廣泛的使用。網絡新環境的出現,使得以主題為中心或者以主題為主結合學科特點的分類法有了應用的空間。應用這種分法的英文搜索引擎中,opendirectory、looksmart基本以主題為中心展開信息資源的分類,其分類專指性強。yahoo!則是采用以主題為中心、結合學科的方式。除按照主題設置類目外,還設置政府與政治、科學、教育和社會科學等專門學科類目與包含內容較寬的類目。
1.2類目的展開形式不同
傳統分類法多基于學科的等級隸屬關系,按照嚴格的邏輯內容從屬劃分,是一個嚴密的、深細的線形體系。網絡分類法層次較少,體系簡明。為了突出重點,不嚴格按照等級劃分,類目的設置也不嚴格完整。傳統分類法一次劃分采用一個標準,網絡分類法為了方便用戶查找與符合網絡信息資源的特點,一次劃分采用多個標準且各主題之間使用超文本鏈接和多窗口顯示。使信息資源得到全面的揭示。
1.3基本大類的設置不同
傳統分類法的類目設置一般根據傳統文獻信息資源和一定的用戶特點進行,重視學科性、邏輯性,設鬣較全面完整。網絡分類體系則根據用戶需求的不同與網絡信息資源的分布不同,以用戶關注程度高、信息資源集中的類目作為基本大類。
2網絡分類法存在的問題
2.1類目展開缺乏規律性
類目的展開缺乏統一的標準。其下位類展開過程中,不少類目同時采用多個分類標準,同時忽略類目展開的完整性。由于下位類的展開往往內容外延過寬,增加了用戶的查詢時間,降低了檢準率。
2.2同位類設置缺乏邏輯性
同位類中往往有不同等級、不同層次的類目共存,且同位類內容交叉從屬缺乏規律性。例如,yahoo!中科學與社會科學在概念關系上就不屬于同一個等級。
2-3類目排列缺乏規范性
英文搜索引擎大都是按照字順的方式排列同位類,其優點是便于用戶按字順查找,缺點是類目排列混亂,不利于相關類目的蠢找。而中文搜索引擎多數不采用字順的方式,而采用以用戶關注類目的程度來排列。這種按關注程度或者說按點擊率排列的方式加大了類目增補的難度,而且不易保持同時也不利于揭示相關類目。
2.4橫向關系揭示缺乏科學性
傳統分類法對橫向關系,一般通過交替類目和類目參照揭示,作為類目縱向關系的一種補充。網絡分類體系則使用鏈接方式,通過在相應類下重復反映,使其成為類目關系的有機組成部分。這也顯示出橫向關系揭示的單一性。在處理過程中缺乏相關關系的控制,憑借鏈接技術的發展使得對于類目的相關揭示更加寬泛。
3網絡分類法選擇的必然性
3.1網絡分類法選擇的競爭行為分析
目前,國外yahoo!open directory、looksmart已經證明網絡分類法的實用性以及其已被廣大用戶接受,雖然這種分類法存在不少問題,但根據網絡效應的概念:當一種產品或服務給某個消費者帶來的價值或效用,與其他使用這一產品或服務的消費者人數具有正向關系時,即存在網絡效應。國內后來的網絡公司,如搜狐、新浪等,都采用類似的分類思想,制定出相似的分類法。另外,如果這些后續的公司有一家公司a決定采用與傳統分類法類似的分類方式,我們命名為科學化,令yahoo!open directoyr、looksmart等的為生活化,則該公司面對的競爭博弈如下圖所示:
圖中數字表示客戶的數量比例的數字抽象,由這個博弈模型可看出,其均衡為公司a選擇生活化,即無論其他公司選擇哪種分類法,公司a選擇現行的網絡分類法均能擁有最大化的市場占有率。
3.2網絡分類法實用的必然性
3.2.1用戶需求的特點
網絡信息資源的用戶非常廣泛,而且不穩定,受教育程度差異較大,利用網絡信息的目的和類型也有很大不同。網絡資源用戶上網利用的絕大部分是現行網絡分類體系所反映出的突出教育、娛樂、旅行、生活等與日常生活密切有關、普通用戶感興趣的類目,弱化了科學技術、學術性類目的設置。
3.2.2網絡信息資源的特點
在學習完前面的信息獲取、加工、集成與交流之后,應對這些信息資源進行有效的管理,才能為我們所用,更好地發揮信息的使用價值。
2.主要內容
本章主要通過三個層次來讓學生了解如何進行信息資源管理,掌握適應社會工作和生活的必要技能。
三個層次遵循了信息資源管理發展的歷史軌跡,通過這三種信息資源管理方式的比較,更加深刻地使學生理解信息資源管理的重要性以及科技發展對信息資源管理的影響。
二、教學目標
1.知識與技能
(1)了解信息資源管理的一般過程;(2)了解信息資源管理的重要性和普遍性;(3)理解信息資源管理的分類組織和標準化思想;(4)合理選擇常用工具,管理個人學習、工作、生活中的信息資源;(5)了解利用數據庫管理信息資源的工作思想;(6)理解數據庫存儲、管理大量信息和高效檢索數據的優勢;(7)能夠把數據庫的一些常見操作技能遷移到今后的學習工作中去;(8)能夠公正地評價三種信息資源管理方式及其對社會和個人的影響。
2.過程與方法
(1)了解信息資源管理的一般過程(從學生身邊的、已有的學習經驗出發,以圖書館藏圖書管理這一具有代表性的實例為依托,讓學生調查了解信息資源管理的一般過程);(2)以“ISBN”引入分類與標準化思想;(3)能夠利用恰當的工具,將信息資源進行數字化管理;(4)體驗、認識數據庫管理大量信息資源的過程。
3.情感態度與價值觀
(1)主動將信息資源管理的思想、方法創造性地應用到生活、學習之中;(2)養成信息資源管理的良好習慣;(3)養成奉獻精神及樂于助人、團結協作精神;(4)正確評價標準化對實現社會生產、管理規范化的影響。
三、教學重點與難點
教學重點:信息資源管理的一般過程,分類組織及標準;個人數字信息資源管理的實踐;數據庫管理大量信息、高效檢索的優勢;信息資源管理對我們今后生活的影響。
教學難點:管理本地計算機信息資源;數據庫存儲、管理大量信息為什么有優勢。
四、課時安排
節 次 參考課時數
第一節 信息資源管理的目的 0.5課時
第二節 信息資源管理的方式 0.5-1.5課時
第三節 使用數據庫管理信息 約2課時
五、教學建議
1.信息資源管理的目的
“信息資源管理”對學生來說是一個新名詞,教師應該讓學生先具有一定的感性認識。因此,建議先讓學生參與一些(或一項)信息資源管理的活動,或者進行信息資源管理的調查(可與研究性學習結合起來),或讓學生留心身邊的有關信息資源管理活動,這樣便于學生對教師所講的內容產生共鳴,教師才能“有的放矢”。
圖書館藏書管理是讓學生了解信息資源管理的一般過程很具代表性的實例,當然也可以以學生整理自己的“小書屋”來說明,也可以以實踐“探究分類搜索的分類方法”來探究網上圖書、信息等資源是如何管理的,這樣可以讓學生更好地理解第三節《使用數據庫管理信息》。在介紹完一般的信息管理過程的基礎上,教師應進一步引導學生去探索,讓他們去比較、發現信息技術對信息資源管理帶來的深遠的影響。
分類組織與標準的教學,可以從商品的條形碼、國際標準書號(ISBN)、國際刊號(ISSN)等入手,讓學生自主探究為什么要分類、如果不分類組織會有什么后果、如何分類,要有一定的標準和標準化思想的形成。
2.信息資源管理方式
一是手工管理方式,二是計算機管理方式(又分文件管理方式和數據庫管理方式)。它們是一般與特殊的關系,即從一般意義上的信息資源管理縮小到僅僅講計算機管理方式。 計算機管理方式實例比較多,教材給出了五例。如:“用電子表格管理個人財務”可創設一個情境,讓學生在緊接著的實踐中體驗如何管理財務和樹立對金錢的正確態度;“用資源管理器管理本地計算機資源”、“用 Blog管理網上學習資源”是對該實例相關知識或理念的說明;再如“用收藏夾分類管理喜愛的網站”或“文曲星的使用”等也是相關示例。通過本章學習,教師要引導學生養成良好的計算機信息管理習慣,并處理好個人與集體的關系。如用Blog管理網上學習資源既能體現個人信息管理又能兼顧集體交流。
3.使用數據庫管理信息
本節是學生尚未接觸過的內容,因此實踐對促進學生理解將具有重要的作用。建議教師在學生實踐的基礎上,引導學生自己去發現問題和總結規律。教師在講解時要多考慮學生已有的知識,盡量引導學生進行知識、技能和方法的遷移。
2高校圖書館開展網絡信息資源組織與管理的意義
網絡環境下,評估高校圖書館水平不再局限于館舍規模和館藏數量,而取決于信息服務手段的自動化、信息服務形式的多樣化、信息服務效率的高效化,以及信息服務資源的網絡化等。高校圖書館能否在這些方面做得更好,主要取決于網絡信息資源的組織與管理。
2.1可以提高網絡信息資源的利用價值當今社會對信息需求13益復雜,互聯網的首要目標是為社會公眾提供有價值的信息.但信息的價值是難以確定的。高校圖書館在參與網絡信息資源組織的過程中。將網上無序的、不均衡的數字化信息資源按照一定的標準進行排列整理,使其有序化,并對其進行選擇和判斷。使分散無序的信息轉化成有利用價值的資源。
2.2可以提高用戶使用網絡信息資源的效率網絡信息爆炸式增長使知識存貯無序化。進而加劇了信息泛濫;知識的增長速度遠遠低于信息的增長速度,導致了人們獲取知識受阻。高校最主要的任務是教學和科研。高校圖書館通過開展網絡信息資源組織和管理,將雜亂零散的、不便于用戶檢索查詢的、在線利用率低的信息資源經過科學的重組,實現信息資源結構由“信息資源”向“知識體系”轉化.成為分類科學、層次明顯的知識體系。就能為教師、學生、科研人員的學習和研究活動提供參考信息。提高用戶使用信息資源的效率。
2.3可以減少信息污染與傳統文獻信息資源相比,網絡信息資源具有數量巨大、內容龐雜、傳播面廣、非控制性等特點。高校圖書館按照統一的規范和質量控制標準.對網絡信息資源進行過濾,從而達到減少信息污染、凈化網絡空間的作用,有利于大學生身心全面、健康地發展_2]。
3高校圖書館開展網絡信息資源組織與管理的優勢
與其他社會機構、團體相比,高校圖書館開展網絡信息資源組織和管理具有以下優勢:(1)服務優勢。高校圖書館在提供知識服務、信息處理等方面的能力強于其他信息機構。(2)人才優勢。高校圖書館具有一大批懂圖書館學、計算機技術等方面的專業人才。(3)經費保障優勢。各高校幾乎都把圖書館列為其重點建設對象,高校圖書館成為衡量一所高校建設發展狀況乃至教學科研能力和水平的重要標志,在經費上給予保障。
4高校圖書館開展網絡信息資源組織與管理存在的問題
當前,高校圖書館在對網絡信息資源進行組織和管理方面存在以下問題:(1)大多數高校圖書館未能建立適合本校教學特點的網上檢索工具和組建學科導航庫,甚至還有不少圖書館未購電子圖書庫、電子期刊網,沒有建立與CALIS等的鏈接,網絡信息資源的存儲位置受到控制,使多數讀者感到檢索、利用網絡資源困難。(2)高校圖書館大多使用商用網絡資源目錄和搜索引擎組織信息,這使得用戶在利用這些工具獵取信息時.由于缺乏統一、規范的分類體系和標引方式,獲得的信息缺乏嚴密的科學性和邏輯性,信息質量參差不齊。(3)許多高校圖書館電子閱覽室規模龐大,但使用者卻始終不多,電腦閑置現象普遍。即使有學生使用,但大多也是為了上網漫游,很少與獲取學術信息有關[。其影響因素是多方面的,但圖書館缺乏對網絡信息進行有效的組織和管理是一個重要原因。(4)網絡環境下館員應具備“專家型”素質,應能夠充分利用先進的信息技術.對館藏資源進行深層次開發,以健康有序的信息資源全方位滿足用戶需求。但目前我國高校能達到這樣素質要求的館員數量仍是少數。
5高校圖書館開展網絡信息資源組織與管理的原則及方式
5.1組織與管理原則
由于網絡信息資源的海量增長且良莠不齊.高校圖書館必須按照一定的原則組織信息資源,以滿足讀者需求(1)針對性原則。高校圖書館應根據學校的學科建設和科研工作以及本館的特點、軟硬件條件、發展目標等開展網絡信息資源的組織和管理。在充分做好用戶信息需求咨詢和調查工作的基礎上,有重點、有目的收集利用價值較大的信息,建立起有自身特色的數據庫館藏與合理的館藏資源體系.實現網絡信息資源開發的最大效益。這就要求高校圖書館要提高工作人員的相關業務素質和技能,創建友好的界面,提供安全有效的主頁鏈接,為師生用戶服務。(2)選擇性原則。圖書館應采取多種渠道和方法選擇信譽好、可信度高、專業的權威網站,按制定的標準系統地進行選擇和鑒別,下載對本校學科建設有用的高水平、連續性信息。在不違背版權的前提下,將最準確、最有價值的信息提供給師生用戶。(3)時效性原則。高校圖書館開展網絡信息資源組織活動時要注重時效,跟蹤網絡信息的動態變化。第一時間為師生用戶提供最新的有學術價值、能反映本學科前沿發展水平的網上學術信息。(4)系統性原則。高校信息用戶多從事系統的研究和學習,出現對循序漸進閱讀的需求和對參考咨詢不斷深入的需求。在經費有限的情況下,要滿足各類用戶的需求,就要求高校圖書館必須從自身實際發展狀況出發,協調處理現有館藏資源和網絡信息資源之間的關系。在網絡信息資源收集組織過程中做好總體規劃,有所比較、有所分析,逐步確立各類信息資源的合理比例關系,避免重復建設。做到資源互補.強化館藏的系統性[4],使信息資源結構的合理性、科學性同用戶需求的系統性相一致。
5.2組織與管理方式
目前高校圖書館組織和管理網絡信息資源的方式主要有以下幾種:
(1)文件方式。以文件系統來組織和管理網絡信息資源,主要用于存貯圖形、圖像、圖表、音頻、視頻等非結構化信息,補充其他信息組織方式。但它難以平衡網絡負載與文件數量的關系。對結構化信息的組織顯得軟弱無力。
(2)超媒體方式。這是超文本技術與多媒體技術的結合.用超媒體方式來組織網絡信息資源,將網上所獲得的各種媒體(文字、音頻、圖像、視頻等)的信息資源利用超文本技術有機地編織在一起。使人們可以通過高度鏈接的網絡結構在各種信息庫中找到所需要的信息。它符合人們跳躍性思維習慣和非線性的信息組織方式,具有良好的包容性和可擴充性。但是當超媒體網絡過于龐大時,很難準確迅速地定位到需要的信息。
(3)數據庫組織方式。利用數據庫組織技術將要處理的網絡信息資源經合理分類和規范化處理之后,按照固定的記錄格式存儲于計算機中。用戶通過關鍵詞和組配查詢就可以找到所需的信息線索.再通過信息線索找到相應的網絡信息資源。數據庫技術組織信息資源可極大地提高信息的有序性、完整性、可理解性和安全性。但其處理的對象通常是結構型、數值型的,對于事實型數據、離散型數據。尚無法達到令人滿意的效果。
(4)主題目錄組織技術。就是將信息資源按照某種事先確定的概念體系結構建立等級式主題目錄.然后以超文本鏈接的方式將同學科、同專業、同行業或同區域的信息按照主題目錄的分類要求逐級組織起來。這種方式提供了一種較為友好的界面.用戶在主題目錄的指引下。通過逐層瀏覽,可找到與自己需求有關的網絡信息資源。具有簡單易用、目的性強、查準率高、可擴充性良好和系統嚴密的特點。但這種主題目錄究竟分多少層.每層分多少類,并無統一規定。因此,如何科學合理地構建網絡信息分類體系成為該技術的難點。
(5)搜索引擎方式。這種方式是Internet上揭示和查找各網站主題信息資源的一種索引工具.是目前網上二次信息組織的主要方式之一。它根據網絡數據協議在網上漫游,發現新的網址、網頁信息.經過抽取、排序、歸并建立網絡索引數據庫:數據庫按一定方式、結構存儲,提供特定處理系統需要的相關信息(包括網址及相關描述性信息、計算機可識別的字段標識符等)。這種方式自動化程度高.更新速度快,并可提供位置檢索、概念檢索、截詞檢索、嵌套檢索等[530
(6)指引庫方式。指引庫常用于組織網絡上專題性強的二次信息。它是一個由語義信息、文獻信息、鏈接信息組成的語義一文獻雙層數據結構。其中語義信息與語義鏈接集合構成雙層結構的第一層:文獻信息與結構鏈構成第二層。鏈接信息由不同語義節點的語義鏈、不同文獻節點的結構鏈和鏈接于語義節點和文獻節點之間的鏈構成,穿行于第一、第二層之間。
6提高高校圖書館網絡信息資源組織與管理的策略
6.1改造傳統分類法以適應網絡信息資源組織的需要
傳統分類法在網絡信息資源組織中的應用是很有限的。現有利用《中圖法》的網站只有Cernet的“網絡指南針”和超星數字圖書館等少數幾家。而幾乎所有書目數據庫檢索系統都采用主題語言。因此了解現有網絡分類檢索工具存在的問題.對網絡環境下傳統分類法從分類主題一體化和分面組配化兩個方面著手進行改造。結合傳統分類法的優勢,建立網上信息的知識分類系統,以適用網絡信息資源的揭示和組織。
6.2采用元數據對網絡信息進行規范處理
網絡信息資源利用率高低,信息的描述和標引是關鍵。元數據是專門用來描述數據特征和屬性的數據,類似于圖書館的編目記錄。它可以促進信息的組織和發展.可以幫助識別、描述和定位網絡信息資源【6_。目前,世界上功能較全面的元數據標準有DublinCore(都柏林核心)、RDF(信息資源描述結構)等。都柏林核心可以從3個方面對資源進行描述,即資源內容描述類包含題名、主題、關鍵詞等元素;知識產權描述類包含作者、出版者、其他責任者和權限管理等元素:外部屬性描述類包含日期、格式、語言等元素。由于其簡單實用、易于理解、可擴展、能與其他元數據形式進行連接等優點,在揭示網絡資源方面非常有效。
6.3建立后控詞表.提高網絡信息資源的利用率
雖然在網絡信息組織中主題法的自然語言得到了廣泛的應用.但是由于其自然語言檢索詞是不規范的.故即使數據庫中相關字段的詞受到控制。其對同義詞(組)、近義詞(組)的查找仍相當困難,不能滿足對查準率和查全率的要求。后控詞表的建立類似于入口詞表,是一種羅列自然語言的轉換工具。后控詞表的控制詞并非直接用于標引.而是作為文獻檢索標識的自然語言詞進行控制。建立等同、等級、相關關系。用戶可通過輸人某一概念的任意同義詞作為檢索詞,經過后控制詞表找出其標識詞,然后再通過對所有同義詞的匹配查找,檢出符合條件的記錄。后控制詞表的建立.將使自由標引顯得更加現實,使自由標引所建數據庫更具實用價值。后控制詞表是提高查全率和查準率的高效控制工具,也是實現自由標引的基礎。
6.4網絡信息資源組織應逐漸向信息挖掘轉變
高校作為重要的教學與科研基地,為社會發展與科技進步提供強大動力,其對信息資源的建設、管理與應用的要求也越來越高。高校進行信息資源建設,必須適應學校發展與建設的根本要求,明確其建設目標。
(一)以促進學科建設與發展為目標,加強高校信息資源建設與服務保障水平學科建設是衡量高校辦學水平和整體綜合實力的重要標志,是決定高校在激烈的競爭中興衰成敗的重要因素。無論是國家教育主管部門還是高校本身在評價學科建設的優劣成敗時,對學科信息資源的評估始終是評價的重要方面。因此,要使信息資源的建設得到廣大師生的認可,必須根據學科的內在規律來進行組織與建設,并適應學科的總體發展目標,全面提升信息資源的服務保障水平。
(二)以教師為中心,強化信息資源對課程教學的支撐作用教師是高校的基石,教師的教學活動必須要有豐富的信息資源作為保障。隨著現代教育技術的應用,傳統的授課方式已經無法滿足學生的需要,教師必須及時更新知識、更新教學方法與手段,才能適應日益發展的課堂教學的需要,而信息資源的建設為這一發展與變化提供了直接的幫助與支撐。教師的教學科研任務日益加重,如何通過現代教育技術,尤其是網絡技術、多媒體技術為教師提供更加豐富的信息資源,為教學科研提供更好的保障是信息資源建設與管理部門義不容辭的責任。
(三)以學生為主體,推進信息資源的終端應用培養好學生是任何一所學校的辦學目的所在,如果沒有學生的發展,也就失去了辦學的意義,高校信息資源的建設也不例外,應以學生所需作為信息資源建設的目標與要求。高校學生在學習過程中,除了通過教師的講授獲取知識外,絕大部分知識需要通過自學來獲取,信息資源的建設與管理除了滿足課堂教學的需要外,還必須滿足學生的課后自學的需要。在現代信息社會,如何將無序的資源進行組織,使之有序化是信息資源建設的重要內容,也是更好地為學生服務的根本方法。
(四)以促進應用為基礎,完善信息資源保障體系建設任何信息資源建設的生命力在于應用。高校的信息資源建設必須以教師教學科研與學生課堂學習和課后自習需要為目的,同時兼顧學校的思想政治工作、后勤保障與行政管理等需要,形成符合高校自身發展規律與實際應用環境的信息資源保障體系,這樣才能發揮更大的效益。
二、高校信息資源建設與管理體系
要使信息資源從無序走向有序,在浩瀚的資源中快速地為特定用戶提供有針對性的資源,是高校信息資源建設與管理的重要內容。
(一)根據學科特點及其相關性,建立完善的信息資源標引體系高校圖書館進行信息資源建設時,往往會按照圖書分類法進行分類標引,這種方法能較快地被高校師生所接受,但在其專屬性上存在分類過粗的問題,不能全面反映學科內容。高校在進行信息資源建設時,必須充分考慮到資源與學科之間的關系,充分利用自身優勢,根據學科資源內在的聯系,編制適合學科特點與規律的分類體系對信息資源進行組織與標引,使之成為各具特點的信息資源分類體系。在對信息資源進行有效分類的同時,還必須依照標題的主題詞抽取方法進行標引,通過計算機輔助標引系統,建立關鍵詞表,有效地提高信息資源檢索的檢準率。
(二)根據教師授課與科研課題分布情況,設置樹狀的信息資源組織體系為了更好地為廣大教師服務,為其備課和課堂教學提供資源保障,高校在進行信息資源建設時,可以考慮按照學科—課程的形式設置樹狀架構的信息資源組織體系,并根據教師的教學和科研需要,進行定題的跟蹤服務,即在學科—課程的基礎上,以專題(專欄)的方式,進行定題跟蹤服務。
(三)根據學生的學習習慣,建立科學的信息資源與檢索體系學生在學習過程中,除了需要了解、掌握教師課堂教學活動中的各種信息外,還需要大量的課外信息作為補充。在信息資源建設過程中,必須要了解學生的學習習慣,以最便捷、最吸引人的方式,培養其學習興趣,提高其學習效率。
三、高校信息資源建設的分工與協作
高校信息資源建設不是一個部門一個單位所能完成,涉及高校各個部門、每個人員。在信息資源建設與管理部門所要承擔的職責中,有很大一部分是組織協調好各部門、各單位以及每個人員的工作,使各類信息資源都有所屬、有所用。(一)信息中心承擔信息資源的組織與協調工作信息中心作為高校的信息化建設的重要組織者與協調者,要承擔起信息資源建設與管理的首要責任,通過建立信息資源管理系統,及時組織、各類信息。