<progress id="pltbd"></progress><cite id="pltbd"><span id="pltbd"><ins id="pltbd"></ins></span></cite><strike id="pltbd"><dl id="pltbd"></dl></strike><strike id="pltbd"><i id="pltbd"><del id="pltbd"></del></i></strike>
<strike id="pltbd"></strike>
<strike id="pltbd"><dl id="pltbd"><del id="pltbd"></del></dl></strike>
<strike id="pltbd"><dl id="pltbd"><del id="pltbd"></del></dl></strike>
<strike id="pltbd"><i id="pltbd"><del id="pltbd"></del></i></strike>
<strike id="pltbd"></strike>
<strike id="pltbd"></strike><strike id="pltbd"></strike>
<strike id="pltbd"><dl id="pltbd"><del id="pltbd"></del></dl></strike><strike id="pltbd"></strike>
<span id="pltbd"></span>
<span id="pltbd"><video id="pltbd"></video></span>
<strike id="pltbd"></strike>
<strike id="pltbd"></strike>
<strike id="pltbd"></strike>
<ruby id="pltbd"><video id="pltbd"><del id="pltbd"></del></video></ruby>
<th id="pltbd"><video id="pltbd"></video></th>
多語言數字圖書館及其研究淺析 http://www.liqianming.com http://www.liqianming.com/LunWen/2017-02-02/96887.html 張彥文(桂林電子科技大學圖書館,廣西桂林541004)關鍵詞:數字圖書館;信息資源;多語言;跨語言檢索摘要:文章對多語言數字圖書館及其相關的元數據記錄翻譯、多語言主題詞表、實驗系統、原型系統等研究進行了討論。中圖分類號:G258.89文獻標識碼:A文章編號:1003-1588(2013)09-0097-03收稿日期:2013-08-07作者簡介:張彥文(1965-),桂林電子科技大學圖書館館員。1引言多語言數字圖書館是具有一種語言以上館藏資源,或者能夠提供單一語言館藏的多語言查詢訪問的數字圖書館。盡管多語

多語言數字圖書館及其研究淺析


  • 時間:2017-02-06 21:56:56
  • 來源:本站發布
  • 作者:張彥文

張彥文

(桂林電子科技大學圖書館,廣西桂林541004)

關鍵詞:數字圖書館;信息資源;多語言;跨語言檢索

摘要:文章對多語言數字圖書館及其相關的元數據記錄翻譯、多語言主題詞表、實驗系統、原型系統等研究進行了討論。

中圖分類號:G258.89文獻標識碼:A文章編號:1003-1588(2013)09-0097-03

收稿日期:2013-08-07

作者簡介:張彥文(1965-),桂林電子科技大學圖書館館員。

1引言

多語言數字圖書館是具有一種語言以上館藏資源,或者能夠提供單一語言館藏的多語言查詢訪問的數字圖書館。盡管多語言數字圖書館的大量工作還側重于可行性研究、原型系統開發、設計方案和建設規劃,但也已有投入運行的多語言數字圖書館系統[1]。含有50種語言的兒童文學館藏的國際兒童數字圖書館(InternationalChildren’sDigitalLibrary,ICDL)于2006年4月投入使用。聯合國教科文組織(UnitedNationsEducational,ScientificandCulturalOrganization,UNESCO)和美國國會圖書館(UnitedStatesLibraryofCongress)共同運營的世界數字圖書館(WorldDigitalLibrary,WDL),具有西班牙語、英語、中文、葡萄牙語、俄語、法語和阿拉伯語等7種語言查詢功能,于2009年4月21日開始創建,中國國家圖書館是WDL的合作伙伴。Europeana是提供48個歐盟國家及許多研究機構圖書館資源網絡訪問、語言種類達35種之多的多語言數字圖書館,于2008年11月開始創建。由海地、阿魯巴、巴哈馬群島、伯利茲、牙買加、委內瑞拉、波多黎各、美國佛羅里達大學等36家單位聯合創建的加勒比海數字圖書館(ThedigitallibraryoftheCaribbean,dLOC),館藏有中文、英語、德語、法語、西班牙語、意大利語、日語、丹麥語、約魯巴語、希伯來語、阿姆哈拉語、拉丁語等語言的加勒比海文化、歷史和科研資料。在線經濟學家(EconomistsOnline)是由20余家歐盟成員國大學和研究機構聯合創建的專業性質的多語言數字圖書館。它提供了英語、德語、法語和西班牙語共四種語言的查詢,館藏為具有這四種語言表述的學術論文索引、文獻全文和經濟數據庫等。虛擬藝術史典藏(TheVirtualCatalogueforArtHistory)artlibraries.,提供多個歐洲藝術學院和研究院的書目記錄(或藝術史數據庫)的集成檢索。為了達到歐洲范圍全面合作并服務于國際藝術史團體,合作伙伴將擴展至英國和斯堪的納維亞半島、其他南歐和東歐的歐盟國家的科研機構和學院。

多語言數字圖書館是數字圖書館的一種新的拓展形式。元數據記錄翻譯、多語言主題詞表、實驗系統、原型系統開發、用戶中心研究等都是多語言數字圖書館的研究熱點。文章對此進行討論。

2跨語言信息檢索

多語言數字圖書館的重要特征在于具備兩種或兩種以上不同語言的信息查詢。為了達到此目的,需要跨越語言障礙實現不同語言表述下信息需求(查詢提問式)和內容(文獻資料)的匹配。從跨語言信息檢索角度講,跨越語言障礙有多種方法。可以將提問式翻譯成文獻資料的語言,可以將文獻資料翻譯成提問式的語言,也可以將提問式和文獻資源翻譯成中介語言表述。

元數據記錄翻譯方法是多語言數字圖書館研究中提出的一種新的翻譯方法。Lee等在開發中文、日語、韓語、英語信息資源收集的主題詞網關服務IPL-Asia(InterPublicLibraryAsia)中,將多語言表述為元數據規范DublinCore和IEEELOM記錄,元數據記錄用XML編碼、存儲和顯示,實現了多語言的元數據記錄翻譯。該方法無需翻譯整個文獻資源,元數據記錄翻譯會提高系統的效率。這種方法尤其適用于僅具有條目或元數據描述的圖片和其他非文本館藏。同源詞(兩種語言共享的詞匯,如:專有名詞)匹配是解決多語言障礙另外一種方法,這種方法適合于具有相同語言字母系統的情形。翻譯知識對于各種翻譯方法的實現有非常好的助推作用,這些知識可以來自于多語言詞典、本體和機器翻譯系統,也可以對文本語料庫進行統計分析來抽取。Larson等對加州大學圖書館的上億條編目進行術語翻譯創建了一個可以定制的多語言詞典。對于多語言內容和域符(標題、主題詞等)的信息資源,Clinchant和Renders對傳統語言模型方法進行擴展,將目標館藏文獻資源定義為元詞匯的一個概率分布(元詞匯是英語、法語和德語三種語言詞匯的并集),這樣每一個館藏文獻就對應唯一的索引。對于某源語言的查詢提問式,通過元詞典(含源語言自身),即每一個詞匯在源語言中的概率轉移矩陣,構造該查詢的多語言模型,進而實現目標文獻的多語言模型的比較。

回到頂部

亚洲精品在线播放