關鍵詞:內容;多媒體;信息檢索;數字圖書館;應用摘 要:本文論述了基于內容的多媒體信息檢索在數字圖書館中的應用,指出了存在的問題及其發展趨勢,以使數字圖書館中的多媒體信息得以有效管理與充分開發利用。中圖分類號:G252
文獻標識碼:A
文章編號:1003-1588(2009)05-0079-04
The application of content-based multimedia information retrieval in digital libraries
CHEN Li-jun
(The Library of Xuchang University ,Henan Xuchang 461000,China)Abstract: The paper elaborates the application of content-based multimedia information retrieval in digitallibraries,and pionts put the existing problems and development trend,so as to effectivly manage and makefull development and ues of the multimedia information of the digital libraries.Key words:content;multimedia;information retrive; digital library;application1 引言
數字圖書館中不僅有大量的文本型文獻信息.還包括大量的圖形、圖像、聲音、動畫、視頻等數字化多媒體信息。由于圖像、音頻、視頻等具有豐富的信息內涵,傳統的基于外部特征和文本描述的信息檢索方法已經無法充分揭示和表達這些多媒體信息的實質內容和語義關系,進而影響到對這部分多媒體信息的有效管理。此外,網絡技術的發展進步給傳統的基于文本的信息檢索方式帶來了挑戰。當今數字圖書館擁有遍布全球的、不同語言和文化背景的用戶,傳統的基于文本的信息檢索方式不能實現對數字圖書館中不同格式和內容的信息的有效檢索和充分利用.進而影響到數字圖書館使用價值的有效發揮。因此,數字圖書館中的信息檢索技術已經由單純的基于文本的檢索方式向基于內容的檢索方式發展。2基于內容的信息檢索簡述
基于內容的信息檢索(Content Based Retrieval)簡稱CBR,是一種新型的檢索方式,它融合了知識系統,認識科學、用戶模型、圖像處理、模式識別、數據庫管理系統以及信息檢索等領域的知識和先進技術,其基本思想是以信息和信息對象的內容語義、特征及上下文聯系為依據進行檢索。CBR的信息類型有:文本、視頻,包括靜止的圖像(形)和動態的視頻;音頻,包括語音、音樂,其他各種聲音等。與傳統的信息檢索相比.CBR的特點有:對信息進行深層次的分析、挖掘;是一種相似性匹配;檢索方式直觀形象;是一種交互式檢索;數據庫的結構復雜、容量大。3 基于內容的信息檢索在數字圖書館中的應用3.1 基于內容的圖像信息檢索在數字圖書館中的應用
基于內容的圖像信息檢索是指通過分析圖像的內容,取其顏色、形狀、紋理等可視特征,建立特征索引,存儲于特征庫中:在檢索時,用戶只需把自己對圖像的模糊印象描述出來.就可以通過多次的近似匹配,在大容量圖像庫中查詢到所需圖像。
在過去幾年里.人們已經提出了許多不同的基于內容的圖像信息檢索系統.其中最有名的是IBM開發的基于內容的圖像信息檢索系統QBIC,該系統允許用戶通過顏色、草圖、紋理、形狀等特征和示例方式從圖像和視頻數據庫中檢索圖像信息。它自從1995年投入使用以來,已經有許多數字圖書館和數字物品收藏機構使用該系統。最近,俄羅斯冬宮博物館采用該系統提供基于網絡的數字圖像信息檢索.用戶可以通過從調色板中選擇顏色或在畫布上繪制草圖的方式檢索圖片信息:此外,用戶還可以提交具有相似視覺特征的所有圖片信息的檢索請求來優化檢索結果。美國的國家科學基金會國際數字圖書館項目(WWW.memory.org)也采用了基于內容的信息檢索技術。該項目的信息檢索系統由幾個圖像數據庫組成.包含了傳統的基于文本的搜索引擎和一個由賓西法尼亞州立大學的Wang et a1.開發的名叫SIMPLIcity的基于內容的圖像信息檢索系統。該系統能夠將每幅圖片分割成小的區域,從中提取顏色、位置、紋理和形狀等特征,然后將這些小的區域分成一些語義大類(如紋理的/非紋理的和圖形/照片)。計算要檢索的目標圖像和數據庫中圖像的相似度時.這些所有的特征被考慮和整合,最佳的匹配結果便被檢索出來。用戶還可以從該數據庫系統的主頁中選擇瀏覽任意一組圖像.并通過點擊每幅圖像下的“相似”按鈕瀏覽與已選擇包含相似特征的一組圖像:可以通過向搜索引擎提供反饋信息.在無需知道圖像的名稱或者描述信息的情況下檢索到所需圖像。基于內容的圖像信息檢索技術在數字圖書館中的相似應用還有加州大學伯克利分校數字圖書館、弗吉尼亞理工大學的人類學數字圖書館和National STEM數字圖書館等。