基于關聯數據的非物質文化遺產資源聚合研究》引入關聯數據的理念與技術方法,在對非物質文化遺產、資源聚合相關理論進行系統梳理的基礎上,基于元數據與本體對非物質文化遺產資源進行了語義化標注,并開展了非物質文化遺產關聯數據構建與的關鍵技術研究,建立了基于關聯數據的非物質文化遺產資源聚合與服務平臺,同時選取具有地方代表性的非物質文化遺產項目"楚劇"進行實證研究。由此證明引入關聯數據的理論與技術方法,是實現非物質文化遺產資源的規范化描述、語義化揭示、多維度關聯的有效途徑,對提高非物質文化遺產資源聚合與保護、優化知識服務質量有著重要的作用。
基于關聯數據的非物質文化遺產資源聚合研究》內容豐富,應用性強,可供數字圖書館、信息組織、信息資源管理等領域從事相關研究的專家學者及院校相關專業師生參考使用。
前
第1章 緒論1
1.1 研究背景及研究意義1
1.2 國內外研究現狀3
1.2.1 關聯數據研究現狀4
1.2.2 非物質文化遺產資源聚合研究現狀7
1.2.3 研究述評13
1.3 研究內容與技術路線14
1.4 研究的創新之處17
1.5 組織結構18
第2章 相關理論基礎20
2.1 語義網及語義標注相關理論20
2.1.1 語義網的發展20
2.1.2 語義標注概述21
2.1.3 語義網環境下元數據、本體及語義標注間的關系23
2.2 關聯數據有關理論24
2.2.1 概念解析25
2.2.2 類型劃分26
2.2.3 支撐技術26
2.2.4 關鍵實現技術30
2.3 非物質文化遺產資源聚合概述37
2.3.1 有關概念的內涵與外延37
2.3.2 相關理論38
2.3.3 維度分析40
2.3.4 聚合方式的演進41
第3章 非物質文化遺產資源描述及其語義標注43
3.1 非物質文化遺產資源分類體系43
3.1.1 分類現狀44
3.1.2 現有分類方法的局限46
3.1.3 分類體系的構建47
3.2 非物質文化遺產資源元數據標準規范53
3.2.1 常用元數據標準53
3.2.2 二維元數據框架構建54
3.2.3 元數據結構的實現57
3.3 非物質文化遺產資源本體構建73
3.3.1 本體構建原則73
3.3.2 本體構建方法與流程74
3.3.3 本體構建的工具75
3.3.4 本體構建的實現―以中國傳統戲劇為例76
3.4 基于本體的非物質文化遺產語義標注模型83
3.4.1 語義描述的層次83
3.4.2 語義描述模板84
3.4.3 語義標注模型的構建85
第4章 非物質文化遺產關聯數據的創建與88
4.1 非物質文化遺產關聯數據創建與的基本原則88
4.2 非物質文化遺產關聯數據創建與的流程89
4.3 基于語義的非物質文化遺產關聯模型構建92
4.3.1 核心資源及其屬性93
4.3.2 項目類及其核心屬性98
4.3.3 機構類及其核心屬性99
4.3.4 相關人員類及其核心屬性101
4.3.5 數據庫集類及其核心屬性102
4.3.6 相關事件類及其核心屬性106
4.4 非物質文化遺產關聯數據創建與平臺的設計109
4.4.1 DHC在非物質文化遺產關聯數據創建與中的應用109
4.4.2 非物質文化遺產關聯數據創建與架構112
4.4.3 非物質文化遺產關聯數據創建與平臺的設計與實現114
第5章 基于關聯數據的非物質文化遺產資源聚合方案設計126
5.1 非物質文化遺產資源聚合的原則126
5.2 關聯數據在非物質文化遺產資源聚合中的應用優勢分析129
5.3 基于關聯數據的非物質文化遺產資源聚合框架131
5.3.1 非物質文化遺產資源聚合宏觀模式131
5.3.2 非物質文化遺產資源聚合微觀模式140
5.3.3 基于關聯數據的非物質文化遺產資源語義聚合框架構建142
5.4 基于關聯數據的非物質文化遺產資源聚合與服務平臺的設計與實現145
5.4.1 基于關聯數據的非物質文化遺產資源聚合與服務平臺設計目標145
5.4.2 基于關聯數據的非物質文化遺產資源聚合與服務平臺整體設計思路147
5.4.3 基于關聯數據的非物質文化遺產資源聚合與服務平臺關鍵功能實現149
第6章 基于關聯數據的非物質文化遺產資源聚合實證研究―以楚劇為例161
6.1 楚劇資源聚合的必要性與可行性分析161
6.2 楚劇資源采集及語義描述163
6.2.1 楚劇資源收集及元數據標準建立164
6.2.2 楚劇領域本體開發167
6.2.3 楚劇資源語義標注172
6.3 基于楚劇資源的關聯數據創建與177
6.4 非物質文化遺產資源聚合與服務平臺應用實例―楚劇資源展示183
6.5 與傳統信息系統的對比分析196
第7章 總結與展望198
參考文獻202
彩圖
第1章緒論
本章在對當前非物質文化遺產資源聚合中所涉及的理論與方法進行深入分析的基礎上,指出當前非物質文化遺產資源聚合中存在的一系列問題,提出基于關聯數據的非物質文化遺產資源聚合方法,并對國內外研究現狀、研究內容與技術路線以及創新之處進行了闡述,后介紹了本書的組織結構。
1.1研究背景及研究意義
本書的選題系"十二五"國家科技支撐計劃"荊楚文化遺產數字化公共服務關鍵技術研究及示范"(2012BAH83F00)、文化遺產傳承與數字化保護協同創新中心招標課題"荊楚非物質文化遺產數字資源知識聚合與應用研究"(2015XT007)及教育部人文社會科學研究青年基金項目"基于用戶興趣挖掘的電子政務門戶知識整合研究"(BYJC870029)研究成果之一。
一方面,非物質文化遺產資源建設依托于文化部文化共享工程,由國家牽頭、地方參與,對地方志、特色文獻、民風民俗等一系列獨具地方特色的文化資源進行加工整理。作為一類特殊的館藏資源,對其進行聚合具有典型的示范意義;另一方面,非物質文化遺產是人類創造力、想象力、智慧和勞動的結晶,對其進行有效的資源聚合和合理保護是當前該領域亟待解決的實際問題。所以,研究基于關聯數據的非物質文化遺產資源聚合具有重要的理論意義和實際應用價值。
1.研究背景
非物質文化遺產與物質文化遺產一樣,都是人類偉大文明的結晶。兩者作為現存的文化記憶,物質文化遺產的可見性,決定了其在保護和傳承上的優勢,而非物質文化遺產的無形性和活態性,使其所包含的文化記憶更容易隨著時代的變遷和時間的推移而被人們忽略和遺忘。非物質文化遺產的保護,不僅僅關乎某項具體文化領域的生存問題,更是對人類精神文明內涵與意義的深刻理解。當前,非物質文化遺產保護面臨著一系列問題,如消亡現象嚴重、工業化與城市化的影響較大、文化生態空間的異化等,在這種情況下,對非物質文化遺產資源實現有效聚合就顯得十分重要。隨著多媒體技術和網絡技術的發展,非物質文化遺產資源聚合與保護有了新的方法途徑――數字化遺產保護技術。
我國文化遺產的數字化保護工作正在如火如荼地開展,并已經初見成效,尤其隨著互聯網的興起,非物質文化遺產的數字化保護得到了進一步的發展。概括起來,非物質文化遺產數字化保護的關鍵技術涉及數字化建模、遙感技術、虛擬現實技術、數字化輔助設計系統、破碎文化修復及復原模擬技術、數字化舞蹈編排與聲音驅動技術等,這些數字化技術的發展為非物質文化遺產資源聚合與保護提供了堅實的技術基礎。然而,我們并不滿足其數字化的保護和保存,更要通過新的方法與手段對其進行重新闡釋,賦予它們新的內涵,并對其資源進行合理組織與整合,更加有效的實現非物質文化遺產資源的知識傳承與利用。
非物質文化遺產資源的異構性、多源性使其在聚合時存在較大的困難,主要表現為資源描述語義程度低、集成度不高、關聯深度與廣度不夠、服務質量和水平有待提升等。一方面,不同的非物質文化遺產相關信息機構往往采用不同的硬件平臺、數據庫和數據描述標準,且對內部資源實行獨立管理,因而造成了大量的分布式異構資源的存在。傳統的資源組織與整合方式只能解決這些資源在物理及邏輯結構上的異構,而對資源間的語義異構現象無法提供有效的解決途徑;另一方面,當前的非物質文化遺產資源聚合是基于數字化技術的,也就是資源聚合的對象往往是數字資源,如音頻、視頻、圖片等,但與非物質文化遺產有關的其他資源卻沒有囊括其中,如某一領域的知識資源、非遺數據庫資源、人員/機構數據等,更無法實現這些資源與開放環境下的網絡資源間的關聯。此外,非物質文化遺產資源聚合的目的就是保護與傳承,并限度地為用戶提供知識服務,使用戶在獲取非物質文化遺產資源的同時,也能夠汲取資源所包含的文化知識及民族文化精髓,而當前非物質文化遺產資源聚合效果及其服務水平很難滿足用戶對知識獲取的迫切需求,人們雖處于信息海洋中,卻經常面臨信息匱乏、知識匱乏的困境[1]。所以,目前非物質文化遺產資源所能實現的聚合廣度、深度以及所提供的服務質量并不盡如人意。
近年來,國內外研究人員利用元數據、本體及領域相關主題詞表等知識組織工具,面向網絡資源開展了有效的組織和利用工作,開啟了資源聚合的新篇章,而語義網的發展及關聯數據的提出,更是極大促進了這項工作的開展,目的就是實現資源的語義描述、關聯、聚合和利用,采用URI和RDF格式、鏈接各類數據。隨著關聯數據逐漸成為語義網的研究熱點,也鑒于其自身所具有的技術特點,使其能夠被應用于資源聚合中。目前關聯數據用于資源融合的領域主要集中在企業信息融合、金融數據融合、圖書館信息融合等,而通過關聯數據組織、聚合和利用非物質文化遺產資源的研究還很少見。因此,有必要引入關聯數據的理念,應用關聯數據相關技術方法,加強網絡環境下非物質文化遺產資源的深度組織、聚合和有效利用,提高其知識服務能力,并不斷創新服務內容和面向用戶的服務功能,縮小與其他應用領域的差距。同時,也使得非物質文化遺產資源中的知識內容和文化精髓能夠通過這種方式進行傳承和延續。
2.研究意義
鑒于非物質文化遺產領域中的資源分布式異構現象,通過現有的資源聚合方式不能解決其語義聚合的難題,且針對資源描述語義化程度低下、聚合程度不高、關聯深度與廣度不夠、服務質量和水平較低等實際情況,本書旨在提出一種基于關聯數據的非物質文化遺產資源語義聚合方法,選題具有重要的理論與實際應用價值。
(1)理論研究意義:①本書系統深入的探索了語義網環境下,基于關聯數據的非物質文化遺產資源聚合相關理論,其研究成果對于建立和完善網絡環境下非物質文化遺產資源聚合的理論體系具有重要價值,也是非物質文化遺產保護與傳承的必然要求;②本書深入分析了元數據技術、本體技術及關聯數據技術在非物質文化遺產知識揭示與描述、知識關聯與、知識聚合與集成、知識可視化展示與語義檢索等方面的應用,對建立和完善網絡環境下非物質文化遺產資源聚合的方法體系具有較大的借鑒意義;③本書采用了語義網、語義標注、關聯數據、資源聚合、知識服務等相關理論與方法,構建了基于關聯數據的非物質文化遺產資源語義聚合框架,對促進語義網、關聯數據、資源聚合、知識服務等相關理論和方法的發展有一定的推動作用。
(2)實際應用意義:①本書針對非物質文化遺產數字化保護及資源聚合的現狀與存在問題,提出了基于元數據、本體及關聯數據的解決思路和方法,該方法可以較為充分的發揮人、資源聚合技術及語義網技術在知識標注、組織、管理和服務上的優勢,具有一定的科學性與合理性,能夠實現非物質文化遺產資源的描述化(基于元數據與本體的語義標注)、深度結構化(明確知識對象、屬性及其關系)和語義關聯化(多維度揭示資源間的語義關聯關系),促進非物質文化遺產資源信息組織向知識組織的轉變;②本書針對非物質文化遺產的資源類型及其特征,提出以關聯數據的形式對其進行、集成與服務,這對提升非物質文化遺產資源聚合效率,改進知識服務模式和質量,拉近與網絡用戶之間的距離,傳承民族文化精髓來說,都起著非常重要的推動作用,將更加凸顯非物質文化遺產及其資源保護的重要性;③深度聚合與開發利用非物質文化遺產資源,探索面向用戶的非物質文化遺產知識服務與語義檢索,以楚劇為應用示范,將該領域內多種類型的信息資源進行整合并建立豐富的語義關聯關系,并基于關聯數據實現楚劇資源的應用與服務,為實現非物質文化遺產其他領域資源聚合積累了寶貴經驗。
1.2國內外研究現狀
國內外研究現狀的闡述主要從關聯數據及非物質文化遺產資源聚合兩個方面展開。首先對關聯數據研究現狀進行概括,其次從數字化技術、理論、方法、應用四個方面對非物質文化遺產資源聚合的研究現狀進行了梳理,然后聚焦于基于關聯數據的非物質文化遺產資源聚合研究中存在的不足,并提出了本書所研究的科學問題。
1.2.1關聯數據研究現狀
國外學者對關聯數據的研究主要集中于學術會議、項目研究、語義關聯模型、技術工具、實際應用方面,國內則更加關注理論層面的研究。
(1)國外研究現狀
2006年萬維網創始人Tim在《關聯數據筆記》中次提出了關聯數據的概念,即將以前沒有進行關聯的數據鏈接起來,并構建一個能夠被機器所理解的富含語義關系的數據網絡(webofdata),在此基礎上實現更加智能的應用[2]。同時,Tim又提出了關聯數據的四個基本原則,得到了學術界和各應用領域的廣泛認同,并針對關聯數據創建、及應用開展了大量的研究與實踐。
學術會議方面。截至2014年9月已經召開了七屆LDOW(LinkedDataontheWeb)研討會,會議主要圍繞關聯數據創建與、關聯關系自動構建、關聯數據應用、關聯數據融合等方面展開[3]。此外,2010年召開的DC元數據年會[4]、2011年的語義網技術大會、DC與元數據應用研討會等都涉及關聯數據研究的多個領域。
項目研究方面。Dbpedia項目從Wikipedia詞條里提取出結構化數據,可以將其他數據集與Wikipedia在數據節點上相鏈接,開發多種創新應用[5];OREChem項目[6]將現有化學類數據源到LOD云中,應用于化學領域的知識本體構建;Linkingopendrugdata項目[7]將不同數據源的醫藥數據進行關聯,并提供相關的醫藥服務;在農業領域方面,聯合國糧農組織(FAO)將AGROVOC敘詞表為關聯數據,并建立了多個詞表之間的關聯關系,以此作為農業領域關聯數據創建與的依據[8];2010年歐盟又啟動了LOD2項目,其目標是研究面向企業級的關聯數據創建、、瀏覽工具[9]。
語義關聯模型方面。目前已經有一些較為成熟和通用的本體模型(領域本體、規范的詞匯集詞表等)可以復用,如LOD社區的LOD數據云中,收錄了多種知名數據集,諸如DBpedia、FOAF、GeoNames、MusicBrainz等,這些數據集涉及地理、醫學、媒體、社會網絡等眾多領域。相關領域本體或者通用詞表在構建關聯數據語義模型、語義聚合和互操作等方面發揮了重要作用。
技術工具方面。關聯數據已經逐漸從理論走向應用,也已經出現了大量關聯數據創建與的工具,大致可以分為三類:①關系型數據庫RDF轉化工具。有代表性的是D2R,其作用是將關系型數據庫中的數據轉化為虛擬RDF數據,由于這一關聯數據創建與工具較容易更新,且數據空間復雜度較低,所以成為一種使用率極高的關聯數據創建與工具。此類型的關聯數據工具還有Triplify,其作用是將關系型數據庫為真實的RDF數據[10]。②直接生成RDF數據的關聯數據工具。Virtuosouniversalserver是一種商業級關聯數據工具,可以通過一個SPARQL端點將數據轉化為RDF數據[11];SparqPlug則是從HTTP文本中直接抽取關聯數據并以RDF格式序列化輸出[12]。③其他RDF數據的工具。這類工具應用較多的是Pubby和Talisplatform。Pubby能將URI請求轉化為潛在RDF數據查詢語言SPARQ[13],Talis則是一個能夠提供RDF或關聯數據存儲的軟件服務平臺[14]。
應用研究方面。關聯數據自2006年產生以來得到了廣泛的認同和應用,越來越多的組織與個人加強了對關聯數據的應用研究,涉及大眾傳媒、商業企業、政府部門、圖書館等眾多領域。Michael將關聯數據的應用分成內容再利用、語義標簽、綜合提問應答系統以及事件數據管理系統四個方面[15]。在圖書館領域,作為信息收集、組織與服務的專門性機構,圖書館的書目數據、主題標目等都可以為關聯數據供用戶使用。2010年W3C成立了圖書館關聯數據孵化小組,其職責就是為了幫助圖書館創建和關聯數據,增強圖書館數字資源的互操作。美國國會圖書館則是通過SKOS將傳統的主題標目轉化成Web可以理解、處理和使用的形式[16]。20 ……