博文谷

位置:首頁 > 實用範文 > 論文

對新資訊環境下資訊組織的解讀論文

論文1.49W

[摘要]在介紹傳統世界的資訊組織模式的基礎上,從傳統世界資訊組織的缺陷入手,比較分析數字世界的資訊組織在檢索語言、元數據、分類方式、組織理念上的變革和優勢。從不同角度論證傳統世界的資訊組織存在的必然性,進而探討新資訊環境中資訊組織的發展趨勢,指出資訊組織應沿着傳統世界與數字世界的融合、社會網絡和知識關聯方向發展。

對新資訊環境下資訊組織的解讀論文

[關鍵詞]資訊組織 傳統世界 數字世界 發展趨勢

1 傳統世界的資訊組織

傳統世界的資訊組織是指對由原子構成的實體資源的組織,包括簡單的安排事物——如餐具如何在櫥櫃中擺放,商品如何在貨架中排放。但是,其最重要的組織對象是附着於各種載體上的資訊,即文獻資訊的組織。是一種線型模式,如圖1所示:

其中資訊標引、資訊描述、資訊排序是關鍵的三個階段。資訊標引是指在對資訊內容進行分析的基礎上,根據一定規則給資訊的內容屬性以標識,並作出描述的過程;資訊描述是指根據資訊組織和檢索的需要,對資訊資源的主題內容、形勢特徵、物質形態等進行分析、選擇、記錄的活動;資訊排序是在資訊標引後,按一定規則和方法把所有資訊描述記錄組織排列成一個有序的整體。在傳統世界中,龐雜、無序的文獻資訊羣經過選擇、標引、描述、排序後,很好地實現了有序化,保證了原子世界中的每個實體在一定空間內的唯一性,這種機制,對資訊資源的開發利用以及用戶檢索資訊有着不可替代的作用。

但是,由於傳統世界的資訊組織對象是原子所構成的物質,而原子的執行是遵循特定規律的:①由原子構成的物質隨着時間的推移會越來越不穩定,紙張會泛黃和分解,照片底片會溶化,所以必須採取一些措施來讓大自然的作用偏離它的軌道;②原子構成的物質需要佔據空間,爲了節省空間,必須爲物質安排唯一的位置,同時要建立目錄、索引等檢索工具來指示物質的位置,但是這些檢索工具不可能記錄某個實體資訊資源的所有資訊,當實體資訊資源的規模大到一定程度時,即便是引用計算機與網絡技術,資訊的查找利用也很難做到高效、準確。loCaLhOst在傳統世界中,無論採用何種資訊組織方式,都要受其資訊組織對象自身以及環境的限制,畢竟在一個圖書館中,很難會把一本書放在它可以歸屬的多個書架上,因爲這樣太浪費空間。

2 數字世界的資訊組織

與傳統世界相比,數字世界的資訊組織發生了很大變化。資訊內容被數字化成比特;資訊組織的範圍更爲廣泛,不再停留在對文獻特徵的描述,而是深入到了知識單元;資訊組織的空間更爲廣闊,它不再需要如傳統世界那般就單一的資訊組織框架體系達成一致。隨着web2.0的深入發展,資訊組織在檢索語言、元數據、分類方式、組織理念上蓬勃發展,展現出全新的特徵,這不僅是技術上的變革,更是理念上的顛覆。

2.1 檢索語言的發展——標籤語言

標籤語言是一種純自然語言,它的語詞來自於一個平面的命名空間,不受任何預先制定的詞彙間的關係限制。以受控語言爲基礎的傳統分類法和主題法主要應用於圖書館的文獻資訊組織中,這類資訊資源在一定意義上具有同質性,即由原子構成,由於實體空間的限制,它們一般是集中分佈、規模有限、增長速度可控的;同時用戶一般都具有一定的知識基礎,對資訊檢索的查全率與查準率要求比較高。在這種情況下,採用受控語言的分類法和主題法可以透過較爲嚴密的機制滿足用戶的需求。但是,對於數字世界中由用戶產生的海量、動態、異質的資訊資源,由一個採用受控語言的系統集中控制和組織的難度加大、成本增加,而標籤語言的優勢恰好可以解決這些困難。

2.1.1 多維度揭示資訊資源 標籤既不同於分類法的類目,也不同於主題法的主題詞,它是在對資訊進行概括和理解基礎上產生的,是基於對資訊內容個人理解上的私人標註,可以是針對主題,也可以是與文章主題無關的語詞,因此標籤的設定要比主題詞自由、方便,它可以從多個維度來揭示資訊內容,從多個語境來豐富其含義,例如,一張以長城爲背景的照片,可能擁有“長城”、“豔陽高照”、“旅行”、“恐高”等標籤。

2.1.2 具有大衆性傳統世界的資訊組織需要專業人員或計算機來完成資訊標引、描述工作,而標籤語言沒有采用預先定義的分類法和詞表,不需要用戶擁有分類法或者本體相關的知識。這樣,用戶可以在幾乎不需要任何學習和使用成本的情況下獨立、輕鬆的完成資訊的標註和分類。

2.2 元數據的發展——任何資訊都是元數據

元數據一股被認爲是“關於數據的數據(date a—bout date)”,它由專家制定,具有嚴格的規範性,以資訊內容爲出發點。其實它並不是一個全新的概念,早已廣泛應用於傳統世界的資訊組織當中了,像圖書中的版權頁說明、圖書館中的目錄卡片等都是元數據。元數據經過了10餘年的發展,其標準越來越複雜,隨着網絡資訊的快速增長,資訊類型越來越多樣化,任何標準都面臨着“滯後”的風險,同時其嚴格的規範性也限制了用戶的使用。

在數字世界中,元數據正在打破那些嚴格的限制,也在挑戰傳統的元數據的概念。如果你記不清羅貫中某部著作的名稱,可以求助於google圖書的搜尋方塊,輸入“羅貫中”,就可以看到一張羅貫中著作列表。只要點擊《三國演義》的連結,你就可以查到全文,其中包括那句經典的原文:“滾滾長江東逝水”。相反,如果你想知道“滾滾長江東逝水”這句話的出處,只要將這句話輸入google圖書的搜尋方塊,就能夠看到《三國演義》被列出來。在第一個例子中,是用羅貫中的名字作爲元數據來找到書中的內容,而在第二個例子中,是用書中部分內容作爲元數據來找到作者和書名。可以說,在多元的數字世界中,不僅一本書中的每一個詞都可以被看做元數據,而且連結到這本書的每一種資訊也是如此,元數據和數據的唯一區別就是,元數據是你已經瞭解的資訊,而數據是你試圖找出來的資訊。

2.3 分類方法的發展——folksonomy

分類在傳統世界的資訊組

織中佔有重要地位,傳統世界對資訊的分類主要採用等級分類法。等級分類法將類目體系組織成一個樹狀結構,其結構顯示直觀,類目設定比較均衡,非常適和文獻的分類排架。但是,這種樹形結構必須以犧牲豐富性和深度爲代價來達成廣泛性,它構建的基礎就是一遍又一遍地使用隸屬關係:“b是a的一種”,或者“b應該向a報告”,又或者“b是a的孩子”。無論各個分支體系是何種關係,這種關係都太過簡單化了,根本不能體現事物自身及其相互關係的複雜性。

在數字世界中,資訊空間更爲廣闊,由下而上的folksonomy正在崛起。與傳統的樹形分類結構相比,folksonomy擁有立體化的、非等級結構的類目體系。如果把等級分類法比喻成一顆樹,那麼folksonomy可視爲一堆離散分佈在一個立體空間中的樹葉。在這裏,利用folksonomy對“索尼照相機”這一類目進行組

織,以明晰其組織原理。首先,對“索尼照相機’’這一類目進行分析,由用戶對“索尼照相機”添加各式各樣的標籤,標籤完全不受限制,包括照相機、索尼產品、生日禮物、旅行用品等。這樣“索尼照相機”就分散在多個類目下,將一片葉子掛在了屬於它的多個枝頭上,用戶可以更方便地找到它;另外,這種標籤立體圖揭示的關係更爲豐富多彩,例如,“索尼筆記本”、“索尼手機”這兩個類別同樣可能被標上“索尼產品”這個標籤,然後“索尼筆記本”、“索尼手機”、“索尼照相機”就透過“索尼產品”這個標籤形成了聚類,同樣,透過“照相機”、“生日禮物”、“旅行用品”這些標籤又可以與其他的多個類別、多個事物形成聯繫,這樣就構成了一個密集的資訊網絡,就如同漫天飄舞的樹葉,而且,這些飄散的樹葉又是智能的,透過一個葉片可以聯繫到多個葉片,只是葉片之間的聯繫是潛在的,等待着用戶去發掘和創造而已,如圖2所示:

2.4 資訊組織理念的發展——用戶中心論

資訊是普遍存在的,它與現實世界一樣的廣博,沒有哪個個體能夠完全理解它。因此,需要有人利用他們積累的知識、經驗來行使資訊過濾器的職能,這些人被稱爲專家。在傳統世界中,由他們負責選擇、篩選資訊,制定元數據的'標準,完成資訊的標引與描述工作。從這個角度看,用戶能看到什麼資訊,能找到什麼資訊,都是由專家決定的,資訊的控制權牢牢的掌握在他們手裏。與此同時,專家們在資訊組織過程中無形的把“以用戶爲中心”與“以文獻資訊爲中心”等同了起來,認爲只要實現了文獻資訊資源的有序化就滿足了用戶的資訊需求,殊不知,在對資訊施以選擇、分析、排序等程序雖然有利於文獻資訊的有序化,但這種有序化依靠的是文獻資訊本身的意義與他們自己的判斷力來完成的,它雖然利於資訊組織工作本身,但無法充分的滿足用戶的資訊需求,畢竟專家們也無法預測每個人到底對什麼感興趣,每條資訊對用戶將會有什麼意義。

數字世界的資訊組織以構建主義哲學和自由主義哲學爲指導思想。構建主義哲學思想認爲:資訊從本質上來說是主觀的東西,無論是被記載下來的資訊(資訊1)還是人腦中的資訊(資訊2)都不可能是現實世界的如實的、客觀的反映,它們永遠只能是外部世界的片面的反映。認識的這種不完整性就決定了特定用戶在特定背景需要尋求特定的資訊來填補認識上的空白。而要滿足這樣的資訊需求,資訊組織應該關注的不是資訊本身,而應該是用戶的個體性以及他的具體背景,因爲每個用戶及其背景都是獨特的,因而其資訊需求也是獨特的。自由主義哲學思想認爲:所有的人都有權按自己的意志安排生活,都有能力爲自己的需要做出適當的選擇(包括資訊的選擇)。所以,資訊組織不應該是替用戶選擇資訊,不應該以各種權威來制約用戶,資訊的所有者應該主動的把資訊組織的控制權轉交到用戶手裏,爲用戶提供一個開放式的架構,讓用戶自己來選擇、組織資訊。

3 新資訊環境下資訊組織的發展趨勢

3.1 傳統世界的資訊組織不會消亡

首先,從哲學的角度看,在傳統世界中,我們對實體資訊資源的組織實際上是由亞里士多德的理性主義指導的。亞里士多德認爲:要了解一件事物,就必須看穿它的本質,並且不被恰巧符合其特點的表象所迷惑、誤導。而對於這些“本質”的定義就決定了哪些東西屬於一類,解釋了爲什麼這些東西屬於該類別而另外一些則不屬於,這樣歸攏和分割的結果就是一棵分類樹,其中的各個枝葉都既與一些東西聚合又與其他東西分離。這種樹形結構對於理解事物是很有幫助的,例如,當有人告訴你某種動物屬於鳥類時,你不需要更多解釋就會明白它是動物,是有脊類的,可以繁殖,會死亡,是實物……以及其他一些資訊,更重要的是,你不需要在每次看到一隻鳥的時候纔會考慮所有這些資訊,只要是在需要的時候,你隨時都可以調用這些類別資訊。

在日常生活中,亞里士多德的理性主義和樹形結構一次次體現在各種組織體系中,比如各種傳統分類法,將一本書分成章節和次級標題,越來越專業化的機構部門,選單上菜品的安排等。這一切都源自於我們所處的資訊環境中離不開原子物質,這種物質形態必然產生一種與之相適合的意識形態,理性主義正是其產物之一,而由理性主義指導的傳統的資訊組織必然是與傳統世界相匹配的資訊組織形態。

其次,從傳統世界的資訊組織所依存的實體看。紙質文獻是其主要對象,圖書館是其依存的主要機構。關於紙質文獻和圖書館是否會被取代的爭論已經持續了幾十年,然而,紙質文獻、圖書館在電子文獻和電子圖書館的挑戰下非但沒有消亡反而呈上升趨勢發展。顯然,不能僅憑技術的進步與經濟的發展就認定紙質文獻和圖書館的消亡,其存在的社會和政治意義也是不容忽視的。比如,數字時代給我們造成了“誰都可以及時地、自由自在地縱覽世界各地的資訊”的柏拉圖式的印象,實際上,它卻加深了數字鴻溝,而圖書館在保證資訊自由和公平中具有的潛在和巨大的作用更有利於消除數字鴻溝。

可見,在當前我們所處的資訊環境中,傳統世界的資訊組織縱然有諸多缺陷,但它並不會消亡。

3.2 新資訊環境下資訊組織的發展趨勢

3.2.1 傳統世界的資訊組織與數字世界的資訊組織的融合 數字世界的資訊組織也有諸如標籤模糊、濫標等缺陷,需要傳統世界的資訊組織來校正。所以,資訊組織的發展不應該是簡單的替代的關係,而應該是兩者之間的融合關係。這種融合可以透過網站提供的個性化服務與圖書館的連接來實現,比如,把圖書館書目數據嵌入到豆瓣網,用戶在瀏覽一本圖書相關評論的同時也可以查找哪些圖書館藏有這本書;反過來,也可以把個性化的資訊組織方式引入到圖書館中,提高書目數據資訊的豐富性和可利用性。除去上面兩種簡單的連接方式外,更值得研究的是利用web2.0的原理和理念來架構圖書館資訊網絡,實現真正意義上的融合,如圖3所示:

3.2.2 基於社會網絡的資訊組織 社會網絡普遍存在於傳統世界與數字世界中,只不過在傳統世界中,由於時空等多方面的限制,由個體之間形成一個羣體,由羣體形成社區面對着諸多困難。而在數字世界中,個體之間透過社會性網絡軟件,打破時空限制,建立更加緊密的社會關聯,由此產生的各種相關的資訊透過多種交互關係而聯繫組織在一起,從而形成一個個大小不一的緊湊型與鬆散型網絡社區。這種社會網絡以交互爲基礎,包括個體間的小範圍的交互,也包括羣體間、社區間的大範圍的交互,在交互的過程中產生的相關資訊會以“話題”爲標準形成具有一定方向性的聚合。同時,基於社會網絡的資訊組織伴隨着資訊流的多向運動,它是對處於即時運動、變化中的資訊的組織,而非以往的對靜態資訊的組織,而且,其深受社會關係的影響與控制。可見,基於社會網絡的資訊組織面臨着更爲複雜的情境,而如何建立一個穩定的、有效的資訊組織機制仍需繼續探索。

3.2.3 知識關聯任何形式的資訊組織都是基於資訊元素之間一定的關聯性而存在的,只不過傳統世界的資訊組織是基於文獻實體關聯,數字世界的資訊組織則基於知識關聯,而研究和揭示知識之間相互關聯的規律又是有效組織、檢索和管理知識的基礎。目前,各種知識組織方式,無論是語詞的還是符號的,大都是基於概括知識內容的概念之間的關聯性來組織、存儲的,這種關聯性體現的是一種概念邏輯,但是,知識之間的關聯性是多樣的,概念邏輯僅是其中的一種,顯然,加強對那些潛在的、隱含的知識關聯的研究是很有必要的。

此外,隨着現代資訊技術的快速發展和廣泛應用,資訊組織的發展方向不應該是僅僅簡單實現資訊、知識的整序、存儲,而應該是根據知識之間的相互關聯透過融合分析、歸納、推理等方式來實現知識創造、知識挖掘和知識發現

標籤:論文 環境 解讀