- 相關推薦
語言信息處理技術在網絡新聞傳播中的作用探析論文
摘 要:本文分析了語言信息處理技術在網絡新聞傳播中的應用表現和重要作用,認為語言技術的應用使得網絡新聞自組織為一個結構化資源,促進了網絡新聞的高效傳播;重塑了傳統新聞體系中的新聞把關人的角色,促進了網絡把關人角色的領域分化;幫助更好地完成了網絡新聞反饋信息的接受和理解過程,完善了網絡新聞傳播的互動機制,并實現了反饋信息的重大經濟價值及社會價值。
關鍵詞:語言信息處理技術 網絡新聞傳播 反饋信息
一、引言
隨著現代科學技術的發展,特別是計算機網絡的出現和信息傳播技術的進步,新聞傳播也由傳統媒體如報紙、電視、廣播媒體主導的時代走向了多元化,網絡媒體和手機媒體的出現和崛起不僅僅是技術的革新,而且也同時創造了新的傳播理念和傳播方式。其中,網絡媒體對于突發事件的報道,對于重大事件的關注,對于民間聲音的表達及對高層決策的影響等等,使得網絡媒體成為普通民眾之間、民眾與政府之間信息交流的重要渠道。可以說,網絡新聞傳播已經成為新聞傳播鏈條上不可缺少的一環。
網絡新聞傳播作為一種新興的傳播方式受到了學術界的廣泛關注和普遍重視,網絡新聞傳播已經成為傳播學中的一個重要概念。近年來關于網絡新聞傳播方面的研究廣泛而深入,涉及到網絡新聞傳播理論研究、網絡技術和新媒體研究、網絡傳播監管研究以及面向網絡新聞傳播的應用研究等各個方面。
本文擬從語言信息處理技術的角度對網絡新聞傳播中的相關問題進行闡述。
二、人類語言與網絡新聞的表達形態
從表達形態上看,網絡新聞表現為多媒體形態和文本形態。多媒體形態的新聞可以進一步分為圖片新聞、視頻新聞和語音新聞,其中視頻新聞包含了視覺形態和語音形態。文本形態的新聞是指以編碼文字形式(如ASCII,BIG5,GB2312-80,GBK,UNICODE等)組織起來的新聞文本。多媒體形態的新聞元素和文本形態的新聞元素常常結合在一起,形成組合式的新聞形態。其中,我們把純粹由文本形態構成的網絡新聞稱之為文本網絡新聞,而把文本形態能獨立構成新聞主體的網絡新聞稱之為綜合文本網絡新聞。
文本網絡新聞以及綜合文本網絡新聞的文本形態部分可以看作是通過互聯網發布、傳播的特定的人類語言產品,按照新聞的定義,當這種特定語言產品以一定的結構形式組織,并反映了國內外新近發生的具有一定社會價值的人和事實的時候,便形成了文本網絡新聞。
從網絡新聞的形式構成可以看出,人類語言包含語音形式及其文本形式,是語音新聞,視頻新聞的語音形態,文本網絡新聞以及綜合文本網絡新聞的文本形態的實現形式,構成了網絡新聞的主體形式。語言文字作為人類社會信息的主要載體,它具有特定的信息結構,因此更有利于減少信息的歧義和節省編碼空間。特別是在網絡空間上,一般說來,新聞的實現訴諸于語言比訴諸于視頻、圖片形式更為經濟、有效;而視頻和圖片則表達了信息的形象性、細節性以及藝術感。事實上,文本和圖片、視頻在網絡新聞中常常是相輔相成的,在圖片新聞和視頻新聞中,語言常常是不可或缺的元素。
三、網絡新聞傳播的信息整合問題
雷躍捷,辛欣(2004)總結了網絡新聞傳播相對于傳統新聞傳播的七大特點,其中包括傳播主體的多元化、傳播方式的多媒體化、傳受關系的交互性、信息傳播的快捷性、傳播內容的廣泛性、傳播環境的全球化等。新的傳播方式提高了物理傳播效率,增加了信息傳遞量和傳遞的可能性,也提升了受眾的需求,但同時也帶來了新的信息整合問題:
(1)由于網絡創造了傳遞網絡上所有新聞的可能性,那么,如何在浩如煙海的網絡新聞中,找到大家最感興趣的內容或者我們所感興趣的內容?
(2)由于我們創造了網絡新聞傳受關系的交互性,那么,如何在浩如煙海的反饋信息中分辨不同的反饋信息和相同的反饋信息?這些反饋信息的比例如何?
(3)由于傳播主體的多元化,傳播環境的全球化以及傳播內容的廣泛性,如何在網絡中過濾我們所不需要的內容,比如虛假信息、意識形態入侵以及色情信息等?
這些問題表明,網絡所造成的信息爆炸的問題在網絡新聞傳播中也同樣存在,只有真正解決這些問題才能使網絡新聞傳播從無序的狀態變為有序的狀態,從而使網絡新聞整合成為可利用的結構性資源。更進一步說,使網絡新聞傳媒成為一個真正的交互式分眾傳媒,即每一對傳播者——受眾的信息都得到相互的理解。
網絡新聞傳播中有兩種重要的力量:人和機器。在傳統的新聞媒體中,所有的傳播過程,比如,在新聞制作過程中,新聞的發現、選擇、編輯、發布等都由人來操控,因此,傳統的新聞媒體存在一個嚴格的把關人角色,只有符合群體規范或把關人價值標準的新聞內容才能進入傳播的渠道。而在網絡新聞傳播中,由于傳播主體的多元化,信息的爆炸效應的存在,造成了把關人角色的相對缺失,這是形成問題(3)的主要原因,因此,解決3個問題的關鍵是塑造網絡把關人的角色。問題(1)和問題(2)是由于信息爆炸和網絡連通效應帶來的新問題。在現實生活中,問題(1)~(3)都可以通過人工干涉得到部分解決。比如,通過建立專門的新聞網站,雇用專門的新聞人解決問題(1),通過人工審查用戶的評論干預問題(3),通過大量的查閱掌握某個話題信息的反饋情況來應對問題(2)。然而,這種解決只是局部的,對于問題(1),某受眾不能發現隱藏于某個論壇或者個人網頁上的或者已被眾多人群關注的重要新聞信息,而問題(2)、(3)的人工解決方案則更顯得應對不暇。解決問題(1)的關鍵在于尋找一種查詢相關的新聞檢索技術,解決問題(2)的關鍵在于建立關于某個新聞話題的評價機制,并尋找一種評價信息的抽取技術。而這些問題都是屬于人類語言技術的研究范疇。
四、語言信息處理技術在信息整合中的作用
語言信息處理技術是以人類語言為對象的信息處理技術,它的目的是讓計算機對語言的處理更加智能化,進而實現自然語言的理解。上文提到,網絡新聞以人類語言為主要載體,可以看作是具有特定結構和特定內容的語言產品。因此,在語言信息處理技術使計算機獲得一定的智能的基礎上,網絡中的計算機對于網絡上新聞內容的一定程度的理解必然會影響網絡新聞的傳播過程,一定程度上實現網絡新聞的自組織和網絡新聞傳播的智能化,使網絡上的新聞自組織為一個具有較高整合性的系統。
(一)查詢相關的新聞檢索技術與網絡新聞分類技術
如何在浩如煙海的網絡新聞中,找到大家最感興趣的內容?理想的解決方法是對網絡上的新聞進行內容分類,然后按照各類數量的降序進行排序。但是,由于網絡新聞數量巨大,需要消耗大量的計算時間,這與新聞的實時性及人們的需求難以相符,使得計算的可行性降低。Google采用了一個簡便而著名的方法PageRank,其基本思想是某個網頁被鏈接(引用)的次數越多,這個網頁就越為重要,其排名就越靠前。這樣網絡新聞便完成了第一遍自組織,成為了具有一定結構的資源,為進一步傳播做好了準備。
然而,網絡上大家最感興趣的新聞內容仍然是數量巨大,豐富多樣的,那么,如何在浩如煙海的網絡新聞中,進一步找到我們所感興趣的內容呢?一般的做法是通過關鍵詞相關的查詢來實現。既然新聞主要是人類語言組織而成的文本,而在網絡上,文本是經過統一編碼的。我們可以通過一定的語言技術,讓計算機在一定程度理解文本,實現查詢與文本的相關性度量,從而找出最為相關的網頁。舉個例子來說,比如我們要查詢“原子能的應用”,如何計算查詢串與文本的相關性,找到相關的網頁呢?我們首先對查詢串進行分詞分為“生物能的應用”,然后計算某個關鍵詞Wi在各個網頁中的出現頻率TFi和含有Wi的逆向文本頻率IDFi,即“所有網頁數/含有Wi的網頁數”,我們把TFi和IDFi相乘作為網頁與Wi相關性的度量。也就是說,關鍵詞Wi在某個網頁中越常見,該網頁與Wi越相關,如某網頁中如果“生物能”出現很多,該網頁與“生物能”就很相關;Wi在各個網頁中分布得越均勻,越不能代表查詢的特征,如“的”可能在各個網頁中分布都很多,所以它不能作為相關性的度量特征,因此IDF可以用作對TF的修正。我們把某網頁中所有關鍵詞的TFi*IDFi的和作為它與查詢相關性的度量。這樣每個網頁便獲得了一個度量值,按照該值與PageRank值的乘積對網頁進行排序,便可獲得我們較為關心的內容的網頁。事實上,TF/IDF的方法可以用來選取網絡新聞的主題特征,從而用于網絡新聞的自動聚類。比如說,對于兩篇網絡新聞,我們可以抽取出TF*IDF值較高的主題詞向量,并把它們的值映射到同一個詞表中,組成兩個具有相同特征和不同特征值的向量V1和V2,應用夾角余弦定理,我們就可以根據向量空間模型計算出兩篇新聞的相似度。將這樣的方法應用于所有的網絡新聞,Google實現了網絡新聞的自動分類,這極大地輔助了網絡新聞的人工編輯工作。
查詢檢索技術和新聞分類技術大大提高了網絡新聞的查詢、組織和傳播的效率。在網絡新聞的傳播過程中,查詢擴展也大大方便了新聞信息的檢索。查詢擴展有多種技術思路,有基于概念擴展的,有基于同現擴展的,限于篇幅,這里不作詳細介紹。
(二)反饋信息采集和評價技術
互動性的大大增強是網絡新聞傳播的一個重要特征。在網絡上,對于一篇新聞報道,常常有成千上萬的反饋信息,這些反饋信息表明了網民對于該新聞的觀點。那么,如何接收和理解這些海量的反饋信息呢?對于網民來說,可以通過逐一閱讀完成信息接收過程,這種接收和理解過程只是局部的,面對海量信息,很少有人能夠讀完所有的信息,對于大家的反饋意見有一個全面的理解。事實上,反饋越多的新聞是大家越為關注的新聞。在某些關鍵的領域,如商業新聞領域,這種反饋顯得尤為重要。舉例來說,如一家汽車企業將要研制或發布一款新的汽車,或者某客戶(個人或單位)需要購置汽車的時候,需要搜集關于汽車指標的相關評論。一般的做法可以在網絡上設置相關的汽車指標,由網民投票來獲得相關信息。但這種做法是有局限的:第一,相關的指標不可能設置太多,否則網民可能完不成全部指標的投票;第二,投票時間可能會比較長,影響商業決策;第三,網民必須瀏覽到投票網頁才能完成投票,大大限制了投票的人流量。
網絡新聞搜集評論信息是一個比較可行的辦法。上文提到,Google使用余弦定理實現了網絡新聞的自動分類。在此技術基礎上,我們可以對某一個主題類別的反饋信息進行進一步的挖掘。首先,根據商家或者客戶的需要,盡可能全面細致地設置挖掘點,比如對于汽車,需要了解外觀、耗油、舒適度、速度、安全性等不同的指標;其次,對每一個指標設置評價向量,比如外觀的積極評價向量可以是{好,酷,漂亮,好看,時髦,……},中等評價向量可以是{一般,中等,……},消極評價向量可以是{丑,難看,差,……},消極評價還可以是積極評價的否定;再次,在局部理解的基礎上,根據這種結構化的評價指標在網絡新聞的反饋信息中進行挖掘,并統計相關數據,由此可以獲得網絡新聞評論的結構化數據,如{外觀(好:80;中:15;差:5),耗油(低:10;一般:10;高:80),舒適度(好:70;中:15;差:5),速度(快:85;中等:15:慢:0);安全性(高:90;中:8;低:2)}。這些數據是基于真實用戶反饋信息而來,對于企業或者客戶的決策具有很高的參考價值。
反饋信息是網絡新聞傳播過程中的一個重要環節,是網絡新聞傳播的互動性的體現。對于一篇網絡新聞,互動不是無限的。我們認為,互動至少終止于第一次的相互理解,包括網絡新聞發布者和接受者之間的相互理解、網絡新聞接受者和接受者之間基于反饋信息的相互理解。如果反饋信息無法得到理解,價值無法體現,網絡新聞傳播的互動性便無法體現。
圖1 一次完整的互動示意圖
很明顯,反饋信息的采集和評價技術有助于更好地完成網絡新聞反饋信息的接受和理解過程,完善了網絡新聞傳播的互動機制,并實現了反饋信息的重大經濟價值及社會價值。
(三)非法網絡新聞及反饋信息過濾技術
在傳統的傳播體系中,新聞的傳播和反饋過程都要經過層層的嚴格把關,不符合群體規范或把關人價值標準的新聞內容往往被提前過濾掉,不能出現在受眾的面前。比如,色情內容的傳播、不同意識形態內容的國際傳播等往往受到比較嚴格的審查。網絡媒體的出現為新聞傳播模式打開了新的局面,造成了傳播主體的多元化,傳播環境的全球化以及傳播內容的廣泛性。這一方面打破了專業新聞機構和新聞人壟斷新聞發布的特權,使得草根階級也能制作和發布新聞信息,出現了民間新聞;另一方面,傳播主體的多元化,網絡傳播的自主性也使得傳播內容更為全面和繁雜。在這種全面和繁雜之中,也摻雜了一些不符合群體規范的新聞內容,如虛假新聞、非法新聞,包括非法的反饋信息。這種局面與傳統的新聞傳播體系走上了兩個極端,即由嚴格的把關人制度到把關人幾乎完全缺失。在語言信息過濾技術之前,一些新聞機構和監管部門只能通過人工審查的辦法在龐大的新聞網絡中尋找和過濾非法新聞,顯然效率是極為低下的。
將語言信息過濾技術應用于新聞審查最成功的案例是基于HNC的邪教信息過濾技術和色情信息過濾技術。HNC是概念層次網絡的簡稱,它是關于自然語言理解處理的一個理論體系,其目標是建立自然語言的知識表述和處理模式,使計算機能夠模擬人腦的語言感知功能。HNC應用于邪教信息過濾和色情信息過濾是在實現文本局部理解的基礎上,實現對文本的語境分析和立場判定,其技術細節仍然是機密。
可以看出,語言信息過濾技術事實上充當了網絡新聞傳播體系的把關人角色。盡管目前這種技術在某些領域取得了成功,但在更多的領域中還沒有得到推廣。由于網絡新聞主要是由人類語言組織而成,因此,重塑把關人角色的重任也必然會由人類語言技術來承擔。隨著語言處理技術的進步,把關人角色必然會進一步地完成領域分化,語言信息過濾技術會在更多的領域中發揮作用。
綜合以上分析,語言信息處理技術,諸如查詢相關的新聞檢索技術與網絡新聞分類技術、反饋信息采集和評價技術、非法網絡新聞及反饋信息過濾技術在網絡新聞傳播中擔負了重要的角色。這些技術將無序狀態的網絡新聞自動地重組為結構化可理解的資源,完善了網絡新聞傳播體系,使得網絡新聞傳播得以高效地運作。
五、結語
本文分析了語言信息處理技術在網絡新聞傳播中的應用表現和重要作用。以往的研究著重于網絡技術和網絡本身的特性對于新聞傳播的影響,而很少從語言技術的角度進行分析。正是由于語言信息處理技術的應用,網絡新聞才得以自組織為一個結構化資源,散落于網格中的潛在熱點網絡新聞才得以浮現在人們的眼前,網絡新聞才得以以更高效的模式傳播;人類語言技術重塑了傳統新聞體系中的新聞把關人的角色,促進了網絡把關人角色的領域分化;人類語言技術還幫助更好地完成了網絡新聞反饋信息的接受和理解過程,完善了網絡新聞傳播的互動機制,并實現了反饋信息的重大經濟價值及社會價值。
參考文獻:
[1]昌慧東.“忽悠”事件與網絡新聞過濾系統缺失[J].傳媒觀察,2008,(3).
[2]雷躍捷,辛欣.網絡新聞傳播概論[M].北京:北京廣播學院出版社,2004.
[3]晉耀紅.HNC(概念層次網絡)語言理解技術及其應用[M].北京:科學出版社,2006.
[4]徐波,孫茂松,靳光瑾.中文信息處理若干重要問題[M].北京:科學出版社,2003.
[5]張甜.對新媒體時代“把關人”理論的新思考[J].新聞實踐,2007,(11).
[6]鄭婧,孫衛.國內自然語言處理技術研究與應用的狀態[J].數字圖書館論壇,2008,(7).
【語言信息處理技術在網絡新聞傳播中的作用探析論文】相關文章:
工程測量中的新技術探析論文04-27
技術地域性與技術傳播問題探析04-30
道教傳播中的語言媒介05-02
道教傳播中的語言媒介05-02
建筑工程中的防滲漏技術探析論文05-02
班主任在高校學風建設中的作用探析的論文04-27
大學英語教學中的文化傳播探析04-26
建筑施工中防水防滲施工技術探析論文04-27
信息技術在美術拓展活動中的應用探析的論文04-27