
近年來(lái)大數(shù)據(jù)不斷地向社會(huì)各行各業(yè)滲透,為每一個(gè)領(lǐng)域帶來(lái)變革性影響,并且正在成為各行業(yè)創(chuàng)新的原動(dòng)力和助推器。這一時(shí)期,互聯(lián)網(wǎng)社交互動(dòng)技術(shù)的不斷發(fā)展創(chuàng)新,人們?cè)絹?lái)越習(xí)慣于通過(guò)微博、微信、博客、論壇等社交平臺(tái)去分享各種信息數(shù)據(jù)、表達(dá)訴求、建言獻(xiàn)策,每天傳播于這些平臺(tái)上的數(shù)據(jù)量高達(dá)幾百億甚至幾千億條,這些數(shù)量巨大的社交數(shù)據(jù)構(gòu)成了大數(shù)據(jù)的一個(gè)重要部分,這些數(shù)據(jù)對(duì)于政府收集民意動(dòng)態(tài)、企業(yè)了解產(chǎn)品口碑、公司開(kāi)發(fā)市場(chǎng)需求等發(fā)揮重要作用。
如今,雖然互聯(lián)網(wǎng)已經(jīng)成為收集民意、了解政府和企業(yè)工作成效的一個(gè)非常有效的途徑。然而由于缺乏對(duì)互聯(lián)網(wǎng)發(fā)貼等行為的必要監(jiān)管措施,在輿情危機(jī)事件發(fā)生后,難以及時(shí)有效獲取深層次、高質(zhì)量的網(wǎng)絡(luò)輿情信息,經(jīng)常造成輿情危機(jī)事件處置工作的被動(dòng)。于是,重視對(duì)互聯(lián)網(wǎng)輿情的應(yīng)對(duì),建立起“監(jiān)測(cè)、響應(yīng)、總結(jié)、歸檔”的輿情應(yīng)對(duì)體系是成為大數(shù)據(jù)時(shí)代政務(wù)工作的重要內(nèi)容之一。
在此背景下,輿情監(jiān)測(cè)及分析行業(yè)就是為適應(yīng)大數(shù)據(jù)時(shí)代的輿情監(jiān)測(cè)和服務(wù)而發(fā)展起來(lái)的。其主要專注于通過(guò)海量信息采集、智能語(yǔ)義分析、自然語(yǔ)言處理、數(shù)據(jù)挖掘,以及機(jī)器學(xué)習(xí)等技術(shù),不間斷地監(jiān)控網(wǎng)站、論壇、博客、微博、平面媒體、微信等信息,及時(shí)、全面、準(zhǔn)確地掌握各種信息和網(wǎng)絡(luò)動(dòng)向,從浩瀚的大數(shù)據(jù)宇宙中發(fā)掘事件苗頭、歸納輿論觀點(diǎn)傾向、掌握公眾態(tài)度情緒、并結(jié)合歷史相似和類似事件進(jìn)行趨勢(shì)預(yù)測(cè)和應(yīng)對(duì)建議。
大數(shù)據(jù)在輿情監(jiān)測(cè)上的應(yīng)用價(jià)值
(一)大數(shù)據(jù)價(jià)值的核心:輿情預(yù)測(cè)
傳統(tǒng)網(wǎng)絡(luò)輿論引導(dǎo)工作的起點(diǎn),是對(duì)已發(fā)生的網(wǎng)絡(luò)輿情進(jìn)行監(jiān)測(cè)開(kāi)始。然而這種方式的局限在于滯后性。大數(shù)據(jù)技術(shù)的應(yīng)用,就是挖掘、分析網(wǎng)絡(luò)輿情相關(guān)聯(lián)的數(shù)據(jù),將監(jiān)測(cè)的目標(biāo)時(shí)間點(diǎn)提前到敏感消息進(jìn)行網(wǎng)絡(luò)傳播的初期,通過(guò)建立的模型,模擬仿真實(shí)際網(wǎng)絡(luò)輿情演變過(guò)程,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)突發(fā)輿情的預(yù)測(cè)。
(二)大數(shù)據(jù)價(jià)值的條件:輿情全面
大數(shù)據(jù)技術(shù)要預(yù)測(cè)輿情,首要條件是對(duì)各種關(guān)聯(lián)的全面數(shù)據(jù)進(jìn)行分析計(jì)算。傳統(tǒng)數(shù)據(jù)時(shí)代,分析網(wǎng)民觀點(diǎn)或輿情走勢(shì)時(shí),只關(guān)注網(wǎng)民跟帖態(tài)度和情緒,忽視了網(wǎng)民心理的變化;只關(guān)注文本信息,而較少關(guān)注圖像、視頻、語(yǔ)音等內(nèi)容;只觀察輿論局部變化,忽視其他群體的輿論變化;只解讀網(wǎng)民文字內(nèi)容,而忽視復(fù)雜多變的社會(huì)關(guān)系網(wǎng)絡(luò)。從輿情分析角度看,網(wǎng)民僅僅是信息海洋中的"孤獨(dú)僵尸",猶如蟻群能夠涌現(xiàn)高度智能,而單個(gè)螞蟻如附熱鍋到處亂竄。
大數(shù)據(jù)時(shí)代,突破了傳統(tǒng)數(shù)據(jù)時(shí)代片面化、單一化、靜態(tài)化的思維,開(kāi)始立體化、全局化、動(dòng)態(tài)化研究網(wǎng)絡(luò)輿情數(shù)據(jù),將看似無(wú)關(guān)緊要的輿情數(shù)據(jù)納入分析計(jì)算的范圍。
(三)大數(shù)據(jù)價(jià)值的基礎(chǔ):輿情量化
大數(shù)據(jù)預(yù)測(cè)輿情的價(jià)值實(shí)現(xiàn),必須建立在對(duì)已挖掘出的海量信息,利用數(shù)學(xué)模型進(jìn)行科學(xué)計(jì)算分析的基礎(chǔ)之上,其前提是各類相關(guān)數(shù)據(jù)的量化,即一切輿情信息皆可量化。但數(shù)據(jù)量化,不等同于簡(jiǎn)單的數(shù)字化,而是數(shù)據(jù)的可計(jì)算化。要在關(guān)注網(wǎng)民言論的同時(shí),統(tǒng)計(jì)持此意見(jiàn)的人群數(shù)量;在解讀網(wǎng)民言論文字內(nèi)容的同時(shí),計(jì)算網(wǎng)民互動(dòng)的社會(huì)關(guān)系網(wǎng)絡(luò)數(shù)量;對(duì)于網(wǎng)民情緒的變化,可通過(guò)量化的指標(biāo)進(jìn)行標(biāo)識(shí)等。
(四)大數(shù)據(jù)價(jià)值的關(guān)鍵:輿情關(guān)聯(lián)
數(shù)據(jù)背后是網(wǎng)絡(luò),網(wǎng)絡(luò)背后是人,研究網(wǎng)絡(luò)數(shù)據(jù)實(shí)際上是研究人組成的社會(huì)網(wǎng)絡(luò)。大數(shù)據(jù)技術(shù)預(yù)測(cè)輿情的價(jià)值實(shí)現(xiàn),最關(guān)鍵的技術(shù)就是對(duì)輿情間的關(guān)系進(jìn)行關(guān)聯(lián),將不再僅僅關(guān)注傳統(tǒng)意義上的因果關(guān)系,更多關(guān)注數(shù)據(jù)間的相關(guān)關(guān)系。按大數(shù)據(jù)思維,每一個(gè)數(shù)據(jù)都是一個(gè)節(jié)點(diǎn),可無(wú)限次地與其他關(guān)聯(lián)數(shù)據(jù)形成輿情鏈上的乘法效應(yīng)--類似微博裂變傳播路徑,數(shù)據(jù)裂變式的關(guān)聯(lián)狀態(tài)蘊(yùn)含著無(wú)限可能性。
大數(shù)據(jù)時(shí)代的輿情監(jiān)測(cè)瓶頸
目前,各地輿情監(jiān)測(cè)工作的主要手段仍以人工檢索為主,盡管也使用了市面相對(duì)成熟的相關(guān)搜索軟件進(jìn)行輔助搜索,但搜索輿情的技術(shù)仍采用傳統(tǒng)的二維搜索方式,即主題關(guān)鍵詞和網(wǎng)絡(luò)平臺(tái)二維坐標(biāo),由輿情員對(duì)采集的信息進(jìn)行二次加工成輿情產(chǎn)品。
但搜索的輿情信息結(jié)果多為一級(jí)文本信息,對(duì)于深層次的多級(jí)輿情信息,如新聞、微博后的評(píng)論,網(wǎng)民的社會(huì)關(guān)系,網(wǎng)民針對(duì)某一事件評(píng)論反映出的情緒變化,以及網(wǎng)民煽動(dòng)性、行動(dòng)性的言論、暗示等數(shù)據(jù)無(wú)法深度挖掘,仍靠人工采集和分析判斷。受制于輿情員的知識(shí)水平和價(jià)值判斷的不同,極有可能導(dǎo)致有價(jià)值的輿情信息丟失,無(wú)法準(zhǔn)確及時(shí)預(yù)測(cè)輿情走勢(shì),大大降低了輿情監(jiān)測(cè)工作的效率、準(zhǔn)確性,增加了有價(jià)值輿情信息發(fā)現(xiàn)的偶然性和投機(jī)性,為重大突發(fā)事件的輿情預(yù)測(cè)埋下隱患。
大數(shù)據(jù)背景下輿情監(jiān)測(cè)的實(shí)現(xiàn)
對(duì)大數(shù)據(jù)的采集加工是整個(gè)輿情監(jiān)測(cè)的基礎(chǔ),掌握數(shù)據(jù)抓取能力,通過(guò)“加工”實(shí)現(xiàn)數(shù)據(jù)的“增值”是輿情監(jiān)測(cè)分析的必備技能。樂(lè)思網(wǎng)絡(luò)輿情監(jiān)測(cè)系統(tǒng)因配置自己研發(fā)不同于爬蟲(chóng)技術(shù)的領(lǐng)先采集技術(shù),用戶不但可以監(jiān)測(cè)各種正文信息,還可配置系統(tǒng)采集獲取某些主題的最新回復(fù)內(nèi)容,并獲取其詳細(xì)信息,如查看數(shù),回復(fù)數(shù),回復(fù)人,回復(fù)時(shí)間等。許多網(wǎng)站結(jié)構(gòu)復(fù)雜或采用了Frame或采用了JavaScript動(dòng)態(tài)寫入內(nèi)容或采用了Ajax技術(shù)實(shí)時(shí)自動(dòng)刷新內(nèi)容,這些都是普通爬蟲(chóng)技術(shù)很難處理或無(wú)法處理的。對(duì)于采集監(jiān)測(cè)到的信息,系統(tǒng)可以自動(dòng)加以分類,以負(fù)面輿情,與我相關(guān),我的關(guān)注,專題跟蹤等欄目分類呈現(xiàn),讓用戶可以直奔主題,最快找到自己需要的信息。
對(duì)趨勢(shì)的研判則是大數(shù)據(jù)時(shí)代輿情監(jiān)測(cè)的目標(biāo)。如今人們能夠從浩如煙海的數(shù)據(jù)中挖掘信息、判斷趨勢(shì)、提高效益,但這遠(yuǎn)遠(yuǎn)不夠,信息爆炸的時(shí)代要求人們不斷增強(qiáng)關(guān)聯(lián)輿情信息的分析和預(yù)測(cè),把監(jiān)測(cè)的重點(diǎn)從單純的收集有效數(shù)據(jù)向?qū)浨榈纳钊胙信型卣埂?lè)思輿情監(jiān)測(cè)系統(tǒng)對(duì)監(jiān)測(cè)到的負(fù)面信息實(shí)施專題重點(diǎn)跟蹤監(jiān)測(cè),重點(diǎn)首頁(yè)進(jìn)行定時(shí)截屏監(jiān)測(cè)及特別頁(yè)面證據(jù)保存。監(jiān)測(cè)人員可以對(duì)系統(tǒng)自動(dòng)識(shí)別分類后的信息進(jìn)行再次挑選和分類,并可以基于工作需要輕松導(dǎo)出含有分析數(shù)據(jù)圖表的輿情日?qǐng)?bào)周報(bào),減輕輿情數(shù)據(jù)分析,統(tǒng)計(jì)作圖的繁雜度。對(duì)于某些敏感信息,系統(tǒng)還可通過(guò)短信和郵件及時(shí)通知用戶,這樣用戶隨時(shí)都可遠(yuǎn)程掌握重要輿情的動(dòng)態(tài)。
大數(shù)據(jù)時(shí)代需要大采集,大數(shù)據(jù)時(shí)代需要大分析,這是數(shù)據(jù)爆炸背景下的數(shù)據(jù)處理與應(yīng)用需求的體現(xiàn),而傳統(tǒng)的人工采集、人工監(jiān)測(cè)顯然難以滿足大數(shù)據(jù)背景下對(duì)數(shù)據(jù)需求及應(yīng)用的要求。樂(lè)思網(wǎng)絡(luò)輿情監(jiān)測(cè)平臺(tái)成功地實(shí)現(xiàn)了針對(duì)互聯(lián)網(wǎng)海量輿情自動(dòng)實(shí)時(shí)的監(jiān)測(cè)、自動(dòng)內(nèi)容分析和自動(dòng)報(bào)警的功能,有效地解決了傳統(tǒng)的以人工方式對(duì)輿情監(jiān)測(cè)的實(shí)施難題,加快了網(wǎng)絡(luò)輿論的監(jiān)管效率,有利于組織力量展開(kāi)信息整理、分析、引導(dǎo)和應(yīng)對(duì)工作,提高用戶對(duì)網(wǎng)絡(luò)突發(fā)輿情的公共事件應(yīng)對(duì)能力,加強(qiáng)互聯(lián)網(wǎng)“大數(shù)據(jù)”分析研判。
政府輿情監(jiān)測(cè)如何實(shí)現(xiàn)預(yù)警負(fù)面、危機(jī)公關(guān)和反饋民意?
互聯(lián)網(wǎng)時(shí)代 企業(yè)如何從網(wǎng)絡(luò)大數(shù)據(jù)中挖掘市場(chǎng)新需求
物價(jià)局如何化解負(fù)面價(jià)格輿情引發(fā)的危機(jī)?
網(wǎng)絡(luò)大數(shù)據(jù)挖掘如何促進(jìn)防災(zāi)減災(zāi)工作?
如何推進(jìn)消防負(fù)面輿情監(jiān)測(cè)工作化解消防輿情危機(jī)