“互聯網+”時代人人都是自媒體,人人都有麥克風,6.88億的中國網民都在通過微信、微博、論壇、貼吧、SNS、博客等網絡平臺發表言論、參與交流,匯集成網絡民意,形成網絡輿論?;ヂ摼W如今已經成為收集民意、了解政府和企業工作成效的一個非常有效的途徑,各地政府及企業也越來越關注網絡輿情動態。
大數據視角下的輿情分析
海量的互聯網社交信息使社交輿情在大數據的應用及落地方面具備了先天的優勢和基礎。但大數據的價值不在信息本身,而在于通過分析數據的關聯性來指導決策及預測未來。社交輿情分析是網絡輿論引導的前提,而大數據技術為網絡輿情分析、預測提供了支撐和保證。大數據技術的應用,就是挖掘、分析網絡輿情相關聯的數據,將監測的目標時間點提前到敏感消息進行網絡傳播的初期,通過建立的模型,模擬仿真實際網絡輿情演變過程,實現對網絡輿情預測。
輿情系統使用行業領先的大數據基礎平臺存儲海量的非結構數據,通過高效的算法分析模塊從豐富的數據集中挖掘出極具價值的信息,從浩瀚的數據宇宙中發掘事件苗頭、歸納輿論觀點傾向、掌握公眾態度情緒,全面實現為政府洞察熱點事件,為企業收集品牌、口碑、競爭對手等情報,幫助用戶第一時間發現輿情、跟蹤輿情、了解輿情發展的整個過程。
對大數據的采集加工是整個輿情分析服務的基礎,掌握數據抓取能力與輿情解讀能力,通過“加工”實現數據的“增值”,是輿情分析的必備技能。社交輿情系統通過采用分布式數據采集系統,高效、準確、實時的對覆蓋主流的微博、微信、知乎、豆瓣、貼吧、天涯等社交平臺數據進行采集。
如何對復雜大數據進行分析及解釋是輿情系統的關鍵,數據分析的模式是否科學將直接影響數據分析的質量,也決定了輿情信息的價值?;跀祿治?,能否提煉出獨到、高質量的觀點,在凌亂紛繁的數據背后找到更符合客戶要求的有價值信息,這是大數據時代輿情最大的變量。社交輿情分析系統,以文本分類、聚類、觀點傾向識別等計算機文本信息內容識別技術為基礎,以數據挖掘技術為核心,應用不同的數據建模,包括關聯規則、序列模式、頻繁序列、決策樹分類、神經元網絡、模糊聚類、異常檢測等多種數據挖掘算法,結合相應的數據可視化方法,實現對輿情數據進行分析預測。