【摘要】隨著互聯網信息技術的飛速發展,企業網絡數據抓取、儲存、分析、處理及其應用已變得很便捷,企業戰略決策和危機處置正在朝數據驅動型的預測、發展和決策的方向發生轉變。因此,未來應對競爭和危機的決策行為將基于對網絡數據抓取與分析,而并不是依靠經驗和直覺判斷的傳統模式。
“大數據”時代真的來臨?
進入21世紀,信息的爆炸式增長帶了數據的海量化,面對規模日益龐大的數據量,全球知名咨詢公司麥肯錫提出“大數據”時代說,麥肯錫稱:數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素,人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來。
有統計顯示,互聯網一天產生的全部數據內容可以刻滿1.68億張DVD;發出的郵件有2940億封之多;發出的社區帖子達200萬個,相當于《時代》雜志770年的文字量;賣出的手機為37.8萬臺,高于全球每天出生的嬰兒數量37.1萬。2011年,全球產生的數量高達1.82ZB,相當于全球每人產生200GB以上的數據。而到目前為止,人類生產的所有印刷材料的數據量是200PB(1024TB=1PB),全人類歷史上說過的所有話的數據量大約是5EB(1024PB=1EB)。
“大數據”的最早提出是基于經濟領域的,而當下已發展至軍事、通訊、金融、行政等各領域,全球正在超大數據時代邁進。近年來,互聯網信息行業的發展使得“大數據戰略”備受人們的關注,作為“大數據”戰略基礎的網絡數據抓取成為時下企業戰略制定的一部分。
“大數據”時代給企業帶來怎樣的機遇與挑戰?
隨著互聯網信息技術的飛速發展,企業網絡數據抓取、儲存、分析、處理及其應用已變得很便捷,企業戰略決策和危機處置正在朝數據驅動型的預測、發展和決策的方向發生轉變。因此,未來應對競爭和危機的決策行為將基于對網絡數據抓取與分析,而并不是依靠經驗和直覺判斷的傳統模式。
德溫特資本市場公司就是大數據運用的受益者。該公司首席執行官保羅·霍廷每天的工作之一,就是利用電腦程序分析全球3.4億微博賬戶的留言,進而判斷民眾情緒,再以“1”到“50”進行打分。根據打分結果,霍廷再決定如何處理手中數以百萬美元計的股票。這一招收效顯著——今年第一季度,霍廷的公司獲得了7%的收益率。
現今,數據的作用正在迅速膨脹并變大,它影響著企業工作戰略的制定,雖然現在企業可能并沒有意識到網絡數據抓取的不到位給自身工作帶來的問題和隱患,但是隨著時間的推移,人們將越來越多的意識到數據對企業的重要性。特別在網絡輿情危機頻發的網絡信息環境下,面對海量的網絡信息數據,依托網絡數據抓取的大數據戰略建設是當下企業應對突發危機事件的重要手段。準確全面的網絡數據抓取,合理的數據分析可以幫助企業了解各種危機要素的發展動態,通過信息數據分析事件參與者的所思所想,依據數據分析結果做出正確的處置措施。
網絡數據抓取將如何推進 “大數據戰略”建設?
數據承載事實、承載民意,在民眾意見表達、監督方面,以及在政府政策的制定、實行方面或企業的盈利創新方面,都起到極大功能,并且是清晰有力的。相信數據、用數據來說話,是理性精神的一種表現。而建立“大數據戰略”體系,其首要實現的是網絡數據抓取,因為企業對各類數據的分析解讀與應用都必須是在采集到的數據上進行,只有通過對所需數據的全面準確采集,形成數據流規模,然后再對數據流進行分析,這樣分析出的數據結果對決策行為才有指導性作用。
“大數據戰略”的建設,對網絡數據抓取工作的要求主要涉及兩個方面:
一、全面的網絡數據抓取。在這里,網絡數據抓取是指利用像樂思信息采集系統這樣的采集軟件,對各類網絡媒介,如搜索引擎、新聞網站、論壇、微博、博客和其他各類型網頁的各種頁面信息通過要素采集、關鍵詞抽取、全文索引等方式進行信息網絡數據抓取,主要有文本信息、URL、數字、日期和圖片等,然后把采集的到的各類數據進行自動去重和分類歸納存儲。足夠的數據量是企業大數據戰略建設的基礎,就像做房子所需的給類建筑材料,這些建筑材料在大數據戰略里就是數據信息。
二、準確的數據分析和使用。完成全面網絡數據抓取后,就應該有準確的分析和使用數據能力,透過對采集數據的深入分析,了解事件的事實真相和事件背后的社情民意,預判各種事件的發展走向,這些變動對整個大局會產生什么樣的影響,影響是否會阻礙自身的健康發展,這認識得需要我們用數據來衡量,用數據放映出的事實來指導我們工作策略的制定,讓我們的工作決策理性化而不是經驗化。
盜用