無論技術進步有多快,也無論企業體驗到之后的好處有多迅速,人們往往展望并期待著下一個大事情的發生。大數據也是一樣。一旦組織開始編制旨在簡化運營、提高收益的大量數據,他們知道他們已經發現了一個非常具有價值并且極具深遠影響的戰略。如今,大數據已經被快速使用,并已在各種各樣的行業極大地提升著公司的運營能力。但接下來將會發生什么呢?對于很多企業來說,大數據到目前為止的影響是沒有什么能與它所提供的尚未開發方式的可能性相提并論。首先在名單上是幾乎沒有觸及文本分析領域,這也被稱為文本挖掘。很多人認為文本分析作為承載企業最多希望的領域,在真正探索到大數據的可能性方面,這些企業是寄予厚望的。
如果要說已經有所作為的話,連續多年來企業也僅僅利用了大數據的一個方面——結構化數據。簡單來說,結構化數據包括了可嚴格測量的數字,這些數字是“冷酷”且“堅硬”的。這可能是指有多少人訪問一個網站,一個特定的產品銷售了多少條目,一個公司生產了多少產品等諸多方面。結構化數據在規模上可以非常廣闊,但其衡量的質量使得它的操作程序更為簡便,并且更易分析。多年以來,平臺和程序已經利用了這一事實。然而,更為復雜的是,這也顯現出了大數據的另外一面——非結構化數據。這是數據僅通過數字本身來予以衡量更為困難的。這種挑戰使得它更難獲得進入眾多企業的入口的鑰匙,但是企業依舊希望在未來能獲得更多更大的成功,而這將需要解鎖并不斷挖掘發現非結構化數據的潛力,這一切將從文本分析開始起步。
文本分析的目的在于從根本上把所有的非結構化數據整合從而化為結構化數據。但由于考慮到大約80%的數據都是非結構化的數據,因此這是一個非常艱難的任務,但它也從中顯示了一個公司可以從這過程中得到多少。非結構化數據可以采取多種多樣的形式,比如Facebook的發布,也可以以微博,語音錄音,在線評論,甚至是視頻的形式。而將解釋所有這些信息歸結為一點,還是需要擁有正確的技術才能做到這樣。因為文本分析,公司可以從通常難以量化的信息中提取大量有價值且有意義的數據,比如社交媒體帖子。這樣的信息可以通過手工勞動進行記錄,但是文本分析是更加具有效率的,并且可以考慮到產品的整體形象或是網絡上提及品牌的全部效益。
文本分析基本上是可以決定一些具有重要性的問題的,比如誰在做評論,在哪里正在做評論,正在說著什么,甚至是非結構化數據的背景以及來龍去脈等諸多問題,文本分析都可以決定。所有這些研究的結果可以被制作成更為可靠且更值得相信的商業情報,從而給企業提供對未來方向、發展規模、企業模式、甚至是未來趨勢的新的見解,正因這樣,企業就可以發揮自己的作用并加以準備以更好地提升效益,從而不斷進步與發展。
利用文本分析來衡量非結構化數據真正價值的途徑備受追捧。文本分析基本上允許公司利用技術聽取網上和其他地方發生的各種對話,給予他們關于客戶情緒體驗的一個更大規模的采樣。文本分析和臨時分析一起應用還可以幫助企業更好地確定客戶喜愛的東西和偏好,幫助他們找出是什么在激勵著他們,而這反過來又有助于提高收入。從文本分析中獲得的反饋也并未經過過濾,但可以給企業更為準確的描述,這個描述是關于消費者如何能真正從多個不同來源的途徑獲得感覺。所有這些新的信息還可以幫助企業想出極具創新思維和發散思路的新產品,因此這也可以讓企業的銷售業績得以提升,讓企業得以發展與進步。
不得不說,這是一個不斷發展并快速前進的行業,這是一個被預測為其整體價值在2020年將遠遠超過60億的行業。只要企業開始使用數據中的一小部分,并且確切地知道他們想找出什么類型和什么方向的信息,他們就會將自己置于一個有利的地位和位置,并為了公司的成長和發展使用該數據。事實上,只要商家愿意探索非結構化數據,文本分析就一定可以被看作是大數據的下一個前沿。(譯文|原文作者:Jonathan Buckley ?來源:CDA數據分析師)