無(wú)論技術(shù)進(jìn)步有多快,也無(wú)論企業(yè)體驗(yàn)到之后的好處有多迅速,人們往往展望并期待著下一個(gè)大事情的發(fā)生。大數(shù)據(jù)也是一樣。一旦組織開(kāi)始編制旨在簡(jiǎn)化運(yùn)營(yíng)、提高收益的大量數(shù)據(jù),他們知道他們已經(jīng)發(fā)現(xiàn)了一個(gè)非常具有價(jià)值并且極具深遠(yuǎn)影響的戰(zhàn)略。如今,大數(shù)據(jù)已經(jīng)被快速使用,并已在各種各樣的行業(yè)極大地提升著公司的運(yùn)營(yíng)能力。但接下來(lái)將會(huì)發(fā)生什么呢?對(duì)于很多企業(yè)來(lái)說(shuō),大數(shù)據(jù)到目前為止的影響是沒(méi)有什么能與它所提供的尚未開(kāi)發(fā)方式的可能性相提并論。首先在名單上是幾乎沒(méi)有觸及文本分析領(lǐng)域,這也被稱(chēng)為文本挖掘。很多人認(rèn)為文本分析作為承載企業(yè)最多希望的領(lǐng)域,在真正探索到大數(shù)據(jù)的可能性方面,這些企業(yè)是寄予厚望的。
如果要說(shuō)已經(jīng)有所作為的話,連續(xù)多年來(lái)企業(yè)也僅僅利用了大數(shù)據(jù)的一個(gè)方面——結(jié)構(gòu)化數(shù)據(jù)。簡(jiǎn)單來(lái)說(shuō),結(jié)構(gòu)化數(shù)據(jù)包括了可嚴(yán)格測(cè)量的數(shù)字,這些數(shù)字是“冷酷”且“堅(jiān)硬”的。這可能是指有多少人訪問(wèn)一個(gè)網(wǎng)站,一個(gè)特定的產(chǎn)品銷(xiāo)售了多少條目,一個(gè)公司生產(chǎn)了多少產(chǎn)品等諸多方面。結(jié)構(gòu)化數(shù)據(jù)在規(guī)模上可以非常廣闊,但其衡量的質(zhì)量使得它的操作程序更為簡(jiǎn)便,并且更易分析。多年以來(lái),平臺(tái)和程序已經(jīng)利用了這一事實(shí)。然而,更為復(fù)雜的是,這也顯現(xiàn)出了大數(shù)據(jù)的另外一面——非結(jié)構(gòu)化數(shù)據(jù)。這是數(shù)據(jù)僅通過(guò)數(shù)字本身來(lái)予以衡量更為困難的。這種挑戰(zhàn)使得它更難獲得進(jìn)入眾多企業(yè)的入口的鑰匙,但是企業(yè)依舊希望在未來(lái)能獲得更多更大的成功,而這將需要解鎖并不斷挖掘發(fā)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)的潛力,這一切將從文本分析開(kāi)始起步。
文本分析的目的在于從根本上把所有的非結(jié)構(gòu)化數(shù)據(jù)整合從而化為結(jié)構(gòu)化數(shù)據(jù)。但由于考慮到大約80%的數(shù)據(jù)都是非結(jié)構(gòu)化的數(shù)據(jù),因此這是一個(gè)非常艱難的任務(wù),但它也從中顯示了一個(gè)公司可以從這過(guò)程中得到多少。非結(jié)構(gòu)化數(shù)據(jù)可以采取多種多樣的形式,比如Facebook的發(fā)布,也可以以微博,語(yǔ)音錄音,在線評(píng)論,甚至是視頻的形式。而將解釋所有這些信息歸結(jié)為一點(diǎn),還是需要擁有正確的技術(shù)才能做到這樣。因?yàn)槲谋痉治觯究梢詮耐ǔky以量化的信息中提取大量有價(jià)值且有意義的數(shù)據(jù),比如社交媒體帖子。這樣的信息可以通過(guò)手工勞動(dòng)進(jìn)行記錄,但是文本分析是更加具有效率的,并且可以考慮到產(chǎn)品的整體形象或是網(wǎng)絡(luò)上提及品牌的全部效益。
文本分析基本上是可以決定一些具有重要性的問(wèn)題的,比如誰(shuí)在做評(píng)論,在哪里正在做評(píng)論,正在說(shuō)著什么,甚至是非結(jié)構(gòu)化數(shù)據(jù)的背景以及來(lái)龍去脈等諸多問(wèn)題,文本分析都可以決定。所有這些研究的結(jié)果可以被制作成更為可靠且更值得相信的商業(yè)情報(bào),從而給企業(yè)提供對(duì)未來(lái)方向、發(fā)展規(guī)模、企業(yè)模式、甚至是未來(lái)趨勢(shì)的新的見(jiàn)解,正因這樣,企業(yè)就可以發(fā)揮自己的作用并加以準(zhǔn)備以更好地提升效益,從而不斷進(jìn)步與發(fā)展。
利用文本分析來(lái)衡量非結(jié)構(gòu)化數(shù)據(jù)真正價(jià)值的途徑備受追捧。文本分析基本上允許公司利用技術(shù)聽(tīng)取網(wǎng)上和其他地方發(fā)生的各種對(duì)話,給予他們關(guān)于客戶情緒體驗(yàn)的一個(gè)更大規(guī)模的采樣。文本分析和臨時(shí)分析一起應(yīng)用還可以幫助企業(yè)更好地確定客戶喜愛(ài)的東西和偏好,幫助他們找出是什么在激勵(lì)著他們,而這反過(guò)來(lái)又有助于提高收入。從文本分析中獲得的反饋也并未經(jīng)過(guò)過(guò)濾,但可以給企業(yè)更為準(zhǔn)確的描述,這個(gè)描述是關(guān)于消費(fèi)者如何能真正從多個(gè)不同來(lái)源的途徑獲得感覺(jué)。所有這些新的信息還可以幫助企業(yè)想出極具創(chuàng)新思維和發(fā)散思路的新產(chǎn)品,因此這也可以讓企業(yè)的銷(xiāo)售業(yè)績(jī)得以提升,讓企業(yè)得以發(fā)展與進(jìn)步。
不得不說(shuō),這是一個(gè)不斷發(fā)展并快速前進(jìn)的行業(yè),這是一個(gè)被預(yù)測(cè)為其整體價(jià)值在2020年將遠(yuǎn)遠(yuǎn)超過(guò)60億的行業(yè)。只要企業(yè)開(kāi)始使用數(shù)據(jù)中的一小部分,并且確切地知道他們想找出什么類(lèi)型和什么方向的信息,他們就會(huì)將自己置于一個(gè)有利的地位和位置,并為了公司的成長(zhǎng)和發(fā)展使用該數(shù)據(jù)。事實(shí)上,只要商家愿意探索非結(jié)構(gòu)化數(shù)據(jù),文本分析就一定可以被看作是大數(shù)據(jù)的下一個(gè)前沿。(譯文|原文作者:Jonathan Buckley ?來(lái)源:CDA數(shù)據(jù)分析師)
]]>