“在數據中,你能看到人性。”淘寶網大數據部門負責人車品覺說。
這位面帶佛相的香港人,當過警察,在匯豐銀行、微軟、eBay做過產品經理,如今在中國最大的電子商務網站做“千淘萬漉雖辛苦,吹盡狂沙未必見金”的數據分析工作,卻能語帶禪機,動心忍性。
他舉了一個例子。“一個蘋果切成很多小塊,每一塊跟這個蘋果是什么關系?不分也不離,DNA是一樣的,這就是相依。做電商都要看購買轉化率,這和公司主體架構不分也不離。企業的業務今天做得很好,肯定有一個不好,這是數據的相對性。”
有一次,車品覺做產品思路停滯,去問師父。師父只說了四個字,讓他回去好好參悟。這四個字就是佛學般若理論中的“四重緣起”:業因、相依、相對、相礙。研究緣起,本質就知道了。
阿彌陀佛,搞電商需要如此玄虛嗎?尤其是在全球都忽然炙手可熱的大數據(Big Data)領域。難道這就是2009年阿里巴巴集團十周年,馬云給總理寫信說的“我們今天掌握的數據,對國家宏觀經濟、微觀經濟,對個人消費,特別對制造業是巨大無比的寶庫”嗎?這就是2012年9月在第九屆全國網商大會上,馬云提出的阿里巴巴“三步戰略”:平臺、金融、數據,“希望用大量的數據為國家和小企業做出預報”嗎?這些商業上的概念跟歷史學家黃仁宇所謂的現代化社會需要“數目化管理”又有什么關系?且讓我們進入海量數據的世界一窺究竟。一切有為法,如夢幻泡影。
杭州,淘寶總部,墻上掛著十幾個大屏幕,數字不斷閃動,一片繁忙的景象。在大數據部門員工面前的電腦屏幕上,則布滿了顏色各異的小方塊。每個方塊代表一種痛點——淘寶賣家在經營中遭遇的痛。不同的顏色代表疼痛的程度。“這有點像醫院監控病人的心電圖。”車品覺說。只要心電圖出現異動,淘寶馬上就能發覺,并采取相應策略。
這個產品取名為“無量神針”,后面有一行小字“傾聽用戶的痛”。車品覺帶領團隊開發了三個多月。他和淘寶客服部門合作,監聽著大約幾百萬淘寶賣家的心跳,每天都要收集和分析大量從賣家反饋回來的信息。
淘寶在收集和整理信息方面處于互聯網業領先地位,已經不再限于簡單的監聽了,甚至可以在賣家做出市場反應之前做出預測。聽起來是不是有點像天橋下在地上鋪一張八卦圖看相算命的白胡子老頭?不但可以說出你未來的兇兆,如果你愿意多花點錢,還可以幫你逢兇化吉。不同的是,淘寶大數據產品的一切論據都來源于真實而科學的監測數據,而不是掐指一算。
利用“無量神針”,淘寶的管理者可以辨別出萌芽狀態的可疑行為。比如某段時間賣家被“惡拍”(買家拍下產品,等產品送貨上門之后又以各種理由拒收)的風險急劇上升,通過大數據分析可以看出,這種情況往往有因在先,一定是某個環節出了問題,一份“異動報告”就交到淘寶總裁“張三豐”的辦公桌上。當然,“無量神針”也可能做出另外的判斷,認為“異動”只是一場虛驚,并給出合理的解釋。
“大數據的意義就是通過數據互聯產生的價值。”車品覺說。這款產品就是大數據團隊把淘寶交易流程各個環節的數據整合互聯,然后基于商業理解對信息進行分類儲存和分析加工,并與決策行為連接起來所產生的效果。車品覺希望能幫助公司完成一項具有歷史意義的動作——減少淘寶的客服量,提高淘寶的服務質量。
這只是車品覺帶領團隊開發的三款大數據產品中的一款。另外兩款將分別針對并提供給買家(通過收集分析淘寶買家的購物行為,為買家量身打造一款完善網購體驗的產品)和淘寶各個類目“小二”(輔助淘寶員工的日常工作)使用。屆時,這三款產品將形成一個封閉的三角形,把淘寶每天產生的數以萬計的數據鎖在三角形中,互融互通。
為開發大數據產品,淘寶管理層開了三天閉門會議,各種職能和級別的“小二”都有代表參加。聽取完所有人的意見之后,車品覺給大數據開發團隊定下了兩個原則,第一,一定要以用戶為中心思考問題。他特別舉了一個例子:下午2點,招商銀行有20個人在排隊,如果銀行管理者想看一下自己的服務質量,他也許會說把每個柜臺排隊的人數報上來,這種是以公司為中心的數據;如果他問用戶平均要多少分鐘才可以得到服務,也就是說,通過每個用戶平均要等多少分鐘(用戶的痛)來計算銀行的服務質量,這就是以用戶為中心的數據。看似細微的變化,其實蘊含著產品的真諦。“‘無量神針’就有一點這個味道。”
第二個原則,“這東西一定要一目了然,不能太復雜”,最后呈現的結果成了一張“彩色圖譜”,每個痛點直觀醒目。車品覺是在2012年初從兄弟公司支付寶借調到淘寶的。“在我沒到淘寶前,他們做了很多報告,但CEO都不太看的,也不太知道看的是什么。如果公司在這個階段,你還提什么數據挖掘,沒意義。”車品覺說,“所以現在我很怕中國企業又興起一種風氣,一堆人說我們用數據來發現價值,但是連基本功都沒練好。”
微軟的MSN雖然快要消失了,但在2002年,如果一個新用戶注冊了MSN,微軟會立刻判斷出他的行為習慣。“微軟的后臺數據一直很厲害,它可以通過30%已知用戶的數據去分析判斷剩下70%的未知用戶。”當時,車品覺在微軟亞洲做MSN產品經理,“至今還沒有看到哪個國內公司可以做到這個地步”。
在國內IT公司,做商業產品的和做技術的往往是兩撥人,懂產品的不懂技術,懂技術的沒有商業思維,這也是制約大數據發展的一個重要原因。2006年,車品覺記得在eBay時,每個產品部門都有自己的技術人員,負責幫助產品經理挖掘分析數據,而不用凡事求救于公司技術部門。“要么降低技術門檻,要么提高產品經理的數據能力,顯然前者更靠譜。所以,我們把“無量神針”做得足夠直觀,讓任何一個不懂技術的人都能看懂,都能運用。”
2010年,車品覺加入支付寶任商業智能官(BI),2012年年中加入淘寶,重新創建大數據部門,全面負責淘寶的數據倉庫、存儲、挖掘、分析以及應用等一系列大數據工作。按理說,今年是馬云提出阿里巴巴“休養生息”的一年,大幅削減了員工招聘計劃,但是,大數據部門卻獲得特權,批量網羅人才。如今,車品覺兼管著支付寶和淘寶兩個公司的大數據部門。阿里巴巴在大數據方面的戰略規劃中,由“七公”(花名)帶領另一支大數據團隊正在秘密籌建一條大數據“高速公路”,而車品覺則會扮演“賽車手”的角色。這兩支隊伍分工協作,由阿里巴巴集團首席數據官陸兆禧統領。
就在今年9月的網商大會上,馬云公布了阿里集團未來新戰略:平臺、金融、數據。此前早些時候,阿里任命陸兆禧為首席數據官。陸堪稱馬云的一員福將,當年就是他帶領幾號人創建了支付寶,后來長期擔任淘寶網總裁,2011年初,衛哲辭職事件之后他轉任阿里巴巴B2B公司CEO。如今他又擔起了數據未來的重任,可見馬云對于大數據的看重絕非口頭文章。其實,早在2005年,馬云就曾經對一位外國朋友說過,阿里巴巴的交易數據都保存完整,早晚有一天會派上大用場。
大數據的典型應用場景是:百萬級用戶,千萬級頁面訪問,億級數據接口請求,萬億字節(TB)/千萬億字節(PB)級后臺數據處理吞吐量。淘寶擁有全國最大的Hadoop分布式計算集群之一,日新增數據50TB,有40PB海量數據存儲。今年“雙十一”,天貓和淘寶交易額191億元,支付寶處理交易筆數1.058億筆,峰值時期處理交易筆數9萬筆/分鐘,核心數據庫集群處理了41億個事務。
在“雙十一”之前,淘寶大數據部門做了詳細預測,基本上還是監控的作用。兩周過后,他們會提煉一份數據報告,詳細分析新增用戶數、各級轉化率、每個類目的比較等。但這些仍屬于業務數據層面,真正大數據層面的,用數據解釋未來,還要更長時間去研究。
車品覺仔細觀察,“雙十一”當天,淘寶網有2.15億用戶購物,而中國網購用戶群一共只有3億人,也就是說當天大部分人都上來了。“這些用戶是從哪里來的呢?被突然喚醒的人是值得研究的,也許正是電商的一些機會點。”
大數據并非一個新詞。被譽為“數據倉庫之父”的Bill Inmon早在20世紀90年代就經常將“Big Data”掛在嘴邊了。大數據之所以在這一兩年迅速走紅,要歸結于互聯網、移動設備、物聯網和云計算的迅猛發展,使得人類每分每秒都在產生巨量數據——從出現文明到2003年,人類總共才創造5EB(百億億字節)的數據,但現在僅兩天就造出相同數據量。
2012年初,瑞士達沃斯論壇,一份題為《大數據,大影響》(Big Data,Big Impact)的報告稱,數據已經成為一種新的經濟資產類別,就像貨幣或黃金一樣。麥肯錫定義大數據是:互聯網公司在日常運營中生成、累積的用戶網絡行為數據增長如此之快,規模如此龐大,以至于不能用常見的G或T來衡量,起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T)。IDC把大數據的商業價值總結為四個方面:對顧客群體細分,針對性營銷;模擬實境,發掘新需求;提高大數據成果在各相關部門的分享程度,提高整個管理鏈條和產業鏈條的投入回報率;進行產品、服務和商業模式的創新。幾十年來,要對付巨量數據,只有財富500強級別的大企業、中字頭或國字頭的央企以及政府機構才有足夠的金錢和資源。沃爾瑪會利用數據分析結果來調整庫存和價格。聯邦快遞對遞送路線的優化一直為人稱道,航空公司和通信公司則利用大數據向客戶提供體貼入微的服務。
最新的大數據應用:在Twitter上根據民眾情緒買賣股票;根據求職網站的崗位數量推斷就業率;根據網民搜索跟蹤全球范圍的流感等病疫傳播……出版《大數據》一書的作者涂子沛說,大數據意味著從信息時代、知識時代向智能時代邁進,是下一個社會發展階段的石油和金礦,應當精細化管理,人與人之間的合作、任務之間的對接會更準確,國家和社會的運行成本會降低。
但車品覺對國內大多數互聯網公司的大數據應用持悲觀看法:很多公司并沒真正意識到大數據的價值,也不知道如何利用。今年有各大公司的副總裁或數據部門負責人跑到杭州向車品覺請教,他們問得最多的問題是,大數據部門該放在運營團隊還是技術團隊?“一聽這個問題,我就知道他們走錯路了,怎么做都沒戲。”車品覺說,“大數據應該是CEO直接領導的戰略級部門。”
在大數據應用開發層面,騰訊是國內少有的可以和阿里巴巴比肩的公司,它擁有7億注冊用戶。今年早些時候,騰訊挖走了車品覺最得力的一個助手,希望在大數據戰場上能一較高下。可惜的是,騰訊的數據都散落在各個事業群之間,難以整合開發利用,而且大多數數據只在營銷環節,這與阿里對大數據的戰略級定位還有距離,“兩到三年的差距吧。”車品覺說。
同為中國互聯網三巨頭之一的百度,擁有中國最多用戶的搜索行為數據,但百度卻無從下嘴,因為絕大多數百度用戶是沒有注冊信息的,都是過客,積累下來的用戶行為數據無法精細化開發利用。同樣“坐在金山上啃饅頭”的還包括大眾點評網,它擁有廣泛且實用的用戶評價體系和商戶信息,但是,他們還在為大數據團隊應該放在運營部還是技術部而發愁。
當然,即使是阿里,在挖掘用戶網購數據上也走過一段彎路。“淘寶數據魔方”已經上線好幾年,賣家可付費購買任何一個行業甚至競爭對手的交易數據。如今,阿里高層發現這是一種錯誤。
“愿意拿數據的肯定是聰明的、先知先覺的賣家們,他們拿過去以后對整個淘寶生態體系不是幫助而是破壞,他們能夠拿得更多吃得更多,每一個個體都能夠長大,但是導致把市場資源分光。草就不長了,只長樹,一把火過來全部燒光。”阿里巴巴集團副總裁、馬云的業務助理李俊凌說。
就在互聯網巨頭們還在研究如何搞大數據的時候,一批創業公司出現了:有提供工具系統的公司友友系統、提供數據存儲和銷售的公司云天科技、提供信息咨詢算法的公司秒針系統等。他們利用價格低廉但性能強大的服務器分析一些新的數據門類,而且作為第三方公司,正試圖打通各企業間的數據聯系。
“我認為大數據的真正魅力是打通不同領域的數據,一個公司內部數據可以產生量變,但是如果打通一定是數量級的提升。”百分點CEO張韶峰說。這是一家利用大數據為客戶做營銷的第三方公司,客戶大多集中在電子商務領域。以前客戶會問他,“我們的用戶在哪里?哪里有便宜的流量?”現在則問,“這個用戶喜歡什么產品?他的朋友是誰?”這些復雜的問題也有了答案。
任何一個新型行業都會面臨政策或道德風險,大數據也不例外。有一則趣聞:一名美國男子氣勢洶洶地闖入Target店鋪,“你們竟然給我的女兒發嬰兒尿片和童車優惠券,她才17歲啊!”店鋪經理道歉。一個月后,該男子打電話道歉,他女兒的確懷孕了。大數據通過關聯行為能預測用戶需要什么。
一年前,車品覺還在支付寶任商業智能官的時候,開發過名為“黃金策”的產品。它可在2秒內對你的問題給出答案,比如,全國多少人買了某款情趣內衣?哪個省份用戶買的內衣罩杯最大?買情趣內衣的同時有多少人又買了杜蕾斯?如果你還有興趣,還能知道多少人買了早孕試紙、是否有商家給他們發放嬰兒用品廣告……這只是大數據應用中最簡單的層面,但即便如此,很多用戶已經感受了到威脅——隱私被侵犯。
馬云曾在寫給總理的信里說,“我們將讓整個社會去分享數據,讓制造業掌握消費者的數據,讓消費者知道制造業的數據,而且我們是徹底分享,而不是靠數據掙錢”。2010年3月,淘寶宣布將面向全球首度開放數據,有兩條大原則:數據分層次開放;涉及消費者個人或者企業隱私的數據絕對保護。今年9月,馬云說,希望阿里的數據給國家經濟扮演一個氣象預報臺,“為每個小企業裝上GPS,為每艘船裝上雷達”。
但隱私問題將在大數據時代愈加復雜。“我們關注的是先保護會員、消費者的隱私,其次才是如何做到數據更開放。”麥包包營銷副總裁青鳥說。這是一家從“淘品牌”成長起來的獨立B2C網站。目前它的數據只開放給Google和百分點兩家公司。他說:“我們知道數據融合在一起更有好處,但誰是數據的擁有者?這些數據需要什么樣的機制來共享?如果這些沒解決,對于擁有數據的任何一方,都是有問題的。”
除了所有權之爭,大數據還有另一面:創新的天敵。Jayson Chi在麥肯錫工作7年,約一半時間做大數據。他說,“大數據的目標是為了優化一些東西,做創新項目時,如果只看行為數據根本沒法了解用戶行為的Why在哪里。用大數據創新,什么靈感都沒了。”
老福特和喬布斯都排斥市場調研,但創新天才太少。“凡是好產品都是今天不靠譜,明天靠譜。”車品覺說,“做產品的人一定要學會孤獨,尤其在尖端的創新產品面前,大眾的眼睛通常不是雪亮的。”“無量神針”是車品覺做產品這么多年最顛覆、最得意的作品。從2013年1月開始,淘寶的所有“小二”都可以個性化定制自己的“無量神針”,“傾聽用戶的痛”的彩色圖譜繽紛閃爍。老子曰:“天之道,損有余而補不足。人之道,損不足以奉有余。孰能有余以奉天下,唯有道者。”

