
目前,電信計費系統流量話單在GGSN設備上產生,是網關設備。這個設備產生流量話單的時候是根據一個流量依據而產生:
第一,達到一定時間,例如2個小時。
第二,達到一定流量大小,比如5兆。
這個流量話單相當于一段時間之內使用流量總合的話單,沒有說訪問哪個目標的IP地質,沒有訪問的目的地,只告訴你這個時刻產生了這樣的話單,用戶當然不愿意,用戶說我那天沒有使用過手機,沒有產生這個流量,這樣情況下用戶要求退費,或者雙倍賠償,GSN設備,無論是中國聯通也好,還是其他運營商也好,采用設備可能來子華為、阿爾卡特,這些設備在全球商用了,GGSN產生的話單在一定意義上之上,出現這種問題是微乎其微的,說不清流量到哪兒去了,運營商作為弱勢群體,只能退費或者雙倍賠償。
運營商的難言之隱
聯通研究院處長王志軍以一個案例進行說明,2011年,中國聯通一個用戶在0點到4點之間產生巨額流量費用,他認為中國聯通既然拿不出證據,以涉嫌欺詐消費者為由向法院提起了訴訟,影響是兩方面的。
對用戶而言,他也是想知道流量到底什么時候發生的,如果手機的問題,他也知道怎么進行防范,這樣就不會發生類似問題,根據客戶部門提供的數據,可能因為無法提供商網流量詳單造成退費和賠付,會影響到運營商流量計費商務模式,所以我們建立這種系統意義非常大,第一,我們的系統供聯通客服人員使用,提供快速查詢服務,解決流量投訴的問題,另外,我們也準備向最終用戶提供異常的大流量查詢服務。再一個問題,上網記錄數據本身是數據的金礦,我們可以通過獲取上網數據記錄對流量進行統計。
海量數據的應對之策
對于以上這些問題該如何應對呢?聯通研究院處長王志軍分析處理問題的難點:上網記錄數據是海量數據,經過我們的系統可以分析到,用戶每個用上網記錄基本幾萬到幾十萬,有的用戶五六十萬,我們現在采用的方案是在網關所有用戶流量必經地方采集,分析流量數據,然后上成上網記錄話單,話單量非常大。
聯通研究院處長王志軍表示,例如用移動手機訪問新浪網首頁,對流量采集設備基本能生成20條左右上網記錄話單,如果點iPad新聞鏈接,恐怕會產生180條上網記錄,如果訪問淘寶網首頁,會產生60條請求和回應,在手機上網記錄當中有大量DNS查詢和推送服務。以中國聯通某一個中等省份公司為例,日均上網記錄達到10億條,每個月的數據接近9T,整個移動互聯網也在快速發展。
根據中國聯通統計,每隔6個月中國聯通用戶整體上網流量會翻一番,去年平均3G每用戶的流量一年之內翻一番,整個流量增長非常迅速,也帶來了上網記錄的量非常非常大。
傳統IOE方式,IBM小型機,思科數據庫存儲,EMC存儲,思科數據庫存儲這么大上網記錄時候已經不可能了,所以,聯想采用開源的Hadoop解決,Hadoop本身是系統架構,也是開源項目,由Apache基金會開發,Hadoop本身最底層是分布式文件系統,這個分布式文件系統叫HDFL,在它之上有分布式處理框架,基于Hadoop整個開源項目,上面構建了結構化的訪問數據庫,在這之上又提供了類似的數據挖掘工具,另外也提供了一些分布式同步,以及遠程調用和序列化工具。
CIO頻道人物視窗
CIO頻道方案案例庫
大數據建設方案案例庫
電子政務建設方案案例庫
互聯集成系統構建方案案例庫
商務智能建設方案案例庫
系統集成類軟件信息研發企業名錄