物流大數據,都是哪些數據?
物流大數據主要包括運單信息的數據和車輛信息的數據,然而關于運單信息往往涉及商業機密,并且信息分布于不同行業企業內部,不宜公開。因此當前現實的數據條件來看,實業界和學術界的物流大數據主要是關于貨運車輛信息的數據。其中包括:車輛id信息,駕駛員信息,車輛行駛軌跡坐標信息,車輛停車信息,車輛速度信息,車輛里程信息,車輛溫度信息,車輛油耗信息,車輛其他狀態信息等。軌跡數據挖掘來源通常是終端設備上產生的位置記錄,然后位置信息傳回數據中心以日志文件形式存放,如下表:
通過定位技術采集到的原始軌跡數據只是一系列的經緯度、時間、速度等信息,通過這些信息無法直接得到物流貨運車的活動行為的特征信息,例如運送貨物的起始點、途經哪些城市信息,以及更深層次的活動規律等。這些原始的北斗/GPS 數據必須經過一系列的處理步驟,才能獲取到物流貨運車的送貨規律等特征信息。
這些數據都有哪些特點?
想要從海量數據中分析獲取到有價值的知識信息,首先要了解物流貨運車輛軌跡數據的特征。
數據海量性:物流車輛一般以10秒到30秒的間隔向數據中心發送當前位置信息,這些移動在全國各地路網中的物流車輛每天生成的北斗/GPS 數據都達到了GB甚至TB規模,并且還在不斷增長中。這既是發展數據挖掘的驅動力,同時也是數據挖掘面臨的難題。
數據稀疏性:雖然軌跡數據規模龐大,但由于地理因素、天氣因素、設備故障等原因,并不能保證每一個路段都有完整的北斗、GPS信息,甚至有些錯誤的北斗/GPS數據。
數據復雜性:物流車輛在實際行駛過程中受各方面主客觀因素影響,難以簡單通過某個模型或者理論來進行評估和預測。其中包括,每個司機都有自己的駕駛習慣,即使同一個司機在駕駛過程中也會針對不同客觀條件改變自己的駕駛行為,這些人為的改變無疑增加了軌跡數據挖掘的不確定性和復雜性。
數據豐富性:在海量的軌跡數據背后隱藏著全國實時路況信息、物流運輸狀態信息和我國不同區域經濟發展水平以及供需關系的變化。對于我國道路基礎建設、交通路徑規劃、物流車輛調度、經濟指標預測等方面有著積極意義。
準備如何挖掘這些數據?
軌跡數據挖掘,是指從大量軌跡數據的集合 C 中發現隱含模式m 和知識 n 的結果 S。因此,軌跡數據挖掘的過程可以看作為一個函數:£ : C→S(m, n),輸入是軌跡數據,輸出是隱含模式 m 和知識 n。通過使用某些技術、理論,從大量的軌跡數據提取模式、發現龐大知識的一個過程。
軌跡數據挖掘發現的知識類型和所使用的方法密切相關,所發現的知識的價值受到數據挖掘算法的影響,目前常用的軌跡數據挖掘技術有規則歸納、概念簇集、關聯發現等。目前的軌跡數據挖掘研究工作中主要為軌跡聚類、軌跡分類、離群點檢測、興趣區域、隱私保護、位置推薦等方面。
物流數據挖掘做什么用?
物流車輛的海量大數據中包含著許多關于交通路況、車輛運行甚至社會經濟發展動態的信息。通過統計分析車輛行駛距離、停車時間、地理位置、車輛特征等多個維度的信息可以發現貨運車輛的行為特征、區域物流的流量分布等,為物流公司提供基于時間、成本、路線等車輛調度的應用服務提供了可靠的理論依據和技術支持,同時也可以為政府提供物流運價指數、貨運效率指數等優先經濟指標。
原文:51CTO
]]>近年來, 互聯網技術的飛速發展,人們獲取信息的途徑正發生著天翻復地的變化。論壇、微博、微信等新媒體的出現具有傳播速度快、時效性和互動參與性強、娛樂化程度高等特點。而正因為如此,也帶來了互聯網信息體量爆炸式增長的局面。在過去,了解用戶的消費習慣或許下發幾百份用戶調研問卷就解決了。而到了今天,如何從互聯網的海量信息中挖掘出用戶的觸媒習慣, 找到用戶的關注熱點,則成為了企業在經營推廣過程中遇到的最大難題。而這點,大數據挖掘便提供了很好的解決方案。
以智能手機為例,目前很多工具都可以通過對關鍵字監測、網站點擊量監測、以及用戶聲量的監測來收集數據。然而這些初步收集的數據仍然可以用海量來形容,為企業快速、準確的判斷用戶需求帶來了極大影響。通過大數據的自動化挖掘及分析工具,可以對這些收集而來的信息進行智能語義分析得出更精準的用戶數據,再有專業數據分析師進行深度的數據挖掘,并最終生成大數據研究報告。
以手機行業研究報告為例,通過大數據研究報告我們發現,在智能手機活躍度方面,男性用戶占據較高優勢,而近年來女性用戶使用者比明顯上升,外觀,顏色、拍照等功能更受到女性用戶的青睞。
在校學生成為智能手機的購買主力,而從事市場營銷、公關、策劃行業的人往往擁有兩部以上的手機來解決電池續航問題。
旅游、音樂、美食、生活等話題是智能手機用關注的熱點,而80、90后的年輕人群則對娛樂、電影、動漫、游戲等話題情有獨鐘。
通過對用戶購買行為的調查,可以發現:功能、配置、價格、外觀仍然是用戶最關注的要點。而是否具有”指紋識別“功能上榜,成為了最新的關注話題。
在對使用過程中存在的問題調查中,手機系統運行慢、發熱快是用戶反映最強烈的話題,也是手機廠商下一階段需要重點解決的問題。
綜上所述,大數據挖掘應用主要面向如何通過對數據的深度分析,解讀用戶的觸媒習慣、日常關注熱點等,進而為企業在做傳播的過程中,指導媒體投放及傳播內容的話題設計,讓傳播更精準、更有效。
免費申請試用>>>>>大數據信息采集系統
來源:中國廣播網
]]>