
飛機旅行似乎已快要達到很多乘客的忍耐極限--座位間距小、食物選擇少、飛行時間長,還有就是安檢的等待和催促。
旅行者們在經過主要樞紐機場的時候都已經做好了這樣的心理準備。不過,他們有可能不知道,在每次飛行的背后,都有著大量數據的生成;只有對它們進行采集、挖掘、分析才能保證飛行安全。雖然大部分數據都是結構化數據,但是也有一部分是文本形式,來自撰寫報告、音頻錄音和警示信號。
NASA首席數據科學家Ashok Srivastava說:“所有人都知道國家空域非常安全。”Srivastava是系統范圍安全保險技術項目(SSAT)的牽頭人,列舉了1959到2006年每年的死亡事故率,來證明近五十年間這一比率的穩固下滑趨勢。
“但現在的問題是,在不斷增加的航班數量中,怎樣才能讓航行變得更安全一些?”
在今年夏天第八屆年度文本分析峰會(Text Analytics Summit)的演講中,Srivastava提到,每年的航班增長率可達2%到3%,根據具體經濟情況上下波動。而交通統計局(Bureau of Transportation Statistics)的報告顯示,美國交通部僅在2011年一年中就記錄了1000萬次國內和國際商業航班。如果增長率為2%,那就是說每年都有幾十萬次新的航班開通,給空域加壓。
他說:“如果是這樣的情況,我們只有尋找到提高安全性的方式,才能保持低事故率。這是一個NASA和其他機構目前正在努力的領域,關鍵就在于必須大力控制住風險。”
通過文本分析得出事件原因
Srivastava和他的團隊會仔細分析發生的異常事故,其中一個方法就是在地圖上按照連續性把它們標識出來,通常從一個安全的州開始。而對于那些在連續性中“反常的州”,團隊會特別注意,因為這意味著事有蹊蹺、值得警惕;他們會在這樣的地方上做下記號,提示該路線安全系數低,可選擇回航到安全的州。
“文本在理解事件中所扮演的角色越來越重要。”
團隊對運營數據進行分析,識別在反常的州發生的事件,同時也會參考機組和地勤工作人員的報告。Srivastava稱,這些報告能夠幫助他們理解事件發生的隨機因素和實際原因。
在金融業中,按秒以計的數字數據可以顯示股票走勢,而媒體報告能夠解析數字之外股票漲跌的原因。航空報告也是這樣。
CIO頻道人物視窗
CIO頻道方案案例庫
大數據建設方案案例庫
電子政務建設方案案例庫
互聯集成系統構建方案案例庫
商務智能建設方案案例庫
系統集成類軟件信息研發企業名錄