一位經常看報但不會上網的離休長輩要我解釋大數據技術,這位九旬老人還要求,用“咱們老百姓”能懂的大白話。
不成功的科普嘗試 筆者首先想起了一篇現成的博文《假日聚會,戲說云物人海》,那篇博文曾在一次聚會上對8-83歲的的朋友作試驗性解釋,收到了深者見深,淺者見淺的效果。
于是,給老人先講了云(計算)、物(聯網),以及人(社會網絡),再解釋“云”如何為大數據準備了的支撐,而“物”和“人”為何既是數據消費者,也是數據的生產者,當十億級的人和百億級的傳感器為大數據增磚添瓦時,大數據時代就到來了。還說了大數據有四大特點,即:大(數據量大)、 多(數據類型多)、 快(要求處理快)、 值(價值大而密度低)。
茫茫然,這位九旬老人搖搖頭:“什么是價值大而密度低,是不是有點矛盾?”。
這次科普失敗的原因是對象定位不準,先沒有注意到,老人腦中并沒有關于“云--物--人”的基礎性知識框架,用計算機科學的行話,腦中沒有相關的“本體”( ontology)。
借用馬航MH370的常識 注意到老人天天看報,對馬航MH370失聯客機(也許,不久會改稱為失事客機)的報道消息比較清楚,幾十天來,老人為乘客惋惜,為乘客家屬擔憂,也因馬航的不確切消息而憤怒,還為在前方搜尋的戰士祝福.......
關于馬航MH370的報道已經在老人腦中形成了一個由相關概念和常識組成的語義網絡,用行話描述,已建立了“本體”(可比喻為“說文解字”),觀察到這一點,于是用大白話解釋:大數據處理就是大海里撈黑盒子,就是大海撈針。
大數據的四大特點也迎刃而解:海洋之大,對應于“數據量大”;r關注目標多(一切與MH370相關的,飛機殘片,旅客物件,甚至生活垃圾等)對應于“數據類型多”;黑匣子快沒電了,對應于“要求處理快”; 茫茫大海中,只有兩個黑匣子,而且至關重要,此外還有無關漂浮物形成的“噪音”(如近期發現的籃球垃圾桶之類),這些對應于“價值大而密度低”。
大海撈黑匣子,需要要大致知道“黑匣子”的大致方位。前些天,馬航提供的不確切消息,忽悠著人們作了名副其實的南轅北轍,在北方通道上用了太多的冤枉力;這也解釋了大數據處理的一個關鍵技術--智能地約簡大數據,要求約簡而不失數據核心。最近,馬航把搜尋地點“約簡”到相當于湖南省面積的大小,還需要以后的實踐來檢驗,是不是包含了那個“核心數據集”。
巧得很,今天搜尋失聯客機,還不是大數據技術, 但卻能用它來比喻大數據技術;暗示著冥冥中它與大數據有緣。
老人點頭表示明白了,雖然這只是淺者見淺,讓老人有了一個好感覺,我感到了作科普的喜悅。
快out的黑匣子,小數據技術,小家子方法 現在民航中采用黑匣子保存飛行數據,是上個世紀的方法,從理念到技術都落后了。客觀上是因為上個世紀既沒有相關基礎研究、也沒有應用研究,財力也不夠大,條件不具備之下,無奈中采用了“啄木鳥自帶板凳”式的黑盒子,本質上是小數據技術。
前幾天,鄰居家的中學生問,為什么飛機上用黑匣子而不用云盤?看,云計算時代的中學生,用過百度云,用過微軟的OneDrive,用了蘋果的iCloud,也用了金山網盤,見識過360手機衛士的云備份和(失聯)手機找回功能,樸素而又自然地就會想到云存儲,在這位云計算時代的中學生看來,黑匣子實在是小家子方法。
科技人員探索并實踐著云匣子技術。專家們早就在研究和實踐 “地面黑匣子”或“云匣子了”。在軍事上早有應用;帶攝像機的偵查炮彈,或無人偵察機,到敵方陣地上冒著槍林彈雨,一面拍照偵聽,一面把多種傳感器收集的音、像、電磁、紅外數據發回基地,無人機的命運已經是九死一生,偵查炮彈更是義無反顧地擁抱死亡,當它們犧牲時,發出最后的燦爛,實現了機與彈的生命價值,無怨無悔。
也許,局部戰爭中,上述處理還只能算小數據技術, 民航機數量大,自然需要大數據處理技術了。
四川大學的一項獲獎成果 在川大智勝的產品網頁上,查到一款 MDSL多通道數字同步記錄儀(點擊這里展開,可知與時俱進到2012年9月的技術參數),此產品在2003年就獲得了國家科技進步二等獎(下圖)。網頁中的前幾行如下:
MDSL多通道數字同步記錄儀是新一代雷達、地空通話、席位景象的同步實時壓縮記錄設備,能夠24小時不間斷同步記錄上百個通道的無線或有線語音通話、數十個通道的雷達數據,還可記錄各個席位顯示畫面景象,并能夠方便快捷地檢索和同步回放。目前,該產品在國內軍民航機場、空管中心、航空公司推廣300余臺套,市場占有率超過50%,逐步替代進口產品。在近年多次空難事故調查分析中發揮了重要作用 ;

這個設備放在機場,一對多地管理若干 軍、民航飛機,體積有點大,但它管得多。
筆者不是項目組成員,但作為川大計算機學院的一員,當然為其感到高興和自豪。記得項目帶頭人游志勝教授給我們講述研發過程時,還講過某個涉外的飛機失事事件,這套設備牛刀初試,就立了一功,記錄了飛行數據,為涉外的事故處理提供了數據和支撐。以前,MDSL被樸素地稱為“地面黑匣子”,現在時髦一點,可能要改稱為“云匣子”了;該網頁中還有許多詳細的描述,不在此列出 。(請知情朋友補充糾正)。
假如馬航裝備了地面黑匣子MDSL 上段引用的網頁中說到,MDSL產品在國內軍民航機場、空管中心、航空公司推廣300余臺套,市場占有率超過50%,逐步替代進口產品。
可惜馬航沒有裝備這個產品(或 類似產品),可能有下列原因:
(1)馬來西亞現在還是英聯邦成員,馬航和英國航空工業界有千絲萬縷的聯系,不知是因崇英而“從”英,還是因“從”英而崇英,英國的航空產品和技術常是其首選;
(2)大陸國家和海洋國家有區別,對產品有特殊要求;
(3)缺錢;
(4)中國產品的宣傳不到位;酒好也怕巷子深;
(5)國家關系和高端技術出口,需要交流或談判,記得有一首歌唱道“愛情不是你想買,想買就能買”,把其中的“愛情”換為“高端技術”,或許能解釋這一場景。
如果馬航裝備了MDSL,也許今天搜尋MH370就沒有樣困難。但歷史沒有“如果”,“向使當初身便死,一生真偽復誰知?”,那只存在于科幻的并行宇宙中或穿越小說中。

