
“剛剛出生的寶寶哭了,家長不知道怎么處理,父母可以將嬰兒的哭聲錄下來,在百度語音庫中對比,究竟是餓了,還是哪里不舒服,可以更直觀地了解孩子為什么哭。 ”這是利用“百度大腦”在不久的將來能實現的場景。
所謂“百度大腦”,是一個擁有200億個參數、智力相當于2-3歲孩子的人工智能系統。在昨天的第四屆技術大會上,百度創始人李彥宏宣布開放全球首個大數據引擎,將百度大腦、開放云、數據工廠等核心數據能力開放出來。中國疾病預防控制中心(CDC)則透露,在傳染病防控方面,借助大數據引擎的技術力量,建成中國首個流感預測系統。業內人士表示,此次把大數據開放,有望加速傳統行業的轉型。
“百度大腦”讓難事變簡單
如何識別寶寶的哭聲,只是“百度大腦”將來能實現的場景之一。以成果之一的百度語音庫為例,在語音技術的相對錯誤率降低了25%以上,移動搜索中文語音識別率突破了90%。
本質上,“百度大腦”在技術上是超大規模的機器學習和深度學習,模擬人腦認知圖片、聲音和文本等數據。目前,全球在深度學習的研究中,只有4家成立了專門的研究院:百度、IBM、谷歌和微軟,“百度大腦”的神經網絡擁有200億參數,谷歌是幾十億,而人腦是千億級別。
百度公司技術總監,深度學習研究院(IDL) 常務副院長余凱博士4月初透露,在圖像識別方面,依賴“百度大腦”,手機百度結合圖像搜索技術已經推出掃描條形碼、二維碼、文字、翻譯、圖書、寵物狗、明星臉和CD封面8大功能。
還記得2013年7月的百度魔圖嗎?其中“PK大咖”功能最受歡迎,網友紛紛通過百度魔圖尋找與自己最為相似的明星。用戶上傳或拍攝一張圖片后,通過人臉識別技術,掃描人臉特征,并在明星圖片庫里一一比對,就能找出與你相似度最高的異性明星。目前,百度魔圖APP已成為“百度億級俱樂部”之一,用戶超過1個億。
利用“百度大腦”的圖像識別和數據分析能力,生活中的一些艱難工作將變得簡單。如攝像頭信息記錄和分析,可以通過海量的監控視頻中圖像識別技術找出犯罪嫌疑人,解決社會問題;如通過穿戴設備,可根據病人信息進行實時記錄并追蹤,醫院通過個體數據分析,預防疾病,提前治療。
“大數據”建流感預測系統
在BAT三家巨頭中,李彥宏最先提出了用互聯網方式改造傳統行業。今年以來,李彥宏也不只一次強調:互聯網正在加速淘汰傳統產業。
昨天的技術大會,百度開放了包括云、數據工廠、“百度大腦”等三大組件在內的核心數據,推出大數據引擎。百度高級副總裁王勁強調,大數據引擎是希望在幫助各行業應對挑戰,推動社會大數據、行業大數據的價值挖掘進程。它是百度多年深厚技術積累的一次質變過程。
李彥宏今年1月說,美國互聯網一直在往純技術的方向發展,中國互聯網在往全部行業滲透,所以中國任何一個行業的公司市場化運作時間都比較短,“現在互聯網金融很火,這也是互聯網在沖擊金融。未來,還會有更多傳統行業受到互聯網的沖擊,比如醫療和教育等”。
事實上,“大數據”已經開始滲透進人們的生活,這從昨天出席大會的一些部門即可看出,比如中國疾病預防控制中心、交通運輸部科技司和平安產險。
交通運輸部科技司司長趙沖久說,在智能交通方面,大數據引擎可以用于出行趨勢預測,使交通管理更具前瞻性。同時,交通運輸管理部門的部分應用也計劃遷移至百度開放云平臺,利用大數據引擎對行業監測數據進行挖掘分析。中國疾病預防控制中心(CDC)則透露,在傳染病防控方面,雙方將結合疾控大數據與百度大數據,借助大數據引擎的技術力量,建成中國首個流感預測系統。“大數據引擎”要經歷逐步開放的過程,目前采取邀請制和免費模式,將在政府、NGO、制造、醫療、金融、零售、娛樂、教育等傳統領域率先開展項目合作。

