一、輿情概述
11月28日,中消協召開新聞發布會,通報100款App個人信息收集與隱私政策測評情況。報告顯示,100款App中,多達91款App列出的權限存在涉嫌“越界”,即存在過度收集用戶個人信息的問題。中消協指出,“美圖秀秀App涉嫌過度收集可識別生物信息、財務信息等”,以及“美圖秀秀向第三方提供個人信息時,未說明雙方所承擔的相應責任。”
二、輿情分析
(一)輿情傳播趨勢分析
自28日發布會后輿情開始發酵,眾多主流媒體發布相關信息,使得輿情開始大范圍傳播,隨后網友熱議美圖秀秀別有用心。
(二)輿情媒體分析

相關信息中新聞占比第一,占比62.5%,其次app,占比20.53%,緊隨其后的為微信,占比11.61%。
(三)事件詞云

本次輿情事件高頻詞圍收集、涉嫌、個人,信息等。
三、輿情熱議
指責沒有隱私
徐徐先生Hsu:?有什么影響呢。該用還是照樣用。該美顏還是這樣美顏。只要不是觸及底線,大家都心照不宣了。現在這個社會,還有隱私嗎。
間歇性笑抽筋:拍個照還被收集信息,喪心病狂啊
這個時代沒有隱私可言
凌零后王后:這個時代早就沒隱私了…上次在百度上給同事寶寶搜了一下送什么禮物,第二天淘寶就開始推薦母嬰用品
蜀山劍膽琴心:現在各種信息早就是透明的了
最好別用
AdonisTong:現在還敢用什么?
愛巨星的小霞迷:嚇得我趕緊刪了
四、輿情小結
事件引發廣泛熱議。11月29日美圖公司看到報告后立刻針對報告提到的情況進行內部自查,美圖公司對輿情的敏感度還是比較高,但回應權威程度略有不足,不足以讓民眾信服。11月29日收盤,美圖公司股價下跌15.14%,報每股3.39港元。對股價下跌是否受侵犯用戶隱私事件影響,美圖公司表示不予回應。后中消協呼吁,全社會要強化個人信息保護的自我憂患意識,多形式開展教育引導活動,廣泛提醒消費者盡量通過審核機制更嚴格的應用商店平臺下載App,下載過程中要認真閱讀App的應用權限和用戶協議或隱私政策,不掃來歷不明的二維碼,不點來歷不明的網頁鏈接,不安裝來歷不明的App,使用過程中一旦發現信息泄露,要留存相關證據,及時向有關部門投訴舉報,依法主動維權。
(樂思網絡輿情監測系統:基于全球領先的互聯網采集監控技術而研發,具有發現快,信息全,分析準的優勢。可讓用戶眼觀六路耳聽八方,在第一時間發現你想要的輿情信息。)
]]>
數據可視化從200多年前基本餅圖發明時的形成至今已走過漫長的歷程。如今,由于數據大潮的到來和人們關于數據使用的討論,一種新的設計語言正在興起,它可以優美地將大數據中的繁雜簡化成既美觀又富有意義的可視化圖形。
以下五條核心原則:
1.?理解數據源
確保了解你工作的數據。這是理解數據至關重要的第一步。你需要對宏觀的全局有所理解:為什么收集這些數據?公司對于這些數據賦予什么樣的價值?用戶是誰?如何能讓數據作用最大化?深入理解這些問題,能為創造出既有意義又人性化的可視化信息,打下重要的基礎。
2.?明確你要講的故事
好的數據可視化不僅僅是一張美麗的圖片,它還能講述一個任何人都能明白的故事。因此,至關重要的是,你首先需明確你想講的故事,然后將數據作為一種潤色故事的方式。
例如,我們之前幫助瑞典某移動運營商重新設計了之前經常讓用戶混淆的月度手機賬單,使其以用戶為中心便于用戶使用。該公司希望設計出更為有效易用的話單,而不是繼續呈現給用戶難懂的一串號碼。好的數據可視化講了一個大家都能看懂的故事。
3. 定義用戶體驗
確保你使用數據是用于引導而非支配整個體驗。用戶在理解與學習并形成自己體驗的過程中,數據應該扮演幕后角色。值得探索的是,如何在可視化數據中融入你的見解,使用戶靈活的解讀數據,對用戶來說極具意義。畢竟,愉悅的體驗才能使用戶記住并反復使用。
4.?簡單法則
數據可視化是用來告知用戶,而非讓用戶接收不需要的過載信息。作用一名設計者,你的角色就是專注簡單,將復雜或者零散的信息變得切實可行,易于理解,極具意義和更人性化的信息。記住,越簡單,用戶才能越明白。
5.?巧用餅圖
試試在可視化中鍵入當前行為與你的理解。會讓你的設計被廣泛的用戶群體接受。餅圖被人們廣泛使用的原因在于:人們理解它表達的含義。這是一種天生優雅的可視化設計,因它有更大的影響力,且能使人們一看即懂。
一種設計驅動的方法
好的數據可視化不僅僅是設計上的杰作,也是幫助人們去解讀之前無法觸及的內容的一種極具價值的工具,并使這些內容賦有意義和指導性。隨著越來越多的公司開始意識到數據的潛在能量,在將一些不清晰的事變成能幫助人們的事物面前,設計將發揮更大的作用。其關鍵就在于采用用戶第一,專注簡單的設計驅動方法,創造永不停息的愉悅體驗。
譯文來源:199IT?
原文:uxmag.com
]]>
導讀:時間常常被認為是一種主觀的體驗,然而在可視化的表達中,時間卻成為了結構化維度。時間幫助我們構建穩健而直觀的框架,使我們更好地建立事件間的聯系。
按照時間線的方式闡述信息已經廣泛應用于企業傳播、營銷的各個領域。從小扎、雷總介紹新產品,到日常做年報、里程碑事件的PPT,我們都能發現時間線的身影。或許你和我一樣抱有疑惑:怎樣才能將時間線用得出彩?那么今天我們不妨看看以下七種有意思的時間線設計。
時間線的構成
要玩轉時間線,首先我們需要了解其四方面的構成元素:
1、描述時間的軌跡或路徑:我們以何種方式呈現時間線,它的發展軌跡如何體現時間的變化?
2、點或段的定義:時間線上排布哪些要素,某一個固定的時間節點如何展開?
3、文本或圖形的定義:文本和圖形所放置的位置,他們是否需要呈現某種變化關系?
4、標簽和調用的定義:補充說明的標簽如何植入,需要調用哪些圖文來增強闡釋?
三維螺旋時間線
在古時候,東西方的先賢已經用首尾相銜的蛇來表示時空的無盡,柏拉圖形容銜尾蛇為一頭處于自我吞食狀態的宇宙始祖。而同樣的螺旋方式也可以用在時間線的表達上。我們發現三維螺旋時間線能夠更理想地刻畫時間周期中其他要素的變化。在這個例子中,插圖增加了地理、生物的演變,讓整個歷史周期的顯得更為奇妙。我們在農業、工業產品制造中也可以通過三維建模地形式將生物科技、產品流程等不易觀察的內容進行更好地展示。
交互時間線
這個精致的時間線顯示了大英圖書館中的西方歷史資源。用戶在顯示的頂部選擇一個時間線,然后通過在底部的滾軸控制時間周期,最后選擇一個圖像卡,并訪問該卡背面的信息頁面。與大多數時間線不同的是,使用交互的時間線并沒有描繪一個完整而龐大的時間路徑,而是將他們打包好,卡片化地放置在最底層的時間線上布局。這樣的形式可以用在目前的游戲、網頁頁面中。
棋盤時間線
一款當年盛行的大富翁游戲,將棋盤類的時間線深深地印刻在我們的記憶里。棋盤時間線淺顯易懂、生動活潑,在設計上也能植入豐富的元素,因此是許多流程圖、進程表、大事件表的理想選擇。
大數據時間線
這個時間線描繪了從公元前1184年到公元3978年間的歷史。要將這么龐大的時間脈絡放進一個整潔的圖上幾乎是不可能的。因此設計師和藝術家們嘗試用更為抽象的方式來描繪時間旅行。在銀河系搭車手冊、星際穿越、三體等許多著作里,我們都感受到了時間線是一個可以扭曲的維度,而在這張圖里,便是用曲線和混沌的關系網來描繪時間的軌跡,并用顏色代表了時間旅行的方法。并非所有人都能看懂和接受這樣的時間線圖,但相信這個圖的受眾,大多數的科幻迷都會理解的。大數據時間線可能離我們日常所見的信息圖稍遠一些,但在數據分析越來越重要的當下社會,必將有更多的應用。
關系時間線
在哲學和藝術史的研究里,我們常常通過三種方法來判定一個人屬于什么流派:他的風格如何、他推崇會跟隨過誰、他處于什么時代。在這張西方文化史的時間線圖里,背景形態刻畫了各類流派存在的時間跨度,順著時間線,我們可以點擊查看各流派之間的沖突和融合。具有關系的時間線目前越來越多地搭配交互使用,在電腦端和移動端數據新聞頁面上,均有過出色的實踐。
甘特時間線
甘特圖又稱為橫道圖、條狀圖,即以圖示的方式通過活動列表和時間刻度形象地表示出任何特定項目的活動順序與持續時間。基本是一條線條圖,橫軸表示時間,縱軸表示項目,線條表示在整個期間上計劃和實際的活動完成情況。甘特圖不僅常常出現在我們的Excel項目計劃里,也在影音剪輯軟件等界面上頗為常見。這張時間線圖描繪了“美國總統選舉的辯論情況”。設計師為此創作多重的時間表:左側代表了選舉年份,上方代表了辯論日程,下方代表了每個階段的議題,并有一個簡單引向圖例的顏色代碼。我們可以將甘特圖運用于項目的規劃上,同時也可以用來反映一個項目進行中的多層面事件。
復雜時間線信息圖
在如圖所示的趨勢圖中,時間線提供了一個框架,用于整合其他類型的抽象圖形。混合的格式允許設計師添加新的維度,將相關信息與時間線相串聯。與此同時,為了幫助讀者區分圖形類型,設計師需要增加更清晰的視覺引導,比如:圖標、放大區域。在復雜的時間線信息圖中,到底是幫助理解還是阻礙溝通,取決于信息是否能夠按照邏輯聚焦。復雜時間線信息圖常常用在企業墻、畫冊首頁,用于介紹里程碑事件和企業的發展歷程。
——來源:Donegood_Studio
]]>
計算機時代催生了海量的科學數據,但如此讓人仰止的信息大山也是要付出代價的。你積累的數據越多,要去領會它背后的深意就越難。
為了爭取對數據進行更好的解讀,2005年,一個由信息科學家組成的研究小組創建了一個名為“位數和空間:繪圖科學(Places?&?Spaces:?Mapping?Science)”的競賽藝術展。從藝術化的流行文化作圖到詮釋科學合作的現狀,藝術展的創辦者希望獲獎作品能激勵研究者將自己搜集的數據以一種聰明易懂的方式呈現出來。
“優秀的科學作圖會讓你更全面的去了解數據的構建方式,”印第安納大學的信息科學家凱蒂·伯爾納(Katy?B?rner)說,她是競賽藝術展的創始人兼管理者。伯爾納同時也是《科學圖集》(Atlas?of?Science)的作者,這是一本收集了很多科學繪圖的專著。“也許它們無法幫你找到回家之路,但卻能讓你縱觀某些主題的全球視角。”
藝術展咨詢委員會每年都會根據主題和某些核心標準來挑選出十幅獲獎作品。今年的“從視覺接口到數字圖書館的科學作圖(science?maps?as?visual?interfaces?to?digital?libraries)”主題類獲獎作品于本周公布,而繪圖的展示版預計將于六月中旬進行展出。
科研合作
2010年12月,有研究者公布了一份5億Facebook用戶的交友展示圖,受此啟發,研究分析師奧利維爾·博謝納(Olivier?H.?Beauchesne)創作了這個展示國際性合作的可視化圖(如下),時間跨度從2005年到2009年,這份可視化圖為獲獎作品之一。
圖片來源:奧利維爾·博謝納/Science-Metrix
圖中的每條弧線代表了不同城市科學家們之間的合作關系,相關資料來自于愛思唯爾(Elsevier)斯高帕斯(Scopus)數據庫收集的研究論文、書籍和行業刊物。圖中的美洲、歐洲和日本都出現了高密度的科學節點。
科學譜系圖
從1817年至2010年,全世界的科學期刊上一共發表了約3900萬篇論文。為了展示研究的爆發性,技術分析師默罕默德·艾爾·愛薩提(M’hamed?el?Aisati)根據愛思唯爾的斯高帕斯數據庫制作了這份獨特的論文發表可視圖(如下)。
圖片來源:默罕默德·艾爾·愛薩提/Academic?and?Government?Products?Group(愛思唯爾),阿姆斯特丹;凱蒂·伯爾納和安吉拉·佐斯(Angela?M.?Zoss)/印第安納大學
雖然這份可視圖并不是獲獎作品,但無礙我們去欣賞它。愛薩提希望能通過圖片表現出期刊的起源,以及特定科學領域在未來的興衰漲落。
生命之樹
另一幅沒有入圍的佳作,這幅示意圖展示了76425個已知物種的樣本(如下),科學家們估計地球上現存的生命形式有500萬到1億種,圖片中標注的不過是九牛一毛。
圖片來源:胡一凡(Yifan?Hu)/AT&T?Labs/生命之樹
圖片數據來自于“生命之樹”工程(Tree?of?Life?project),這是一項旨在記錄時間維度下的地球生物體譜系。圖中的生命起源和智人(Homo?sapiens)都被標上了紅色。
維基百科VS國際十步分類法
這幅示意圖極為醒目的展示了維基百科上公共目錄和正式文庫系統國際十進分類法(Universal?Decimal?Classification)中的學術目錄在結構上的差異。
圖片來源:Almila?Akdag?Salah/Cheng?Gao/Krzystof?Suchecki/Andrea?Scharnhorst/Den?Haag/Knowledge?Space?Lab
“我們想弄清楚這樣一個問題:社會化形成的知識網絡(維基百科)和利用分類理論正式創建的知識網絡(UDC)之間存在多大差異,”圖片作者在談及這份獲獎作品是這般寫到。
桌式互聯網
保羅·奧特勒(Paul?Otlet),一位具有遠見卓識的比利時學者,生于1868年,死于1944年,人們通常認為是他成功預測了用于知識傳播的互聯網的出現。在計算機還未出現之前,為了創造一個網絡化的學習環境,奧特勒設計了被稱為Mondothèque的單人學習操作臺。
圖片來源:查爾斯·范登·赫維爾(Charles?van?den?Heuvel)惠贈/HuygensING?Institute;斯蒂芬妮·曼弗洛伊德(Stephanie?Manfroid)/Mundaneum
操作臺的抽屜里塞滿了參考書、縮微膠片和各種書目卡片。奧特勒還設想在手臂可及的桌子上擺上收音機、電視和照相設備。
上述獲獎作品將奧特勒的想象描繪在了圖紙上。
建筑學搜索元數據
為了使歐洲的所有建筑學數據更便于檢索,幾位用戶創建了一個名為“歐洲建筑學目錄元數據(Metadata?for?Architectural?Content?in?Europe)”的分類樹,這幅作品成功入圍十佳。
圖片來源:莫里茨·斯特凡(Moritz?Stefaner)
分類樹網站上的交互式圖表讓用戶可以通過建筑學詞匯來搜索網絡。一旦某個詞組被選定,相應的網站列表就出現在下方,大大節省了檢索時間。
標準集合
對于集合大量組織化數據來說,標準選擇異常關鍵,但現在被廣泛使用的規則集合有100多個。
圖片來源:德文·貝克爾(Devin?Becker)/愛達荷大學;簡恩·萊利(Jenn?Riley)/北卡羅來納大學教堂山分校
為了將特殊元數據標準的使用方式和時機通過可視化圖表現出來,愛達荷和北卡羅來納的文庫科學家們創作上述圖片,該作品亦位列十佳之列。
圣經數據挖掘
利用自定義的Java程序,兩位信息科學家從圣經中提取了盡可能多的數據,然后創作了可視圖,這幅作品成功獲獎。
上面這張圖表描繪了一個由圣經中提到的2619個人物和地名所組成的“社會網絡”;下方的圖片展示了交叉參考(彩色弧線)被映射到不同章節中的經文(灰條)。

圖片來源:克里斯·哈里斯(Chris?Harrison)卡耐基梅隆大學;帕斯特·克里斯托弗·羅姆希爾德(Pastor?Christoph?R?mhild)/St.?Johannis-Harvestehude
航空業三十年興衰史
這些年度報表展示了北半球的航班客流量。
圖片來源:C·羅澤布拉特(C.?Rozenblat)/路易斯安那大學;G·邁蘭根(G.?Melan?on)/D·奧柏(D.?Auber)/M·馬蒂耶斯(M.?Mathiaut)/波爾多大學
這幅可視化作品沒有獲獎,但其作者表示將發布一段展示過去三十年來航空業大起大落的視頻,我們拭目以待。
科幻歷史
沃德·雪萊(Ward?Shelley)繪制的這幅科幻編年史藝術性的再現了這類題材的進化歷程,極富啟示意義,該作品位列十佳。
圖片來源:沃德·雪萊/帕森設計學院(Parsons?the?Newschool?for?Design)
從恐懼和驚奇的出現,到新式太空小說的興起,雪萊創作的可視圖覆蓋了文學、電影和電視領域中數百個最受歡迎的科幻作品。
——來源|譯言網 作者|Dave Mosher 譯者|Lineker
]]>
【導讀】:在大數據時代,數據攜帶的信息量越來越多,數據可視化、信息可視化變得越來越重要,如何將龐大的信息“直觀、簡潔”的展現給讀者?在各種煩雜的信息中,到底什么才是重要的?什么是可以舍棄的?分享信息可視化的經典案例——倫敦地鐵線路圖
1863?年,倫敦地鐵第一次通車。在之后的幾十年中,數條鐵路線出現,并且縱橫交錯。但由于私營企業的運營,地鐵線路圖也隨之變得復雜混亂,這與如今的標志性地鐵圖大為不同。
這張標志性的地鐵線路圖1931年由Harry?Beck設計的,現在世界各地的地鐵圖大多由該地鐵圖衍生而來。而實際上,在這張著名的地鐵線路圖出現之前,人們也曾設計過許多地鐵線路圖。
尺寸問題
地鐵線路分布之廣讓線路圖的制作非常困難。即便在倫敦市中心,站與站之間的距離也大相徑庭。比如考文特花園站和萊斯特廣場站僅隔200米,而國王十字站和法林頓站卻相隔1.85公里遠。
地鐵線路延伸至距離貝克街50英里的周邊郊區——白金漢郡的維爾內路口站和布里爾站。當時的地鐵線路圖設計要求地圖和實際的地理位置要準確的定位。
但到了1930年,人們清楚地認識到,想在一張地圖上按照真實比例來反應和規劃整個地鐵網絡,實在是一個可以讓人絕望的工程。所以那時的地鐵線路圖往往只側重于倫敦市中心的地鐵線路的描繪。而地圖上的那些幸存的地鐵線路逐漸布及城市邊緣地區。
而許多早期的線路圖因為充滿藝術氣息,如今成為收藏家的的藏品。即使這些地圖沒有什么用處。
地圖還是蒙德里安?
1925?年,一位名叫Harry?Beck的工程繪圖師加入倫敦地鐵的繪圖隊伍,并于1931年發明了新的線路設計圖。這張圖不僅成為倫敦市民和游客的工具,其自身設計也頗受人們喜愛。如今倫敦地鐵線路圖仍遵循當時的基本設計。
但是,當?Beck向地鐵管理部門初次展示他的設計時,地鐵管理部門卻對此表示懷疑。Beck設計的地鐵線路呈水平、垂直或對角線延伸。擺脫了真實地理比例局限,地鐵線路圖如同一個電路圖,又像是一幅蒙德里安風格的繪畫。
Beck認為,實際的距離并不是特別的重要,乘客們只需要知道他們應該要在哪里上車和下車就可以了。
1933?年,地鐵、城市公交車、有軌電車、無軌電車、過河巴士以及綠線公交組合成一個新的公共交通集團:倫敦乘客運輸委員會。1932年,在少數站點嘗試性地印發500?份的Back的線路圖后,在1933年又印發了70萬份線路圖。一個月內又重印了再發了一遍,這表明線路圖十分的成功受人們的喜歡。
可是這份線路圖也并非完美。Back并沒有考慮區域線的西端區域,也沒有考慮里克曼沃斯另一邊的大都市區的郊區。經過他多年的改進,這些問題已得到解決。他的最終設計版本于1960年印發。
直至1974年去世之前,他仍在繼續著私人設計,包括數十年前就開始繪制的巴黎地鐵線路圖。
淚流成河(歌名:Cry?me?a?river)
自1986年起,這項設計工作已成為一項公司任務,而作為創始者的Back卻近乎被人們遺忘。其他國家紛紛效仿這份線路圖的設計。它不僅成為各國地鐵線路圖的設計模板,也激發了許多設計靈感,在襯衫、咖啡杯以及無數商品上都可以見到它的身影。
2009年,一直被奉為倫敦地標的泰晤士河從地圖上被移去。這項舉措在全國激起一片嘩然,各國媒體的負面報道更是紛至沓來。最終幾個月后,泰晤士河又重新出現在地鐵圖上。正如郵票收藏者珍藏愛德華八世的郵票一樣,因其珍稀的設計,許多收藏者也將珍藏這份沒有泰晤士河的線路圖。
2006年,BBC發起“英國最偉大的設計”評選活動,超過20萬名觀眾對一些著名設計進行投票。Back設計的線路圖名列第二,僅次于世界上最美飛機——協和客機。
Back的地圖以及之后的更新版本同樣也給予藝術家靈感。David?Booth的《The?Tate?Gallery?by?Tube》是倫敦地鐵站的宣傳海報,用畫作展示了紛繁復雜的路線。自1992年起,泰特現代美術館展出Simon?Patterson的《大熊》一作,畫中地鐵站名稱變成諸多藝術家、探險家、科學家、演員以及作家的名字。
受到倫敦地鐵線路圖啟發的不僅僅是藝術家。多年來,學生們為了打發上學和放學途中的無聊時間,嘗試將站名翻譯成不同的語言,如將站名翻譯成德語。或者使用Johnston字體使地鐵路線一目了然。這樣人們就能輕松記憶線路圖的每一站。
隨著工藝品和紀念品的融入,漸漸的,人們腦海中刻下了一張特殊的倫敦地圖。80多年來,Back設計的線路圖仍被視為新地鐵路線設計的標桿。
——來源:煎蛋?[一夕via?BBC]
]]>
導讀:《時代周刊》最新一期封面文章稱,我們每天被數據海洋淹沒,只有讓冷冰冰的數據形象化,變成看得見摸得著的東西,我們才能從中挖掘出意義。
威廉-普萊費爾(William?Playfair)生于1759年,在家里排行老四,父親是上進的蘇格蘭大臣。他年紀輕輕便當上瓦特的個人助理,隨后從事制圖、會計、工程、經濟、銀匠、土地投機、記者等多種職業,取得大小不等的成功。最終他在貧困中去世。
不過在此過程中,他差不多是不聲不響地一手創立了統計圖表學,發明了柱狀圖、線形圖和扇形圖。1786年他出版《商業和政治地圖集》,該書以一副英國歷史進出口圖開場,放在今天的話與本刊的排版看上去并不太脫節。用他自己的話說,“普萊費爾是將幾何原理用于財政事務之第一人”。
他生不逢時。如果他活在當今時代,普萊費爾很可能身居硅谷一家受熱捧創業公司的首席數據官高位。我們周圍的世界發生著看不見但影響巨大的轉變,即從信息稀缺到信息過剩的無聲顛覆。人類進化首先面臨的是食物短缺,如今我們卻遭受著普遍肥胖之苦。
與之大同小異的是,過去我們獲得信息很困難,現在到處都是海量的信息。谷歌[微博]前CEO斯密特曾經估計,人類每兩天所創造的數據量就相當于有史以來到2003年的數據量總和。他說這話是在五年前。我們從認識上還未進化到這一步。
估計人類創造的總數據量是技術人員的一大愛好。確切數字雖然各不相同,但誰都承認大得驚人。只需想想你的智能手機就夠了:沒錯,它是一個通訊設備,但它也是把你周圍的世界轉化為數據的工具。你看到某個東西,把它拍下來或者錄下來,然后上傳到云端,以字節的方式永遠存在。每一天人們發布五億條推文,在Instagram分享7000萬張照片,在Facebook觀看40億條視頻。每一分鐘我們向YouTube上傳300小時的新內容。
創造數據的不僅是人。還有被稱為物聯網的新現象。汽車、自動售貨機、眼鏡、計步器等裝上傳感器和傳輸器,與云端或彼此之間通訊。這些物體也像人類一樣在數字世界留下痕跡。市場研究機構IDC在2014年的報告中估計,數字世界的規模將從2013年的10萬億吉字節增長到2020年的44萬億或44澤字節。
我們擁有豐富的數據,但從中獲得的回報卻迅速減少,因為擁有的數據越多,就越難從中挖掘出意義。頗具諷刺意味的是,信息過多差不多也像信息不足一樣難以分析和理解。于是,新技術讓我們的世界充斥著越來越多的復雜信息,我們最終就越需要有著悠久歷史的人類努力,即始終致力于使復雜的東西可以理解、從混亂中求得意義的藝術,尤其是視覺藝術。
正如普萊費爾所發現的那樣,超過某一界限挖掘數據意義的最佳辦法就是使數據形象化。試想Instagram的海量照片。去年紐約市立大學教授曼努維奇(Lev?Manovich)對來自紐約、圣保羅、柏林、曼谷、莫斯科5座城市的12萬張照片進行了視覺分析。他和他的研究團隊從中選取自拍照片,估計照片上的人的年齡和性別。然后他們對照片運用面部分析算法,對所有數據進行統計分析,最后放到selfiecity.net制成互動圖表。
結果這些毫無意義的原始數據現在具有了意義。你可以按照城市、性別、心情、是否歪腦袋、是否戴眼鏡、睜開還是閉上眼睛瀏覽照片。你可以提出問題并得到答案:誰自拍用的多,男人還是女人?(答案是女人)。哪里的人笑得最多?(曼谷)哪里的老年人愛自拍?(紐約)……
如果你把數據形象化看作我們抵抗信息海洋的防洪堤,那么隨著數據日益增多,防洪堤的壓力總是不斷上升,而壓力上升又改變了數據形象化的方式和作用,這一點甚至普萊費爾也不曾料到。
形象化從對統計數據集的分析呈現發展為實時數據的不斷變化圖景。在Bostonography你可以像上帝一樣鳥瞰波士頓所有按照當前時速進行顏色編碼的公交車位置。Crimemapping.com實時顯示按照報案地點分類的案發地情況,用不同表情符號代表不同性質的案件。fbomb.co網站提供上推特的人何時何地如何說國罵的全球實時圖景。
從“紐約出租:生命中的一天”(NYC?Taxis:?A?Day?in?the?Life)可以得見美觀、免費的數據豐富性。一位名叫Chris?Whong的黑客根據《信息自由法》從出租車與電召車委員會(TLC)下載50G紐約市出租車數據,利用這些數據制作了2013年某一天任意出租車的路線和收入圖。你可以選擇一輛車快進(或以正常速度——如果你有時間)觀看它在曼哈頓大街上行駛,像勤勞的小精靈吃豆子那樣在身后留下一條藍線。
數據形象化并非總是為了鬧著玩。今年4月30日在Kickstarter發布的一個眾籌項目將從OpenSecrets.org抓去競選資金數據并以多種方式自動圖像化,清楚、簡潔地顯示政治家獲得的資金數量和來源。這是超越透明性的下一個必要步驟:不僅公布信息,而且要公布該信息的意義。今年數據圖像化最引人注目、最具革命性的實驗之一是紀錄片制作人、數據專家霍洛蘭(Neil)的“二戰死難者”(The?Fallen?of?World?War?II)互動視頻。該實驗利用圖表圖像講述歷史:表示成千上萬死難者的幾乎獨家的抽象數據形象化地帶領我們回顧二戰和“大屠殺”。
視頻六分鐘左右鏡頭急劇仰拍現出摩天大樓似的柱狀圖,表示前蘇聯軍隊870萬人的傷亡。初一看似乎極不可能,但隨著鏡頭回搖,在二戰的巨大災難中又合情合理。在這種不動聲色的敘述中,人類的死亡更顯觸目驚心。
之后的視頻同樣攝影手法反復出現:冷冰冰的抽象數據變為視覺藝術,讓我們感同身受,增加知識。現階段人類遭遇普萊費爾也發現無法理解的海量數據。我們也覺得數據多得無法理解,而這些數據又可能使得我們的世界不可理解。不過我們并非毫無辦法。信息不僅需要自由,它還需要看得見摸得著。
——譯文來源:新浪財經 ? ?編譯:檸楠
原文標題:《時代周刊》:用形象化的老辦法對付大數據
]]>