一年一度的奧斯卡頒獎(jiǎng)典禮又要到來(lái)了。也許你還在為去年《美國(guó)騙局》惜敗《地心引力》而耿耿于懷,但你的朋友們已經(jīng)為《鳥(niǎo)人》和《少年時(shí)代》孰優(yōu)孰劣、卷福和庫(kù)珀誰(shuí)會(huì)封王爭(zhēng)得面紅耳赤,為一個(gè)月后杜比劇院里那場(chǎng)星光璀璨的盛大儀式預(yù)熱了吧。
眾所周知,對(duì)于電影這樣的藝術(shù)作品進(jìn)行價(jià)值評(píng)判往往是非常困難的。首先電 影審美是一個(gè)非常主觀的概念,一千個(gè)影迷心中有一千零一個(gè)哈利波特。更何況,在這個(gè)大片如流水、明星似牛毛的娛樂(lè)時(shí)代,電影的數(shù)量、種類(lèi)層出不窮,即便有 金球獎(jiǎng)、奧斯卡這樣的專(zhuān)業(yè)獎(jiǎng)項(xiàng),依然是眾口難調(diào)。
星球大戰(zhàn)與星際迷航,到底誰(shuí)是永恒經(jīng)典?
如何才能評(píng)價(jià)一部電影的價(jià)值,成了影迷心中最難的問(wèn)題。是看票房,還是看 小金人?是看爛番茄、Metacritic、豆瓣上的總評(píng)分,還是看觀影人數(shù)?是看是否入選IMDb等各大網(wǎng)站的Top榜單,還是看有沒(méi)有受到羅杰?埃伯 特等知名影評(píng)人的青睞?標(biāo)準(zhǔn)太多,信息量太大,這實(shí)在讓人無(wú)所適從。
不過(guò)沒(méi)有關(guān)系,人搞不定的事情,那就讓計(jì)算機(jī)來(lái)幫你搞定吧!最近,芝加哥西北大學(xué)復(fù)雜系統(tǒng)研究院聯(lián)席主任路易斯?阿馬拉爾(Luis Amaral)教授率領(lǐng)的科學(xué)團(tuán)隊(duì)(其他兩名作者為馬克斯·沃瑟曼(Max Wasserman)和我)就發(fā)表了這樣一項(xiàng)研究。結(jié)合互聯(lián)網(wǎng)上的眾包數(shù)據(jù),利用數(shù)據(jù)挖掘、復(fù)雜網(wǎng)絡(luò)分析等手段,我們找出了比網(wǎng)友打分和專(zhuān)家評(píng)論更能反映電影作品重要性的指標(biāo)。這項(xiàng)成果已于1月20日在《美國(guó)科學(xué)院院刊》(PNAS)上發(fā)表[1]。
電影是否“重要”,誰(shuí)說(shuō)了算?
那么你也許會(huì)問(wèn)了,先不管這數(shù)據(jù)分析是個(gè)什么玩意兒,研究團(tuán)隊(duì)要怎么定義 電影的“重要性”呢?首先票房、觀影人數(shù)這一類(lèi)的數(shù)字肯定是不行的。像《復(fù)仇者聯(lián)盟》、《變形金剛》這樣的商業(yè)大片,雖然上映時(shí)火爆異常、吸金無(wú)數(shù),沖擊 力(Impact)自然十足,但要放到整個(gè)電影發(fā)展史來(lái)看,其影響力(Influence)就很難說(shuō)了。而且,《穆赫蘭道》《歡樂(lè)糖果屋》等Cult片的 擁躉自然也會(huì)反對(duì)以票房論成敗。
當(dāng)年的電影票房滑鐵盧,如今的不朽經(jīng)典,電影的重要性究竟要如何衡量?
那么奧斯卡之類(lèi)的電影獎(jiǎng)項(xiàng)呢?小金人由美國(guó)電影藝術(shù)與科學(xué)學(xué)會(huì)頒發(fā),評(píng)選的六千多名會(huì)員全部都是業(yè)內(nèi)資深人士,這可夠權(quán)威了吧?好是好,可惜奧斯卡 只評(píng)選當(dāng)年上映的電影,提名的影片也就那么幾個(gè),最終獲獎(jiǎng)名單極易受到流行時(shí)尚、商業(yè)宣傳的左右,因此在評(píng)估影片的長(zhǎng)遠(yuǎn)影響方面,它仍是力有不逮。每年奧 斯卡都會(huì)引發(fā)諸多爭(zhēng)議,也從側(cè)面印證了這一點(diǎn)。
那么,到底該怎么辦?我們的研究團(tuán)隊(duì)幾經(jīng)尋覓思索,終于發(fā)現(xiàn)了一個(gè)最接近理想的標(biāo)準(zhǔn),那就是美國(guó)國(guó)會(huì)圖書(shū)館保存的國(guó)家影片登記表[2]。 1988年,美國(guó)政府成立了美國(guó)國(guó)家電影保護(hù)局,每年年底評(píng)選25部“文化上、歷史上和藝術(shù)上具有重要性”的美國(guó)電影,收錄進(jìn)國(guó)家影片登記表加以保存。最 為重要的是,參選電影必須上映至少十年以上,這就確保了入選的電影必須經(jīng)過(guò)時(shí)間的沉淀,最大程度地避免了潮流、商業(yè)運(yùn)作的影響。
電影也有“引用”網(wǎng)絡(luò)
找到了這個(gè)相對(duì)可靠的“重要性”評(píng)價(jià)標(biāo)準(zhǔn)之后,研究團(tuán)隊(duì)的下一個(gè)任務(wù)便是要找出哪些變量是預(yù)測(cè)電影能否入選國(guó)家影片登記表的最佳指標(biāo)。仔細(xì)考量之后,研究團(tuán)隊(duì)認(rèn)為電影的重要性能夠從它的“品質(zhì)”、在大眾中的“沖擊力”和對(duì)其他電影的“影響力”幾個(gè)方面體現(xiàn)出來(lái)。
“品質(zhì)”可以由“專(zhuān)家意見(jiàn)”和“大眾點(diǎn)評(píng)”反映,埃伯特評(píng)分(Ebert’s Rating)這樣的單個(gè)專(zhuān)家評(píng)分,Metacritic Score這樣眾多專(zhuān)家評(píng)分的匯總,以及IMDb上影迷評(píng)分的數(shù)據(jù)都可以作為參考。“沖擊力”則可以通過(guò)IMDb上的評(píng)分人數(shù)來(lái)衡量。
而衡量某一個(gè)電影對(duì)其他電影的“影響力”就不那么好辦了。電影不像科學(xué)論文,它們不會(huì)在片尾字幕里打上“參考文獻(xiàn)”列表,把對(duì)本影片產(chǎn)生過(guò)影響的電影一一列出。不過(guò),萬(wàn)能的互聯(lián)網(wǎng)還是不會(huì)讓我們失望的。
互聯(lián)網(wǎng)電影數(shù)據(jù)庫(kù)(Internet Movie Database, IMDb.com)是亞馬遜(Amazon)旗下的一個(gè)網(wǎng)站,擁有極為詳實(shí)的電影資料,從演員表、票房收入到劇情梗概,巨細(xì)無(wú)遺。而其中最末尾也是最不被 人們注意的一欄,其實(shí)隱藏著非常豐富的信息,那就是由網(wǎng)友們提交的電影之間的“聯(lián)系”(Connection)。
一代代電影人都是看著上一代電影人的作品成長(zhǎng)的,那些經(jīng)典電影自然會(huì)對(duì)后 來(lái)的電影產(chǎn)生深遠(yuǎn)的影響,其中的經(jīng)典橋段也可能在之后的電影中有所體現(xiàn)。而火眼金睛的網(wǎng)友們發(fā)現(xiàn)了這種聯(lián)系,便會(huì)把它提交到IMDb網(wǎng)站上。根據(jù)提交原 因,這些聯(lián)系可分為“參考”、“惡搞”、“放映”、“續(xù)作”等等類(lèi)別。
比如,1977年上映的傳世之作《星球大戰(zhàn):新希望》中唐僧一般嘮叨的機(jī) 器人C3PO,他其實(shí)是以1927年科幻電影開(kāi)山鼻祖之一《大都會(huì)》里的機(jī)器人為范本設(shè)計(jì)的,因此我們便可以認(rèn)為《星球大戰(zhàn)》“參考”了《大都會(huì)》。同 理,我們也可以認(rèn)為《北京遇上西雅圖》“參考”了《西雅圖未眠夜》,《舌尖上的中國(guó)2》“參考”了《人類(lèi)星球》。而《當(dāng)哈利遇到莎莉》里直接出現(xiàn)了《卡薩 布蘭卡》的片段,這就算是“放映”。《怪物史萊克》則“惡搞”了許多經(jīng)典的動(dòng)畫(huà)角色和橋段。我們可以認(rèn)為,這些“聯(lián)系”其實(shí)就是電影之間的“引用”。

電影的引用網(wǎng)絡(luò)。t為兩部電影的年份間隔,越往下的電影越老。圖片來(lái)自參考文獻(xiàn)1
在這個(gè)數(shù)據(jù)庫(kù)中,15425部影片組成的電影引用網(wǎng)絡(luò)里一共可以找到42794個(gè)聯(lián)系。越重要、越經(jīng)典的電影,擁有的“引用”數(shù)自然也越多,《綠野仙蹤》、《驚魂記》、《教父》、《公民凱恩》等影迷們津津樂(lè)道的名作都有著成百上千的“引用”。
最佳指標(biāo):長(zhǎng)間隔引用次數(shù)
有了這個(gè)引用網(wǎng)絡(luò)之后,我們就可以利用復(fù)雜網(wǎng)絡(luò)分析的手段,來(lái)計(jì)算某一部電影對(duì)其他電影的“影響力”了。研究團(tuán)隊(duì)從這個(gè)網(wǎng)絡(luò)中計(jì)算生成了兩個(gè)數(shù)字指標(biāo),一個(gè)是根據(jù)PageRank算法[3]給 出的分?jǐn)?shù),另一個(gè)則是時(shí)間跨度超過(guò)25年的被引用次數(shù),我們稱(chēng)之為“長(zhǎng)間隔引用次數(shù)”。為什么不直接使用總引用數(shù)呢?這是因?yàn)檠芯繄F(tuán)隊(duì)通過(guò)觀察經(jīng)驗(yàn)分布和 與零模型對(duì)比發(fā)現(xiàn),很多電影被引用都是在大約25年之內(nèi),超過(guò)25年以后就無(wú)人問(wèn)津了。而對(duì)于某些電影,不管它多老,總還會(huì)收到新的“引用”。因此我們認(rèn) 為,時(shí)間跨度在25年以?xún)?nèi)的“引用”可能更多受到潮流的影響,而長(zhǎng)時(shí)間跨度的“引用”更能說(shuō)明作品經(jīng)受住了時(shí)間的考驗(yàn)。
接下來(lái),研究團(tuán)隊(duì)使用Probit回歸模型和隨機(jī)森林兩種機(jī)器學(xué)習(xí)算法,分別計(jì)算了埃伯特評(píng)分、Metacritic Score、IMDb評(píng)分、IMDb評(píng)分人數(shù)、PageRank分?jǐn)?shù)以及長(zhǎng)間隔引用次數(shù)這六個(gè)指標(biāo)是否能夠預(yù)測(cè)電影能否入選美國(guó)國(guó)家影片登記表。
結(jié)果表明,長(zhǎng)間隔引用次數(shù)在兩個(gè)算法下的表現(xiàn)都是最優(yōu),它超過(guò)了總引用次數(shù)和PageRank分?jǐn)?shù),更是遠(yuǎn)勝于影評(píng)專(zhuān)家的個(gè)人意見(jiàn)。研究團(tuán)隊(duì)根據(jù)“長(zhǎng)跨度引用”的個(gè)數(shù),制定了一張“最具影響力”的電影榜單,排在前十位的電影分別是《綠野仙蹤》(1939)、《星球大戰(zhàn)》、《驚魂記》、《卡薩布蘭卡》、《亂世佳人》(1939)、《金剛》(1933)、《科學(xué)怪人》(1931)、《教父》、《公民凱恩》和《2001:太空漫游》。值得一提的是,在作者提交論文的六個(gè)月后,《歡 樂(lè)糖果屋》已于2014年年底入選國(guó)家影片登記表。這樣一來(lái),這張榜單上前40部電影里,除了《德州電鋸殺人狂》、《七年之癢》和《羅絲瑪麗的嬰兒》之 外,其余37部均已入選。另外我們的研究結(jié)果也顯示,來(lái)自Metacritic Score和IMDb的網(wǎng)友平均打分預(yù)測(cè)力超過(guò)了單個(gè)專(zhuān)家意見(jiàn),這也再次證實(shí)了兩句老話:“人多力量大”,“三個(gè)臭皮匠,賽過(guò)諸葛亮”。
根據(jù)“長(zhǎng)間隔引用”次數(shù)得出的美國(guó)電影排名,最后一欄為影片入選美國(guó)國(guó)家影片登記表的時(shí)間。數(shù)據(jù)由本文作者提供
由此看來(lái),在預(yù)測(cè)電影的重要性方面,數(shù)據(jù)科學(xué)的效果還是最好的,而大眾評(píng) 審的綜合評(píng)分也比專(zhuān)家的個(gè)人意見(jiàn)更加可靠。雖然目前的評(píng)價(jià)方法還要依靠網(wǎng)友手動(dòng)提交電影之間的“聯(lián)系”,計(jì)算25年后的“引用率”也需要相當(dāng)漫長(zhǎng)的等待, 不過(guò)這依然是數(shù)據(jù)科學(xué)與復(fù)雜網(wǎng)絡(luò)理論在文藝作品評(píng)價(jià)方面一次有趣的嘗試。
“影評(píng)家在挑選重要電影時(shí)有時(shí)會(huì)過(guò)于自信,而且會(huì)有偏見(jiàn)。我們的方法則 是盡可能客觀的。” 阿馬拉爾教授評(píng)價(jià)說(shuō),“一部電影的某些屬性是我們無(wú)法看見(jiàn)的,但卻有其他方面可以測(cè)量,包括評(píng)分、獎(jiǎng)項(xiàng)以及受其他電影人的參考程度。這些方面都在暗示著這 部電影的隱藏屬性——它的重要性。我們發(fā)現(xiàn),到頭來(lái)是電影的創(chuàng)造者自己來(lái)決定哪些電影最為重要,而非那些影評(píng)專(zhuān)家們。” (編輯:窗敲雨)
作者的PS:對(duì)于中國(guó)電影,“引用網(wǎng)絡(luò)”這樣的數(shù)據(jù)還很匱乏,不知道大家有沒(méi)有興趣一起補(bǔ)充數(shù)據(jù)庫(kù),讓咱們也看看中國(guó)電影到底哪些才是經(jīng)典之作呢?
參考資料:
- Wasserman M, Zeng XHT, Amaral LAN (2015), Cross-evaluation of metrics to estimate the significance of creative works. Proceedings of the National Academy of Sciences, Early Edition, DOI: 10.1073/pnas.1412198112
- Library of Congress (2014) National Film Registry. Available at www.loc.gov/film/ filmnfr.html. Accessed
- Brin S, Page L (1998) The anatomy of a large-scale hypertextual Web search engine. Computer Networks and ISDN Systems 30(1-7):107–117. 26.

