按照作者統(tǒng)計標(biāo)準(zhǔn),納博科夫最喜歡的詞是“淡紫色”阿加莎克里斯蒂則是“審訊”“不在場證明”和“可怕的” 文學(xué)可以計算嗎?
陳琰嬌 南開大學(xué)文學(xué)院青年教師,主要從事電影研究和文化批評。
國內(nèi)引進圖書有個有趣的現(xiàn)象,那就是有時候會只譯主標(biāo)題不譯副標(biāo)題,又或者只譯部分標(biāo)題,各位看官若只是按名下單,有時不免文不對題。上回拿到一本《文學(xué)課:如何輕松理解偉大作品》,正準(zhǔn)備學(xué)習(xí)一番,定睛一看才發(fā)現(xiàn)原書名里還有“for kids(給孩子的)”倆詞沒被譯出。看來不是給我準(zhǔn)備的書,只好轉(zhuǎn)送中學(xué)生。這回發(fā)現(xiàn)一本《納博科夫最喜歡的詞》,興致勃勃打開來,才發(fā)現(xiàn)這也并不是納博科夫研究專著。納博科夫喜歡什么詞在這里僅僅是個引子,作者是要用統(tǒng)計的方法來研究“經(jīng)典、暢銷書和我們自己的寫作背后的數(shù)據(jù)到底說明了什么”(What the Numbers Reveal About the Classics, Bestsellers, and Our Own Writing)。
盡管有點“標(biāo)題黨”,但確也是一本有趣的書。作者的研究方法是用數(shù)據(jù)統(tǒng)計來研究文學(xué)作品,比如:都說優(yōu)秀的作品副詞少,那么到底要少到什么程度才算好,誰是用副詞最少的作家?男女作家在用詞習(xí)慣上有什么不同,書中的男女角色在表現(xiàn)上有不同嗎?我們會在自己的寫作中留下“指紋”嗎?什么樣的開頭結(jié)尾更受歡迎?當(dāng)然,看到這里,也許你現(xiàn)在也有了一個疑問——這一連串的“十萬個為什么”也算文學(xué)研究嗎?
隨著人工智能熱潮的到來,“大數(shù)據(jù)”成為了這幾年最熱門的話題之一。不僅互聯(lián)網(wǎng)要關(guān)心大數(shù)據(jù),人文社科領(lǐng)域也要研究人工智能,思考數(shù)字人文。不僅現(xiàn)代影視劇要將數(shù)據(jù)庫的功能可視化,像《長安十二時辰》這樣的古裝片中也出現(xiàn)了“大案牘術(shù)”,也就是原始的數(shù)據(jù)管理系統(tǒng)。那么接下來的問題便是,文學(xué)真的可以計算嗎?
書一開篇,作者就講了一個破案的故事。話說美國的《聯(lián)邦黨人文集》,收錄了漢密爾頓、麥迪遜和杰伊三位政治家的85篇文章,影響深遠(yuǎn)。由于文章刊發(fā)時是共用筆名,所以一開始誰都沒說哪篇是自己的。后來漢密爾頓在給朋友的信中分別列出了各篇文章的作者,再后來麥迪遜又說漢密爾頓認(rèn)領(lǐng)的文章中,有12篇是他寫的,于是這作者之爭一吵就是一百多年,各方學(xué)者誰也說服不了誰。直到1963年,才由兩位教授給出了明確答案,而他們既不研究歷史,也不研究政治,是貨真價實的統(tǒng)計學(xué)家。
說來也簡單,兩位學(xué)者分別統(tǒng)計了麥迪遜和漢密爾頓文章中的高頻詞,再將高頻詞與12篇文章比對。比如在已確認(rèn)是麥迪遜的文章中,超過一半使用了“whilst”而“while”從未出現(xiàn),而漢密爾頓的文章則恰恰相反,三分之一使用了“while”而“whilst”從未出現(xiàn)。類似這樣的詞,他們選出幾十個,逐一對比,最終確認(rèn)麥迪遜的確是12篇文章的作者。就這樣,困惑了歷史學(xué)家兩個世紀(jì)的問題,最終被計算機解決了。
沿著這個思路,作者選了9個有趣的話題,對文學(xué)作品進行了新的審視。也因此,他才能準(zhǔn)確地回答(按照作者統(tǒng)計標(biāo)準(zhǔn))納博科夫最喜歡的詞是“mauve(淡紫色)”,簡奧斯汀最喜歡的三個詞是“civility(禮貌)”“fancying(幻想)”和“imprudence(輕率)”,而阿加莎克里斯蒂則是“inquest(審訊)”“alibi(不在場證明)”和“frightful(可怕的)”。
盡管知道了名家最愛用的詞、副詞使用率、暢銷書的性別氣質(zhì),這樣的“文學(xué)統(tǒng)計學(xué)”也不會在短時間內(nèi)影響作家的寫作和我們對作品的看法,甚至數(shù)字人文這個研究領(lǐng)域也存在方法和路徑上的爭議。但反過來,計算機輔助文本處理技術(shù)的發(fā)展又的確給我們帶來了看待作品的新視角,讓我們看見了文本中隱藏的“指紋”。也正是準(zhǔn)確無誤的數(shù)據(jù)統(tǒng)計讓我們看到了文本背后的無意識,為什么作品會呈現(xiàn)出“這樣”的特點,或許值得我們繼續(xù)思考。