網(wǎng)絡(luò)文學(xué)研究中的數(shù)字人文視野 ——以晉江文學(xué)城積分榜單及“清穿文”為例
摘要:論文以“清穿文”這一網(wǎng)絡(luò)文學(xué)類型及其主要發(fā)表平臺晉 江文學(xué)城為例,討論了從數(shù)字人文的理論視野出發(fā)開展網(wǎng)絡(luò)文學(xué)研究 的可行性與必要性。分析了包括文學(xué)網(wǎng)站積分榜單計算公式在內(nèi)的網(wǎng) 絡(luò)文學(xué)生產(chǎn)機(jī)制與數(shù)字人文思維之間纏繞共生的關(guān)系,由此指出相關(guān) 研究工具的匱乏和數(shù)據(jù)資料庫的缺失。為了加強(qiáng)理論自覺,推進(jìn)學(xué)科 建設(shè),當(dāng)前最迫切的工作,就是盡快開發(fā)具有針對性的研究工具,以及建設(shè)完善一個學(xué)術(shù)向的網(wǎng)絡(luò)文學(xué)資料數(shù)據(jù)庫,抓緊搜集、保存現(xiàn)有 的各種研究資料。
關(guān)鍵詞:數(shù)字人文 網(wǎng)絡(luò)文學(xué) “清穿文”
當(dāng)我們借助數(shù)字人文(Digital Humanities)的研究方法與問題意識,去審視中國網(wǎng)絡(luò)文學(xué)的創(chuàng)作實踐,自不難發(fā)現(xiàn)二者之間客觀存在的適配性:網(wǎng)絡(luò)文學(xué)天然是數(shù)字人文的,它的整套生產(chǎn)機(jī)制,都是在互聯(lián)網(wǎng)這個數(shù)字媒介的環(huán)境之中,伴隨著數(shù)字技術(shù)的發(fā)展逐步確立并不斷更新的。
這事實上意味著,從數(shù)字人文的角度介入網(wǎng)絡(luò)文學(xué)研究,并不僅僅只是“可 能的選項”,而理應(yīng)成為某種不可或缺的、內(nèi)在化的思維范式。由此反觀當(dāng)前網(wǎng) 絡(luò)文學(xué)的前沿研究,如圍繞生產(chǎn)機(jī)制、粉絲社群文化的研究,又或是對類型文的 研究(目前的方法主要是脈絡(luò)梳理+經(jīng)典文本細(xì)讀)等,如能被納入數(shù)字人文的理論框架,必將打開一重全新的視野。同時,過往研究之中客觀存在的諸多困境,以及若干難以落實的推論,也有望運(yùn)用數(shù)字人文的工具、方法得到解決。當(dāng)然,更重要的是,在數(shù)字人文的思維模式下,還可能提出以當(dāng)下的研究視域很難 預(yù)見的新問題。
為避免討論過于抽象,本論將以圍繞“清穿文”及其主要發(fā)表平臺晉江文學(xué) 城 1 (以下簡稱“晉江”)的研究為例,具體地闡釋數(shù)字人文的理論與方法介入 網(wǎng)絡(luò)文學(xué)研究的可能性、面臨的困局以及解決的途徑。
一 作為網(wǎng)絡(luò)文學(xué)生產(chǎn)機(jī)制內(nèi)核的算法設(shè)計
“清穿文”是流行于網(wǎng)絡(luò)文學(xué)發(fā)展初期(2004—2007)的一個非常重要的創(chuàng)作潮流和子類型,通常描寫現(xiàn)代女性穿越 2 到清朝,與阿哥、親王們(或別的王公大臣、貴族子弟)戀愛的言情小說。其肇始之作,是2004年7月開始連載于晉江 原創(chuàng)網(wǎng) 3 的《夢回大清》(金子),與它齊名的作品,還包括《步步驚心》(桐 華,晉江原創(chuàng)網(wǎng),2006)和《瑤華》(晚晴風(fēng)情,晉江原創(chuàng)網(wǎng),2006),即所謂 的“清穿三座大山”。
中文學(xué)界對穿越/清穿小說的廣泛關(guān)注,大約始于2011年,即《步步驚心》 電視劇熱播之后。這顯然是一種回溯性的肯定,遠(yuǎn)遠(yuǎn)晚于清穿文在網(wǎng)絡(luò)文學(xué)界內(nèi)部的流行,甚至也晚于影視資本對它的挖掘。考慮到文學(xué)網(wǎng)站通常為UGC(User Generated Content,用戶生產(chǎn)內(nèi)容)架構(gòu),刊載的作品均由用戶自主上傳,近乎于零門檻,印刷文明時代那種以編輯、學(xué)者為中心的、精英化的遴選機(jī)制,自然也 就無從談起。海量文本泥沙俱下,清穿文卻在浩如煙海的網(wǎng)絡(luò)言情小說之中自成 脈絡(luò),《步步驚心》也迅速脫穎而出,成為最受矚目的代表作。這便足以證明,在網(wǎng)絡(luò)文學(xué)的生產(chǎn)機(jī)制和閱讀反饋機(jī)制內(nèi)部,是存在著某種評判作品優(yōu)劣的標(biāo)準(zhǔn) 以及相應(yīng)的推介渠道的。
這些標(biāo)準(zhǔn)和渠道的具象化,就是文學(xué)網(wǎng)站上常見的各類積分榜單。盡管不同了網(wǎng)站內(nèi)部的榜單設(shè)置也不盡相同,但核心思路都是依據(jù)某種算法規(guī)則 4 ,將網(wǎng)站上刊載的所有作品按照點(diǎn)擊量、付費(fèi)訂閱量或好評率等標(biāo)準(zhǔn)進(jìn)行量化排序。
參見晉江文學(xué)城頒布于2005年3月2日(正是清穿文最為流行的時期)的一版積分計算公式 5 :全文點(diǎn)擊數(shù)/章節(jié)數(shù)×Ln(全文字?jǐn)?shù))×平均打分+(Ln(書評字 數(shù))×?xí)u打分)之和+精華書評特別加分
不難看出,在上述公式中,能影響到作品積分的系數(shù)主要包括三類:第一 類是作品本身的客觀數(shù)據(jù),如全文字?jǐn)?shù);第二類則是對讀者瀏覽、評價作品的行為進(jìn)行的量化與賦值,如全文點(diǎn)擊數(shù)、書評字?jǐn)?shù)和平均打分等;第三類是網(wǎng)站編 輯對作品的獎勵和推薦,如精華評論特別加分。6 套用這個公式計算出的最終 數(shù)值,即一部小說的“作品積分”,是晉江在排列各種推薦榜單時的重要參考依據(jù),對于總分排行榜、半年榜、月榜和新晉作者榜等榜單而言 7 ,甚至是唯一的依據(jù)。這些通過積分排序篩選出的作品,通常都是同時期最優(yōu)秀、最受歡迎的,而有幸登上榜單頁面,顯然也會為它們帶來更多實體出版和影視改編的機(jī)會。“清穿三座大山”早年間都曾是榜單上的常客。
相比起印刷文明時代的編輯審稿制和學(xué)院體系內(nèi)的精英批評話語,文學(xué)網(wǎng)站 訴諸積分算法,雖然的確是將選擇、評價一部小說的權(quán)力讓渡給了讀者 8 ,卻也絕非僅止于此。最為關(guān)鍵的秘密,其實就隱藏在公式之中:盡管每位用戶(包括 讀者和作者)的行為(點(diǎn)擊、寫書評)與喜惡(打正分或負(fù)分),都經(jīng)由相對客觀、固定的渠道轉(zhuǎn)化成了數(shù)據(jù),但總積分?jǐn)?shù)值的輸出,卻是糅合了網(wǎng)站自身利益與傾向的加權(quán)計算。也就是說,雖然對小說的點(diǎn)擊和評分是由讀者決定的,每一章寫多少字是由作者決定的,但這些字?jǐn)?shù)、點(diǎn)擊和評分的數(shù)值最終能在多大程度上影響總積分的大小,卻是由文學(xué)網(wǎng)站決定的。通過調(diào)整算法,網(wǎng)站就能將當(dāng)下的運(yùn)營理念貫徹到這個龐然大物的每一根毛細(xì)血管里。譬如,在晉江頒布于2016 年的新版積分公式之中,就新增了作者簽約限和版權(quán)授權(quán)狀況等系數(shù),這顯然是在當(dāng)時IP(Intellectual Property)運(yùn)營熱潮的推動下做出的修訂。9
晉江推出這套積分計算公式的根本目的,一方面是對讀者的閱讀時間、審美 能力和判斷力加以征用,把原本由個別編輯、學(xué)者承擔(dān)的遴選任務(wù)分?jǐn)偨o每個用 戶,對站內(nèi)數(shù)量龐大的小說展開地毯式摸底與分揀,為網(wǎng)站后續(xù)的版權(quán)運(yùn)營工作 (如洽談實體出版、售賣影視改編權(quán)等)提供依據(jù);另一方面,也是在利用算法引導(dǎo)和控制用戶的行為。事實證明,這種控制和引導(dǎo)是行之有效的:作者要想迅速提升人氣、嶄露頭角,就不免對積分規(guī)則多加鉆研,保持穩(wěn)定更新10 ;讀者為、了支持自己喜歡的作者和作品,也會積極地、反復(fù)地進(jìn)行評論、點(diǎn)擊或打賞。11這些行為的最終結(jié)果,均為網(wǎng)站帶來了更多的流量和銷售額。除此之外,網(wǎng)站編 輯往往也會通過參考積分?jǐn)?shù)值的變化,掌握并管理作者的創(chuàng)作情況。
盡管在積分計算公式的字里行間,的確暗含著網(wǎng)站對用戶的隱性剝削,但這僅僅是硬幣的一面,因為用戶也完全可以通過理解規(guī)則、利用規(guī)則來影響某部作品的積分,甚至于網(wǎng)站的決策。透過這行短短的積分計算公式,折射出的,是 一個小型“文學(xué)場”內(nèi)部的各方博弈。其中,居于核心位置的公式,固然是在建構(gòu)階序(受歡迎的優(yōu)秀作品和平庸的、失敗的作品),卻也同時設(shè)定了規(guī)則與玩 法。例如“平均打分”這個系數(shù),指的就是讀者對小說各個章節(jié)打出的所有評分的平均值,實際可選分值從正2分到負(fù)2分不等。這類口碑評價體系在互聯(lián)網(wǎng)行業(yè)并不罕見,豆瓣、大眾點(diǎn)評和滴滴打車等網(wǎng)站或應(yīng)用中,都包含這項功能。然而大多數(shù)文學(xué)網(wǎng)站,例如閱文系尤其是起點(diǎn)中文網(wǎng)(以下簡稱“起點(diǎn)”),似乎還是更看重點(diǎn)擊、收藏12和訂閱這些實打?qū)嵉目陀^數(shù)據(jù),允許讀者對作品進(jìn)行評分并將其納入積分算法的主流文學(xué)網(wǎng)站,其實只有晉江。
乍看上去,打分畢竟是一種主觀好惡,似乎容易影響榜單的客觀性。但對于晉江這樣一個深耕粉絲文化的“女性向”13 文學(xué)網(wǎng)站而言,卻有著獨(dú)特的意義。作為一種細(xì)水長流的日常操作,針對每一章更新進(jìn)行的打分,顯然更容易在讀者和作者之間建立起深厚的羈絆關(guān)系。不僅如此,該評分系統(tǒng)的特殊之處還在于, 它是可以打出負(fù)值的。這是一種暗含著攻擊性的設(shè)置,它意味著,晉江的用戶完 全可以通過打負(fù)分,甚至是大量“刷負(fù)分”的操作,來降低一部作品的積分和排名。而相比之下,起點(diǎn)的用戶卻不可能通過任何操作削減作品的積分,而最多只能“還原”,例如取消之前的訂閱或收藏等。不同的規(guī)則也導(dǎo)向了不同的行為模式,在晉江,由于負(fù)分的存在,批判性的審美判斷、個人情緒的發(fā)泄甚至有組織 的抵制行為,都成為可能。不同粉絲團(tuán)體(包括作者粉、作品粉等)之間的相互攻訐、黨同伐異,也往往通過“刷負(fù)分”來達(dá)成。14 這正是當(dāng)前“女性向”網(wǎng)絡(luò)文學(xué)社群的基本生態(tài),它參差多變、難以一言蔽之,卻始終與網(wǎng)站算法互為因 果,環(huán)環(huán)相扣。
文學(xué)網(wǎng)站本質(zhì)上屬于互聯(lián)網(wǎng)公司,甚至普遍具有游戲公司的背景,將算法視為指導(dǎo)網(wǎng)站運(yùn)營的依據(jù)和建構(gòu)社群文化(企業(yè)文化)的基礎(chǔ),是很值得理解的策略。因為它顯然遵循著互聯(lián)網(wǎng)產(chǎn)品運(yùn)營的基本邏輯,所能舉出的例子也絕不僅僅 是前面列出的那些。15
上述一系列事實,集中體現(xiàn)了數(shù)字媒介和數(shù)字技術(shù)對傳統(tǒng)人文學(xué)科的重要研究領(lǐng)域之一 ——文學(xué)——的生產(chǎn)機(jī)制的深度重構(gòu)。歸根結(jié)底,這種依靠積分算法評判作品優(yōu)劣、篩選人氣作品的機(jī)制,無論創(chuàng)造它的人是否有此自覺,但本質(zhì)上都是數(shù)字人文思維的產(chǎn)物。同理,當(dāng)這種數(shù)據(jù)化的、新媒體運(yùn)營的理念開始與文學(xué)的創(chuàng)作、接受和傳播等各個環(huán)節(jié)緊密纏繞,直面這一新興文化現(xiàn)象的網(wǎng)絡(luò)文學(xué)研究者,只要曾經(jīng)直接深入網(wǎng)絡(luò)文學(xué)生產(chǎn)機(jī)制的內(nèi)部,那么無論自覺還是不自覺,他其實已經(jīng)在進(jìn)行著某種數(shù)字人文式的研究了。
眾所周知,數(shù)字人文研究起源于文獻(xiàn)典籍的數(shù)字化與數(shù)據(jù)庫化。然而經(jīng)過本節(jié)的討論,我們幾乎可以肯定,與必然需要經(jīng)歷數(shù)字化與數(shù)據(jù)庫化步驟的傳統(tǒng)人文學(xué)科不同,網(wǎng)絡(luò)文學(xué)的起點(diǎn),就是數(shù)字人文。甚至可以說,越是貼近網(wǎng)絡(luò)文學(xué) 生產(chǎn)機(jī)制內(nèi)核的研究,就越和數(shù)字人文研究殊途同歸。而研究網(wǎng)絡(luò)文學(xué)的生產(chǎn)機(jī) 制,也未嘗不能是研究數(shù)字人文本身。
二 網(wǎng)絡(luò)文學(xué)研究與數(shù)字人文分析工具
盡管網(wǎng)絡(luò)文學(xué)與數(shù)字人文之間的聯(lián)系是如此緊密,但現(xiàn)有的適用于中文文本的數(shù)字人文研究工具和項目,顯然都不是針對網(wǎng)絡(luò)文學(xué)作品的研究需求開發(fā)的。以數(shù)字人文研究平臺Docusky16 為例,該平臺所提供的半自動標(biāo)記工具包含有多種 功能:有的可以為研究者上傳的文檔標(biāo)注人名、地名、年代及官名,這無疑有助 于古典文獻(xiàn)的分析和整理;有的能標(biāo)記小說中出現(xiàn)的對話的參與者、類別和次數(shù) 等,對解讀長篇小說的劇情走向及人物性格具有一定的參考價值;還有詞頻統(tǒng)計這個常見功能,可用于分析某個作者的用詞偏好、寫作習(xí)慣或者以關(guān)鍵詞為依據(jù) 分析人文思潮的變遷等。
然而這些常規(guī)的分析工具對于網(wǎng)絡(luò)文學(xué)作品的研究而言,卻起不到太大的助益。網(wǎng)絡(luò)小說不同于古典文獻(xiàn),以幻想題材居多,標(biāo)記人名、地名本無太大 意義;并且相對于劇情、人物性格等要素,類型和結(jié)構(gòu)的流變才是更為核心的 問題;此外,網(wǎng)絡(luò)文學(xué)研究對具體某位作者的遣詞造句和寫作風(fēng)格也并不是特 別關(guān)注。
如此看來,著眼于網(wǎng)絡(luò)文學(xué)作品的研究需求搜尋和開發(fā)更為恰當(dāng)?shù)姆治龉ぞ撸统闪水?dāng)務(wù)之急。可供開拓的方向大致有以下幾種。
首先是能針對不同類型的網(wǎng)文,提煉出它們的敘事結(jié)構(gòu)的分析工具。長篇類 型小說在網(wǎng)絡(luò)文學(xué)中占據(jù)著非常顯著的位置,其最大的特征就是類型化,同類型的小說在敘事結(jié)構(gòu)和風(fēng)格上高度近似,而各大主流類型本身,又都是在復(fù)雜的演 化、融合的過程中慢慢成型的。
“清穿文”就是一個非常典型的例子。作為穿越文中知名度最高的一個子類型,這批作品的故事背景和人物形象多取材于20世紀(jì)末21世紀(jì)初熱播的一批清宮劇,特別是《雍正王朝》。因受其影響,相當(dāng)一部分“清穿文”都將時間跨度設(shè)定在了康熙四十年左右至雍正繼位初期。如果我們將這批“清穿文”匯 總到一處,再把每本書都提到過的關(guān)鍵性歷史節(jié)點(diǎn)標(biāo)記出來,例如康熙四十七年廢太子、或者康熙駕崩雍正繼位等,據(jù)此拉出一條公共的時間軸。再以這條時間軸為參照系,把每一部“清穿文”的劇情一層一層地疊加在這個時間軸上,凡遇到發(fā)生沖突的情況,例如有些小說里女主選上了秀女,有些小說則沒選上,就畫出分叉的兩條線索,以此類推。那么不難想象,最終形成的劇情流 程總圖,就會像是一條從康熙四十年發(fā)源的長河,先是迅速分裂出無數(shù)條平行的支流,偶爾收束,再分流,然后不斷向著雍正初年的入海口奔涌而去。如果 這些繁復(fù)而又有序的變化能通過工具批量化地加以處理并可視化,必將對“清穿文”的結(jié)構(gòu)類型分布做出更為全面的總結(jié)與展示。
其次可以考慮開發(fā)的,是提取小說主要角色的萌要素的分析工具。所謂“萌 要素”17 ,是日本學(xué)者東浩紀(jì)在其專著《動物化的后現(xiàn)代》中提出的概念。特指ACG18 作品中某些與角色形象相關(guān)的,風(fēng)格化、類型化的元素,包括著裝(水 手服、女仆裝等)、發(fā)型(雙馬尾、黑色長直發(fā)等)或性格特征(傲嬌、天然呆 等)等。19 東浩紀(jì)認(rèn)為,1990年代中期以后的日本御宅族20 群體,由于身處后現(xiàn)代語境之中,早已不再執(zhí)著于作品背后的宏大敘事,轉(zhuǎn)而開始關(guān)注具體角色身上所攜帶的,能夠喚起讀者強(qiáng)烈愛意的“萌要素”。與這一趨勢相呼應(yīng),ACG作品 中的角色,也逐漸轉(zhuǎn)變?yōu)楦鞣N萌要素拼貼、集合與再循環(huán)的產(chǎn)物。這批萌要素匯總一處,就是所謂的“萌要素數(shù)據(jù)庫”,而御宅族群體對ACG作品及作品中人物的消費(fèi),本質(zhì)上其實是針對這個數(shù)據(jù)庫的消費(fèi)。21
這一消費(fèi)萌要素的趨勢,也早已在中國的網(wǎng)絡(luò)文學(xué)界蔓延開來。“清穿文” 中那些取材于清宮劇的人物形象,如康熙朝諸皇子,他們在進(jìn)入“清穿文”的世界,成為女主人公情感、欲望的投射對象的過程中,顯然也遭遇過一次微妙的 “人設(shè)化”22 處理:先從電視劇的文本里拆解出若干較有辨識度的人物性格特 征,例如四阿哥胤禛的堅毅隱忍殺伐果決、八阿哥胤禩的謙謙君子溫潤如玉等, 將其“萌要素化”,再利用這些“萌要素”,拼貼出一個外表上看似與原形象相差無幾的“人設(shè)”來:四阿哥因此化身為“霸道總裁”,八阿哥則是公認(rèn)的“暖男”。而這些“人設(shè)”在“清穿文”的創(chuàng)作過程中,也經(jīng)由粉絲社群的交流討論,逐漸成為整個類型內(nèi)部通用的“公共知識”和“基本共識”。這暗示著一個耐人尋味的事實,即網(wǎng)絡(luò)時代的作者和讀者,他們的欲望模式也同樣是數(shù)據(jù)庫化的。數(shù)字技術(shù)和數(shù)字媒介環(huán)境對網(wǎng)絡(luò)文學(xué)的影響與重構(gòu),又豈止停留在生產(chǎn)機(jī)制層面呢。
在理想的狀態(tài)下,如果可以利用分析工具解析海量文本中隱藏的萌要素,再加以匯總整理,必能得出有趣的結(jié)論,甚至最終形成一個由萌要素組成的字面意義上的“數(shù)據(jù)庫”。在數(shù)字人文分析工具“一葉·故事薈”23 中,就包含了一個 “人物側(cè)寫”的功能,即通過給出小說中主要人物的名稱,分析提取與之聯(lián)系最為密切的關(guān)鍵詞。但這個功能畢竟沒有針對萌要素的識別進(jìn)行過優(yōu)化,經(jīng)過筆者 的幾輪試用,結(jié)果也確實不能盡如人意。不過既然有珠玉在前,此類分析工具的開發(fā),就已經(jīng)具備了相當(dāng)?shù)幕A(chǔ)。
除此之外,網(wǎng)絡(luò)文學(xué)的粉絲社群也是非常值得注意的研究對象,或可利用社會網(wǎng)絡(luò)分析的相關(guān)研究方法和工具進(jìn)行介入。最典型的例子仍然是“清穿文” 的粉絲社群。由于整個“清穿文”的作者、讀者群體都是直接或間接的清宮劇粉絲,又往往容易將強(qiáng)烈的愛意投射到某個特定的人物身上,成為所謂的“角色粉”,例如四阿哥胤禛的粉絲團(tuán),就被稱為“四爺黨”,同理八阿哥胤禩的粉絲團(tuán)則被稱為“八爺黨”。姑且不論這些粉絲社群的組織形態(tài)本身就非常具有研究價值,它們對“清穿文”創(chuàng)作的反哺作用也是顯而易見的,比方說,這些“角色 粉”的社群內(nèi)部就常常圍繞著相應(yīng)的人物形象展開交流討論以及史料挖掘等。盡管“清穿文”的創(chuàng)作熱潮早已過去,而當(dāng)年這些粉絲團(tuán)的討論現(xiàn)場也已消失殆 盡,但與之類似的現(xiàn)象卻仍在不斷上演,例如起點(diǎn)中文網(wǎng)開啟本章說功能之后,某些作者就會從讀者評論里吸取有價值的想法融入自己的創(chuàng)作。這些讀者與讀 者、讀者與作者之間的交往關(guān)系,無疑是網(wǎng)絡(luò)文學(xué)的生產(chǎn)、接受環(huán)節(jié)之中不可或 缺的重要組成部分。
倘若不必將視野局限于網(wǎng)絡(luò)文學(xué)的文本,那便不難意識到,近十年來,網(wǎng)絡(luò)文學(xué)作品改編的影視劇已越來越常見。《步步驚心》電視劇的熱播,正是這股潮 流的開端。既然如此,利用包括多模態(tài)語篇分析24 (multimodal discourse analysis) 在內(nèi)的各種理論,開發(fā)用于分析對比網(wǎng)絡(luò)文學(xué)文本及其改編影視劇的工具,似乎 也是一個可行的方向。
三 建立網(wǎng)絡(luò)文學(xué)研究數(shù)據(jù)資料庫的必要性
在沒有數(shù)字人文技術(shù)介入的情況下,如果想要研究網(wǎng)絡(luò)文學(xué)之中的某個特定類型,例如“清穿文”,常見的做法是從中挑選出代表性的文本進(jìn)行細(xì)讀,再借此挖掘與闡釋整個類型的特征與發(fā)展脈絡(luò)。這一研究思路本身并無問題,卻終究只能從結(jié)果向前追溯,無法系統(tǒng)、完整地呈現(xiàn)一個類型在演變過程中所有枝節(jié), 若引入數(shù)字人文的相關(guān)工具,或可處理此類問題。但對于“清穿文”而言,到遴 選研究對象這一步,還是不免遇到一些困難:文學(xué)網(wǎng)站的庫存書目往往數(shù)以百萬 計,如何才能盡可能全面準(zhǔn)確地挖掘出符合條件的文本?目前為止,最具可行性 的解決方案,就是利用內(nèi)嵌在文學(xué)網(wǎng)站主頁上的搜索欄,依據(jù)關(guān)鍵詞和標(biāo)簽進(jìn)行 檢索。這就不免令人聯(lián)想起數(shù)字人文研究的核心成果與重要工具——學(xué)術(shù)文獻(xiàn)數(shù) 據(jù)庫的使用,事實上,單以保存/檢索數(shù)字文本這項功能而論,二者之間其實并 不存在任何本質(zhì)差異。正如前文所言,數(shù)字人文研究起源于文獻(xiàn)典籍的數(shù)字化與數(shù)據(jù)庫化,網(wǎng)絡(luò)文學(xué)顯然直接越過了“數(shù)字化”這個步驟,那么,文學(xué)網(wǎng)站是否 能夠直接承擔(dān)數(shù)據(jù)庫的功能呢?
仍以晉江文學(xué)城為例,該網(wǎng)站現(xiàn)有藏書331萬部,簽約版權(quán)作品也已超過25 萬部。25 為方便讀者查找書目,晉江在首頁上提供了兩種檢索方式,第一種是 關(guān)鍵詞檢索,即依據(jù)作品、作者或主人公的姓名搜尋具體的某部作品;第二種則 是通過限定時代(包括近代現(xiàn)代、古色古香等4種)、類型(包括愛情、武俠、 仙俠、科幻等16種)和風(fēng)格(包括悲劇、正劇和輕松等5種)等標(biāo)簽,篩選出符 合條件的作品列表。其中,“內(nèi)容標(biāo)簽”這個分類之下,就包含著一個叫作“清穿”的標(biāo)簽。26乍看上去,這套標(biāo)簽檢索系統(tǒng)與學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫中的某些功能倒也頗為相似,但作為以UGC為核心運(yùn)營理念的文學(xué)網(wǎng)站,晉江站內(nèi)的標(biāo)簽編輯模塊,一直由作者自行打理。該模塊內(nèi)嵌在發(fā)布/修改小說的后臺頁面上,可以根據(jù)個人的 理解與偏好自由選擇添加27 ,并沒有統(tǒng)一的操作規(guī)范,也就無從苛求它的準(zhǔn)確性。除此之外,UGC這個屬性,還意味著內(nèi)容的積累與增殖,以及新的創(chuàng)作潮流和類型的不斷涌現(xiàn)。然而網(wǎng)站標(biāo)簽庫的更新卻要滯后許多,至少“清 穿文”的命名和“清穿”標(biāo)簽的引入就絕不可能早于第一批“清穿文”的發(fā)表。事實上,連載于2004—2006年的“清穿文”,其常用標(biāo)簽就多為“穿越時空”和“靈魂轉(zhuǎn)換”,但在這兩個標(biāo)簽之中,卻又包含著大量并非“清穿 文”的作品。
僅憑搜索標(biāo)簽,顯然是不夠的。那么能否利用爬蟲軟件,通過限定故事年代背景,再結(jié)合相應(yīng)標(biāo)簽等信息進(jìn)行抓取呢?確實未嘗不可,但晉江歸根結(jié)底是一 個營利性的商業(yè)網(wǎng)站,一旦站內(nèi)作品出現(xiàn)版權(quán)變動或被某項新政策波及,那么相 關(guān)頁面便會立即鎖定,無法瀏覽。“清穿文”恰好是上述兩種狀況的重災(zāi)區(qū),前文提到過的“清穿三座大山”,即《步步驚心》《夢回大清》和《瑤華》,目前均處于鎖定或部分鎖定的狀態(tài)。雖然上述幾部小說的紙質(zhì)書和電子文檔早已廣為 流傳,但更多不那么知名的作品,或許便就此湮滅了。況且,原發(fā)布頁面的丟失也意味著一部小說連載至今的所有讀者評論、積分和點(diǎn)擊量等重要信息的損毀,這種缺憾是無可挽回的。
總而言之,盡管以晉江為代表的絕大多數(shù)文學(xué)網(wǎng)站在架構(gòu)和功能等方面與學(xué) 術(shù)文獻(xiàn)數(shù)據(jù)庫存在一定程度上的相似性,但作為一個UGC屬性的商業(yè)網(wǎng)站,它終究只需要對投資者和用戶(作者、讀者)負(fù)責(zé),既無義務(wù)也無意向為學(xué)術(shù)研究提供服務(wù)。并且,由于站內(nèi)發(fā)布文本的總量極其巨大,也就談不上對小說的錯字病句進(jìn)行勘誤或者核實作品標(biāo)簽的準(zhǔn)確性,距離正規(guī)學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫的標(biāo)準(zhǔn),還差得很遠(yuǎn)。
盡管如此,從數(shù)字人文的研究視野出發(fā),利用檢索、爬蟲軟件抓取等手法 遴選““清穿文””研究對象的基本思路,仍然是合理有效的。只不過一旦進(jìn)入 實操環(huán)節(jié),就不免暴露出當(dāng)前中國網(wǎng)絡(luò)文學(xué)研究面臨的一層隱憂,即學(xué)術(shù)導(dǎo)向的數(shù)據(jù)資料庫的缺位。相比一些傳統(tǒng)人文學(xué)科(如歷史學(xué)、古代文學(xué)等)在文獻(xiàn)典 籍?dāng)?shù)字化和數(shù)據(jù)庫化過程中投入的大量人力物力,網(wǎng)絡(luò)文學(xué)研究作為一門新興學(xué) 科,亟需加快腳步。目前可以著手的工作有兩個:一、與文學(xué)網(wǎng)站合作,開辟學(xué) 術(shù)搜索端口;二、著手搭建專用的學(xué)術(shù)資料數(shù)據(jù)庫,廣泛收集、整理和挽救網(wǎng)絡(luò) 文學(xué)研究所需的各種數(shù)據(jù)信息和材料。
隨著信息時代的來臨,許多傳統(tǒng)人文學(xué)科早已通過文獻(xiàn)典籍?dāng)?shù)據(jù)庫的建設(shè)以及相關(guān)分析工具的開發(fā),翻開了數(shù)字人文的新篇章。而原本就生長在互聯(lián)網(wǎng)算法規(guī)則與技術(shù)邏輯之中的文學(xué)網(wǎng)站及其內(nèi)部的創(chuàng)作實踐,卻在誕生的一刻,就注定了要與數(shù)字人文的思維緊密糾纏。基于天然的媒介優(yōu)勢,如何一邊繼承過往研究成果,一邊借助數(shù)字人文的視野來推進(jìn)學(xué)科建設(shè)與理論自覺,必將成為未來的網(wǎng)絡(luò)文學(xué)研究者們面臨的最大挑戰(zhàn)。
注釋:
1 晉江文學(xué)城創(chuàng)立于2003年8月,是網(wǎng)絡(luò)文學(xué)界規(guī)模最大,影響力也最為深遠(yuǎn)的,主要面向女性用戶的文學(xué)網(wǎng)站。其前身為1999年由福建晉江電信局建立的文學(xué)站點(diǎn)“晉江 文學(xué)城”。最初主要靠掃描、校對港臺言情小說維持更新,2003年之后轉(zhuǎn)型為原創(chuàng)文 學(xué)網(wǎng)站。近年來諸多大熱電視劇的原著,最初都連載于晉江文學(xué)城,如《步步驚心》 《甄嬛傳》《微微一笑很傾城》以及《陳情令》等。
2 “穿越”指的是主角由于某種原因(通常是意外事件)來到了過去、未來或平行時 空。該詞由英文travel through或traverse翻譯而來,語源為“穿越蟲洞”(travel through a wormhole),是物理學(xué)界普遍認(rèn)可的一種實現(xiàn)時空穿越的理論可能。參見邵燕君主 編《破壁書:網(wǎng)絡(luò)文化關(guān)鍵詞》,第263~267頁,“穿越”詞條,該詞條編撰者為李 強(qiáng)、肖映萱。
3 晉江原創(chuàng)網(wǎng),是晉江文學(xué)城于2003年至2010年使用的站名,突出“原創(chuàng)”二字的目 的,是為了與此前掃描、校對港臺言情小說的主營業(yè)務(wù)切割,轉(zhuǎn)型為刊載原創(chuàng)作品的 文學(xué)網(wǎng)站,招攬培養(yǎng)本網(wǎng)站的簽約作者。2010年2月之后,又再度更名為晉江文學(xué)城, 并沿用至今。
4 算法是計算機(jī)領(lǐng)域的術(shù)語,指用系統(tǒng)方法描述解決的題的策略機(jī)制,由一系列解決的 問題的清晰指令構(gòu)成。一個完整的算法對應(yīng)一個要解決的問題,其內(nèi)部包含數(shù)據(jù)傳輸 (如輸入、輸出、賦值)、算法計算(如加減乘除)、邏輯計算(如或、非、且)和 關(guān)系計算(如大于、小于)中的一個或多個環(huán)節(jié)。
5 該積分計算公式,由晉江文學(xué)城站長iceheart于2005年3月2日發(fā)布于晉江文學(xué)城論壇網(wǎng) 友交流區(qū)碧水江汀版塊,原帖標(biāo)題為《原創(chuàng)網(wǎng)新版積分公式及評論規(guī)則,請讀者作者都進(jìn)來看一下》。在清穿文最為流行的時期,晉江文學(xué)城的作品積分計算就是以這個公式為準(zhǔn)的。該積分公式已于2016年作廢。
6 早期的晉江文學(xué)城,只有網(wǎng)站編輯才有權(quán)限為長篇評論添加“精華”獎勵,后來由于評論量激增而改為由作者手動添加,此后這項積分系數(shù)也就名存實亡了。
7 總分排行榜是對晉江全站小說的作品積分進(jìn)行排名的榜單,沒有下榜期限。半年榜是 對發(fā)文時間在第131天到310天內(nèi)的作品按積分排行的榜單。月榜是對發(fā)文時間在第 11~40天內(nèi)的作品按積分排行的榜單。新晉作者榜是對30天內(nèi)申請成為作者的賬號發(fā)表的作品的總積分進(jìn)行排行的榜單。
8 這種讓渡也不同于暢銷書生產(chǎn)機(jī)制,雖然都是將選擇權(quán)交給讀者,但出版業(yè)畢竟只能通過消費(fèi)這一個渠道,而文學(xué)網(wǎng)站的積分排序等機(jī)制,卻能多維度、精細(xì)化地對用戶行為進(jìn)行引導(dǎo)和把控。二者是不可同日而語的。
9 自2013年起,以騰訊、阿里為首的互聯(lián)網(wǎng)資本全面進(jìn)軍文娛行業(yè),大量收購網(wǎng)絡(luò)小說進(jìn)行影視改編。晉江依靠售賣版權(quán)帶來的收入也因此一路飆升,占據(jù)了網(wǎng)站收益的絕 大部分比重。為了鼓勵旗下作者與網(wǎng)站簽訂長期合約,并盡可能地將版權(quán)運(yùn)營授權(quán)給 網(wǎng)站代理,新修訂的積分計算公式才增加了簽約年限和版權(quán)授權(quán)狀況這兩個系數(shù)。
10 在晉江文學(xué)城論壇里,就不時能見到作者討論如何利用積分規(guī)則獲得更好排名的帖子。
11 讀者付費(fèi)購買網(wǎng)站提供的虛擬道具贈送給作者,以表示支持的一種功能。
12 收藏是文學(xué)網(wǎng)站提供的一項功能,它允許讀者通過點(diǎn)擊具體作品頁面上的收藏按鈕,將這部作品添加進(jìn)自己的收藏夾,以便查找管理。收藏榜一般按照作品當(dāng)前現(xiàn)存的收藏人數(shù)由高到低排列。
13 “女性向”這個概念來源于日語詞匯“女性向け”(じょせいむけ jyosei muke),
字面含義為“面向女性、針對女性的”。它有廣義和狹義兩種含義,廣義上,包含 一切面向女性創(chuàng)作的文化消費(fèi)品;狹義上,特指面向女性創(chuàng)作,同時“規(guī)避男性目 光”“逃離外界凝視”的一種文化生產(chǎn)與社群生態(tài)。參見邵燕君主編《破壁書:網(wǎng)絡(luò) 文化關(guān)鍵詞》,生活·讀書·新知三聯(lián)書店 2018年版,第166~172頁,“女性向”詞 條,該詞條編撰者為肖映萱。
14 例如發(fā)表于2020年4月1日的一篇名為《我的老攻××歲》的小說,由于存在拉票、刷 分等違規(guī)行為,作者“是個削”又卷入了復(fù)雜的粉圈斗爭,因而遭到抵制。具體的抵 制策略當(dāng)然就是“刷負(fù)分”。截至2020年4月18日凌晨,該作品的總積分已降至負(fù)七億 零五百余萬,且仍在持續(xù)下降中。
15 事實上,論文舉例積分計算規(guī)則,不過是管中窺豹,目前在各大文學(xué)網(wǎng)站的閱讀App 上,利用大數(shù)據(jù)算法分析用戶喜好,進(jìn)行定向推送的操作已越來越多見。在可預(yù)見的 未來,數(shù)字技術(shù)對網(wǎng)絡(luò)文學(xué)生產(chǎn)的干預(yù)必將越發(fā)顯著。
16 Docusky由臺灣大學(xué)數(shù)位人文研究中心、資訊工程學(xué)系數(shù)位典藏與自動推論實驗室規(guī)劃,是 一個滿足人文學(xué)者研究需要,提供面向個人的材料整理與分析服務(wù)的網(wǎng)絡(luò)平臺。
17 萌要素:萌,在日語中寫作萌え(moe),是燃え(燃燒)這個詞的同音詞。日本的御宅族常會用“燃”來形容喜愛一個角色到了胸口仿佛在燃燒的程度,后來漸漸被更 為生動有趣的同音詞“萌”所代替。而所謂“萌要素”,就是指能為人物增加可愛感 的特定元素。參見邵燕君主編《破壁書:網(wǎng)絡(luò)文化關(guān)鍵詞》,第23~33頁,“萌”詞 條,該詞條編撰者為林品。
18 ACG,是指Anime、Comic、Game,也即動畫、漫畫和游戲的首字母縮寫,在此處特指 與日本的二次元文化相關(guān)的一系列文化消費(fèi)品。參見邵燕君主編《破壁書:網(wǎng)絡(luò)文化 關(guān)鍵詞》,第7~11頁,“ACGN”詞條,該詞條編撰者為高寒凝。
19 “傲嬌”,即性格別扭,口是心非,明明喜歡卻裝作不在意甚至很討厭的樣子;“天 然呆”,指性格迷迷糊糊、傻傻的樣子。
20 御宅族(御宅,おたく,otaku),這個詞起源于日本,指的是日系漫畫、動畫、電子 游戲和輕小說(light novel)的愛好者。參見邵燕君主編《破壁書:網(wǎng)絡(luò)文化關(guān)鍵詞》 第2~6頁,“宅”詞條,該詞條編撰者為林品。
21 [日]東浩紀(jì):動物化するポストモダン:オタクから見た日本社會,講談社, 2001,第62、78頁。
22 “人設(shè)”指的是由“萌要素”拼貼而成的“人物設(shè)定”,也稱“角色設(shè)定”,通常 簡稱為“人設(shè)”。參見高寒凝《親密關(guān)系的實驗場:“女性向”網(wǎng)絡(luò)空間與文化生 產(chǎn)》,《文藝?yán)碚撆c批評》2020年第3期。
23 由谷臻故事工坊開發(fā),是一個基于人工智能技術(shù)開發(fā)的大數(shù)據(jù)文本分析系統(tǒng)。主要功 能包括關(guān)鍵詞提取、題材分析和情緒曲線分析等。
24 多模態(tài)語篇分析理論,是國際系統(tǒng)功能語言學(xué)者Kress van Leeuwen于1990年代中期提出 的一個較為系統(tǒng)化的、完善的分析視覺圖像中多種模態(tài)的語法框架。
25 參見晉江文學(xué)城“關(guān)于我們”頁面內(nèi)的簡介。
26 “內(nèi)容標(biāo)簽”的選項多達(dá)160余個,“清穿”只是其中之一。
27 添加標(biāo)簽的選項會出現(xiàn)在作者操作后臺的“發(fā)布新文”這個頁面上,分為兩類。第一類是必選標(biāo)簽,例如時代、類型和風(fēng)格等,小說發(fā)布之后,會依據(jù)作者選擇的標(biāo)簽, 將文章按照這些標(biāo)簽進(jìn)行歸類。而“清穿”標(biāo)簽所屬的“內(nèi)容標(biāo)簽”一欄,則并不是 必選項目,只要求作者從中選擇0~4個用于描述小說的內(nèi)容。