為人文社科研究插上數(shù)字羽翼
數(shù)字技術(shù)使人類生活方式發(fā)生了翻天覆地的變化,而數(shù)字化應(yīng)用也給人文社科研究帶來了巨大的驅(qū)動力。記錄與保存、創(chuàng)新與傳承、傳播與發(fā)展,人文社科研究利用數(shù)字化技術(shù)將實(shí)物載體或理論成果,以多元化的形式儲存于數(shù)字空間,在一定程度上打破了研究的時空局限。徜徉數(shù)字的汪洋大海,如何放寬學(xué)術(shù)視野,拓展研究路徑,成為很多人文社科學(xué)者關(guān)注的焦點(diǎn)。
數(shù)字邂逅古人浪漫詩詞
一直以來,資料離散和時空分離是古代文學(xué)研究的兩大難題,中南民族大學(xué)數(shù)字人文資源研究中心主任王兆鵬表示,數(shù)字技術(shù)將改變古代文學(xué)資料查詢檢索方式,實(shí)現(xiàn)從電子文獻(xiàn)的分詞定位檢索到結(jié)構(gòu)化數(shù)據(jù)庫的分類提取,從點(diǎn)狀檢索到網(wǎng)狀關(guān)聯(lián),從逐條拷貝到分類打包。數(shù)字技術(shù)還可以自動對比識別作品間的互文關(guān)系,重建古代文學(xué)的歷史現(xiàn)場,提供古代文學(xué)閱讀欣賞的嶄新體驗(yàn)。
“唐宋文學(xué)編年地圖”就是一張可以看懂唐宋詩人一生的特殊地圖。登錄該地圖平臺,我們可以跟隨蘇軾的“步伐”,看到他意氣風(fēng)發(fā)時的作品,也可以感受到其被貶后,在黃州留下《赤壁賦》的心情。點(diǎn)擊切換洛陽,便可發(fā)現(xiàn)有57位詩人曾在此留下了603首詩歌,其中不乏《次北固山下》《芙蓉樓送辛漸》等名篇。借助地圖,我們可以更深入地感受到韓愈“一封朝奏九重天,夕貶潮陽路八千”的痛苦,還能了解韓愈南貶途中經(jīng)行之地的地形地貌。
正是數(shù)字化技術(shù)讓歷史上一群人、一代人的活動軌跡同時呈現(xiàn),一個時期的文學(xué)生態(tài)、文壇活動圖景由此得以還原性建構(gòu)。王兆鵬告訴記者,過去我們可能只知道一個或幾個作家曾經(jīng)在某地的經(jīng)歷和作品,有了“唐宋文學(xué)編年地圖”,我們就可以了解某個時間點(diǎn)或者時間段內(nèi)所有作家的活動軌跡。“與全文檢索數(shù)據(jù)庫僅能提供字詞檢索最大的不同是,文學(xué)編年地圖可以提供更多考量維度,提供更多知識點(diǎn)。”王兆鵬說。
錢鍾書先生早在1984年就在中國社會科學(xué)院倡導(dǎo)把計(jì)算機(jī)技術(shù)引入中國古典文獻(xiàn)的搜集、疏證和整理中。記者了解到,近20多年來,我國在古籍文獻(xiàn)數(shù)字化和古籍?dāng)?shù)據(jù)庫建設(shè)方面成就巨大,在一定意義上推動了學(xué)術(shù)的發(fā)展。但這些數(shù)據(jù)庫的主體內(nèi)容除全文檢索外,并沒有完成更深入的工作。因此,對古籍文獻(xiàn)數(shù)據(jù)庫進(jìn)行升級換代勢在必行。
新一代信息技術(shù)和人工智能技術(shù)等,能夠高效抓取研究所需要的數(shù)據(jù)資料,通過智能化的信息挖掘,幫助學(xué)者從數(shù)據(jù)中發(fā)現(xiàn)現(xiàn)象或事物的本質(zhì)和彼此間的邏輯關(guān)聯(lián)。中國社會科學(xué)院數(shù)量經(jīng)濟(jì)與技術(shù)經(jīng)濟(jì)研究所研究員李金華表示,數(shù)字化背景下,需要用全新的思維、全新的方法處理資料和選擇數(shù)據(jù),以此獲得有價值的信息。學(xué)者科學(xué)解讀復(fù)雜信息所蘊(yùn)含的真義,準(zhǔn)確把握經(jīng)濟(jì)、社會、文化發(fā)展的規(guī)律、特征和趨勢走向,從而提升人文社會科學(xué)的研究水平和研究質(zhì)量。
智慧數(shù)據(jù)之光照進(jìn)文遺
千年莫高,藝術(shù)瑰寶。當(dāng)敦煌文化搭乘數(shù)字化列車跨入新時代的發(fā)展軌道時,“數(shù)字敦煌”實(shí)現(xiàn)了跨越時空的穿梭。
記者登錄“數(shù)字敦煌”資源庫,30個經(jīng)典洞窟,4430平方米絕美壁畫,穿越10個朝代呈現(xiàn)眼前。人們不僅可以通過VR全方位細(xì)細(xì)欣賞這些石窟,甚至能比直接走進(jìn)洞窟獲得更為震撼的沉浸式藝術(shù)體驗(yàn),同時還大大減少了人體、空氣流動以及濕度變化對壁畫的傷害。
敦煌文化遺產(chǎn)數(shù)字化工程積累的海量學(xué)術(shù)文獻(xiàn)資料與高保真數(shù)字資源,為敦煌文化遺產(chǎn)的保護(hù)、研究和傳播提供了良好的基礎(chǔ)保障。近年來,武漢大學(xué)與敦煌研究院通力合作,圍繞敦煌智慧數(shù)據(jù)資源建設(shè)與服務(wù)應(yīng)用開展了一系列探索性工作。武漢大學(xué)大數(shù)據(jù)研究院常務(wù)副院長王曉光告訴記者,智慧數(shù)據(jù)和智能計(jì)算理念的興起,為敦煌文化遺產(chǎn)的創(chuàng)造性轉(zhuǎn)化和創(chuàng)新性發(fā)展提供了可能。敦煌智慧數(shù)據(jù)資源建設(shè)的主要內(nèi)容,包括敦煌文化遺產(chǎn)主題詞表構(gòu)建與關(guān)聯(lián)數(shù)據(jù)發(fā)布、敦煌文化遺產(chǎn)本體模型設(shè)計(jì)與應(yīng)用、敦煌壁畫圖像與遺書文本的深度語義標(biāo)注、敦煌數(shù)字資產(chǎn)管理與數(shù)字?jǐn)⑹孪到y(tǒng)開發(fā)、敦煌文化遺產(chǎn)知識圖譜構(gòu)建與應(yīng)用服務(wù)、敦煌遺書數(shù)字化復(fù)原與數(shù)字記憶再造等。
“敦煌智慧數(shù)據(jù)資源建設(shè)與服務(wù)工作,繼承了‘?dāng)?shù)字敦煌’項(xiàng)目的建設(shè)目標(biāo),不僅能夠進(jìn)一步支撐敦煌相關(guān)的歷史、文學(xué)、藝術(shù)等學(xué)術(shù)研究的數(shù)字化轉(zhuǎn)型,也有利于促進(jìn)敦煌文化遺產(chǎn)的保護(hù)、傳承和傳播工作,提升大眾對敦煌文化遺產(chǎn)相關(guān)知識的理解和認(rèn)知水平,也為在國際上講好中國故事和利用先進(jìn)技術(shù)實(shí)現(xiàn)文化遺產(chǎn)保護(hù)的中國方案提供了支撐。”王曉光說。
數(shù)字圖書館和數(shù)字出版的發(fā)展,使得數(shù)字形態(tài)的學(xué)術(shù)文獻(xiàn)資源成為學(xué)術(shù)研究的主流。如今,學(xué)者足不出戶就可以獲得全球各大圖書館的稀有文獻(xiàn)資料。數(shù)字化應(yīng)用給人文社科研究既帶來了文獻(xiàn)資料獲取的豐富性和便利性,也帶來了方法和范式的變革。
“隨著海量數(shù)字資源的產(chǎn)生和積累,人類文化遺產(chǎn)的范疇也在擴(kuò)展,并引發(fā)了新的人文學(xué)術(shù)問題,如數(shù)字遺產(chǎn)、數(shù)字記憶等。”王曉光談道,在大規(guī)模數(shù)字文獻(xiàn)資料和專題數(shù)據(jù)庫支撐下,文本挖掘、社會網(wǎng)絡(luò)分析、情感計(jì)算、數(shù)字化模擬復(fù)原分析等各種新興研究方法和研究手段的應(yīng)用,改變了以往以人文學(xué)者個體分析和闡釋分析為主的范式。通過文獻(xiàn)資料的數(shù)據(jù)化和語義化建模,增強(qiáng)了文獻(xiàn)資料的功能可供性,同時也借助各種分析性軟件工具和數(shù)字平臺,提升了人文學(xué)者獲取、分析、比對的效率。
引領(lǐng)人文時空數(shù)字化轉(zhuǎn)換
人類現(xiàn)有的知識將陸續(xù)轉(zhuǎn)化為數(shù)字形式,再加上數(shù)字世界原生的知識(如互聯(lián)網(wǎng)本身),人們已從知識匱乏變成知識過盛。《數(shù)字人文》編委桑海表示,數(shù)字時代人文領(lǐng)域的知識轉(zhuǎn)型,一種是呈現(xiàn)式,即把現(xiàn)有知識通過數(shù)字化方式呈現(xiàn),即知識表示;另一種是研究式,即借助數(shù)字化方式發(fā)現(xiàn)新知,即知識發(fā)現(xiàn)。知識表示的數(shù)字化,呼喚與之相應(yīng)的知識發(fā)現(xiàn)方式。知識發(fā)現(xiàn)方式的變化,反過來又引發(fā)了知識表示的進(jìn)一步變革。到最后,實(shí)質(zhì)都是把閱讀文獻(xiàn)的主體從人變成機(jī)器,進(jìn)而可以用數(shù)字技術(shù)進(jìn)行文本分析。他列舉了兩篇數(shù)字人文研究的文章。一篇是對科幻小說敘事形式的研究,以算法區(qū)分“展示”和“告知”兩種敘事形式,發(fā)現(xiàn)主流文學(xué)的敘事節(jié)奏普遍快于科幻小說,為敘事分析提供了新的視角。另外一篇在計(jì)量文學(xué)史視角下分析經(jīng)濟(jì)學(xué)、種族和美國戰(zhàn)后小說。文章通過對近五千部美國當(dāng)代小說進(jìn)行建模分析發(fā)現(xiàn),20世紀(jì)70年代中期白人男性寫的小說中經(jīng)濟(jì)學(xué)語言增長明顯,該研究的樣本體量令傳統(tǒng)研究難以望其項(xiàng)背。
上海社會科學(xué)院社會學(xué)研究所研究員陶希東進(jìn)一步表示,數(shù)字時代,人文社科研究無論在理論研究還是方法論上都面臨數(shù)字化轉(zhuǎn)型,在理念和思維上也出現(xiàn)了新的變化,如數(shù)據(jù)庫建設(shè)和應(yīng)用風(fēng)行、定性與定量研究并重、從知識關(guān)聯(lián)中探尋新的研究結(jié)論等。同時,網(wǎng)絡(luò)問卷、大數(shù)據(jù)分析等現(xiàn)代研究方式,使得學(xué)者獲取資料的效率極大提高,樣本代表性進(jìn)一步增強(qiáng)。
辯證對待人文領(lǐng)域數(shù)字化應(yīng)用
盡管目前人文社科數(shù)字化還缺乏成熟成果,但已展現(xiàn)出令人鼓舞的潛力。桑海介紹了關(guān)于中國古典詩歌聲律統(tǒng)計(jì)分析與研究的一些新進(jìn)展,提出通過對古典詩歌語料庫中的聲律現(xiàn)象進(jìn)行統(tǒng)計(jì)分析,找出聲律現(xiàn)象的規(guī)律。若此研究能在大數(shù)據(jù)基礎(chǔ)上進(jìn)行全面統(tǒng)計(jì)分析,相信會使執(zhí)著于局部規(guī)律的舊說失去其有效性,并對整個學(xué)科發(fā)展產(chǎn)生更大影響。
面對大數(shù)據(jù)和數(shù)字處理技術(shù)給人文社會科學(xué)研究提供的豐富素材和研究新模式、新思路,李金華提出,要辯證對待數(shù)字技術(shù)在人文社會科學(xué)研究中的應(yīng)用,避免科學(xué)研究對軟件、分析技術(shù)的依賴,避免研究成果陷入信息的孤島。他說,人文社會科學(xué)研究的是人的思想、情感、觀念、精神、價值,研究的是人以及人與人之間的關(guān)系,人文社會科學(xué)成果是有思想、有溫度、有價值取向的。應(yīng)保持人文社會科學(xué)研究的獨(dú)立性、嚴(yán)肅性和人性光輝,推動人文社會科學(xué)研究科學(xué)性和批判性的協(xié)調(diào)發(fā)展。
在陶希東看來,數(shù)字化浪潮下人文社科發(fā)展主要有兩條路徑,一是順應(yīng)數(shù)字化社會的趨勢和規(guī)律,圍繞國家數(shù)字經(jīng)濟(jì)、數(shù)字治理、數(shù)字社會發(fā)展中碰到的重大問題,不斷拓展研究領(lǐng)域;二是轉(zhuǎn)變和更新傳統(tǒng)的研究方法,在融合利用現(xiàn)代科技手段上下功夫,增強(qiáng)研究成果的理論性、科學(xué)性、指導(dǎo)性。此外,還要重視人文社科領(lǐng)域數(shù)字化人才的培養(yǎng),主動組織開展普適性學(xué)習(xí),更要實(shí)施專業(yè)化培訓(xùn),提高在研究中對數(shù)字化技術(shù)的利用能力。
“數(shù)據(jù)、技術(shù)終究是工具,核心是人,數(shù)字化技術(shù)不論如何發(fā)展,人文社科領(lǐng)域研究始終要堅(jiān)守‘思想創(chuàng)新、觀點(diǎn)創(chuàng)新’的初心,要以產(chǎn)生‘偉大思想’為榮、‘出大師’為要。”陶希東說。
談及對人文社科數(shù)字化應(yīng)用發(fā)展的期待,王曉光表示,面對數(shù)字文明的興起,人文社科的數(shù)字化轉(zhuǎn)型應(yīng)該加快行動步伐,積極開展數(shù)據(jù)驅(qū)動與理論驅(qū)動的研究范式的探索性融合。學(xué)術(shù)研究只有走在數(shù)字化文明發(fā)展的前沿,才能指引社會發(fā)展的方向,規(guī)避文明建設(shè)的陷阱。期待高等教育與科研界加快數(shù)字化應(yīng)用步伐,在反思與審慎批判中,創(chuàng)新學(xué)術(shù)研究與文化傳承手段,并借助“新文科”建設(shè)良機(jī),推動“三大體系”建設(shè)。
數(shù)字技術(shù)的應(yīng)用與賦能有望觸發(fā)人文社科研究在知識基礎(chǔ)、方法論和評價體系等多方面的反思與進(jìn)步,借助數(shù)字的羽翼,一個學(xué)科大碰撞、知識大融通的時代正在到來。