如何定義和推進大數(shù)據(jù)出版
貴州出版集團是2016年開始認識和思考“大數(shù)據(jù)出版”的,當時我們遇到的第一個問題就是,“出版業(yè)有大數(shù)據(jù)嗎”? 有的觀點認為,現(xiàn)在的大數(shù)據(jù),都是以PB、ZB為單位來計算的,都是規(guī)模超大的海量數(shù)據(jù),而我們出版業(yè),即便所有出版物加起來,數(shù)據(jù)量最多也就TB級別,和ZB差了好幾個數(shù)量級,規(guī)模不“大”,所以也不能稱為“大數(shù)據(jù)”。順著這個問題往下,第二個問題是,貴州有大數(shù)據(jù)嗎? 貴州是全國第一個大數(shù)據(jù)綜合實驗區(qū),每年在貴州召開的大數(shù)據(jù)峰會,吸引全國乃至國際眾多一流企業(yè)參與,已經(jīng)成為國內(nèi)在大數(shù)據(jù)方面宣傳、展示、交流的一個重要舞臺。貴州做大數(shù)據(jù),并不是因為貴州已經(jīng)擁有了規(guī)模超大的海量數(shù)據(jù),而是貴州聚焦一個主題:數(shù)據(jù)安全存儲。在這個主題上,貴州有多個維度的優(yōu)勢:不沿邊、不沿海、無地震帶,水電資源豐富且價格便宜,能夠為支撐數(shù)據(jù)存儲的服務(wù)器機房提供充分的資源及安全保障;氣候宜人,年平均溫度14度,僅機房建設(shè)一項每年就可以節(jié)約電費1億元以上。貴州的PUE值是1.45(PUE是總能耗與有效能耗的比值,越接近1說明能耗利用率越高),和其他城市相比,北京是2,杭州是2.2,相當于有效能耗在50%以下。由此說明,貴州在數(shù)據(jù)的存儲成本、安全備份和防災(zāi)保護方面,較其他地區(qū)更好,適合于做數(shù)據(jù)中心。
從這個案例大家可以發(fā)現(xiàn),“大數(shù)據(jù)”的“大”,其實不在于“數(shù)據(jù)大、規(guī)模大”,而在于對聚焦的主題,能夠做到“多維度、全覆蓋”。通過進一步研究我們發(fā)現(xiàn),大數(shù)據(jù)的特點就是,“主題明確、動態(tài)變化、分析預(yù)測、降維服務(wù)、匹配推送”。如果沒有一個明確的主題,采集一堆大而無用的數(shù)據(jù),沒有任何實際意義,而數(shù)據(jù)會因為各種情況,根據(jù)對我們聚焦主題的影響程度,產(chǎn)生冷溫熱三種數(shù)據(jù),而且不斷變化,而采集數(shù)據(jù)、建立模型、算例推演,最后的目的就是三個,為我們聚焦的主題做分析預(yù)測,為我們研究的對象做降維服務(wù),為我們產(chǎn)品的開發(fā)做匹配推送。這就是大數(shù)據(jù)理念的核心,要做大數(shù)據(jù)出版,首先要準確理解這個核心。
那么什么是大數(shù)據(jù)出版呢?我們認為,大數(shù)據(jù)出版,就是借助大數(shù)據(jù)的技術(shù)和研究方法,把有用的知識以適合的形態(tài)推送給需要的用戶,實現(xiàn)產(chǎn)品供給側(cè)對用戶需求側(cè)的“精致服務(wù)”和“精準推送”。大數(shù)據(jù)出版符合當前出版業(yè)的發(fā)展趨勢。出版業(yè)從以紙質(zhì)圖書傳承文明、傳播文化的傳統(tǒng)出版開始,發(fā)展到“云上存儲、網(wǎng)上出版、屏上閱讀”的數(shù)字出版,這一步的實質(zhì),是極大地豐富了知識服務(wù)的產(chǎn)品形態(tài)和輸出終端,再往下,發(fā)展大數(shù)據(jù)出版和以機器人、智能化音箱等為載體的人工智能出版,實質(zhì)是提高產(chǎn)品供給側(cè)的服務(wù)質(zhì)量,更好地滿足用戶精細化、交互式的閱讀需求。而且,傳統(tǒng)出版、數(shù)字出版、大數(shù)據(jù)出版、人工智能出版,不僅有各自鮮明的特點,而且能夠有效融合,一體推進。后三者實際就是我們說的“新興出版”,出版業(yè)當前的發(fā)展趨勢,就是在傳統(tǒng)出版與新興出版的融合發(fā)展方面,努力探索更多用戶認可、滿足需要且愿意消費的高質(zhì)量知識服務(wù)產(chǎn)品,從而更好履行“建設(shè)優(yōu)秀文化陣地”的工作職能。這也是當前時代賦予我們出版人的使命。
理清了大數(shù)據(jù)和大數(shù)據(jù)出版的概念,明確了大數(shù)據(jù)出版在當前出版業(yè)發(fā)展趨勢中的位置,我們也就進一步清晰了自己布局大數(shù)據(jù)出版的思路:以理論和實踐相結(jié)合,一方面對貴州大數(shù)據(jù)發(fā)展及行業(yè)大數(shù)據(jù)探索進行有效梳理和研究,從數(shù)據(jù)標準化層面制定基礎(chǔ)、管理、技術(shù)、運營四項出版業(yè)大數(shù)據(jù)實務(wù)標準,為國家新聞出版署今后規(guī)范和完善行業(yè)大數(shù)據(jù)建設(shè)提供試點經(jīng)驗和政策建議;另一方面,按照大數(shù)據(jù)技術(shù)特點,從傳統(tǒng)出版與新興出版融合發(fā)展的角度,積極探索優(yōu)質(zhì)內(nèi)容資源的“多產(chǎn)品形態(tài)、多終端輸出”,爭取在用戶層面得到認可、滿足需求并形成畫像分析,在行業(yè)內(nèi)樹立具有貴州特色的“大數(shù)據(jù)出版”品牌,創(chuàng)造一定的社會經(jīng)濟效益。
在理論研究方面,我們抓住貴州作為全國首個大數(shù)據(jù)綜合實驗區(qū)的政策優(yōu)勢和(原)國家新聞出版廣電總局與貴州省政府簽訂省部大數(shù)據(jù)戰(zhàn)略合作的發(fā)展契機,組織編寫《關(guān)于落實省部大數(shù)據(jù)(出版廣電)戰(zhàn)略合作協(xié)議出版應(yīng)用任務(wù)研究報告》,從標準建設(shè)的角度制定《出版業(yè)大數(shù)據(jù)行業(yè)實務(wù)標準》,并根據(jù)黨委政府部門領(lǐng)導(dǎo)及專家的意見,不斷修訂完善,最終編為學(xué)術(shù)專著《出版有“數(shù)”》,由中宣部出版局(原)副局長、巡視員,中國畫報協(xié)會會長劉建生作序,貴州人民出版社編輯出版。成果出來后,得到行業(yè)同仁一致好評,比較好地完成了行業(yè)在當前形勢下對大數(shù)據(jù)出版的理論研究任務(wù)。
在實踐探索方面,一方面,從選題策劃開始,推進傳統(tǒng)出版與新興出版的融合探索,選題產(chǎn)品一定要有明確的用戶畫像,要針對用戶“看書”“上網(wǎng)”“讀屏”的閱讀體驗和習(xí)慣,在“圖、文、聲、像、影”的“多產(chǎn)品形態(tài)”,“書、網(wǎng)、屏、聽”的“多終端輸出”方面大膽嘗試,開發(fā)選題《張大光講故事》,紙書銷售2.6萬余冊,音視頻產(chǎn)品播放50余萬次,圍繞用戶采集的有效數(shù)據(jù)500G以上,實現(xiàn)了很好的社會經(jīng)濟效益。我們開發(fā)的選題《華為三十年(修訂版)》《西游志》《姐姐》等在發(fā)行方面做了數(shù)據(jù)分析,有效降低了發(fā)行成本,提高了發(fā)行效率。另一方面,我們和高校合作,按照大數(shù)據(jù)“降維服務(wù)”的特點,集中行業(yè)50多位政產(chǎn)學(xué)研一線專家的意見,把學(xué)生在學(xué)校“學(xué)不到”,但工作“用得上”的就業(yè)實務(wù)知識編成職場成長、出版實務(wù)兩套系統(tǒng)、體系的課程,爭取在出版人才的多維度數(shù)據(jù)服務(wù)和校企深度合作方面,形成集團的一些特色。我們與北京印刷學(xué)院合作做了一個校企共建的實驗室,效果很好,就是讓學(xué)生去感受真實的職場環(huán)境和職場任務(wù),并由此產(chǎn)生一些問答、直播、畫像分析、就業(yè)推薦等新型出版服務(wù),學(xué)校和學(xué)生都認為,這樣的課程是對學(xué)校學(xué)習(xí)的有益補充,在加快推進學(xué)生向行業(yè)所需人才的轉(zhuǎn)型上,具有積極意義。
在布局大數(shù)據(jù)出版的實踐過程中,我們也是形成了一點微不足道的經(jīng)驗,在這里拋磚引玉,歡迎大家批評指正:第一就是實操策略,大數(shù)據(jù)出版在行業(yè)內(nèi)是具有前沿探索性質(zhì)的新興出版,在實踐過程中,我們的策略有三個,一是小步快走,即始終要保證投入風(fēng)險可控,我們也沒有那么多錢去“燒”數(shù)據(jù),去交學(xué)費,要做就一定要保證發(fā)展可持續(xù),在這個過程中,采取一種“小步快走”,不斷自我完善、迭代升級的態(tài)度,我們認為比較務(wù)實;二是內(nèi)外融合,內(nèi)部是集團傳統(tǒng)出版社與新興出版公司之間的融合,通過具體的選題、項目,讓傳統(tǒng)編輯和數(shù)字編輯一起參與,讓大家都有大數(shù)據(jù)出版的概念,一起探索大數(shù)據(jù)出版的融合發(fā)展流程,外部是和出版“政產(chǎn)學(xué)研技”各領(lǐng)域的融合,多看人家怎么做的,多學(xué)人家的經(jīng)驗,進一步了解有什么合作的點。三是有效布局,沒有誰說一來就可以做成大數(shù)據(jù),事實上,數(shù)據(jù)需要積累,算法需要優(yōu)化,應(yīng)用場景需要不斷推演和完善,布局大數(shù)據(jù)出版的實操流程,應(yīng)該是按照大數(shù)據(jù)的特點和方法,先嘗試做一個滿足用戶需求、得到用戶認可的產(chǎn)品,這樣的產(chǎn)品多了,才有可能撐起一個有價值、有流量的平臺,最后成為一種頭部數(shù)據(jù)的“獨角獸”生態(tài)。
前期的積累會很辛苦,但只要我們每一步都做得很踏實,哪怕慢一點,但只要可以堅持下去,隨著“云計算、移動互聯(lián)網(wǎng)、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能”技術(shù)的不斷成熟和投入應(yīng)用,一旦有一個投資風(fēng)口,大數(shù)據(jù)出版就很有可能成為出版企業(yè)吸引投資或爭取國家政策支持的一個題材和亮點,在經(jīng)歷前期的艱難積累后,迎來一個“井噴”式的超常規(guī)發(fā)展。
第二就是借助外腦。無論是規(guī)模體量,還是人才質(zhì)量,貴州出版集團在地方集團中都不算特別突出,因此我們采取一種“借助外腦,開放共建”的態(tài)度,一方面從管理、業(yè)務(wù)、財務(wù)三個層次邀請專家,為集團布局大數(shù)據(jù)出版提供權(quán)威、專業(yè)的指導(dǎo)及評審意見,另一方面在出版業(yè)“產(chǎn)、學(xué)、研、技”及大數(shù)據(jù)領(lǐng)域,邀請具有豐富實操經(jīng)驗的專家,具體參與項目建設(shè),集團布局大數(shù)據(jù)出版,至今共邀請了120位專家參與項目建設(shè)、論證及評審工作,從而有效降低了我們的決策風(fēng)險,并通過專家的“傳幫帶”作用,提高了我們自己團隊的專業(yè)能力。
第三就是程序規(guī)范,作為國有大型文化企業(yè),貴州出版集團在布局大數(shù)據(jù)出版的過程中,努力做到“程序講規(guī)范,建設(shè)有成效,發(fā)展可持續(xù)”,其中程序規(guī)范具有一票否決權(quán)。項目從一開始就制定嚴格的“建設(shè)及資金使用管理制度”“工作人員廉潔自律管理制度”,每個項目,每個階段,都建立全面的管理、業(yè)務(wù)、財務(wù)文檔,項目每一步怎么決策、怎么執(zhí)行,資金怎么使用,都做到流程規(guī)范,文檔齊全,并根據(jù)項目需要,形成專項審計報告,保證項目做到“三個經(jīng)得起”(經(jīng)得起查、經(jīng)得起審、經(jīng)得起告),“三個說得清”(對紀檢檢查人員說得清、過三五年說得清、離職離崗說得清),“三個不出事”(人不出事、錢不出事、項目不出事)。
出版業(yè)究竟“什么為王”? 從大數(shù)據(jù)出版的角度,“內(nèi)容”“技術(shù)”“渠道”好比組成王字的三橫,而真正能把這三橫串起來的一豎,是大數(shù)據(jù)服務(wù),只有通過數(shù)據(jù)的采集、“脫敏”、建模、清洗、統(tǒng)計、預(yù)測等一系列工作,在內(nèi)容的多形態(tài)、多終端方面,形成知識服務(wù)對用戶畫像的匹配推送,才能讓內(nèi)容的“資源優(yōu)勢”轉(zhuǎn)化為“資本優(yōu)勢”,讓技術(shù)開發(fā)有意義,讓渠道發(fā)布可持續(xù),成為真正的“王者”。
(本文作者為貴州出版集團版云大數(shù)據(jù)公司董事長、數(shù)字出版公司副總經(jīng)理)