大數據推動計算社會科學發展

文章來源:中國社會科學網

100多年前,社會學創始人孔德提出社會物理學,并將其主要內容歸納為社會靜力學與社會動力學。社會靜力學用于分析社會結構,理解社會秩序何以可能;而社會動力學則用于分析社會變遷,理解社會如何進步。孔德的理想是希望將社會系統的分析納入實證分析的范疇,即將物理學的實證分析方法引入社會學研究。100多年來,有關社會系統的運行研究主要是社會學家的研究對象與研究領域。但在由信息技術主導的計算社會科學運動的勃發過程中,社會學家不應將研究領域“拱手相讓”,而應該積極主動進取。

大數據時代重啟社會物理學

孔德的理想是建構一種宏觀社會學,以社會系統作為整體的分析思路。雖然孔德為實證社會學研究勾勒了美好藍圖,但在社會學100多年的發展歷史中,其理想幾乎沒有被完美實現過。原因眾所周知:一方面,研究者很難獲取關于社會系統整體運行的信息;另一方面,研究者更難獲取關于社會系統長期變遷的信息。這兩個方面決定了社會學家很難對社會運行的整體圖景展開分析。我們很難獲得社會運行的整體信息,進而很難對社會系統的運行邏輯展開實證分析。

已有的關于社會系統運行的宏觀分析,主要進路是理論分析,如帕森斯的社會系統理論、鄭杭生等人有關中國社會運行與社會轉型的理論。這些研究具有諸多洞見,但它們與孔德倡導的社會物理學并不是一回事。孔德的理想是將社會系統的運行納入實證分析的路徑中,而非純粹的理論建構。盡管在100多年的發展歷程中,社會學領域存在大量的實證分析,但已有的定量分析方法主要通過問卷驅動,以微觀社會學為主。實際上,借助問卷把握社會系統的整體運行力有不逮,這幾乎是學界的共識。簡而言之,孔德的社會物理學理想在實證的進路上進展緩慢,原因在于獲得所需數據的方法與技術存在諸多限制。

大數據時代的到來,使得這種困境漸漸被打破,曙光最早出現在“社會計算”與計算社會科學領域。這是一場主要由計算機科學家主導的跨學科學術運動,如有關“星球脈搏”的分析、王飛躍等人領銜的“社會計算”與“社會物理學”研究。這些研究進路主要借助大數據、人工智能、機器學習等技術,可以說,計算機科學家已經開始對復雜社會系統的運行產生極大興趣。計算機科學與社會科學正在深度交叉,計算社會科學展示出巨大潛力。

學科建設助力計算社會科學研究

計算社會科學作為一個新興的研究領域,已有10多年的發展歷程。回顧計算社會科學的發展歷程可知,它取得了很多新的發現,數據驅動的洞見也讓社會科學研究范式煥然一新。不過,現有研究存在的一個突出問題是:已有的若干研究就如天上的顆顆孤星,研究者對其在計算社會科學發展中的位置、這些研究之間的關系、學科知識積累等重要問題則無暇思考,即學科建設不足的問題。

筆者認為,無論是計算社會科學學科還是學者個人,都不應讓研究領域支離破碎以致無法形成知識積累,也就是不應讓研究成為毫無關聯的案例。已有研究易處于碎片化的狀況,往往與當前大數據的特征有關:一方面,數據開發難度大、數據價值密度低;另一方面,在統合多元的數據來源上存在困難,研究者往往基于某個具體的點數據開展研究,而無法打通多種數據來源的面源數據。

最為致命的是,現有計算社會科學的問題意識往往嵌入在不同理論脈絡中,這樣,計算社會科學本身作為一個研究領域被碎片化了。基于不同理論脈絡而形成的計算社會科學實踐之間沒有太大的關聯,導致案例研究結論之間難以形成學科意義上的知識積累,更難以形成“積沙成塔”式的學科范式。

本體論共識為計算社會科學筑基

如何避免這個問題,是當前計算社會科學需要解決的關鍵問題。筆者認為,解決此問題首先要明確計算社會科學的本體論問題,即計算社會科學的使命究竟是什么。沿著具有本體論意義的問題展開深度思考,才能誘發計算社會科學領域的學科范式。

計算社會科學如果要形成知識的積累并形成學科的范式,不應僅僅在研究方法和技術上形成共識,更應在本體論上形成共識。從本體論的角度來看,計算社會科學應該回歸社會學的元問題,進而從社會計算的角度回應社會學的根本問題并作出獨有的貢獻。這些元問題包括計算社會科學意義上的社會究竟是什么;社會作為一個復雜系統是如何可能的,又是如何運行的等。這一系列問題大致可以歸結為孔德所要回應的秩序問題和進步問題,或者說社會的靜力學問題與動力學問題。

社會學家過去回答這些問題時,往往基于某一特定的社會共同體去思考和歸納。這些歸納中有很多洞見,但絕大部分都是地方性知識,是學者基于其有限經驗資料與閱歷甚至是戴著有色眼鏡做出的分析與建構。尤其是基于“西方中心主義”的所謂現代社會科學知識及話語,其經驗基礎往往是西方式的,帶著濃厚的西方中心主義色彩。這些分析與思考的局限性是很明顯的。另外,由單一的社會經驗所建構的理論,基本上都是個案分析,而基于個案的研究很難跳出個案固有的局限。

在大數據時代,對上述元問題的分析與回答已經有了完全不同的方法與視角。全球有100多個國家、上千個民族、多種社會形態,大數據記錄了這些社會中的長時間段時序數據,即關于不同文化環境下的社會系統運行的時序數據和變遷數據。這樣,橫向上,就可以對多個不同的社會實體進行比較,進而回答社會有機體的本質是什么、社會秩序如何可能、社會結構如何維系以及個體與社會之間關系的形態等根本性問題;縱向上,則可以回答不同社會的變遷機制與變遷路徑,研究社會的演化形態及機制。

總而言之,無論橫向上還是縱向上的分析,實際上都是從宏觀層面對多個社會的形態進行比較,對多個社會進行透視,故而其得出的結論不再是地方性知識,而是基于全球范圍的經驗證據。當前的中國社會科學發展,應借助于大數據時代所提供的特有機遇,在達至普適性意義上的計算社會科學結論道路上作出應有的努力并形成其特有的貢獻。