【国民娱乐每日礼金gm777.top,99彩票注册平台登录中大奖】我们为您提供99彩票注册平台登录注册,99彩票注册平台登录投注,99彩票注册平台登录app,99彩票注册平台登录平台,巨华彩票开户,充提快速,操控简单,为99彩票注册平台登录彩民服务!

您所在的位置: 99彩票注册平台登录  >>  學術科研  >>  學術活動  >>  正文

龔為綱副教授輿情大數據相關研究刊發于《社會學研究》等重要期刊

作者:  文章來源:    點擊次數:  更新時間:2019-09-16 11:04

互聯網時代產生了海量的輿情數據,借助于這些海量的數據信息刻畫社會系統的運行邏輯與社會結構的特征,是計算社會科學的一個重要研究方向。借助于社會學的“結構敘事”,龔為綱及其研究團隊最近2年先后根據輿情大數據GDELT的海量信息,開展了2項“結構社會學”的相關研究,分析結果先后刊發于《政治學研究》(2018年第4期)和《社會學研究》(2019年第5期)99彩票注册平台登录,前者試圖借助于GDELT數據庫,刻畫中國社會各階層的情緒體驗以及不同階層之間的互動關系,并據此透視當代中國社會的階層關系;后者則試圖從世界體系的角度,刻畫全球社會的媒介信息傳播結構99彩票注册平台登录,據此透視“文化帝國主義”與世界體系的結構邏輯。

據悉,這兩項研究的數據來源為GDELT數據庫,GDELT(“全球事件,語言和語調數據庫”)是世界上最大的政治事件開放數據庫,其信息來源于全球100多個國家、65種語言中的社交媒體、門戶網站、網絡論壇、網絡新聞信息,其中20152-20199月99彩票注册平台登录,該數據庫已經匯聚了全球各種新媒體平臺上大致10億張網頁的信息,數據體量高達10TB99彩票注册平台登录。該數據庫由谷歌開發者 Kalev Leetaru根據 Philip A. Schrodt 和其他人在2011年的工作開而來。自2014年以來,可以在 Google BigQuery 界面查詢99彩票注册平台登录99彩票注册平台登录,龔為綱等主要通過Google Bigquery云計算平臺對GDELT數據進行處理。

這兩項研究的主要數據源主要包括GDELT數據的兩種形式99彩票注册平台登录。第一種是根據GDELT數據庫所提供的半結構化信息,相關數據目前存儲在Google Bigquery平臺上。Kalev Leetaru等人將全球輿情大數據匯集起來之后,由于受版權限制,他們并不能在谷歌云平臺上直接公布這些數據庫的原始文本形態,只能向用戶提供經過各種算法(主要是主題模型算法和情感詞庫技術)所提取的半結構化信息99彩票注册平台登录,這些半結構化信息包含很多豐富的內容,本研究的媒介議題分析(Themes)、媒介語調(Tone)分析、超鏈接網絡分析等都來源于這部分信息。但這些半結構化數據是經過算法處理之后的二手數據,由于缺乏原始文本數據,所以無法對媒介話語的內容展開分析,這樣就必須涉及到本研究的第二部分數據信息。第二種是根據GDELT數據庫所提供的網頁URL信息,進行定向網絡爬蟲,進而獲取本研究所需要的3.5億篇英文文本的原始信息,用于分析發達國家涉華輿情的話語建構特征。通過安暢云部署了100多臺服務器99彩票注册平台登录,借助于通用網絡爬蟲程序將2015-2018年間所有來自西方發達國家和部分英語國家中的英文文本信息全部爬取下來,這大致涉及到3.5億篇英文文本信息,對西方國家的政治話語分析以及內容分析主要來源于這部分數據。

 

附錄:

《社會學研究》原文插圖(1):中國威脅論的話語空間:基于句向量算法

注釋:借助于谷歌云在AI Hub中最近推出的通用句子編碼系統(Universal Sentence Encoding,下面簡稱USE)99彩票注册平台登录,我們對新聞文本中有關“中國威脅論”的文本進行語義編碼,借助于這一算法99彩票注册平台登录,將句子和段落等非結構化的文本語義信息結構化為512維向量。語料庫中共有58472句直接與中國威脅有關的語料(圖中每一個點代表一句話對對應的向量)99彩票注册平台登录,借助于USE將每一句與中國威脅有關的語料轉化成為512維向量99彩票注册平台登录99彩票注册平台登录,然后對這個58472×512的數組調入到Google Bigquery平臺中,借助于K-Meams算法,以512維向量為運算對象,對上述數組進行分類,并將分類結果納入到谷歌云的Tensorboard Projector中進行可視化。結合K-means算法和Tensorboard Projector的可視化結果,去掉向量空間中那些明顯與中國威脅論在語義上無關的奇異點,中國威脅論的話語空間及其語義結構如上圖,在上圖的話語空間結構中,語義集群1、2、5分別表示經濟威脅、貿易威脅和科技威脅,由于經濟威脅(第1類)和貿易威脅(第2類)、科技威脅(第5類)密切關聯,所以我們看到語義空間結構中第1類分別和第2類與第5類在語義上密切關聯99彩票注册平台登录;語義集群399彩票注册平台登录、4、699彩票注册平台登录、7則主要是中國軍事威脅99彩票注册平台登录,第4類主要是在炒作中國軍事實力和尖端武器的發展對美國所構成的軍事威脅,而3、6、7則分別在炒作中國在東北亞(日本與韓國)、東南亞(南海)和南亞對美國亞太盟友所造成的軍事威脅,由于這4個語義集群都是在炒作中國軍事和安全威脅,所以它們在向量空間中密切關聯,中國軍事威脅話語非常側重于炒作中國崛起對周邊國家的威脅。

 

《社會學研究》原文插圖(2):網絡超鏈接所展示的全球媒介信息互動結構

注釋:基于全球新媒體語料庫中18億個超鏈接,展示國家之間的媒介互動關系。這張圖顯示的是各國媒介超鏈接互動的網絡結構,每一個節點代表一個國家99彩票注册平台登录,節點越大,代表與其他國家建立的鏈接數量越多,這些國家在全球輿情空間中的話語權越大。節點與節點之間根據超鏈接互動數量形成邊。節點之間因為聯系密切99彩票注册平台登录,形成各種各樣的凝聚子群和圈群結構,通過社區探索算法99彩票注册平台登录,我們一共識別出六個文化圈群,圈群內部超鏈接互動關系更加緊密。

通過這張網絡關系圖,我們可以清晰地呈現當前新媒體中的媒介信息傳播網絡,既能從中看到經典的媒介帝國主義理論中“核心-邊緣”機制所提供的洞見,也能從中看到基于地理區域、共同語言和歷史文化的 “文化圈群”(即網絡結構中的“凝聚子群”)。也就是說,當前全球新媒體互動所展示的全球傳播秩序,既在很大程度上延續了過去的“核心-邊緣”機制,同時也展示了共同語言和歷史文化等因素在塑造媒介傳播景觀方面的重要意義。除此之外,圖6也刻畫了不同圈群內部以及圈群之間的媒介互動關系99彩票注册平台登录,這實際上是當今世界主要文明之間,在信息共享99彩票注册平台登录、經濟文化上的交流網絡,表達了文明內部的親緣關系以及文明之間的邊界。

 

 

99彩票注册平台登录