資源環(huán)境要素涉及大氣圈、水圈(含冰凍圈)、生物圈、人類圈和巖石圈這五大圈層在地球表層中的各種自然和人文要素(含社交媒體公眾信息)。如何面向科學發(fā)現(xiàn)和領域應用需求,獲取、挖掘和治理這些包括自然屬性和人文屬性的海量地理要素信息,是資源環(huán)境大數據驅動科學研究的重要內容。
王卷樂研究團隊結合衛(wèi)星遙感、調查統(tǒng)計、社交媒體等數據處理新方法,在資源環(huán)境大數據分析和科學數據治理領域取得系列進展。
1、社交媒體用戶行為模式挖掘?;谏缃幻襟w數據構建了一種融合時空語義“三維”特征的公眾行為模式挖掘方法。該方法以社交媒體用戶行為軌跡立方體表達模型為基礎,構建時空語義加權的用戶行為相似度度量算法,采用譜聚類算法和PrefixSpan算法挖掘用戶時空語義行為模式,并以新浪微博為數據源進行了方法驗證。成果發(fā)表在Transactions in GIS上。
2、地球大數據分析支持SDGs指標評估。面向聯(lián)合國可持續(xù)發(fā)展目標SDG15.3中的土地退化指標量化評估,開展遙感地球大數據分析。選用MODIS L1B數據作為源數據構建沙塵指數模型,獲取蒙古高原2000-2021年的春季沙塵暴分布,并進行時空分析和歸因。利用特征空間方法實現(xiàn)鹽漬土壤分布的大數據量計算和反演,得到2015-2020年黃河流域鹽漬化空間分布,并揭示其時空變化。2篇成果發(fā)表在International Journal of Digital Earth上。
3、多源數據分析支持洪水減災。針對巴基斯坦2022年特大洪災,通過遙感監(jiān)測、歷史災害分析和風險評價等方法,分析了巴基斯坦洪水的淹沒范圍及其對農田、建筑和道路的影響,對大壩潰決情況開展風險評估,并對北部山區(qū)喀喇昆侖公路(KKH)沿線積雪融化與南部洪水的關系進行挖掘。成果發(fā)表在Natural Hazards上。
4、要素分類方法與質量檢查技術。以機器學習方法的演變歷程為媒介,剖析了自然地理要素遙感影像分類和人文社會要素網絡文本分類方法的異同,并以遙感單一對象、復合對象分類和社交媒體公眾話題分類提取為實例,指出二者在機器學習分類方法上具有相通性?;谧匀粸暮C合風險普查中的調查統(tǒng)計數據分析,提出包括大數據異常值自動檢測算法在內的災害普查數據質量檢查方法體系。成果發(fā)表的遙感學報和地球信息科學學報上。
5、科學數據共享和治理。針對科學數據中心數據治理的需求,分析了FAIR原則(可發(fā)現(xiàn)、可訪問、可互操作和可重用)的全球影響力,并提出促進和發(fā)展科學數據共享治理的啟示和建議。成果發(fā)表在科學通報上。
論文信息:
Han, X.; Wang, J.*; Zhang X.; Wang, L.; Xu, D. (2023). Mining public behaviour patterns from social media data during emergencies: a multidimensional analytical framework considering spatial–temporal–semantic features. Transactions in GIS. DOI:10.1111/tgis.13125
Zhang, Y., Wang, J.*, Ochir, A., Chonokhuu, S., & Togtokh, C. (2023). Dynamic evolution of spring sand and dust storms and cross-border response in Mongolian plateau from 2000 to 2021. International Journal of Digital Earth, 16(1), 2341-2355. DOI:10.1080/17538947.2023.2224088
Hong, M., Wang, J.*, & Han, B. (2023). Spatial-temporal variation and attribution of salinization in the Yellow River Basin from 2015 to 2020. International Journal of Digital Earth, 16(1), 446-463. DOI: 10.1080/17538947.2023.2181993
Juanle Wang*, Kai Li, Lina Hao, et al. (2023). Disaster Mapping and Assessment of Pakistan’s 2022 Mega-Flood Based on Multi-Source Data Driven Approach, Natural Hazards, DOI:10.1007/s11069-023-06337-8
王卷樂*, 李凱, 嚴欣榮, 等. 2023. 地理要素分類機器學習方法發(fā)展與前景. 遙感學報,27(8):1757-1768. DOI:10.11834/jrs.20232299
王卷樂*, 李姝晗, 王玉潔, 等. 2023. 自然災害綜合風險普查中的質量檢查方法研究[J]. 地球信息科學學報, 25(9):1765-1773. DOI:10.12082/dqxxkx.2023.230239
王卷樂*, 李揚, 王淑強, 等. 2023. FAIR 原則全球影響分析及其實施策略建議, 科學通報, DOI:10.1360/TB-2023-0585
以上研究得到國家重點研發(fā)計劃項目、國家自然科學基金項目、科技基礎資源調查專項、中國科學院戰(zhàn)略先導A類地球大數據科學工程專項、資源與環(huán)境信息系統(tǒng)國家重點實驗室自主創(chuàng)新項目等資助和支持。
圖1 融合時空語義三維特征的公眾行為模式挖掘方法框架