王卷乐研究团队在资源环境大数据分析和数据治理领域取得新进展
资源环境要素涉及大气圈、水圈(含冰冻圈)、生物圈、人类圈和岩石圈这五大圈层在地球表层中的各种自然和人文要素(含社交媒体公众信息)。如何面向科学发现和领域应用需求,获取、挖掘和治理这些包括自然属性和人文属性的海量地理要素信息,是资源环境大数据驱动科学研究的重要内容。
王卷乐研究团队结合卫星遥感、调查统计、社交媒体等数据处理新方法,在资源环境大数据分析和科学数据治理领域取得系列进展。
1、社交媒体用户行为模式挖掘。基于社交媒体数据构建了一种融合时空语义“三维”特征的公众行为模式挖掘方法。该方法以社交媒体用户行为轨迹立方体表达模型为基础,构建时空语义加权的用户行为相似度度量算法,采用谱聚类算法和PrefixSpan算法挖掘用户时空语义行为模式,并以新浪微博为数据源进行了方法验证。成果发表在Transactions in GIS上。
2、地球大数据分析支持SDGs指标评估。面向联合国可持续发展目标SDG15.3中的土地退化指标量化评估,开展遥感地球大数据分析。选用MODIS L1B数据作为源数据构建沙尘指数模型,获取蒙古高原2000-2021年的春季沙尘暴分布,并进行时空分析和归因。利用特征空间方法实现盐渍土壤分布的大数据量计算和反演,得到2015-2020年黄河流域盐渍化空间分布,并揭示其时空变化。2篇成果发表在International Journal of Digital Earth上。
3、多源数据分析支持洪水减灾。针对巴基斯坦2022年特大洪灾,通过遥感监测、历史灾害分析和风险评价等方法,分析了巴基斯坦洪水的淹没范围及其对农田、建筑和道路的影响,对大坝溃决情况开展风险评估,并对北部山区喀喇昆仑公路(KKH)沿线积雪融化与南部洪水的关系进行挖掘。成果发表在Natural Hazards上。
4、要素分类方法与质量检查技术。以机器学习方法的演变历程为媒介,剖析了自然地理要素遥感影像分类和人文社会要素网络文本分类方法的异同,并以遥感单一对象、复合对象分类和社交媒体公众话题分类提取为实例,指出二者在机器学习分类方法上具有相通性。基于自然灾害综合风险普查中的调查统计数据分析,提出包括大数据异常值自动检测算法在内的灾害普查数据质量检查方法体系。成果发表的遥感学报和地球信息科学学报上。
5、科学数据共享和治理。针对科学数据中心数据治理的需求,分析了FAIR原则(可发现、可访问、可互操作和可重用)的全球影响力,并提出促进和发展科学数据共享治理的启示和建议。成果发表在科学通报上。
论文信息:
Han, X.; Wang, J.*; Zhang X.; Wang, L.; Xu, D. (2023). Mining public behaviour patterns from social media data during emergencies: a multidimensional analytical framework considering spatial–temporal–semantic features. Transactions in GIS. DOI:10.1111/tgis.13125
Zhang, Y., Wang, J.*, Ochir, A., Chonokhuu, S., & Togtokh, C. (2023). Dynamic evolution of spring sand and dust storms and cross-border response in Mongolian plateau from 2000 to 2021. International Journal of Digital Earth, 16(1), 2341-2355. DOI:10.1080/17538947.2023.2224088
Hong, M., Wang, J.*, & Han, B. (2023). Spatial-temporal variation and attribution of salinization in the Yellow River Basin from 2015 to 2020. International Journal of Digital Earth, 16(1), 446-463. DOI: 10.1080/17538947.2023.2181993
Juanle Wang*, Kai Li, Lina Hao, et al. (2023). Disaster Mapping and Assessment of Pakistan’s 2022 Mega-Flood Based on Multi-Source Data Driven Approach, Natural Hazards, DOI:10.1007/s11069-023-06337-8
王卷乐*, 李凯, 严欣荣, 等. 2023. 地理要素分类机器学习方法发展与前景. 遥感学报,27(8):1757-1768. DOI:10.11834/jrs.20232299
王卷乐*, 李姝晗, 王玉洁, 等. 2023. 自然灾害综合风险普查中的质量检查方法研究[J]. 地球信息科学学报, 25(9):1765-1773. DOI:10.12082/dqxxkx.2023.230239
王卷乐*, 李扬, 王淑强, 等. 2023. FAIR 原则全球影响分析及其实施策略建议, 科学通报, DOI:10.1360/TB-2023-0585
以上研究得到国家重点研发计划项目、国家自然科学基金项目、科技基础资源调查专项、中国科学院战略先导A类地球大数据科学工程专项、资源与环境信息系统国家重点实验室自主创新项目等资助和支持。
图1 融合时空语义三维特征的公众行为模式挖掘方法框架
附件下载: