在移动互联网与人工智能深度融合的背景下,资源环境学院信息地理学研究团队围绕“多时间尺度+多数据源”的人类活动识别开展系统研究,以腾讯定位请求数据(TLR)为核心,融合轨迹、土地利用与社交媒体签到数据,构建从日内—年际的时空分析链条。
以祁连山国家公园(筹建)为例,团队以TLR构建小时列,结合STL时间序列分解与K-means聚类,叠加“两步路”GPS轨迹与土地利用,识别出了当地两种典型的人类活动模式:以夜间峰值明显、耕地/建设用地占比高的居民日常模式,以及仅日间活跃、夜间定位数量低、旅游轨迹密度高的旅游活动模式,为当地旅游季节管理提供依据。
另一项研究拓展到整个青藏高原,团队将腾讯定位请求数据重采样后,分别在日尺度和年尺度进行聚类,提取出三类日内模式(日常/流动/离散居住)与两类年际模式(城/乡):日常区出现深夜峰值、与较高耕地与建设用地面积显著相关;流动区无夜峰、与旅游轨迹显著相关;离散居住区在海拔3500米以上的区域广泛分布;年际上城市模式的分布与当地城市建成区分布高度吻合,“城/乡”模式在春节(2月)呈现相反起伏,反映了城市—乡村人口迁移。该多尺度框架定量揭示了高原人类活动的海拔分异与城—乡/牧—旅复合格局,为人类活动精细化管理与高原生态承载监测提供可操作的数据方案。
在另一项工作中,团队关注到社交媒体文本对环境感知与污染事件定位的独特优势,提出了“迭代关键词库+RoBERTa主题/情感判别 + BERT-BiGRU-CRF命名实体识别”的多模型框架,通过“获取-判别-提取-更新”的对关键词库进行迭代更新,构建了1019个词的微博环境主题词库,采集47,737条主题文本并进行地名地理编码,主题分类/情感分析/关键词识别的F1分别达到0.90/0.80/0.87。结果显示:北京、成都等地负向情绪显著,而山东—江苏区域长期保持积极情绪。最后以水污染个案分析验证了框架对污染事件快速落点与舆情时空扩散识别的能力。这些工作在社交媒体数据和定位数据方面的突破性的应用提高了人类活动研究的时空分辨率,弥补了传统遥感手段的不足,为相关政策制定提供了重要的方法和见解。
研究成果于近期在信息地理学领域的期刊《International Journal of Digital Earth》(JCR1区)和《Geo-Spatial Information Science》(JCR1区)上发表。兰州大学资源环境学院信息地理学系地图学与地理信息系统硕士生车明陆(现在中科院青藏所担任科研助理)为第一作者,年雁云教授为通讯作者,兰州大学兼职教授、中科院地理所裴韬研究员为合作作者。研究得到了国家青藏高原科学数据中心的资助。
原文链接:
https://doi.org/10.1080/17538947.2023.2259926
https://doi.org/10.1080/17538947.2025.2543570
https://doi.org/10.1080/10095020.2025.2541877

图 1. 祁连山国家公园两种日模式的日内变化曲线,红色为日常模式,蓝色为旅游模式

图 2. 青藏高原西宁 (a) 和拉萨 (b) 附近年度模式分布与遥感图像的比较(图中红色为城市模式,蓝色为乡镇模式)

图3. 青藏高原人类活动日模式分布

图4 青藏高原日模式 (a) 和年模式 (b) 中不同模式的高度分布和概率密度曲线

图5. 从微博中提取的中国不同区域人们对环境污染问题的情感偏向

图6 人们关注的环境污染问题的词云图

图7. 模型对小规模污染事件的快速监测与响应