谷歌利用新闻文本构建全球山洪数据集

谷歌宣布其新研发的Groundsource系统成功突破山洪预测的技术瓶颈。该系统通过Gemini人工智能技术,对自2000年以来的数百万篇新闻报道进行深度分析,提取出与山洪相关的事件信息,并精准定位到具体地点与时间。这一过程生成了覆盖150多个国家、总计260万次历史山洪事件的结构化数据集,现已向公众开放下载。

从非结构化文本到可操作预警信号

研究团队对多语言新闻内容进行清洗,剔除广告、导航栏及重复条目,将非标准描述统一翻译为英文,并转化为具有地理坐标和时间戳的时序数据。这些数据成为训练新型人工智能模型的核心输入。

基于LSTM模型的城市山洪实时预测

新模型采用LSTM神经网络架构,专为处理时间序列数据设计。系统每小时整合天气预报、城市化密度、土壤渗透率与地形特征等变量,针对人口密度超过每平方公里100人的城区,输出未来24小时内是否存在中度或高度洪水风险的简明判断。

填补传统监测空白,提升应急响应效率

传统洪水预警依赖河流水位传感器,但城市街道缺乏长期连续监测设备。暴雨引发地表积水与排水系统超载时,山洪暴发迅猛且局部性强,难以被常规系统捕捉。Groundsource通过将新闻报道转化为“虚拟传感器”,弥补了历史数据缺失的短板。

实际应用展现关键价值

在南非某测试区域,灾害管理机构收到预警平台发出的警报后,迅速组织人道主义力量开展应对。谷歌危机韧性总监朱丽叶·罗滕伯格表示:“从预测生成到实地救援行动的完整链条,正是我们致力于实现‘自然灾害零突袭’愿景的核心体现。”

系统局限与未来优化方向

当前模型单次覆盖范围约为20平方公里,无法精确评估洪水强度,且在新闻报道稀少的地区表现受限。未来计划结合更多来源数据,进一步扩展覆盖广度与预测精度。