Back to datasets
Dataset assetOpen Source CommunitySatellite DataGeospatial Learning
MMEarth
MMEarth数据集包含从不同传感器和卫星(如Sentinel-2、Sentinel-1、ERA5 - 温度与降水、Aster GDEM等)下载的大规模卫星数据,这些数据被称为模态。数据通过Google Earth Engine下载,用于探索多模态预训练任务在地理空间表示学习中的应用。
Source
github
Created
Mar 25, 2024
Updated
May 8, 2024
Signals
561 views
Availability
Linked source ready
Overview
Dataset description and usage context
数据集概述
数据集名称
- MMEarth
数据集内容
- 数据来源:Google Earth Engine
- 数据类型:卫星数据
- 传感器/卫星:Sentinel-2, Sentinel-1, ERA5 (温度 & 降水), Aster GDEM等
- 数据下载方式:使用提供的脚本下载
数据集版本
- 当前状态:数据集正在维护中,预计将发布Version 001。
数据集结构
-
主要数据集:
-
其他数据集:
数据集使用
- 数据加载:提供了一个使用PyTorch加载数据的示例Jupyter Notebook。
- 数据下载与处理:
- 创建瓷砖:使用
create_tiles_polygon.py和config/config_tiles.yaml配置文件。 - 下载数据堆栈:使用
main_download.py和config/config_data.yaml配置文件。 - 后处理:使用
post_download.py进行数据合并、转换和统计计算。 - 重新下载:使用
redownload.py重新下载失败的数据瓷砖。
- 创建瓷砖:使用
数据集许可证
- 许可证:CC BY 4.0
数据集引用
- 论文:MMEarth: Exploring Multi-Modal Pretext Tasks For Geospatial Representation Learning
- 作者:Vishal Nedungadi, Ankit Kariryaa, Stefan Oehmcke, Serge Belongie, Christian Igel, & Nico Lang
- 年份:2024
- arXiv链接:arXiv链接
数据集下载与执行
- 下载工具:使用SLURM进行并行处理加速数据下载。
- 执行命令:
sbatch slurm_scripts/slurm_download_parallel.sh
以上信息总结了MMEarth数据集的关键细节,包括数据集的结构、内容、下载和使用方法,以及相关的许可证和引用信息。
Need downstream help?
Pair the dataset with AI analysis and content workflows.
Once the source passes your review, move straight into summarization, transformation, report drafting, or presentation generation with the JuheAI toolchain.