DATASET
Open Source Community
MMEarth
MMEarth数据集包含从不同传感器和卫星(如Sentinel-2、Sentinel-1、ERA5 - 温度与降水、Aster GDEM等)下载的大规模卫星数据,这些数据被称为模态。数据通过Google Earth Engine下载,用于探索多模态预训练任务在地理空间表示学习中的应用。
Updated 5/8/2024
github
Description
数据集概述
数据集名称
- MMEarth
数据集内容
- 数据来源:Google Earth Engine
- 数据类型:卫星数据
- 传感器/卫星:Sentinel-2, Sentinel-1, ERA5 (温度 & 降水), Aster GDEM等
- 数据下载方式:使用提供的脚本下载
数据集版本
- 当前状态:数据集正在维护中,预计将发布Version 001。
数据集结构
-
主要数据集:
-
其他数据集:
数据集使用
- 数据加载:提供了一个使用PyTorch加载数据的示例Jupyter Notebook。
- 数据下载与处理:
- 创建瓷砖:使用
create_tiles_polygon.py和config/config_tiles.yaml配置文件。 - 下载数据堆栈:使用
main_download.py和config/config_data.yaml配置文件。 - 后处理:使用
post_download.py进行数据合并、转换和统计计算。 - 重新下载:使用
redownload.py重新下载失败的数据瓷砖。
- 创建瓷砖:使用
数据集许可证
- 许可证:CC BY 4.0
数据集引用
- 论文:MMEarth: Exploring Multi-Modal Pretext Tasks For Geospatial Representation Learning
- 作者:Vishal Nedungadi, Ankit Kariryaa, Stefan Oehmcke, Serge Belongie, Christian Igel, & Nico Lang
- 年份:2024
- arXiv链接:arXiv链接
数据集下载与执行
- 下载工具:使用SLURM进行并行处理加速数据下载。
- 执行命令:
sbatch slurm_scripts/slurm_download_parallel.sh
以上信息总结了MMEarth数据集的关键细节,包括数据集的结构、内容、下载和使用方法,以及相关的许可证和引用信息。
AI studio
Generate PPTs instantly with Nano Banana Pro.
Generate PPT NowAccess Dataset
Login to Access
Please login to view download links and access full dataset details.
Topics
Satellite Data
Geospatial Learning
Source
Organization: github
Created: 3/25/2024
Power Your Data Analysis with Premium AI Models
Supporting GPT-5, Claude-4, DeepSeek v3, Gemini and more.
Enjoy a free trial and save 20%+ compared to official pricing.