数据集
下载预构建数据集(推荐)
python scripts/setup/download_assets.py --only data
下载后直接传 shard 目录用于训练:
python train_mimic/scripts/train.py --motion_file data/datasets/seed/train
如需自定义构建,继续阅读下文。
自定义构建
数据主线:typed source YAML -> preprocess/filter -> shard-only 训练数 据
python train_mimic/scripts/data/build_dataset.py \
--spec train_mimic/configs/datasets/twist2_full.yaml
输出目录结构
data/datasets/<dataset>/
├── clips/ # 可选;仅在需要逐 clip 中间产物时存在
│ └── <source>/...
├── train/