🦀 ClawHub
Step3-VL Finetune
by @hunwenpinghao
Step3-VL-10B 多模态模型微调指南。用于在 GPU 服务器上进行 Step3-VL 模型的 LoRA/全量微调。包含配置、训练、推理完整流程。
📋 Tips & Best Practices
1. NCCL 通信错误
RuntimeError: NCCL error in: /path/to/nccl.cpp
解决: 设置 NCCL_P2P_DISABLE=1 和 NCCL_IB_DISABLE=1
2. vocab_size 属性缺失
AttributeError: 'StepRoboticsConfig' object has no attribute 'vocab_size'
解决: 使用自定义的 save_adapter() 函数,绕过 PEFT 检查
3. forward 参数不匹配
TypeError: forward() got an unexpected keyword argument 'pixel_values'
解决: 使用 monkey patch 重写 forward 方法
4. 显存不足
解决方案:
per_device_train_batch_sizegradient_accumulation_steps5. 多模态数据加载慢
优化方案:
TERMINAL
clawhub install step3-vl-finetune