🦀 ClawHub
视频转操作指南
by @siyou315
将操作视频自动转换为图文并茂的Word操作指南文档,支持智能截图、语音转录、LLM内容提炼和流程图生成
📋 Tips & Best Practices
Q: 为什么截图分析要在主对话做?
A: read_image 是扣子平台的内置视觉理解工具,可以直接理解截图内容,无需额外调用 API 或模型。Q: 可以跳过语音转录吗?
A: 可以,使用--no-audio 参数。但建议保留语音,可以让操作说明更准确。Q: 分析结果文件是什么格式?
A: JSON 格式,包含frames 数组,每个帧包含 timestamp、ui_elements、text_content、action_hint。Q: 如何调整截图数量?
A: 使用-m 参数,如 -m 20 表示最多20张截图。TERMINAL
clawhub install video-to-doc