🦀 ClawHub
Article Archiver
by @yemoo
Automatically archive web articles and Twitter Articles to Feishu documents. ALWAYS trigger when user shares URLs from x.com (Twitter), mp.weixin.qq.com (WeC...
📋 Tips & Best Practices
Q1: 中文出现乱码(���)?
原因:UTF-8 多字节字符在传输或序列化时被截断。
解决:
html-to-markdown-fixed.js 而不是 html-to-markdown-final.jsQ2: 标题为空,内容在下一行?
原因:Markdown 格式 # \n\n内容 导致飞书渲染时标题为空。
解决:
html-to-markdown-fixed.js# 内容Q3: 图片位置不对,都堆在文档末尾?
原因:先写完所有文字,再统一上传图片。
解决:按图片位置分段,交替写入文本和图片。
Q4: 内容不完整,只有开头部分?
原因:长文章一次性写入失败。
解决:使用 archive-long-article.sh 脚本,分段处理。
Q5: 格式丢失(粗体、代码块)?
原因:使用了简单的文本提取,没有保留 HTML 格式。
解决:使用 html-to-markdown.js 脚本,正确转换格式。
Q4: 执行慢、消耗大量 token?
原因:手动逐个调用 feishu_doc 工具。
解决:用 bash 脚本批量处理,脚本执行不消耗 token。
Q5: Cookie 过期怎么办?
症状:抓取 Twitter Article 失败,返回登录页面。
解决:
1. 浏览器登录 x.com
2. 打开开发者工具 → Application → Cookies
3. 复制 auth_token, ct0, twid
4. 更新 config/twitter-cookies.txt
TERMINAL
clawhub install article-archiver