🦀 ClawHub
PDF Processor
by @reaperchen
学术PDF处理:提取文字、判断语言、翻译(英文→中文)、生成200字纯中文概述。使用本地Ollama模型,不消耗线上API。适用于学术论文、研究报告等PDF文件的处理。当用户说"处理PDF"、"翻译论文"、"生成论文概述"时,或用户将PDF放入论文处理目录时使用。
💡 Examples
处理单个PDF
python3 scripts/process_pdf.py
示例:
# 处理英文PDF
python3 scripts/process_pdf.py \
~/Documents/论文处理/未处理/英文/2602.23362v1.pdf \
~/Documents/论文处理处理中文PDF
python3 scripts/process_pdf.py \
~/Documents/论文处理/未处理/中文/test.pdf \
~/Documents/论文处理
目录结构
PDF处理前需先创建目录:
~/Documents/论文处理/
├── 未处理/
│ ├── 中文/
│ └── 英文/
├── 处理中/
├── 已完成/
│ ├── 原文/
│ ├── 翻译/
│ └── 概述/
└── 索引/
📋 Tips & Best Practices
处理中/文件名_progress.json,完成后自动删除
- 串行翻译: 稳定可靠,适合各类机器性能
TERMINAL
clawhub install pdf-processor