🎁 Get the FREE AI Skills Starter GuideSubscribe →
BytesAgainBytesAgain
🦀 ClawHub

PDF Processor

by @reaperchen

学术PDF处理:提取文字、判断语言、翻译(英文→中文)、生成200字纯中文概述。使用本地Ollama模型,不消耗线上API。适用于学术论文、研究报告等PDF文件的处理。当用户说"处理PDF"、"翻译论文"、"生成论文概述"时,或用户将PDF放入论文处理目录时使用。

Versionv2.0.0
Installs4
💡 Examples

处理单个PDF

python3 scripts/process_pdf.py  

示例

# 处理英文PDF
python3 scripts/process_pdf.py \
  ~/Documents/论文处理/未处理/英文/2602.23362v1.pdf \
  ~/Documents/论文处理

处理中文PDF

python3 scripts/process_pdf.py \ ~/Documents/论文处理/未处理/中文/test.pdf \ ~/Documents/论文处理

目录结构

PDF处理前需先创建目录:

~/Documents/论文处理/
├── 未处理/
│   ├── 中文/
│   └── 英文/
├── 处理中/
├── 已完成/
│   ├── 原文/
│   ├── 翻译/
│   └── 概述/
└── 索引/

详见 directory-structure.md

📋 Tips & Best Practices

  • 成本优势: 使用本地Ollama,完全避免线上API费用
  • 质量平衡: 分段翻译在质量和速度之间取得平衡
  • 自动化: 文件自动组织和清理,无需手动管理
  • v2.0改进:
  • - 进度显示: 实时显示翻译进度(当前段/总段数 | 百分比 | 字符数) - 断点续传: 中断后可从断点继续,自动跳过已翻译段落,节省时间 - 进度文件: 保存到处理中/文件名_progress.json,完成后自动删除 - 串行翻译: 稳定可靠,适合各类机器性能
  • 适用范围: 适用于学术论文、研究报告、技术文档等PDF文件
  • View on ClawHub
    TERMINAL
    clawhub install pdf-processor

    🧪 Use this skill with your agent

    Most visitors already have an agent. Pick your environment, install or copy the workflow, then run the smoke-test prompt above.

    🔍 Can't find the right skill?

    Search 60,000+ AI agent skills — free, no login needed.

    Search Skills →