PDF Processing Skill
数据处理Anthropic 官方 PDF 处理 Skill,支持文本/表格/图片提取与 PDF 生成。
概览
Anthropic 官方 skills 仓库中的 PDF 处理 Skill,基于 pdfplumber / PyMuPDF / ReportLab 等成熟库构建。
支持 PDF 文本提取、表格识别、图片提取、PDF 生成、PDF 合并/拆分等常见操作。
支持中文 PDF(含 OCR 兜底)。
可作为办公自动化的基础 Skill,与 Excel / PPT Skill 协同使用。
基础信息
作者
anthropics
主语言
Python
开源协议
MIT
Star 数
8,200
Fork 数
610
最近更新
2026-06-10
标签
Claude CodePDF办公自动化数据提取
适配平台
claude-code
安装指南
- 1
确保已安装 Python 3.10+
- 2
git clone https://github.com/anthropics/skills.git
- 3
复制 pdf-processing 目录到 ~/.claude/skills/
- 4
安装依赖:pip install pdfplumber PyMuPDF reportlab pillow
- 5
可选:安装 OCR 兜底:pip install paddleocr(用于扫描件 PDF)
优缺点
优点
- ✓官方维护,质量有保障
- ✓支持中文 PDF(含 OCR)
- ✓覆盖 PDF 处理常见需求
- ✓可作为其他办公 Skill 的基础
缺点
- ✗依赖较多 Python 库,安装较重
- ✗OCR 模式较慢,需要 GPU 加速
- ✗对加密 PDF 支持有限
适用场景
1批量提取 PDF 表格数据到 Excel
2扫描件 OCR 转 Markdown
3PDF 合并与拆分
4根据 Markdown 自动生成 PDF 报告
常见问题
觉得这个技能有用?
去 GitHub 给作者一个 Star,支持项目持续维护