Tarvis · AI 编码工具 & 大模型比价平台
AI 技能
返回列表

PDF Processing Skill

数据处理

Anthropic 官方 PDF 处理 Skill,支持文本/表格/图片提取与 PDF 生成。

anthropics/skills8.2k610更新于 2026-06-10
概览

Anthropic 官方 skills 仓库中的 PDF 处理 Skill,基于 pdfplumber / PyMuPDF / ReportLab 等成熟库构建。

支持 PDF 文本提取、表格识别、图片提取、PDF 生成、PDF 合并/拆分等常见操作。

支持中文 PDF(含 OCR 兜底)。

可作为办公自动化的基础 Skill,与 Excel / PPT Skill 协同使用。

基础信息
作者
anthropics
主语言
Python
开源协议
MIT
Star 数
8,200
Fork 数
610
最近更新
2026-06-10
标签
Claude CodePDF办公自动化数据提取
适配平台
claude-code
安装指南
  1. 1

    确保已安装 Python 3.10+

  2. 2

    git clone https://github.com/anthropics/skills.git

  3. 3

    复制 pdf-processing 目录到 ~/.claude/skills/

  4. 4

    安装依赖:pip install pdfplumber PyMuPDF reportlab pillow

  5. 5

    可选:安装 OCR 兜底:pip install paddleocr(用于扫描件 PDF)

优缺点
优点
  • 官方维护,质量有保障
  • 支持中文 PDF(含 OCR)
  • 覆盖 PDF 处理常见需求
  • 可作为其他办公 Skill 的基础
缺点
  • 依赖较多 Python 库,安装较重
  • OCR 模式较慢,需要 GPU 加速
  • 对加密 PDF 支持有限
适用场景
1批量提取 PDF 表格数据到 Excel
2扫描件 OCR 转 Markdown
3PDF 合并与拆分
4根据 Markdown 自动生成 PDF 报告
常见问题

觉得这个技能有用?
去 GitHub 给作者一个 Star,支持项目持续维护
Star on GitHub