跳到正文

从 PDF 提取图片 — 整页栅格化 vs 内嵌图片抽取

工具作者与维护者发布于 2026年4月26日约 3 分钟阅读

「从 PDF 提取图片」有两种完全不同的含义:A. 整页栅格化 —— 文本+图+图表合成 1 页 1 张图(多数用户要的就是它);B. 内嵌图片抽取 —— 把作者插进 PDF 的原始图片字节原样取出。选错就是浪费时间。本文告诉你该选哪一个,以及两种模式的浏览器流程。

「从 PDF 提取图片」到底是什么?

同一个名字两件事。整页栅格化:把每页连同文本、图片、图表合成一张平面图。适用于幻灯片、扫描件、OCR 入口。内嵌图片抽取:PDF.js 走 PDF 对象图,把作者放进去的所有图片流原样取出 —— 适合需要‘原图’而不是‘整页截图’的场景。

什么时候选整页栅格化?

五个常见场景:(1) 把幻灯片 PDF 预切成 IG 轮播图;(2) 扫描件喂给 OCR;(3) 把讲义弄到手机上看;(4) 把合同变缩略图;(5) 单页海报留高清 JPG 归档。这些都需要整页布局。

什么时候选内嵌抽取?

三个常见场景:(1) 设计师把高清主图放进手册,你要原图;(2) 从厂商产品 PDF 收回原画质图重用;(3) 为版权审核盘点 PDF 用了哪些图。输出是每页 N 张,30 页可能产出 80 张。

DPI 怎么选?

只对栅格化有意义。72 DPI 屏幕渲染默认体积最小;150 DPI 视网膜屏最佳;300 DPI 打印;再高基本无感。OCR 喂图建议 200–300 DPI,低于 150 会精度骤降。

PNG vs JPG 输出?

文字多/细线多用 PNG(保边但大);照片多用 JPG 质量 90(小 5–10 倍且无感);混合页 JPG 质量 92 折中。

加密 PDF 与扫描 PDF?

加密:工具内联弹密码框。扫描:抽取模式返回原扫描,栅格化模式按选择 DPI 重新渲染。可填表单:栅格化会同时拿到底版与已填值。

操作步骤

约 1 分钟
  1. 拖入 PDF

    单个文件(最多 200MB)。加密 PDF 会先弹密码。

  2. 选模式与参数

    模式:「整页栅格化」(默认)或「内嵌抽取」。DPI 默认 150,格式 JPG 质量 90。

  3. 处理

    PDF.js 按页渲染,进度条按页推进,可随时取消。

  4. 下载 ZIP

    全部输出图片打成 1 个 ZIP,文件名编号与页号一致。

30 页 PDF 浏览器 PDF.js 栅格化
设置耗时(M2)ZIP 体积
72 DPI JPG Q905 秒4 MB
150 DPI JPG Q908 秒11 MB
150 DPI PNG12 秒32 MB
300 DPI JPG Q9021 秒38 MB
环境:14 寸 MacBook Pro M2、Chrome 139、30 页文/图混合手册 PDF、PDF.js 4.6(2026-04-26)。

常见问题

  • 100 页也能处理吗?

    能 —— PDF.js 流式按页处理,内存不随长度增长。100 页 150 DPI 在现代笔记本约 25–35 秒,输出约 30MB ZIP。

  • 只抽某一页可以吗?

    可以 —— 页码范围选择器,输入「5」或「5-10」。

  • DPI 越高 OCR 越准吗?

    到点为止。150 以下急降,300 以上收益递减。

  • 能否取出 PDF 中的原图?

    切到「内嵌抽取」模式即可,按原始分辨率保存。

  • 加密 PDF 支持吗?

    有密码就支持,工具会先弹输入框。

  • 会上传吗?

    不会。PDF.js 在浏览器里全程处理,PDF 不离开设备。

立即试用

Convert each PDF page to PNG or JPG

PDF to Image Converter

本文包含 AI 翻译,如发现错误欢迎告知。

我们使用无 Cookie 的分析工具,记录匿名使用数据。详见隐私政策