从 PDF 提取图片 — 整页栅格化 vs 内嵌图片抽取
Tomoda Hinata工具作者与维护者发布于 2026年4月26日约 3 分钟阅读
「从 PDF 提取图片」有两种完全不同的含义:A. 整页栅格化 —— 文本+图+图表合成 1 页 1 张图(多数用户要的就是它);B. 内嵌图片抽取 —— 把作者插进 PDF 的原始图片字节原样取出。选错就是浪费时间。本文告诉你该选哪一个,以及两种模式的浏览器流程。
本指南使用的工具
「从 PDF 提取图片」到底是什么?
同一个名字两件事。整页栅格化:把每页连同文本、图片、图表合成一张平面图。适用于幻灯片、扫描件、OCR 入口。内嵌图片抽取:PDF.js 走 PDF 对象图,把作者放进去的所有图片流原样取出 —— 适合需要‘原图’而不是‘整页截图’的场景。
什么时候选整页栅格化?
五个常见场景:(1) 把幻灯片 PDF 预切成 IG 轮播图;(2) 扫描件喂给 OCR;(3) 把讲义弄到手机上看;(4) 把合同变缩略图;(5) 单页海报留高清 JPG 归档。这些都需要整页布局。
什么时候选内嵌抽取?
三个常见场景:(1) 设计师把高清主图放进手册,你要原图;(2) 从厂商产品 PDF 收回原画质图重用;(3) 为版权审核盘点 PDF 用了哪些图。输出是每页 N 张,30 页可能产出 80 张。
DPI 怎么选?
只对栅格化有意义。72 DPI 屏幕渲染默认体积最小;150 DPI 视网膜屏最佳;300 DPI 打印;再高基本无感。OCR 喂图建议 200–300 DPI,低于 150 会精度骤降。
PNG vs JPG 输出?
文字多/细线多用 PNG(保边但大);照片多用 JPG 质量 90(小 5–10 倍且无感);混合页 JPG 质量 92 折中。
加密 PDF 与扫描 PDF?
加密:工具内联弹密码框。扫描:抽取模式返回原扫描,栅格化模式按选择 DPI 重新渲染。可填表单:栅格化会同时拿到底版与已填值。
操作步骤
约 1 分钟拖入 PDF
单个文件(最多 200MB)。加密 PDF 会先弹密码。
选模式与参数
模式:「整页栅格化」(默认)或「内嵌抽取」。DPI 默认 150,格式 JPG 质量 90。
处理
PDF.js 按页渲染,进度条按页推进,可随时取消。
下载 ZIP
全部输出图片打成 1 个 ZIP,文件名编号与页号一致。
| 设置 | 耗时(M2) | ZIP 体积 |
|---|---|---|
| 72 DPI JPG Q90 | 5 秒 | 4 MB |
| 150 DPI JPG Q90 | 8 秒 | 11 MB |
| 150 DPI PNG | 12 秒 | 32 MB |
| 300 DPI JPG Q90 | 21 秒 | 38 MB |
常见问题
100 页也能处理吗?
能 —— PDF.js 流式按页处理,内存不随长度增长。100 页 150 DPI 在现代笔记本约 25–35 秒,输出约 30MB ZIP。
只抽某一页可以吗?
可以 —— 页码范围选择器,输入「5」或「5-10」。
DPI 越高 OCR 越准吗?
到点为止。150 以下急降,300 以上收益递减。
能否取出 PDF 中的原图?
切到「内嵌抽取」模式即可,按原始分辨率保存。
加密 PDF 支持吗?
有密码就支持,工具会先弹输入框。
会上传吗?
不会。PDF.js 在浏览器里全程处理,PDF 不离开设备。
立即试用
Convert each PDF page to PNG or JPG
PDF to Image Converter本文包含 AI 翻译,如发现错误欢迎告知。