PDF에서 이미지 추출 — 페이지 래스터화 vs 임베디드 이미지 추출
Tomoda Hinata도구 작성자 및 유지 관리자게시 2026년 4월 26일약 4분 읽기
‘PDF에서 이미지 추출’은 두 가지 의미가 있습니다. 모드 A — 각 페이지 래스터화 — 텍스트·사진·도표를 하나로 평면화한 페이지당 1 이미지를 만듭니다(대부분의 사용자가 원하는 모드). 모드 B — 임베디드 추출 — PDF 작성자가 삽입한 원본 사진 바이트를 그대로 꺼냅니다. 모드를 잘못 고르면 시간 낭비. 어느 쪽이 맞는지와 각각의 브라우저 워크플로를 설명합니다.
이 가이드에서 사용하는 도구
‘PDF에서 이미지 추출’의 두 의미
같은 이름의 두 작업이 있습니다. 페이지 래스터화는 PDF의 각 페이지를 텍스트·사진·도표를 모두 합친 한 장의 평면 이미지로 만듭니다(슬라이드, 스캔, OCR 입력에 적합). 임베디드 이미지 추출은 PDF.js가 객체 그래프를 순회해 작성자가 삽입한 모든 이미지 스트림을 원본 그대로 꺼냅니다.
페이지 래스터화가 맞는 경우
다섯 가지 — 슬라이드 PDF를 Instagram 캐러셀로 사전 가공, 스캔 문서를 OCR에 투입, 강의 노트 모바일 뷰, 계약서 미리보기 썸네일, 1쪽 포스터 고해상도 JPG 보관. 모두 ‘페이지 전체 레이아웃’이 필요.
임베디드 추출이 맞는 경우
세 가지 — 디자이너가 브로셔에 넣은 고해상도 히어로 사진을 원본 해상도로 가져오고 싶을 때, 벤더 제품 PDF에서 원본 화질을 회수해 재사용, PDF가 어떤 이미지를 포함하는지 저작권 감사. 출력이 페이지당 N장(예: 30쪽 → 80장 가능).
DPI는 얼마?
DPI는 래스터화에서만 의미. 72 DPI는 화면 표시 기본, 150 DPI는 레티나 화면에 최적, 300 DPI는 인쇄 품질. OCR 입력은 200–300 DPI가 표준이며 150 미만은 정확도가 급락.
PNG vs JPG 출력
텍스트 위주/세선 도표는 PNG(엣지 보존, 용량 큼). 사진 위주는 JPG 품질 90(5–10× 작음, 차이 안 보임). 혼합 페이지는 JPG 품질 92가 균형.
암호화/스캔 전용 PDF?
암호 보호: 도구가 입력 폼을 표시. 스캔 전용: 추출 모드는 원본 스캔을 반환, 래스터화 모드는 선택 DPI로 다시 그림. 양식 PDF: 양식 + 입력값 모두 캡처.
단계
약 1분 소요PDF 드롭
단일 파일(최대 200MB)을 도구에 드래그. 암호 PDF는 입력 폼 표시.
모드/설정 선택
모드: ‘각 페이지 래스터화’(기본) 또는 ‘임베디드 추출’. DPI 150, 형식 JPG 품질 90 기본.
처리
PDF.js가 페이지 단위로 렌더링. 진행률은 페이지 단위, 언제든 취소 가능.
ZIP 다운로드
모든 출력 이미지를 페이지 번호와 일치하는 순번 파일명으로 ZIP에 묶음.
| 설정 | 시간 (M2) | 출력 ZIP 크기 |
|---|---|---|
| 72 DPI JPG Q90 | 5 초 | 4 MB |
| 150 DPI JPG Q90 | 8 초 | 11 MB |
| 150 DPI PNG | 12 초 | 32 MB |
| 300 DPI JPG Q90 | 21 초 | 38 MB |
자주 묻는 질문
100쪽 PDF도 가능?
가능 — 페이지 스트리밍으로 메모리는 일정. 100쪽 150 DPI는 25–35초, 결과물 ~30MB ZIP.
특정 페이지만 추출?
가능 — 페이지 범위 선택 ‘5’ 또는 ‘5-10’.
DPI를 올리면 OCR 정확도가 좋아지나?
어느 한도까지. 150 미만은 급락, 300 초과는 효용 체감.
PDF에서 원본 사진을 꺼낼 수 있나?
‘임베디드 추출’ 모드에서 가능 — 원본 해상도 그대로 저장.
암호 PDF 지원?
암호가 있으면 지원 — 도구가 입력 폼을 띄움.
업로드되나?
되지 않음. PDF.js가 브라우저에서 모두 처리.
지금 사용해 보기
Convert each PDF page to PNG or JPG
PDF to Image Converter이 글은 AI 번역을 포함합니다. 오류가 있으면 알려 주세요.