9.3. Bilder aus PDF extrahieren

Das Programm ExtractImages extrahiert alle Bilder aus einem PDF-Dokument. Jedes Bild wird als eigene Datei gespeichert. Die Tests mit diesen Bildern werden in Kapitel 3.7: „Bilder in Dokumenten“ beschrieben.

Aufruf

::
:: Extract all images of a PDF document into a PNG file for each image.
::

@echo off
setlocal
set CLASSPATH=./lib/aspectj-1.8.7/*;%CLASSPATH%
set CLASSPATH=./lib/bouncycastle-jdk15on-153/*;%CLASSPATH%
set CLASSPATH=./lib/commons-logging-1.2/*;%CLASSPATH%
set CLASSPATH=./lib/pdfbox-2.0.0/*;%CLASSPATH%
set CLASSPATH=./lib/pdfunit-2016.05/*;%CLASSPATH%

set TOOL=com.pdfunit.tools.ExtractImages
set OUT_DIR=./tmp
set IN_FILE=imageDemo.pdf
set PASSWD=

java  %TOOL%  %IN_FILE%  %OUT_DIR%  %PASSWD%
endlocal

Eingabe

Die Eingabedatei imageDemo.pdf enthält zwei Bilder:

Ausgabe

Nach der Ausführung des Hilfsprogramms entstehen zwei Bilddateien:

# created images:

.\tmp\_exported-image_imageDemo.pdf_Im4-0.out.png   1
.\tmp\_exported-image_imageDemo.pdf_Im12-1.out.jpg  2

1 2

Die Nummer im Dateinamen entspricht der Objekt-Nummer innerhalb des PDF-Dokumentes.