9.3. Bilder aus PDF extrahieren

Das Programm ExtractImages extrahiert alle Bilder aus einem PDF-Dokument. Jedes Bild wird als eigene Datei gespeichert. Die Tests mit diesen Bildern werden in Kapitel 3.6: „Bilder in Dokumenten“ beschrieben.

Aufruf

::
:: Extract all images of a PDF document into a PNG file for each image.
::

@echo off
setlocal
set CLASSPATH=./lib/pdfunit-2015.10/*;%CLASSPATH%
set CLASSPATH=./lib/itext-5.5.1/*;%CLASSPATH%
set CLASSPATH=./lib/bouncycastle-jdk15on-150/*;%CLASSPATH%

set TOOL=com.pdfunit.tools.ExtractImages
set OUT_DIR=./tmp
set IN_FILE=imageDemo.pdf
set PASSWD=

java  %TOOL%  %IN_FILE%  %OUT_DIR%  %PASSWD%
endlocal

Eingabe

Die Eingabedatei imageDemo.pdf enthält zwei Bilder:

Ausgabe

Nach der Ausführung des Hilfsprogramms entstehen die zwei Dateien:

# created images:

.\tmp\_exported-image_imageDemo_4.out.png   1
.\tmp\_exported-image_imageDemo_12.out.png  2

1 2

Die Nummer im Dateinamen entspricht der Objekt-Nummer innerhalb des PDF-Dokumentes.