Narzędzie PDF to DjVu umożliwia konwersję dokumentu elektronicznego w formacie PDF lub PDF/A do pliku w jednym spośród formatów DjVu, HC-PDF lub TIFF.


Składnia wywołania narzędzia jest następująca :

 
pdftodjvu [Options...]



Spośród wielu parametrów narzędzia "pdftodjvu", kilka to parametry, których użycie jest wymagane obligatorynie (ich opis poprzedza informacja "wymagany"), użycie pozostałych pozostaje do decyzji użytkownika. Parametry "pdftodjvu" dotyczą różnych aspektów procesu konwersji i dlatego przedstawione zostały z podziałem na grupy tematyczne. Dostępne są w pakiecie Document Express Enterprise w wersji 8.x. Wersje poprzednie pakietu (v.7.1, v.7.5) w porównaniu z wersją 8.0, posiadają kilkanaście parametrów mniej. To, czy dany parametr ninejszego zestawienia dostępny jest w wersji poprzedniej, zweryfikować można w oparciu o podręcznik aplikacji dostępny w opcji menu "Help".
 

    ►  Grupa parametrów  "INPUT CONTROL OPTIONS" :

INPUT_PDF_NAME

"wymagany". Parametr określa nazwę konwertowanego pliku PDF lub PDF/A.

-ipasswd INPUT_PDF_PASSWORD

Opcja określenia hasła dostępu do pliku PDF z ograniczonym dostępem.

-pages PAGES


 

Możliwość wykonania konwersji jedynie dla wskazanych stron wielostronicowego pliku PDF. Numery stron przeznaczonych do konwersji lub ich zakresy rozdzielone są przecinkami. Równoważnymi postaciami użycia opcji są dla przykładu zapisy -pages 1,3,4,5,8,10,11,12 oraz -pages 1,3-5,8,10-12.


 

    ►  Grupa parametrów  "OUTPUT CONTROL OPTIONS" :

-o OUTPUT_NAME

"wymagany". Parametr określa nazwę pliku wynikowego w formatach DjVu, HC-PDF lub TIFF.

-fmt OUTPUT_FORMAT


 

Parametr pozwala jednoznacznie określić format pliku wynikowego. Jeżeli opcja nie zostanie użyta, program przyjmie automatycznie format pliku wynikowego w oparciu o nazwę pliku wynikowego podaną w opcji "-o". Dopuszczalnymi wartościami parametru OUTPUT_FORMAT są djvu, pdf, tif.


 

    ►  Grupa parametrów  "OUTPUT QUALITY OPTIONS" :

-profile PROFILE_NAME

Opcja określająca nazwę profilu konwersji do formatu DjVu, dostępnego w domyślnym repozytorium profili.

-dpi DPI

Określenie rozdzielczości optycznej dla pliku wynikowego w jednostce [dpi] dots per inch. Jeżeli opcja nie zostanie użyta, domyślnie przyjęta będzie wartość 300. Wartość rozdzielczości posiada wpływ na wymiary (podłużny i poprzeczny) pliku wynikowego.

-width WIDTH

Określenie szerokości stron pliku wynikowego w jednostce [pixel]. Użycie tej opcji powoduje automatyczne wyliczenie wysokości stron w oparciu o stosunek wymiarów podłużnego i poprzecznego strony.

-height HEIGHT

Określenie wysokości stron pliku wynikowego w jednostce [pixel]. Użycie tej opcji powoduje automatyczne wyliczenie szerokości stron w oparciu o stosunek wymiarów podłużnego i poprzecznego strony.

-box WIDTHxHEIGHT

Określenie prostokątnego obszaru szerokość*wysokość, w którym poprzez dopasowanie umieszczony będzie obraz konwertowanej strony.

-crop WIDTHxHEIGHT

Opcja pozwala każdą konwertowaną stronę, której rozmiar jest większy niż zadeklarowany prostokątny obszar szerokość*wysokość obciąć do rozmiaru tego obszaru.

-max MAX_PIXELS

Opcja pozwala każdą konwertowaną stronę, której rozmiar w pikselach jest większy niż zadeklarowany w wartości MAX_PIXELS, poddać przeskalowaniu do rozmiaru odpowiadającego wartości MAX_PIXELS.

-dict NUM_OF_PAGES

Określenie częstotliwości, co ile stron wielostronicowego wynikowego pliku DjVu tworzony będzie kolejny plik słownika kształtów wspólnych. Jeżeli opcja nie zostanie użyta, domyślnie przyjęta będzie wartość 20.

-nodict

Wyłączenie opcji tworzenia plików słowników kształtów wspólnych w wynikowym pliku DjVu.

-mode SEGMENTATION_MODE

Dla opcji "mode" dopuszczalnych jest kilka wartości SEGMENTATION_MODE :

Document - stosuje się gdy konwertowany obraz strony zawiera dowolne kolory lub odcienie szarości. Wtedy konwersja realizowana jest zgodnie z wartością opcji "-fg-mode". Jeżeli jednak obraz strony nie zawiera żadnych kolorów lub odcieni, konwersja zrealizowana będzie w trybie Bitonal,

SegmentIfFGEmpty - w sytuacji kiedy warstwa treści jest pusta, użycie tej opcji spowoduje wykonanie konwersji z segmentacją obrazu każdej strony pliku PDF na warstwę treści oraz warstwę tła,

BitonalOrPhotoIfFGEmpty - jest opcją wykonania konwersji dla sytuacji kiedy warstwa treści jest pusta. W zależności od zawartości konwertowanych stron pliku PDF, automatycznie dokonywany jest wybór trybu konwersji Bitonal lub Photo. Jeżeli nie użyto opcji "-mode", ta wartość przyjęta będzie jako wartość domyślna,

BitonalOrPhoto - użycie tej opcji powoduje, że obraz strony zawierający dowolne kolory lub odcienie szarości konwertowany jest w trybie Photo, a gdy obraz ten nie jest wielobarwnym lub nie zawiera żadnych odcieni, konwersja realizowana jest w trybie Bitonal,

SegmentAlways - wybór tej opcji powoduje, że podczas konwersji obrazu każdej strony pliku PDF, obraz ten będzie podlegać segmentacji na warstwę treści oraz warstwę tła,

PhotoAlways - jest opcją wykonania konwersji każdej strony pliku PDF w trybie Photo,

Bitonal - jest opcją wykonania konwersji każdej strony pliku PDF w trybie Bitonal.

-fg-mode MODE

Użycie tego parametru jest zasadne tylko w przypadku, kiedy dla opcji "-mode" wybrano Document, SegmentIfFGEmpty lub SegmentAlways. Wartości parametru MODE przypisać można jedną spośród trzech wartości :

FG44 - dla wykonania warstwy treści użyte będzie kodowanie obrazu FG44,

ColorJB2 - dla wykonania warstwy treści użyty będzie tryb kompresji ColorJB2,

Auto - opcja automatycznej detekcji. Jest wartością, której nie zaleca się stosować. Zamiast tej wartości, rekomendowanym jest użycie parametru "-flex-encode".

-flex-encode

Użycie tego parametru powoduje automatyczne dostosowanie konfiguracji enkodera w zależności od zawartości konwertowanej strony pliku PDF.

-fg-quality QUALITY

Użycie tego parametru jest zasadne tylko w przypadku, kiedy dla opcji "-mode" wybrano SegmentIfFGEmpty lub SegmentAlways. Wartość parametru - QUALITY - określa w zakresie wartości 1÷100 jakość wykonania warstwy treści. Wartość domyślna wynosi 75.

-bg-quality QUALITY

Wartość parametru - QUALITY - określa w zakresie wartości 1÷100 jakość wykonania warstwy tła. Wartość domyślna wynosi 75.

-fg-subsample FGSUBSAMPLE

Wartość parametru - FGSUBSAMPLE - określa w zakresie wartości 1÷12 wartość dzielnika rozdzielczości optycznej obrazu konwertowanej strony, dla wyznaczenia rozdzielczości dla warstwy treści pliku wynikowego. Wartość domyślna wynosi 12.

-bg-subsample BGSUBSAMPLE

Wartość parametru - BGSUBSAMPLE - określa w zakresie wartości 1÷12 wartość dzielnika rozdzielczości optycznej obrazu konwertowanej strony, dla wyznaczenia rozdzielczości dla warstwy tła pliku wynikowego. Wartość domyślna wynosi 3.

-lossless

Użycie tego parametru spowoduje zastosowanie bezstratnej kompresji JB2.

-fgfilltreshold FG_FILL_TRESHOLD

Wartość parametru - FG_FILL_TRESHOLD - określa graniczny rozmiar obiektu. Jeżeli podczas segmentacji zawartości konwertowanej strony, rozmiar jednolicie wypełnionego obiektu jest mniejszy od wartości FG_FILL_TRESHOLD, obiekt będzie przeniesiony do warstwy treści. Domyślną wartością parametru jest 300. Aby opcję wyłączyć, należy przypisać jej wartość 0.

-bthreshold BTHRESHOLD

Wartość parametru - BTHRESHOLD - określa wartość progu zmiany w ocenie monochromatyczny/skala szarości. Wartość ta jest dodatnią liczbą rzeczywistą. Domyślnie przyjmuje się wartość 1.5. Im wyższą wartość posiada parametr, tym bardziej próg zmiany przesuwa się w stronę oceny "monochromatyczny".

-disable-bitonaldetect

Użycie tego parametru wyłącza detekcję monochromatycznych obrazów.

aathreshold AATHRESHOLD

Wartość parametru - AATHRESHOLD - określa próg skoku de-antyaliasingu. Wartość domyślna wynosi 127.

-disable-deantialias

Użycie tego parametru wyłącza skok de-antyaliasingu.

-disable-imageonlydetect

Użycie tego parametru włącza detekcję Image-Only-PDF.

-imageonly-multiplier MULTIPLIER


 

Wartość parametru - MULTIPLIER - określa wartość mnożnika dla stron Image-Only-PDF. Wartość domyślna wynosi 1.


 

    ►  Grupa parametrów  "CONTENT VISIBILITY OPTIONS" :

-render-annots

Użycie tego parametru włącza renderowanie adnotacji PDF.

-enable-cms

Użycie tego parametru włącza zarządzanie kolorami.

-disable-ocg

Użycie tego parametru wyłącza OCG (Optional Content Group).

-no-links


 

Użycie tego parametru wyłącza generowanie adresów hiperłączy na stronach.


 

    ►  Grupa parametrów  "TEXT HANDLING OPTIONS" :

-char

Użycie tego parametru pozwala - podczas operacji rozpoznania tekstu na skonwertowanej stronie - zachować współrzędne położenia każdego rozpoznanego znaku. Gdy nie użyto parametrów "-char", "-word" lub "-line", domyślnie przyjęty będzie parametr "-char", którego użycie powoduje generowanie najbardziej szczegółowej struktury rozpoznanego na stronie tekstu.

-word

Użycie tego parametru pozwala - podczas operacji rozpoznania tekstu na skonwertowanej stronie - zachować współrzędne położenia każdego rozpoznanego słowa.

-line

Użycie tego parametru pozwala - podczas operacji rozpoznania tekstu na skonwertowanej stronie - zachować współrzędne położenia każdego rozpoznanego wiersza tekstu.

-remove-dupchars

Użycie tego parametru włącza opcję usuwania z rozpoznanego tekstu znaków parokrotnie powtórzonych, emitowanych z pliku PDF. Opcja jest przydatna zwłaszcza wtedy, gdy w tekście występuje czcionka z atrybutem cieniowania.

-extract-invisibletexts

Opcja włączenia ekstrakcji fragmentów tekstu, nawet gdy są zachowane jako niewidzialne/ukryte. Pomimo to, niektóre fragmenty tekstu mogą zostać niewyekstrahowane. Aby wyodrębnić cały tekst, zaleca się użyć tą opcję wraz z opcją "-disable-ocg".

-ocr

Opcja powoduje wykonanie rozpoznania tekstu OCR wtedy, gdy nie wyekstrahowano tekstu z strony pliku PDF.

-forceocr

Opcja powoduje wykonanie rozpoznania tekstu OCR nawet wtedy, gdy strona pliku PDF zawiera już częściowo lub całkowicie rozpoznany tekst.

-lang LANG1[, LANG2[,...]]


 

opcja określa języki dla operacji rozpoznania tekstu OCR.


 

    ►  Grupa parametrów  "WATERMARK OPTIONS" :

-wm WATERMARK_FILENAME

Parametr WATERMARK_FILENAME określa nazwę pliku, który będzie użyty jako osadzony znak wodny.

-wmpos POS

Wartość parametru POS jest liczbą naturalną z zakresu 0÷8 określającą położenie znaku wodnego na stronie. Przykładowo, wartość 0 wskazuje górny lewy narożnik, 4 wskazuje środek strony a wartość 8 wskazuje dolny prawy narożnik strony.

-wmm HORZ_MARGIN VERT_MARGIN MARGIN_UNIT

Opcja "wmm" działa w połączeniu z opcją "wmpos". Poza określeniem położenia znaku wodnego, opcja "wmm" pozwala określić przesunięcie znaku wodnego od krawędzi strony. Wartości przesunięcia określa się dwoma wartościami - margines poziomy, margines pionowy, po których należy określić jednostkę miary tych wartości. Dopuszczalnymi jednostkami miary są inch, mm oraz pixel.

-wmscale SCALE


 

Opcja pozwala przeskalować plik znaku wodnego przed jego osadzeniem na skonwertowanej stronie. Wartość pomniejszenia jest ułamkiem z przedziału 0÷1. Dla osadzenia znaku bez jego skalowania, SCALE posiada wartość 1.0. Zwyczajowo, przeskalowanie realizowane jest z uwzględnieniem rozdzielczości optycznej pliku znaku wodnego chyba, że wartość przeskalowania określono wraz z przyrostkiem "p" (np. 2.0p). W takim wypadku skalowanie prowadzone będzie wyłącznie w oparciu o rozmiar znaku w pikselach.


 

    ►  Grupa parametrów  "HIGH-COMPRESSION-PDF OPTIONS" :

-j JPX_OPTIONS

Wartość parametru JPX_OPTIONS określa użycie dowolnych opcji kodowania JPX wyrażonych w stylu JasPer dla wszystkich warstw.

-jf JPX_OPTIONS

Wartość parametru JPX_OPTIONS określa użycie dowolnych opcji kodowania JPX wyrażonych w stylu JasPer dla warstwy treści.

-jb JPX_OPTIONS

Wartość parametru JPX_OPTIONS określa użycie dowolnych opcji kodowania JPX wyrażonych w stylu JasPer dla warstwy tła.

-pdfdebug

Użycie opcji jest wskazaniem dla enkodera wstrzymującym kompresję niektórych obiektów strony, celem możliwości prostego debagowania pliku wynikowego.

-visibletext

Opcja stosowana jest dla celów debagowania pliku wynikowego. Użycie jej powoduje, że w pliku wynikowym zamiast ukrytej warstwy tekstowej, zachowywany jest widoczny tekst na obrazie strony.

-no-ocg

Wyłącza PDF OCG (Optional Content Group) dla pliku DjVu.

-codepage CODEPAGE

Opcja określa główną stronę kodową dla konwersji. Jeżeli opcji nie użyto, program przypisuje stronę kodową zgodnie z lokalnymi ustawieniami systemu operacyjnego.

-qcompat


 

Opcja uaktywnia generowanie "quartz" (Mac OS X PDF renderer). W konsekwencji wzrasta rozmiar powstałego pliku PDF.


 

    ►  Grupa parametrów  "MISCELLANEOUS OPTIONS" :

-pagecount

Gdy użyto tą opcję, po zakończeniu konwersji, program jako kod zakończenia zwróci ilość stron skonwertowanego pliku PDF.

-cmapdir CMAP_DIRECTORY

Opcja definiuje ścieżkę CMap. Domyślną ścieżką jest "C:\ProgramData\Caminova\CMap".

-verbose

Użycie tej opcji zwiększa ilość wyświetlanych informacji podczas procesu konwersji.

-nologo

Użycie tej opcji wstrzymuje wyświetlanie informacji o wersji programu.

-stdout STDOUT_FILENAME

Opcja definiuje nazwę pliku raportowego, w którym zachowane będą informacje o wykonanej konwersji.

-stderr STDERR_FILENAME

Opcja definiuje nazwę pliku raportowego, w którym zachowane będą informacje o błędach, które wystąpiły podczas konwersji.

-time

Użycie tej opcji powoduje wyświetlenie czasu trwania całego procesu konwersji.

-langlist

Jest to opcja pomocnicza. Jej użycie powoduje wyświetlenie listy nazw języków, które można wskazać podczas rozpoznawania tekstu OCR.

Expand imageZobacz także