Balík: pdfsandwich (0.1.7-1)
Odkazy pre pdfsandwich
Zdroje Debian:
Stiahnuť zdrojový balík pdfsandwich:
Správca:
Externé zdroje:
- Domovská stránka [www.tobias-elze.de]
Podobné balíky:
nástroj na tvorbu „sendvičových“ súborov PDF s rozpoznaným textom
pdfsandwich vytvára „sendvičové“ súbory PDF s textom rozpoznaným pomocou OCR. T.j. súbory obsahujúce iba obrázky (žiaden text) spracuje optické rozpoznávanie znakov (OCR, optical character recognition) a neviditeľný text sa pridá „za“ obrázky. pdfsandwich je nástroj príkazového riadka, ktorý je užitočný na OCR naskenovaných kníh alebo časopisov.
Dokáže rozpoznať rozloženie stránky aj v prípade textu vo viacerých stĺpcoch.
V podstate je pdfsandwich wrapper skript, ktorý volá nasledovné spustiteľné súbory: convert, unpaper, gs (iba na zmenu veľkosti psd), hocr2pdf (pre tesseract < 3.03) a tesseract.
Ostatné balíky súvisiace s balíkom pdfsandwich
|
|
|
|
-
- dep: exactimage
- programy na rýchlu manipuláciu s obrázkami
-
- dep: ghostscript
- interpreter jazyka PostScript a PDF
-
- dep: imagemagick
- programy na manipuláciu s obrázkami - binárne súbory
tiež virtuálny balík poskytovaný balíkom graphicsmagick-imagemagick-compat, imagemagick-6.q16
-
- dep: libc6 (>= 2.17)
- knižnica GNU C - zdieľané knižnice
tiež virtuálny balík poskytovaný balíkom libc6-udeb
-
- dep: poppler-utils
- nástroje PDF (založené na Poppler)
-
- dep: tesseract-ocr (>= 3.00)
- Tesseract - OCR nástroj pre príkazový riadok
-
- dep: unpaper
- nástroj na postprocessing naskenovaných stránok
Stiahnuť pdfsandwich
Architektúra | Veľkosť balíka | Nainštalovaná veľkosť | Súbory |
---|---|---|---|
armhf | 233.7 kB | 659.0 kB | [zoznam súborov] |