Operare sui PDF da terminale su Linux con Poppler Utils
Su Linux ci sono diversi programmi per elaborare i PDF, ma la maggior parte sono strumenti grafici.
Se volessimo operare sui PDF da terminale come potremmo fare?
Semplicemente usando Poppler Utils!
Questa è una suite di programmi composta da:
- pdffonts - strumento per analizzatore tipi di font presenti in un PDF
- pdfimages - estrattore di immagini da PDF
- pdfinfo - informazioni su documenti,
- pdfseparate - strumento di estrazione di pagine,
- pdftocairo - convertitore da PDF a PNG/JPEG/PDF/PS/EPS/SVG
- pdftohtml - convertitore da PDF a HTML,
- pdftoppm - convertitore di PDF in immagini PPM/PNG/JPEG,
- pdftops - convertitore da PDF a PostScript (PS),
- pdftotext - estrattore testo
- pdfunite - strumento per unione di documenti
Come potete vedere le operazioni che possiamo fare sono parecchie.
Prima di tutto installiamo la suite.
Su Debian e Ubuntu:
# aptitude install poppler-utils
Su Ubuntu dovrebbe comunque essere già installata.
Su Fedora:
# yum install poppler-utils
Su Archlinux:
# pacman -Sy poppler
Vediamo qualche esempio.
Per unire più file PDF:
$ pdfunite file_1.pdf file_2.pdf file_3.pdf file_completo.pdf
Per ultimo va indicato il nome del file finale.
Se vogliamo dividerlo in più file:
$ pdfseparate -f 2 -l 4 file_da_dividere.pdf pagina%d.pdf
Dove -f indica il numero della pagina dalla quale cominciare a dividere, e -l la pagina finale.
Per convertire un PDF in HTML:
$ pdftohtml file_pdf.pdf file_html.html
Non penso ci sia da commentare su questo esempio.
Sostanzialmente è un ottimo programma; se si riuscisse ad includere in programmi propri sarebbe il top!
linux pdf poppler poppler utils debian ubuntu fedora archlinux
Commentami!