Successivo

HowTo

Come convertire un Pdf in testo dal terminale di Linux

Dario Orlandi | 3 Ottobre 2016

Per l’ambiente Windows esiste un gran numero di utility che permettono di trasformare un documento Pdf in un testo editabile, […]

Per l’ambiente Windows esiste un gran numero di utility che permettono di trasformare un documento Pdf in un testo editabile, e ancor più sono quelle che dichiarano di saperlo fare, salvo poi installare software indesiderato, adware e altri elementi inutili se non dannosi.

Il panorama per gli utenti Linux non è altrettanto variegato, ma esistono comunque strumenti efficaci, che evitano di cadere nelle trappole fin troppo comuni nel mondo dei freeware per Windows. Per convertire un Pdf in un file di testo si possono usare gli strumenti contenuti nel pacchetto poppler-utils.

Scopriamo come installarlo e utilizzarlo, con Ubuntu

Per verificare se il pacchetto è già  presente nel sistema (spesso, infatti, è richiesto come dipendenza da altri programmi) basta aprire una finestra di terminale, per esempio con la scorciatoia da tastiera Ctrl+Alt+T, e digitare il comando dpkg -s poppler-utils. Se il pacchetto è disponibile, nella seconda riga potrete leggere Status: install ok installed.

Se invece non fosse ancora installato, potete rimediare digitando sudo apt-get install poppler-utils.

Utilizzare gli strumenti di questo pacchetto, e in particolare il tool di conversione dei documenti Pdf, è molto semplice: basta digitare il comando pdftotext ./documento.pdf ./documento.txt. Quando la conversione è completa aprite il file testuale; se doveste notare una formattazione imperfetta, con righe spezzate in modo errato, potete aggiungere l’argomento -layout, trasformando il comando in quello seguente:

pdftotext -layout ./documento.pdf  ./documento.txt