pdftk

Fiche logiciel validé
  • Création ou MAJ importante : 12/04/11
  • Correction mineure : 21/11/12
Mots-clés
Pour aller plus loin
  • Mots-clés principaux : PDF

pdftk : PDF toolkit

Description
Fonctionnalités générales

Application de manipulation de contenu de fichiers PDF sans l'(autrement) incontournable Adobe Acrobat. Les cas d'utilisation les plus fréquents sont certainement l'extraction de page(s) ou la combinaison de plusieurs fichiers en un seul.
"Si on considère PDF comme du papier électronique, alors pdftk est la version électronique de : un ôte-agrafes, un perforateur, un relieur, un encodeur-décodeur et des lunettes à rayons X. Pdftk est un outil simple pour effectuer des opérations de tous les jours sur les documents PDF." dixit le manuel pdftk.
Toutes les opérations s'exécutent en mode ligne de commande, ce qui permet de les automatiser ou de les intégrer dans des applications plus complexes.

Autres fonctionnalités
  • Combiner plusieurs documents PDF en un seul.
  • Extraire une ou plusieurs pages dans un nouveau document PDF.
  • Effectuer une rotation sur tout ou partie des pages dans un document PDF.
  • Décrypter un document PDF (connaissant le mot de passe).
  • Crypter un document PDF et associer les droits d'accès (lecture, copie, impression, modification, ...).
  • Travailler avec les formulaires PDF :
    • Remplir un formulaire PDF avec des données X/FDF.
    • Générer un patron FDF à partir d'un document PDF.
    • (cf. billet sur informatique.in2p3.fr à ce sujet) ou remplir un formulaire PDF avec des données FDF (flatten)
  • Appliquer une filigrane (arrière-plan, watermark) ou tampon (premier plan, stamp) à un document.
  • Calculer la métrique d'un document PDF, comme les métadata et les signets.
  • Mettre à jour les métadata d'un document.
  • Attacher des fichiers à une page ou un document PDF.
  • Extraire les fichiers attachés d'un document PDF.
  • Éclater un document PDF multipage en pages individuelles.
  • Compresser et décompresser des suites de pages.
  • Réparer des fichiers PDF endommagés (dans la limite du logiquement intact).
Interopérabilité

pdftk est basé sur les fonctions d'itext qui, lui, est écrit en Java. L'interopérabilité est donc garantie par principe. Cependant, pdftk intègre les sources Java en les compilant avec gcj, afin de compacter les binaires. Cette portabilité n'est pas toujours bien configurée sur certaines distributions Linux.

Contexte d'utilisation dans mon laboratoire/service

Alternative gratuite et libre sur Linux à la connexion à un serveur Windows partagé/public qui contient Adobe Acrobat (produit payant) pour la manipulation des PDF.

Limitations, difficultés, fonctionnalités importantes non couvertes

La conversion des fichiers pdf avec des formats images et aussi des formats de traitement de texte sont des manipulations souhaitables des documents pdf. L'annotation est aussi une fonctionnalité non couverte. PDF est un format ouvert mais à ce jour, il ne semble pas y avoir de bibliothèque qui couvre tous les aspects de sa manipulation. Gimp permet de faire les manipulation des pdf au niveau image, http://doc.ubuntu-fr.org/pdf recense les différentes solutions existantes sous linux.

Environnement du logiciel
Distributions dans lesquelles ce logiciel est intégré

La plupart des distributions Linux.

Plates-formes

Paquets d'installation disponibles pour Linux, Windows, Mac OS X.

Logiciels connexes
Autres logiciels aux fonctionnalités équivalentes

Adobe Acrobat payant

PDFedit  libre et gratuit

PDF Split and Merge libre et gratuit

PDFCreator libre et gratuit

 

Environnement de développement
Type de structure associée au développement

Un seul auteur transparait dans les publications (livre "PDF hacks" chez O'Reilly) et la documentation. Le copyright du site est au nom de Sid Steward. Il est propriétaire de PDF Labs, l'entreprise à la source de ce logiciel.

Eléments de pérennité

Un seul auteur transparait dans les publications (livre "PDF hacks" chez O'Reilly) et la documentation. L'ampleur du programme ne semble pas nécessiter un groupe de développeurs plus grand. L'auteur est assez actif et sort plusieurs nouvelles versions par an (en 2009/2010).

Environnement utilisateur
Liste de diffusion ou de discussion, support et forums

Il n'existe a priori pas de liste, mais vous pouvez contacter l'auteur du logiciel par email

Documentation utilisateur

Disponible sur le site de pdftk.

Divers (astuces, actualités, sécurité)

La sécurité d'un document PDF crypté n'est intrinsèquement pas très forte à cause de la faiblesse du cryptage PDF. (Il y a des outils de décryptage en ligne facilement trouvables avec Google, si on veut se rendre compte de la sécurité d'un document donné. Pour des informations confidentielles, on aura probablement recours à un cryptage supplémentaire externe.)

Contributions

Il ne semble pas possible de contribuer à ce logiciel, en tout cas, la contribution n'est pas organisée.

Commentaires

Autres programmes AFE

Lors de la prochaine mise à jour, je devrais mentionner également pdfminer http://www.unixuser.org/~euske/python/pdfminer/ et aussi la librairie pyPdf http://pybrary.net/pyPdf/.

GUI pour pdftk

Il existe un GUI (general user interface) graphique sous Windows qui rend l'utilisation de pdftk beaucoup plus intuitive :
http://www.paehl.de/pdf/gui_pdftk.html