Bibliothèque JavaScript gratuite pour la gestion des métadonnées PDF
Bibliothèque JavaScript gratuite et open source pour la gestion des métadonnées des documents PDF.
Qu'est-ce que pdf-lib ?
Pdf-lib est une bibliothèque JavaScript gratuite et open source permettant de travailler avec des documents PDF pour effectuer des opérations telles que la création de nouveaux PDF à partir de zéro, la modification de fichiers existants ou la lecture et la mise à jour des métadonnées de documents PDF. Nous avons déjà évoqué les fonctionnalités d'édition PDF de pdf-lib, mais dans cette revue, nous nous concentrerons uniquement sur les fonctionnalités de gestion des métadonnées de pdf-lib, qui incluent :
- Auteur
- Créateur
- Producteur
- Titre
- Sujet
- Mots clés
- Langue
- Date de création
- Date de modification
- Mettre à jour les métadonnées : vous pouvez également mettre à jour les métadonnées ci-dessus des documents PDF à l'aide de pdf-lib.
Démarrer avec pdf-lib
Il existe deux manières d'installer pdf-lib :
Modules NPM
Vous pouvez utiliser les modules npm si vous utilisez npm ou yarn comme gestionnaire de paquets :
Installer à l'aide de NPM
npm install --save pdf-lib
Installer à l'aide de Yarn
yarn add pdf-lib
Modules UMD
Si vous n'utilisez pas de gestionnaire de paquets, les modules UMD sont disponibles sur les CDN unpkg et jsDelivr :
- https://unpkg.com/pdf-lib/dist/pdf-lib.js
- https://unpkg.com/pdf-lib/dist/pdf-lib.min.js
- https://cdn.jsdelivr.net/npm/pdf-lib/dist/pdf-lib.js
- https://cdn.jsdelivr.net/npm/pdf-lib/dist/pdf-lib.min.js
Lire les métadonnées du PDF
Nous pouvons utiliser la bibliothèque pdf-lib pour lire les métadonnées des documents PDF. Il existe de nombreuses fonctions telles que getAuthor, getCreator, getCreationDate, etc. qui permettent d'accéder aux métadonnées des documents PDF ou de les extraire, comme le montre l'extrait de code ci-dessous :
Sortir
L'extrait de code ci-dessus affichera les métadonnées du document PDF comme indiqué ci-dessous :
Modifier les métadonnées du PDF
Nous pouvons également utiliser la bibliothèque pdf-lib pour éditer ou mettre à jour les métadonnées des documents PDF. Comme les fonctions get (getAuthor, getCreator, etc.), pdf-lib fournit également des fonctions set (comme setAuthor, setCreator, etc.) pour mettre à jour les métadonnées des fichiers PDF. Nous utiliserons les fonctions setAuthor et setTitle pour mettre à jour les métadonnées d'un document PDF dans l'extrait de code ci-dessous à des fins de démonstration :
Conclusion
Il est plus facile pour les développeurs JavaScript de lire/extraire et de mettre à jour les métadonnées des documents PDF à l'aide de la bibliothèque pdf-lib. L'API est assez soignée et fournit des fonctions de définition/d'obtention standard pour lire et mettre à jour les propriétés des documents PDF. Aucun problème n'a été observé concernant la gestion des métadonnées des PDF lors de notre utilisation.
Produits Similaires
- API OpenPyXL – Gérez les métadonnées Excel sans effort
- API PyLightXL – Gérez efficacement les métadonnées des fichiers Excel
- Bibliothèque Mutagen Python - Gérez les métadonnées audio sans effort
- Bibliothèque Python PikePDF - Manipulation et sécurité PDF sans effort
- Bibliothèque Python PyMuPDF pour les métadonnées PDF | Open Source