Bibliothèque de métadonnées PDF Python Open Source
Bibliothèque Python gratuite et open source pour lire et mettre à jour les métadonnées des documents PDF.
Qu'est-ce que pypdf ?
Pypdf est une bibliothèque Python open source polyvalente connue pour son ensemble diversifié de fonctionnalités de manipulation de PDF. Cette bibliothèque est utile pour diverses manipulations PDF telles que l'analyse de PDF et le scission et fusion de PDF, etc., mais dans cette évaluation du produit, nous nous concentrerons uniquement sur ses fonctionnalités de gestion des métadonnées PDF.
Voici les principales fonctionnalités de pypdf liées aux métadonnées :
- Lire les métadonnées PDF : vous pouvez lire les propriétés (telles que l'auteur, le créateur, le producteur, le titre, le sujet et les mots-clés) des documents PDF à l'aide de pypdf.
- Mettre à jour les métadonnées PDF : vous pouvez également mettre à jour les métadonnées des documents PDF à l'aide de pypdf.
Premiers pas avec pypdf
Vous avez besoin de la version 3.6.0 ou supérieure de Python pour installer et utiliser pypdf. Commencez donc par installer Python, puis utilisez les commandes ci-dessous pour installer pypdf sur votre machine en utilisant pip et environnement virtuel.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
Fenêtres
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Lecture des métadonnées d'un PDF
Nous pouvons lire les métadonnées d'un document PDF en utilisant la bibliothèque pypdf. Nous obtiendrons les métadonnées d'un PDF à partir de la propriété metadata de la classe PdfReader de la bibliothèque pypdf. Consultez l'extrait de code ci-dessous pour plus de détails :
Sortir
La capture d'écran ci-dessous affiche les métadonnées du fichier PDF fourni :
Mise à jour des métadonnées du PDF
Nous pouvons également mettre à jour les métadonnées d'un document PDF telles que l'auteur, le producteur, le sujet et le titre, etc. à l'aide de la bibliothèque pypdf. Nous allons transmettre un objet contenant les informations de métadonnées à la méthode add_metadata de la classe PdfWriter dans la bibliothèque pypdf pour mettre à jour/écrire les métadonnées du document PDF. Pour plus de détails, consultez l'extrait de code ci-dessous :
Conclusion
En conclusion, pypdf s'avère être une bibliothèque Python exceptionnelle pour la lecture et la mise à jour des métadonnées des documents PDF. Les développeurs peuvent facilement lire et mettre à jour les métadonnées des documents PDF sans aucun problème.
Produits Similaires
- API OpenPyXL – Gérez les métadonnées Excel sans effort
- API PyLightXL – Gérez efficacement les métadonnées des fichiers Excel
- Bibliothèque Mutagen Python - Gérez les métadonnées audio sans effort
- Bibliothèque Python PikePDF - Manipulation et sécurité PDF sans effort
- Bibliothèque Python PyMuPDF pour les métadonnées PDF | Open Source