Bibliothèque de métadonnées PDF Python Open Source
Bibliothèque Python gratuite et open source pour lire et mettre à jour les métadonnées des documents PDF.
Qu’est-ce que pypdf ?
Pypdf est une bibliothèque Python open source polyvalente connue pour son ensemble diversifié de fonctionnalités de manipulation de PDF. Cette bibliothèque est utile pour diverses manipulations de PDF telles que l'analyse de PDF et le fractionnement et fusion de PDF. etc. mais dans cette revue de produit, nous nous concentrerons uniquement sur ses fonctionnalités de gestion des métadonnées PDF.
Voici les principales fonctionnalités de pypdf liées aux métadonnées :
- Lire les métadonnées PDF : vous pouvez lire les propriétés (telles que l'auteur, le créateur, le producteur, le titre, le sujet et les mots-clés) des documents PDF à l'aide de pypdf.
- Mettre à jour les métadonnées PDF : vous pouvez également mettre à jour les métadonnées des documents PDF à l'aide de pypdf.
Premiers pas avec pypdf
Vous avez besoin de Python version 3.6.0 ou supérieure pour installer et utiliser pypdf. Alors, installez d'abord Python, puis utilisez les commandes ci-dessous pour installer pypdf sur votre machine en utilisant pip et environnement virtuel.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
Mac OS
python -m venv venv
source venv/bin/activate
pip install pypdf
les fenêtres
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Lecture des métadonnées du PDF
Nous pouvons lire les métadonnées d'un document PDF en utilisant la bibliothèque pypdf. Nous obtiendrons les métadonnées d'un PDF à partir de la propriété metadata de la classe PdfReader de la bibliothèque pypdf. Consultez l'extrait de code ci-dessous pour plus de détails :
Sortir
La capture d'écran ci-dessous affiche les métadonnées du fichier PDF fourni :
Mise à jour des métadonnées du PDF
Nous pouvons également mettre à jour les métadonnées d'un document PDF telles que l'auteur, le producteur, le sujet et le titre, etc. à l'aide de la bibliothèque pypdf. Nous transmettrons un objet contenant les informations de métadonnées à la méthode add_metadata de la classe PdfWriter dans la bibliothèque pypdf pour mettre à jour/écrire les métadonnées du document PDF. Pour plus de détails, consultez l'extrait de code ci-dessous :
Conclusion
En conclusion, pypdf s'avère être une bibliothèque Python exceptionnelle pour la lecture et la mise à jour des métadonnées des documents PDF. Les développeurs peuvent facilement lire et mettre à jour les métadonnées des documents PDF sans aucun problème.