Bibliothèque de métadonnées PDF Python Open Source

Bibliothèque Python gratuite et open source pour lire et mettre à jour les métadonnées des documents PDF.

Qu’est-ce que pypdf ?

Pypdf est une bibliothèque Python open source polyvalente connue pour son ensemble diversifié de fonctionnalités de manipulation de PDF. Cette bibliothèque est utile pour diverses manipulations de PDF telles que l'analyse de PDF et le fractionnement et fusion de PDF. etc. mais dans cette revue de produit, nous nous concentrerons uniquement sur ses fonctionnalités de gestion des métadonnées PDF.

Voici les principales fonctionnalités de pypdf liées aux métadonnées :

  • Lire les métadonnées PDF : vous pouvez lire les propriétés (telles que l'auteur, le créateur, le producteur, le titre, le sujet et les mots-clés) des documents PDF à l'aide de pypdf.
  • Mettre à jour les métadonnées PDF : vous pouvez également mettre à jour les métadonnées des documents PDF à l'aide de pypdf.
GitHub

Statistiques GitHub

Nom:
Langue:
Étoiles:
Fourchettes:
Licence:
Le référentiel a été mis à jour pour la dernière fois à

Premiers pas avec pypdf

Vous avez besoin de Python version 3.6.0 ou supérieure pour installer et utiliser pypdf. Alors, installez d'abord Python, puis utilisez les commandes ci-dessous pour installer pypdf sur votre machine en utilisant pip et environnement virtuel.

Linux


python3 -m venv venv
source venv/bin/activate
pip install pypdf

Mac OS


python -m venv venv
source venv/bin/activate
pip install pypdf

les fenêtres


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

Lecture des métadonnées du PDF

Nous pouvons lire les métadonnées d'un document PDF en utilisant la bibliothèque pypdf. Nous obtiendrons les métadonnées d'un PDF à partir de la propriété metadata de la classe PdfReader de la bibliothèque pypdf. Consultez l'extrait de code ci-dessous pour plus de détails :

Sortir

La capture d'écran ci-dessous affiche les métadonnées du fichier PDF fourni :

Mise à jour des métadonnées du PDF

Nous pouvons également mettre à jour les métadonnées d'un document PDF telles que l'auteur, le producteur, le sujet et le titre, etc. à l'aide de la bibliothèque pypdf. Nous transmettrons un objet contenant les informations de métadonnées à la méthode add_metadata de la classe PdfWriter dans la bibliothèque pypdf pour mettre à jour/écrire les métadonnées du document PDF. Pour plus de détails, consultez l'extrait de code ci-dessous :

Conclusion

En conclusion, pypdf s'avère être une bibliothèque Python exceptionnelle pour la lecture et la mise à jour des métadonnées des documents PDF. Les développeurs peuvent facilement lire et mettre à jour les métadonnées des documents PDF sans aucun problème.

Produits Similaires

 Français