Bibliothèque de fusion PDF Python Open Source

Essayez cette bibliothèque Python conviviale et open source qui vous permet de diviser, joindre, faire pivoter, échanger et supprimer des pages sans effort, ce qui en fait un outil polyvalent pour vos besoins en matière de documents PDF.

Qu'est-ce que PyMuPDF ?

PyMuPDF, également connu sous le nom de Fitz, est une bibliothèque Python open source qui fournit un ensemble complet d'outils pour travailler avec des fichiers PDF. Avec PyMuPDF, les utilisateurs peuvent effectuer efficacement des tâches telles que l'ouverture de PDF, l'extraction de texte et d'images, la manipulation des propriétés de page telles que la rotation et le recadrage, la création de nouveaux documents PDF et la conversion de pages PDF en images.

PyMuPDF prend en charge plusieurs fonctionnalités. Cependant, dans cette revue, nous nous concentrerons principalement sur les fonctionnalités de fractionnement, de fusion et de gestion de pages de PDF de la bibliothèque. Pour une évaluation approfondie des capacités d'extraction et d'analyse, veuillez cliquez ici.

GitHub

Statistiques GitHub

Nom:
Langue:
Étoiles:
Fourchettes:
Licence:
Le référentiel a été mis à jour pour la dernière fois à

Premiers pas avec PyMuPDF

Vous avez besoin de Python version 3.8.0 ou supérieure pour installer et utiliser PyMuPDF. Alors, installez d'abord Python, puis utilisez les commandes ci-dessous pour installer PyMuPDF sur votre machine en utilisant pip et environnement virtuel.

Linux


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

Mac OS


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

les fenêtres


python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf 

Rejoignez plusieurs PDF en un seul

Grâce à la bibliothèque PyMuPDF, nous pouvons combiner plusieurs PDF en un seul fichier PDF en Python. L'extrait de code suivant joint deux documents PDF en les ajoutant l'un après l'autre et en l'enregistrant en tant que nouveau document :

Diviser le PDF en plusieurs fichiers

Il est également possible de diviser un document PDF en plusieurs PDF en Python à l'aide de la bibliothèque PyMuPDF. L'extrait de code suivant divise les deux premières pages d'un document et les stocke dans un PDF distinct :

Faire pivoter les pages PDF

Nous pouvons également faire pivoter les pages d'un fichier PDF à l'aide de la bibliothèque PyMuPDF. Nous utiliserons la fonction set_rotation pour faire pivoter les pages dans l'extrait de code ci-dessous :

Sortir

Comme nous pouvons le voir, le document pivote de 90 degrés.

Supprimer des pages PDF

PyMuPDF peut également être utilisé pour supprimer des pages d'un fichier PDF. Nous utiliserons la fonction delete_page pour supprimer les pages. Voici le document qui constitue l'entrée et le code supprimera sa deuxième page :

Sortir

L'image ci-dessous affiche le fichier PDF modifié, dont la deuxième page a été supprimée.

Conclusion

PyMuPDF possède des atouts remarquables en matière de fusion et de manipulation de pages dans des documents PDF. Sa flexibilité et son efficacité en matière de rotation, de recadrage, de redimensionnement et de suppression de pages en font un choix solide pour les tâches de modification de PDF. De plus, la capacité de PyMuPDF à fusionner plusieurs documents PDF de manière transparente constitue un avantage notable.

Cependant, son API relativement complexe peut présenter une courbe d'apprentissage pour les nouveaux arrivants, et il peut y avoir certaines limitations dans la gestion de fichiers PDF extrêmement volumineux ou complexes, ce qui pourrait avoir un impact sur les performances. Néanmoins, ses capacités étendues dans ces domaines en font un outil précieux pour ceux qui recherchent un contrôle précis sur le contenu PDF.

Produits Similaires

 Français