Bibliothèque de fusion de PDF Python Open Source

Essayez cette bibliothèque Python open source conviviale qui vous permet de diviser, joindre, faire pivoter, échanger et supprimer des pages sans effort, ce qui en fait un outil polyvalent pour vos besoins en documents PDF.

Qu'est-ce que PyMuPDF ?

PyMuPDF, également connu sous le nom de Fitz, est une bibliothèque Python open source qui fournit un ensemble complet d'outils pour travailler avec des fichiers PDF. Avec PyMuPDF, les utilisateurs peuvent effectuer efficacement des tâches telles que l'ouverture de PDF, l'extraction de texte et d'images, la manipulation des propriétés de page comme la rotation et le recadrage, la création de nouveaux documents PDF et la conversion de pages PDF en images.

PyMuPDF prend en charge plusieurs fonctionnalités. Cependant, dans cette revue, nous nous concentrerons principalement sur les fonctionnalités de fractionnement, de fusion et de gestion des pages PDF de la bibliothèque. Pour une évaluation approfondie des capacités d'extraction et d'analyse, veuillez cliquer ici.

GitHub

Statistiques GitHub

Nom:
Langue:
Étoiles:
Fourchettes:
Licence:
Le référentiel a été mis à jour pour la dernière fois à

Premiers pas avec PyMuPDF

Vous avez besoin de la version 3.8.0 ou supérieure de Python pour installer et utiliser PyMuPDF. Commencez donc par installer Python, puis utilisez les commandes ci-dessous pour installer PyMuPDF sur votre machine à l'aide de pip et de l'environnement virtuel.

Linux


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

MacOS


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

Fenêtres


python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf 

Joindre plusieurs PDF en un seul

Grâce à la bibliothèque PyMuPDF, nous pouvons combiner plusieurs fichiers PDF en un seul fichier PDF en Python. L'extrait de code suivant joint deux documents PDF en les ajoutant l'un après l'autre et les enregistre en tant que nouveau document :

Diviser un PDF en plusieurs fichiers

Il est également possible de diviser un document PDF en plusieurs PDF en Python à l'aide de la bibliothèque PyMuPDF. L'extrait de code suivant divise les deux premières pages d'un document et les stocke dans un PDF distinct :

Faire pivoter les pages PDF

Nous pouvons également faire pivoter les pages d'un fichier PDF à l'aide de la bibliothèque PyMuPDF. Nous utiliserons la fonction set_rotation pour faire pivoter les pages dans l'extrait de code ci-dessous :

Sortir

Comme nous pouvons le voir, le document est tourné de 90 degrés.

Supprimer les pages PDF

PyMuPDF peut également être utilisé pour supprimer des pages d'un fichier PDF. Nous utiliserons la fonction delete_page pour supprimer les pages. Voici le document qui est l'entrée et le code supprimera sa deuxième page :

Sortir

L'image ci-dessous montre le fichier PDF modifié, dont la deuxième page a été supprimée.

Conclusion

PyMuPDF dispose de points forts remarquables en matière de fusion et de manipulation de pages au sein de documents PDF. Sa flexibilité et son efficacité en matière de rotation, de recadrage, de redimensionnement et de suppression de pages en font un choix solide pour les tâches de modification de PDF. De plus, la capacité de PyMuPDF à fusionner plusieurs documents PDF de manière transparente constitue un avantage notable.

Cependant, son API relativement complexe peut représenter une courbe d'apprentissage pour les nouveaux venus, et il peut y avoir certaines limitations dans la gestion de fichiers PDF extrêmement volumineux ou complexes, ce qui peut avoir un impact sur les performances. Néanmoins, ses capacités étendues dans ces domaines en font un outil précieux pour ceux qui recherchent un contrôle précis du contenu PDF.

Produits Similaires

 Français