Open Source Python PDF-fusiebibliotheek
Probeer deze gebruiksvriendelijke, open source Python-bibliotheek waarmee u moeiteloos pagina's kunt splitsen, samenvoegen, roteren, verwisselen en verwijderen, waardoor het een veelzijdig hulpmiddel wordt voor uw PDF-documentbehoeften.
Wat is PyMuPDF?
PyMuPDF, ook bekend als Fitz, is een open-source Python-bibliotheek die een uitgebreide set hulpmiddelen biedt voor het werken met PDF-bestanden. Met PyMuPDF kunnen gebruikers efficiënt taken uitvoeren zoals het openen van PDF's, het extraheren van tekst en afbeeldingen, het manipuleren van pagina-eigenschappen zoals rotatie en bijsnijden, het maken van nieuwe PDF-documenten en het converteren van PDF-pagina's naar afbeeldingen.
PyMuPDF ondersteunt verschillende functies. In deze recensie zal onze primaire focus echter liggen op de functies voor het splitsen, samenvoegen en paginabeheer van PDF's van de bibliotheek. Voor een diepgaande evaluatie van de extractie- en parseermogelijkheden, klik hier.
Aan de slag met PyMuPDF
Je hebt Python versie 3.8.0 of hoger nodig om PyMuPDF te installeren en te gebruiken. Installeer dus eerst Python en gebruik vervolgens onderstaande opdrachten om PyMuPDF op uw computer te installeren met behulp van pip en virtuele omgeving.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
MacOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
ramen
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Voeg meerdere PDF's samen in één
Met behulp van de PyMuPDF-bibliotheek kunnen we meerdere PDF's combineren tot één PDF-bestand in Python. Het volgende codefragment voegt twee PDF-documenten samen door ze achter elkaar toe te voegen en op te slaan als een nieuw document:
Splits PDF in meerdere bestanden
Het is ook mogelijk om een PDF-document in meerdere PDF's te splitsen in Python met behulp van de PyMuPDF-bibliotheek. Het volgende codefragment splitst de eerste twee pagina's van een document en slaat ze op als een afzonderlijke PDF:
PDF-pagina's roteren
We kunnen ook pagina's van een PDF-bestand roteren met behulp van de PyMuPDF-bibliotheek. We gebruiken de functie set_rotation om de pagina's in het onderstaande codefragment te roteren:
Zoals we kunnen zien, is het document 90 graden gedraaid.
PDF-pagina's verwijderen
PyMuPDF kan ook worden gebruikt om pagina's van een PDF-bestand te verwijderen. We gebruiken de functie delete_page om de pagina's te verwijderen. Hieronder volgt het document dat de invoer is en de code zal de tweede pagina verwijderen:
De onderstaande afbeelding toont het gewijzigde PDF-bestand, waarvan de tweede pagina is verwijderd.
Conclusie
PyMuPDF beschikt over opmerkelijke sterke punten bij het samenvoegen en paginamanipulatie binnen PDF-documenten. De flexibiliteit en efficiëntie bij het roteren, bijsnijden, vergroten of verkleinen en verwijderen van pagina's maken het een robuuste keuze voor PDF-wijzigingstaken. Bovendien is de mogelijkheid van PyMuPDF om meerdere PDF-documenten naadloos samen te voegen een opmerkelijk voordeel.
De relatief complexe API kan echter een leercurve vormen voor nieuwkomers, en er kunnen enkele beperkingen zijn bij het verwerken van extreem grote of complexe PDF's, wat de prestaties zou kunnen beïnvloeden. Desalniettemin maken de uitgebreide mogelijkheden op deze gebieden het tot een waardevol hulpmiddel voor wie nauwkeurige controle over PDF-inhoud zoekt.