1. Producten
  2.   Fusie
  3.   Python
  4.   PyMuPDF
 
  

Open Source Python PDF-fusiebibliotheek

Probeer deze gebruiksvriendelijke, open-source Python-bibliotheek eens uit. Hiermee kunt u moeiteloos pagina's splitsen, samenvoegen, roteren, verwisselen en verwijderen. Dit is een veelzijdige tool voor al uw PDF-documenten.

Wat is PyMuPDF?

PyMuPDF, ook bekend als Fitz, is een open-source Python-bibliotheek die een uitgebreide set tools biedt voor het werken met PDF-bestanden. Met PyMuPDF kunnen gebruikers efficiënt taken uitvoeren zoals het openen van PDF's, het extraheren van tekst en afbeeldingen, het manipuleren van pagina-eigenschappen zoals roteren en bijsnijden, het maken van nieuwe PDF-documenten en het converteren van PDF-pagina's naar afbeeldingen.

PyMuPDF ondersteunt verschillende functies. In deze review ligt onze focus echter vooral op de PDF-splitsings-, samenvoegings- en paginabeheerfuncties van de bibliotheek. Voor een diepgaande evaluatie van extractie- en parseermogelijkheden, klikt u hier.

GitHub

GitHub-statistieken

Naam:
Taal:
Sterren:
Vorken:
Licentie:
De opslagplaats is voor het laatst bijgewerkt op

Aan de slag met PyMuPDF

Je hebt Python versie 3.8.0 of hoger nodig om PyMuPDF te installeren en gebruiken. Installeer dus eerst Python en gebruik dan onderstaande commando's om PyMuPDF op je machine te installeren met pip en virtual environment.

Linux


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

MacOS


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

Vensters


python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf 

Voeg meerdere PDF's samen tot één

Met behulp van de PyMuPDF-bibliotheek kunnen we meerdere PDF's combineren tot één PDF-bestand in Python. Het volgende codefragment voegt twee PDF-documenten samen door de ene na de andere toe te voegen en op te slaan als een nieuw document:

PDF splitsen in meerdere bestanden

Het is ook mogelijk om een PDF-document in meerdere PDF's te splitsen in Python met behulp van de PyMuPDF-bibliotheek. Het volgende codefragment splitst de eerste twee pagina's van een document en slaat ze op als een afzonderlijke PDF:

PDF-pagina's roteren

We kunnen ook pagina's van een PDF-bestand roteren met behulp van de PyMuPDF-bibliotheek. We gebruiken de functie set_rotation om de pagina's in het onderstaande codefragment te roteren:

Uitvoer

Zoals u kunt zien, is het document 90 graden gedraaid.

PDF-pagina's verwijderen

PyMuPDF kan ook worden gebruikt om pagina's van een PDF-bestand te verwijderen. We gebruiken de functie delete_page om de pagina's te verwijderen. Hieronder staat het document dat de invoer is en de code verwijdert de tweede pagina:

Uitvoer

De afbeelding hieronder toont het aangepaste PDF-bestand, waaruit de tweede pagina is verwijderd.

Conclusie

PyMuPDF heeft opmerkelijke sterke punten in het samenvoegen en manipuleren van pagina's binnen PDF-documenten. De flexibiliteit en efficiëntie in het roteren, bijsnijden, formaat wijzigen en verwijderen van pagina's maken het een robuuste keuze voor PDF-modificatietaken. Bovendien is het vermogen van PyMuPDF om meerdere PDF-documenten naadloos samen te voegen een opmerkelijk voordeel.

De relatief complexe API kan echter een leercurve vormen voor nieuwkomers, en er kunnen beperkingen zijn bij het verwerken van extreem grote of complexe PDF's, wat de prestaties kan beïnvloeden. Niettemin maken de uitgebreide mogelijkheden op deze gebieden het een waardevolle tool voor degenen die nauwkeurige controle over PDF-inhoud zoeken.

Vergelijkbare Producten

 Nederlands