1. Producten
  2.   Fusie
  3.   Python
  4.   PyMuPDF
 
  

Open Source Python PDF-fusiebibliotheek

Probeer deze gebruiksvriendelijke, open source Python-bibliotheek waarmee u moeiteloos pagina's kunt splitsen, samenvoegen, roteren, verwisselen en verwijderen, waardoor het een veelzijdig hulpmiddel wordt voor uw PDF-documentbehoeften.

Wat is PyMuPDF?

PyMuPDF, ook bekend als Fitz, is een open-source Python-bibliotheek die een uitgebreide set hulpmiddelen biedt voor het werken met PDF-bestanden. Met PyMuPDF kunnen gebruikers efficiënt taken uitvoeren zoals het openen van PDF's, het extraheren van tekst en afbeeldingen, het manipuleren van pagina-eigenschappen zoals rotatie en bijsnijden, het maken van nieuwe PDF-documenten en het converteren van PDF-pagina's naar afbeeldingen.

PyMuPDF ondersteunt verschillende functies. In deze recensie zal onze primaire focus echter liggen op de functies voor het splitsen, samenvoegen en paginabeheer van PDF's van de bibliotheek. Voor een diepgaande evaluatie van de extractie- en parseermogelijkheden, klik hier.

GitHub

GitHub-statistieken

Naam:
Taal:
Sterren:
Vorken:
Licentie:
De opslagplaats is voor het laatst bijgewerkt op

Aan de slag met PyMuPDF

Je hebt Python versie 3.8.0 of hoger nodig om PyMuPDF te installeren en te gebruiken. Installeer dus eerst Python en gebruik vervolgens onderstaande opdrachten om PyMuPDF op uw computer te installeren met behulp van pip en virtuele omgeving.

Linux


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

MacOS


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

ramen


python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf 

Voeg meerdere PDF's samen in één

Met behulp van de PyMuPDF-bibliotheek kunnen we meerdere PDF's combineren tot één PDF-bestand in Python. Het volgende codefragment voegt twee PDF-documenten samen door ze achter elkaar toe te voegen en op te slaan als een nieuw document:

Splits PDF in meerdere bestanden

Het is ook mogelijk om een PDF-document in meerdere PDF's te splitsen in Python met behulp van de PyMuPDF-bibliotheek. Het volgende codefragment splitst de eerste twee pagina's van een document en slaat ze op als een afzonderlijke PDF:

PDF-pagina's roteren

We kunnen ook pagina's van een PDF-bestand roteren met behulp van de PyMuPDF-bibliotheek. We gebruiken de functie set_rotation om de pagina's in het onderstaande codefragment te roteren:

Zoals we kunnen zien, is het document 90 graden gedraaid.

PDF-pagina's verwijderen

PyMuPDF kan ook worden gebruikt om pagina's van een PDF-bestand te verwijderen. We gebruiken de functie delete_page om de pagina's te verwijderen. Hieronder volgt het document dat de invoer is en de code zal de tweede pagina verwijderen:

De onderstaande afbeelding toont het gewijzigde PDF-bestand, waarvan de tweede pagina is verwijderd.

Conclusie

PyMuPDF beschikt over opmerkelijke sterke punten bij het samenvoegen en paginamanipulatie binnen PDF-documenten. De flexibiliteit en efficiëntie bij het roteren, bijsnijden, vergroten of verkleinen en verwijderen van pagina's maken het een robuuste keuze voor PDF-wijzigingstaken. Bovendien is de mogelijkheid van PyMuPDF om meerdere PDF-documenten naadloos samen te voegen een opmerkelijk voordeel.

De relatief complexe API kan echter een leercurve vormen voor nieuwkomers, en er kunnen enkele beperkingen zijn bij het verwerken van extreem grote of complexe PDF's, wat de prestaties zou kunnen beïnvloeden. Desalniettemin maken de uitgebreide mogelijkheden op deze gebieden het tot een waardevol hulpmiddel voor wie nauwkeurige controle over PDF-inhoud zoekt.

Vergelijkbare Producten

 Nederlands