1. Producten
  2.   Fusie
  3.   Python
  4.   PyMuPDF
 
  

Open Source Python PDF-fusiebibliotheek

Probeer deze gebruiksvriendelijke, open-source Python-bibliotheek eens uit. Hiermee kunt u moeiteloos pagina's splitsen, samenvoegen, roteren, verwisselen en verwijderen. Dit is een veelzijdige tool voor al uw PDF-documenten.

Wat is PyMuPDF?

PyMuPDF, ook bekend als Fitz, is een open-source Python-bibliotheek die een uitgebreide set tools biedt voor het werken met PDF-bestanden. Met PyMuPDF kunnen gebruikers efficiënt taken uitvoeren zoals het openen van PDF's, het extraheren van tekst en afbeeldingen, het manipuleren van pagina-eigenschappen zoals roteren en bijsnijden, het maken van nieuwe PDF-documenten en het converteren van PDF-pagina's naar afbeeldingen.

PyMuPDF ondersteunt verschillende functies. In deze review ligt onze focus echter vooral op de PDF-splitsings-, samenvoegings- en paginabeheerfuncties van de bibliotheek. Voor een diepgaande evaluatie van extractie- en parseermogelijkheden, klikt u hier.

GitHub

GitHub-statistieken

Naam: PyMuPDF
Taal: Python
Sterren: 6.9K
Vorken: 583
Licentie: GNU Affero General Public License v3.0
De opslagplaats is voor het laatst bijgewerkt op 2025-04-07

Aan de slag met PyMuPDF

Je hebt Python versie 3.8.0 of hoger nodig om PyMuPDF te installeren en gebruiken. Installeer dus eerst Python en gebruik dan onderstaande commando's om PyMuPDF op je machine te installeren met pip en virtual environment.

Linux


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

MacOS


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

Vensters


python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf 

Voeg meerdere PDF's samen tot één

Met behulp van de PyMuPDF-bibliotheek kunnen we meerdere PDF's combineren tot één PDF-bestand in Python. Het volgende codefragment voegt twee PDF-documenten samen door de ene na de andere toe te voegen en op te slaan als een nieuw document:

# Import PyMuPDF
import fitz
# Open first document
doc1 = fitz.open("documentprocessing.pdf")
# Open second document
doc2 = fitz.open("data.pdf")
# Append document 2 after document 1
doc1.insert_pdf(doc2)
# Save the new combined document
doc1.save("joined-doc1-and-doc2.pdf")

PDF splitsen in meerdere bestanden

Het is ook mogelijk om een PDF-document in meerdere PDF's te splitsen in Python met behulp van de PyMuPDF-bibliotheek. Het volgende codefragment splitst de eerste twee pagina's van een document en slaat ze op als een afzonderlijke PDF:

# Import PyMuPDF
import fitz
# Open the first PDF document
doc1 = fitz.open("joined-doc1-and-doc2.pdf")
# Create a new empty PDF document
doc2 = fitz.open()
# Insert the first 2 pages of doc1 into doc2
doc2.insert_pdf(doc1, to_page=1)
# Save the modified document as "first-and-last-10.pdf"
doc2.save("prev-doc1.pdf")

PDF-pagina's roteren

We kunnen ook pagina's van een PDF-bestand roteren met behulp van de PyMuPDF-bibliotheek. We gebruiken de functie set_rotation om de pagina's in het onderstaande codefragment te roteren:

# Import PyMuPDF
import fitz
# Open a PDF file
doc = fitz.open("documentprocessing.pdf")
# Rotate the first page clockwise by 90 degrees
first_page = doc[0]
first_page.set_rotation(90)
# Save the modified PDF to a new file
output_file = "modified.pdf"
doc.save(output_file)
# Close the PDF document
doc.close()

Uitvoer

Zoals u kunt zien, is het document 90 graden gedraaid.

PDF-pagina's verwijderen

PyMuPDF kan ook worden gebruikt om pagina's van een PDF-bestand te verwijderen. We gebruiken de functie delete_page om de pagina's te verwijderen. Hieronder staat het document dat de invoer is en de code verwijdert de tweede pagina:

# Import PyMuPDF
import fitz
# Open a PDF file
doc = fitz.open("documentprocessing.pdf")
# Delete the second page
doc.delete_page(1)
# Save the modified PDF to a new file
output_file = "modified.pdf"
doc.save(output_file)
# Close the PDF document
doc.close()

Uitvoer

De afbeelding hieronder toont het aangepaste PDF-bestand, waaruit de tweede pagina is verwijderd.

Conclusie

PyMuPDF heeft opmerkelijke sterke punten in het samenvoegen en manipuleren van pagina's binnen PDF-documenten. De flexibiliteit en efficiëntie in het roteren, bijsnijden, formaat wijzigen en verwijderen van pagina's maken het een robuuste keuze voor PDF-modificatietaken. Bovendien is het vermogen van PyMuPDF om meerdere PDF-documenten naadloos samen te voegen een opmerkelijk voordeel.

De relatief complexe API kan echter een leercurve vormen voor nieuwkomers, en er kunnen beperkingen zijn bij het verwerken van extreem grote of complexe PDF's, wat de prestaties kan beïnvloeden. Niettemin maken de uitgebreide mogelijkheden op deze gebieden het een waardevolle tool voor degenen die nauwkeurige controle over PDF-inhoud zoeken.

Vergelijkbare Producten

 Nederlands