1. produkty
  2.   Fúze
  3.   Python
  4.   PyMuPDF
 
  

Open Source Python PDF Merger Library

Vyzkoušejte tuto uživatelsky přívětivou knihovnu Pythonu s otevřeným zdrojovým kódem, která vám umožňuje bez námahy rozdělovat, spojovat, otáčet, zaměňovat a mazat stránky, což z ní činí všestranný nástroj pro potřeby vašich dokumentů PDF.

Co je PyMuPDF?

PyMuPDF, také známý jako Fitz, je open-source Python knihovna, která poskytuje komplexní sadu nástrojů pro práci se soubory PDF. S PyMuPDF mohou uživatelé efektivně provádět úkoly, jako je otevírání souborů PDF, extrahování textu a obrázků, manipulace s vlastnostmi stránky, jako je otáčení a oříznutí, vytváření nových dokumentů PDF a převod stránek PDF na obrázky.

PyMuPDF podporuje několik funkcí. V této recenzi se však primárně zaměříme na funkce knihovny rozdělování, slučování a správu stránek PDF. Chcete-li hloubkové vyhodnocení možností extrakce a analýzy, klikněte sem.

GitHub

Statistiky GitHubu

Název: PyMuPDF
Jazyk: Python
hvězdy: 6.9K
Vidlice: 584
Licence: GNU Affero General Public License v3.0
Úložiště bylo naposledy aktualizováno v 2025-04-04

Začínáme s PyMuPDF

K instalaci a používání PyMuPDF potřebujete Python verze 3.8.0 nebo vyšší. Nejprve tedy nainstalujte Python a poté pomocí níže uvedených příkazů nainstalujte PyMuPDF na váš počítač pomocí pip a virtuální prostředí.

Linux


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

MacOS


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

Windows


python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf 

Spojte více souborů PDF do jednoho

Pomocí knihovny PyMuPDF můžeme v Pythonu zkombinovat více PDF do jednoho souboru PDF. Následující úryvek kódu spojuje dva dokumenty PDF tak, že je jeden po druhém připojí a uloží jako nový dokument:

# Import PyMuPDF
import fitz
# Open first document
doc1 = fitz.open("documentprocessing.pdf")
# Open second document
doc2 = fitz.open("data.pdf")
# Append document 2 after document 1
doc1.insert_pdf(doc2)
# Save the new combined document
doc1.save("joined-doc1-and-doc2.pdf")

Rozdělit PDF do více souborů

Je také možné rozdělit dokument PDF do více souborů PDF v Pythonu pomocí knihovny PyMuPDF. Následující fragment kódu rozdělí první dvě stránky dokumentu a uloží je jako samostatné PDF:

# Import PyMuPDF
import fitz
# Open the first PDF document
doc1 = fitz.open("joined-doc1-and-doc2.pdf")
# Create a new empty PDF document
doc2 = fitz.open()
# Insert the first 2 pages of doc1 into doc2
doc2.insert_pdf(doc1, to_page=1)
# Save the modified document as "first-and-last-10.pdf"
doc2.save("prev-doc1.pdf")

Otočit stránky PDF

Můžeme také otáčet stránky souboru PDF pomocí knihovny PyMuPDF. K otočení stránek v níže uvedeném fragmentu kódu použijeme funkci set_rotation:

# Import PyMuPDF
import fitz
# Open a PDF file
doc = fitz.open("documentprocessing.pdf")
# Rotate the first page clockwise by 90 degrees
first_page = doc[0]
first_page.set_rotation(90)
# Save the modified PDF to a new file
output_file = "modified.pdf"
doc.save(output_file)
# Close the PDF document
doc.close()

Výstup

Jak vidíme, dokument je otočen o 90 stupňů.

Smazat stránky PDF

PyMuPDF lze také použít k odstranění stránek souboru PDF. Ke smazání stránek použijeme funkci delete_page. Následuje dokument, který je vstupem a kód smaže jeho druhou stránku:

# Import PyMuPDF
import fitz
# Open a PDF file
doc = fitz.open("documentprocessing.pdf")
# Delete the second page
doc.delete_page(1)
# Save the modified PDF to a new file
output_file = "modified.pdf"
doc.save(output_file)
# Close the PDF document
doc.close()

Výstup

Obrázek níže zobrazuje upravený soubor PDF, ze kterého byla odstraněna druhá stránka.

Závěr

PyMuPDF se může pochlubit pozoruhodnými přednostmi při slučování a manipulaci se stránkami v dokumentech PDF. Jeho flexibilita a efektivita při otáčení, ořezávání, změně velikosti a mazání stránek z něj činí robustní volbu pro úlohy úpravy PDF. Kromě toho je pozoruhodnou výhodou schopnost PyMuPDF hladce sloučit více dokumentů PDF.

Jeho relativně složité API však může představovat křivku učení pro nováčky a mohou existovat určitá omezení při práci s extrémně velkými nebo složitými PDF, což by mohlo ovlivnit výkon. Nicméně jeho rozsáhlé možnosti v těchto oblastech z něj dělají cenný nástroj pro ty, kteří hledají přesnou kontrolu nad obsahem PDF.

Podobné Produkty

 Czech