Open Source Python PDF Merger Library
Vyzkoušejte tuto uživatelsky přívětivou knihovnu Pythonu s otevřeným zdrojovým kódem, která vám umožňuje bez námahy rozdělovat, spojovat, otáčet, zaměňovat a mazat stránky, což z ní činí všestranný nástroj pro potřeby vašich dokumentů PDF.
Co je PyMuPDF?
PyMuPDF, také známý jako Fitz, je open-source Python knihovna, která poskytuje komplexní sadu nástrojů pro práci se soubory PDF. S PyMuPDF mohou uživatelé efektivně provádět úkoly, jako je otevírání souborů PDF, extrahování textu a obrázků, manipulace s vlastnostmi stránky, jako je otáčení a oříznutí, vytváření nových dokumentů PDF a převod stránek PDF na obrázky.
PyMuPDF podporuje několik funkcí. V této recenzi se však primárně zaměříme na funkce knihovny rozdělování, slučování a správu stránek PDF. Chcete-li hloubkové vyhodnocení možností extrakce a analýzy, klikněte sem.
Statistiky GitHubu
Název: PyMuPDFJazyk: Python
hvězdy: 6.9K
Vidlice: 584
Licence: GNU Affero General Public License v3.0
Úložiště bylo naposledy aktualizováno v 2025-04-04
Začínáme s PyMuPDF
K instalaci a používání PyMuPDF potřebujete Python verze 3.8.0 nebo vyšší. Nejprve tedy nainstalujte Python a poté pomocí níže uvedených příkazů nainstalujte PyMuPDF na váš počítač pomocí pip a virtuální prostředí.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
MacOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Windows
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Spojte více souborů PDF do jednoho
Pomocí knihovny PyMuPDF můžeme v Pythonu zkombinovat více PDF do jednoho souboru PDF. Následující úryvek kódu spojuje dva dokumenty PDF tak, že je jeden po druhém připojí a uloží jako nový dokument:
# Import PyMuPDF | |
import fitz | |
# Open first document | |
doc1 = fitz.open("documentprocessing.pdf") | |
# Open second document | |
doc2 = fitz.open("data.pdf") | |
# Append document 2 after document 1 | |
doc1.insert_pdf(doc2) | |
# Save the new combined document | |
doc1.save("joined-doc1-and-doc2.pdf") |
Rozdělit PDF do více souborů
Je také možné rozdělit dokument PDF do více souborů PDF v Pythonu pomocí knihovny PyMuPDF. Následující fragment kódu rozdělí první dvě stránky dokumentu a uloží je jako samostatné PDF:
# Import PyMuPDF | |
import fitz | |
# Open the first PDF document | |
doc1 = fitz.open("joined-doc1-and-doc2.pdf") | |
# Create a new empty PDF document | |
doc2 = fitz.open() | |
# Insert the first 2 pages of doc1 into doc2 | |
doc2.insert_pdf(doc1, to_page=1) | |
# Save the modified document as "first-and-last-10.pdf" | |
doc2.save("prev-doc1.pdf") |
Otočit stránky PDF
Můžeme také otáčet stránky souboru PDF pomocí knihovny PyMuPDF. K otočení stránek v níže uvedeném fragmentu kódu použijeme funkci set_rotation:
# Import PyMuPDF | |
import fitz | |
# Open a PDF file | |
doc = fitz.open("documentprocessing.pdf") | |
# Rotate the first page clockwise by 90 degrees | |
first_page = doc[0] | |
first_page.set_rotation(90) | |
# Save the modified PDF to a new file | |
output_file = "modified.pdf" | |
doc.save(output_file) | |
# Close the PDF document | |
doc.close() |
Výstup
Jak vidíme, dokument je otočen o 90 stupňů.
Smazat stránky PDF
PyMuPDF lze také použít k odstranění stránek souboru PDF. Ke smazání stránek použijeme funkci delete_page. Následuje dokument, který je vstupem a kód smaže jeho druhou stránku:
# Import PyMuPDF | |
import fitz | |
# Open a PDF file | |
doc = fitz.open("documentprocessing.pdf") | |
# Delete the second page | |
doc.delete_page(1) | |
# Save the modified PDF to a new file | |
output_file = "modified.pdf" | |
doc.save(output_file) | |
# Close the PDF document | |
doc.close() |
Výstup
Obrázek níže zobrazuje upravený soubor PDF, ze kterého byla odstraněna druhá stránka.
Závěr
PyMuPDF se může pochlubit pozoruhodnými přednostmi při slučování a manipulaci se stránkami v dokumentech PDF. Jeho flexibilita a efektivita při otáčení, ořezávání, změně velikosti a mazání stránek z něj činí robustní volbu pro úlohy úpravy PDF. Kromě toho je pozoruhodnou výhodou schopnost PyMuPDF hladce sloučit více dokumentů PDF.
Jeho relativně složité API však může představovat křivku učení pro nováčky a mohou existovat určitá omezení při práci s extrémně velkými nebo složitými PDF, což by mohlo ovlivnit výkon. Nicméně jeho rozsáhlé možnosti v těchto oblastech z něj dělají cenný nástroj pro ty, kteří hledají přesnou kontrolu nad obsahem PDF.