Biblioteca de fuziune PDF Python cu sursă deschisă
Încercați această bibliotecă Python open-source, ușor de utilizat, care vă permite să împărțiți, să uniți, să rotiți, să schimbați și să ștergeți pagini fără efort, făcându-l un instrument versatil pentru nevoile dvs. de documente PDF.
Ce este PyMuPDF?
PyMuPDF, cunoscut și sub numele de Fitz, este o bibliotecă Python open-source care oferă un set cuprinzător de instrumente pentru lucrul cu fișiere PDF. Cu PyMuPDF, utilizatorii pot efectua eficient sarcini precum deschiderea PDF-urilor, extragerea de text și imagini, manipularea proprietăților paginilor, cum ar fi rotația și decuparea, crearea de noi documente PDF și conversia paginilor PDF în imagini.
PyMuPDF acceptă mai multe caracteristici. Cu toate acestea, în această revizuire, accentul nostru principal se va pune pe funcțiile de împărțire, îmbinare și gestionare a paginilor PDF ale bibliotecii. Pentru o evaluare aprofundată a capabilităților de extracție și analizare, vă rugăm să dați clic aici.
Noțiuni introductive cu PyMuPDF
Aveți nevoie de versiunea Python 3.8.0 sau o versiune ulterioară pentru a instala și utiliza PyMuPDF. Deci, mai întâi instalați Python și apoi utilizați comenzile de mai jos pentru a instala PyMuPDF pe computer folosind pip și mediu virtual.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
MacOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Windows
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Alăturați mai multe PDF-uri într-unul singur
Folosind biblioteca PyMuPDF, putem combina mai multe PDF-uri într-un singur fișier PDF în Python. Următorul fragment de cod unește două documente PDF, adăugându-l unul după altul și salvându-l ca document nou:
Împărțiți PDF în mai multe fișiere
De asemenea, este posibil să împărțiți un document PDF în mai multe PDF-uri în Python folosind biblioteca PyMuPDF. Următorul fragment de cod împarte primele două pagini ale unui document și le stochează ca PDF separat:
Rotiți paginile PDF
De asemenea, putem roti paginile unui fișier PDF folosind biblioteca PyMuPDF. Vom folosi funcția set_rotation pentru a roti paginile din fragmentul de cod de mai jos:
După cum putem vedea, documentul este rotit cu 90 de grade.
Ștergeți paginile PDF
PyMuPDF poate fi folosit și pentru a șterge paginile unui fișier PDF. Vom folosi funcția delete_page pentru a șterge paginile. Mai jos este documentul care este introdus și codul își va șterge a doua pagină:
Imaginea de mai jos afișează fișierul PDF modificat, din care a fost eliminată a doua pagină.
Concluzie
PyMuPDF se mândrește cu puncte forte remarcabile în îmbinarea și manipularea paginilor în documentele PDF. Flexibilitatea și eficiența sa în rotirea, decuparea, redimensionarea și ștergerea paginilor îl fac o alegere robustă pentru sarcinile de modificare PDF. În plus, capacitatea PyMuPDF de a îmbina mai multe documente PDF fără probleme este un avantaj notabil.
Cu toate acestea, API-ul său relativ complex poate prezenta o curbă de învățare pentru noii veniți și ar putea exista unele limitări în manipularea PDF-urilor extrem de mari sau complexe, care ar putea afecta performanța. Cu toate acestea, capabilitățile sale extinse în aceste domenii îl fac un instrument valoros pentru cei care doresc un control precis asupra conținutului PDF.