Biblioteca de fusió de PDF Python de codi obert
Proveu aquesta biblioteca Python fàcil d'utilitzar i de codi obert que us permet dividir, unir, girar, intercanviar i suprimir pàgines sense esforç, la qual cosa la converteix en una eina versàtil per a les vostres necessitats de documents PDF.
Què és PyMuPDF?
PyMuPDF, també conegut com Fitz, és una biblioteca Python de codi obert que proporciona un conjunt complet d'eines per treballar amb fitxers PDF. Amb PyMuPDF, els usuaris poden realitzar de manera eficient tasques com ara obrir PDF, extreure text i imatges, manipular propietats de la pàgina com la rotació i el retall, crear nous documents PDF i convertir pàgines PDF en imatges.
PyMuPDF admet diverses funcions. Tanmateix, en aquesta revisió el nostre enfocament principal se centrarà en les funcions de divisió, fusió i gestió de pàgines de PDF de la biblioteca. Per a una avaluació en profunditat de les capacitats d'extracció i anàlisi, feu clic aquí.
Com començar amb PyMuPDF
Necessiteu la versió 3.8.0 o superior de Python per instal·lar i utilitzar PyMuPDF. Per tant, primer instal·leu Python i després utilitzeu les ordres següents per instal·lar PyMuPDF a la vostra màquina mitjançant pip i virtual medi ambient.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
MacOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Windows
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Uniu diversos PDF en un
Mitjançant la biblioteca PyMuPDF, podem combinar diversos PDF en un sol fitxer PDF a Python. El fragment de codi següent uneix dos documents PDF afegint un darrere l'altre i desant-lo com a document nou:
Dividiu PDF en diversos fitxers
També és possible dividir un document PDF en diversos PDF a Python mitjançant la biblioteca PyMuPDF. El fragment de codi següent divideix les dues primeres pàgines d'un document i les emmagatzema com a PDF independent:
Gira les pàgines PDF
També podem girar pàgines d'un fitxer PDF mitjançant la biblioteca PyMuPDF. Utilitzarem la funció set_rotation per girar les pàgines del fragment de codi següent:
Sortida
Com podem veure, el document està girat 90 graus.
Suprimeix pàgines PDF
PyMuPDF també es pot utilitzar per eliminar pàgines d'un fitxer PDF. Utilitzarem la funció delete_page per suprimir les pàgines. El següent és el document que és l'entrada i el codi esborrarà la seva segona pàgina:
Sortida
La imatge següent mostra el fitxer PDF modificat, del qual s'ha eliminat la segona pàgina.
Conclusió
PyMuPDF té punts forts notables en la fusió i la manipulació de pàgines dins de documents PDF. La seva flexibilitat i eficiència a l'hora de rotar, retallar, canviar la mida i suprimir pàgines el converteixen en una opció sòlida per a tasques de modificació de PDF. A més, la capacitat de PyMuPDF per combinar diversos documents PDF perfectament és un avantatge notable.
Tanmateix, la seva API relativament complexa pot presentar una corba d'aprenentatge per als nouvinguts i pot haver-hi algunes limitacions en la gestió de PDF extremadament grans o complexos, que podrien afectar el rendiment. No obstant això, les seves àmplies capacitats en aquestes àrees la converteixen en una eina valuosa per a aquells que busquen un control precís sobre el contingut PDF.