1. Productes
  2.   Fusió
  3.   Python
  4.   PyMuPDF
 
  

Biblioteca de fusió de PDF Python de codi obert

Proveu aquesta biblioteca Python fàcil d'utilitzar i de codi obert que us permet dividir, unir, girar, intercanviar i suprimir pàgines sense esforç, la qual cosa la converteix en una eina versàtil per a les vostres necessitats de documents PDF.

Què és PyMuPDF?

PyMuPDF, també conegut com Fitz, és una biblioteca Python de codi obert que proporciona un conjunt complet d'eines per treballar amb fitxers PDF. Amb PyMuPDF, els usuaris poden realitzar de manera eficient tasques com ara obrir PDF, extreure text i imatges, manipular propietats de la pàgina com la rotació i el retall, crear nous documents PDF i convertir pàgines PDF en imatges.

PyMuPDF admet diverses funcions. Tanmateix, en aquesta revisió el nostre enfocament principal se centrarà en les funcions de divisió, fusió i gestió de pàgines de PDF de la biblioteca. Per a una avaluació en profunditat de les capacitats d'extracció i anàlisi, feu clic aquí.

GitHub

Estadístiques de GitHub

Nom:
Llenguatge:
Estrelles:
Forquilles:
Llicència:
El repositori es va actualitzar per última vegada a

Com començar amb PyMuPDF

Necessiteu la versió 3.8.0 o superior de Python per instal·lar i utilitzar PyMuPDF. Per tant, primer instal·leu Python i després utilitzeu les ordres següents per instal·lar PyMuPDF a la vostra màquina mitjançant pip i virtual medi ambient.

Linux


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

MacOS


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

Windows


python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf 

Uniu diversos PDF en un

Mitjançant la biblioteca PyMuPDF, podem combinar diversos PDF en un sol fitxer PDF a Python. El fragment de codi següent uneix dos documents PDF afegint un darrere l'altre i desant-lo com a document nou:

Dividiu PDF en diversos fitxers

També és possible dividir un document PDF en diversos PDF a Python mitjançant la biblioteca PyMuPDF. El fragment de codi següent divideix les dues primeres pàgines d'un document i les emmagatzema com a PDF independent:

Gira les pàgines PDF

També podem girar pàgines d'un fitxer PDF mitjançant la biblioteca PyMuPDF. Utilitzarem la funció set_rotation per girar les pàgines del fragment de codi següent:

Sortida

Com podem veure, el document està girat 90 graus.

Suprimeix pàgines PDF

PyMuPDF també es pot utilitzar per eliminar pàgines d'un fitxer PDF. Utilitzarem la funció delete_page per suprimir les pàgines. El següent és el document que és l'entrada i el codi esborrarà la seva segona pàgina:

Sortida

La imatge següent mostra el fitxer PDF modificat, del qual s'ha eliminat la segona pàgina.

Conclusió

PyMuPDF té punts forts notables en la fusió i la manipulació de pàgines dins de documents PDF. La seva flexibilitat i eficiència a l'hora de rotar, retallar, canviar la mida i suprimir pàgines el converteixen en una opció sòlida per a tasques de modificació de PDF. A més, la capacitat de PyMuPDF per combinar diversos documents PDF perfectament és un avantatge notable.

Tanmateix, la seva API relativament complexa pot presentar una corba d'aprenentatge per als nouvinguts i pot haver-hi algunes limitacions en la gestió de PDF extremadament grans o complexos, que podrien afectar el rendiment. No obstant això, les seves àmplies capacitats en aquestes àrees la converteixen en una eina valuosa per a aquells que busquen un control precís sobre el contingut PDF.

Productes Similars

 Catalan