Biblioteca de fusión de PDF de Python de código abierto
Pruebe esta biblioteca Python de código abierto y fácil de usar que le permite dividir, unir, rotar, intercambiar y eliminar páginas sin esfuerzo, lo que la convierte en una herramienta versátil para sus necesidades de documentos PDF.
¿Qué es PyMuPDF?
PyMuPDF, también conocida como Fitz, es una biblioteca de código abierto de Python que ofrece un conjunto completo de herramientas para trabajar con archivos PDF. Con PyMuPDF, los usuarios pueden realizar tareas de manera eficiente, como abrir archivos PDF, extraer texto e imágenes, manipular propiedades de página como rotación y recorte, crear nuevos documentos PDF y convertir páginas PDF en imágenes.
PyMuPDF admite varias funciones. Sin embargo, en esta revisión nos centraremos principalmente en las funciones de división, fusión y gestión de páginas de PDF de la biblioteca. Para obtener una evaluación detallada de las capacidades de extracción y análisis, haga haga clic aquí.
Introducción a PyMuPDF
Necesita la versión 3.8.0 o superior de Python para instalar y usar PyMuPDF. Por lo tanto, primero instale Python y luego use los siguientes comandos para instalar PyMuPDF en su máquina usando pip y virtual environment.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Sistema operativo Mac
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Ventanas
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Unir varios archivos PDF en uno
Con la biblioteca PyMuPDF, podemos combinar varios archivos PDF en un solo archivo PDF en Python. El siguiente fragmento de código une dos documentos PDF agregando uno tras otro y guardándolos como un documento nuevo:
Dividir PDF en varios archivos
También es posible dividir un documento PDF en varios PDF en Python utilizando la biblioteca PyMuPDF. El siguiente fragmento de código divide las dos primeras páginas de un documento y las almacena como un PDF independiente:
Girar páginas PDF
También podemos rotar las páginas de un archivo PDF utilizando la biblioteca PyMuPDF. Utilizaremos la función set_rotation para rotar las páginas en el siguiente fragmento de código:
Producción
Como podemos ver, el documento está girado 90 grados.
Eliminar páginas PDF
PyMuPDF también se puede utilizar para eliminar páginas de un archivo PDF. Utilizaremos la función delete_page para eliminar las páginas. A continuación se muestra el documento que es la entrada y el código eliminará su segunda página:
Producción
La imagen a continuación muestra el archivo PDF modificado, del cual se ha eliminado la segunda página.
Conclusión
PyMuPDF cuenta con notables ventajas en la fusión y manipulación de páginas dentro de documentos PDF. Su flexibilidad y eficiencia a la hora de rotar, recortar, redimensionar y eliminar páginas lo convierten en una opción sólida para las tareas de modificación de PDF. Además, la capacidad de PyMuPDF para fusionar varios documentos PDF sin problemas es una ventaja notable.
Sin embargo, su API relativamente compleja puede presentar una curva de aprendizaje para los principiantes y puede haber algunas limitaciones en el manejo de archivos PDF extremadamente grandes o complejos, lo que podría afectar el rendimiento. No obstante, sus amplias capacidades en estas áreas lo convierten en una herramienta valiosa para quienes buscan un control preciso sobre el contenido PDF.