Biblioteca de fusión de PDF de Python de código abierto
Pruebe esta biblioteca Python de código abierto y fácil de usar que le permite dividir, unir, rotar, intercambiar y eliminar páginas sin esfuerzo, lo que la convierte en una herramienta versátil para sus necesidades de documentos PDF.
¿Qué es PyMuPDF?
PyMuPDF, también conocida como Fitz, es una biblioteca Python de código abierto que proporciona un conjunto completo de herramientas para trabajar con archivos PDF. Con PyMuPDF, los usuarios pueden realizar tareas de manera eficiente como abrir archivos PDF, extraer texto e imágenes, manipular propiedades de la página como rotación y recorte, crear nuevos documentos PDF y convertir páginas PDF en imágenes.
PyMuPDF admite varias funciones. Sin embargo, en esta revisión nuestro enfoque principal estará en las funciones de división, fusión y administración de páginas de PDF de la biblioteca. Para obtener una evaluación en profundidad de las capacidades de extracción y análisis, haga clic aquí.
Primeros pasos con PyMuPDF
Necesita la versión 3.8.0 o superior de Python para instalar y utilizar PyMuPDF. Entonces, primero instale Python y luego use los siguientes comandos para instalar PyMuPDF en su máquina usando pip y entorno virtual.
linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Mac OS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
ventanas
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Unir varios archivos PDF en uno
Usando la biblioteca PyMuPDF, podemos combinar varios archivos PDF en un solo archivo PDF en Python. El siguiente fragmento de código une dos documentos PDF añadiéndolos uno tras otro y guardándolos como un documento nuevo:
Dividir PDF en varios archivos
También es posible dividir un documento PDF en varios archivos PDF en Python utilizando la biblioteca PyMuPDF. El siguiente fragmento de código divide las dos primeras páginas de un documento y las almacena como un PDF independiente:
Rotar páginas PDF
También podemos rotar páginas de un archivo PDF usando la biblioteca PyMuPDF. Usaremos la función set_rotation para rotar las páginas en el siguiente fragmento de código:
Producción
Como podemos ver, el documento está girado 90 grados.
Eliminar páginas PDF
PyMuPDF también se puede utilizar para eliminar páginas de un archivo PDF. Usaremos la función delete_page para eliminar las páginas. A continuación se muestra el documento que es la entrada y el código eliminará su segunda página:
Producción
La siguiente imagen muestra el archivo PDF modificado, del cual se eliminó la segunda página.
Conclusión
PyMuPDF cuenta con notables fortalezas en la combinación y manipulación de páginas dentro de documentos PDF. Su flexibilidad y eficiencia para rotar, recortar, cambiar el tamaño y eliminar páginas lo convierten en una opción sólida para las tareas de modificación de PDF. Además, la capacidad de PyMuPDF para fusionar múltiples documentos PDF sin problemas es una ventaja notable.
Sin embargo, su API relativamente compleja puede presentar una curva de aprendizaje para los recién llegados y puede haber algunas limitaciones en el manejo de archivos PDF extremadamente grandes o complejos, lo que podría afectar el rendimiento. No obstante, sus amplias capacidades en estas áreas lo convierten en una herramienta valiosa para quienes buscan un control preciso sobre el contenido PDF.