1. Productos
  2.   Fusión
  3.   Python
  4.   PyMuPDF
 
  

Biblioteca de fusión de PDF de Python de código abierto

Pruebe esta biblioteca Python de código abierto y fácil de usar que le permite dividir, unir, rotar, intercambiar y eliminar páginas sin esfuerzo, lo que la convierte en una herramienta versátil para sus necesidades de documentos PDF.

¿Qué es PyMuPDF?

PyMuPDF, también conocida como Fitz, es una biblioteca Python de código abierto que proporciona un conjunto completo de herramientas para trabajar con archivos PDF. Con PyMuPDF, los usuarios pueden realizar tareas de manera eficiente como abrir archivos PDF, extraer texto e imágenes, manipular propiedades de la página como rotación y recorte, crear nuevos documentos PDF y convertir páginas PDF en imágenes.

PyMuPDF admite varias funciones. Sin embargo, en esta revisión nuestro enfoque principal estará en las funciones de división, fusión y administración de páginas de PDF de la biblioteca. Para obtener una evaluación en profundidad de las capacidades de extracción y análisis, haga clic aquí.

GitHub

Estadísticas de GitHub

Nombre:
Idioma:
Estrellas:
Tenedores:
Licencia:
El repositorio se actualizó por última vez en

Primeros pasos con PyMuPDF

Necesita la versión 3.8.0 o superior de Python para instalar y utilizar PyMuPDF. Entonces, primero instale Python y luego use los siguientes comandos para instalar PyMuPDF en su máquina usando pip y entorno virtual.

linux


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

Mac OS


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

ventanas


python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf 

Unir varios archivos PDF en uno

Usando la biblioteca PyMuPDF, podemos combinar varios archivos PDF en un solo archivo PDF en Python. El siguiente fragmento de código une dos documentos PDF añadiéndolos uno tras otro y guardándolos como un documento nuevo:

Dividir PDF en varios archivos

También es posible dividir un documento PDF en varios archivos PDF en Python utilizando la biblioteca PyMuPDF. El siguiente fragmento de código divide las dos primeras páginas de un documento y las almacena como un PDF independiente:

Rotar páginas PDF

También podemos rotar páginas de un archivo PDF usando la biblioteca PyMuPDF. Usaremos la función set_rotation para rotar las páginas en el siguiente fragmento de código:

Producción

Como podemos ver, el documento está girado 90 grados.

Eliminar páginas PDF

PyMuPDF también se puede utilizar para eliminar páginas de un archivo PDF. Usaremos la función delete_page para eliminar las páginas. A continuación se muestra el documento que es la entrada y el código eliminará su segunda página:

Producción

La siguiente imagen muestra el archivo PDF modificado, del cual se eliminó la segunda página.

Conclusión

PyMuPDF cuenta con notables fortalezas en la combinación y manipulación de páginas dentro de documentos PDF. Su flexibilidad y eficiencia para rotar, recortar, cambiar el tamaño y eliminar páginas lo convierten en una opción sólida para las tareas de modificación de PDF. Además, la capacidad de PyMuPDF para fusionar múltiples documentos PDF sin problemas es una ventaja notable.

Sin embargo, su API relativamente compleja puede presentar una curva de aprendizaje para los recién llegados y puede haber algunas limitaciones en el manejo de archivos PDF extremadamente grandes o complejos, lo que podría afectar el rendimiento. No obstante, sus amplias capacidades en estas áreas lo convierten en una herramienta valiosa para quienes buscan un control preciso sobre el contenido PDF.

Productos Similares

 Español