Libreria di unione PDF Python Open Source
Prova questa libreria Python open source e intuitiva che ti consente di dividere, unire, ruotare, scambiare ed eliminare pagine senza sforzo, rendendola uno strumento versatile per le tue esigenze di documenti PDF.
Che cos'è PyMuPDF?
PyMuPDF, noto anche come Fitz, è una libreria Python open source che fornisce un set completo di strumenti per lavorare con file PDF. Con PyMuPDF, gli utenti possono eseguire in modo efficiente attività come l'apertura di PDF, l'estrazione di testo e immagini, la manipolazione di proprietà di pagina come rotazione e ritaglio, la creazione di nuovi documenti PDF e la conversione di pagine PDF in immagini.
PyMuPDF supporta diverse funzionalità. Tuttavia, in questa recensione ci concentreremo principalmente sulle funzionalità di suddivisione, unione e gestione delle pagine dei PDF della libreria. Per una valutazione approfondita delle capacità di estrazione e analisi, clicca qui.
Introduzione a PyMuPDF
Per installare e utilizzare PyMuPDF è necessaria la versione 3.8.0 o superiore di Python. Quindi, installa prima Python e poi usa i comandi sottostanti per installare PyMuPDF sul tuo computer usando pip e ambiente virtuale.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
MacOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Finestre
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Unisci più PDF in uno
Utilizzando la libreria PyMuPDF, possiamo combinare più PDF in un singolo file PDF in Python. Il seguente frammento di codice unisce due documenti PDF aggiungendone uno dopo l'altro e salvandolo come nuovo documento:
Dividi PDF in più file
È anche possibile dividere un documento PDF in più PDF in Python usando la libreria PyMuPDF. Il seguente frammento di codice divide le prime due pagine di un documento e le memorizza come un PDF separato:
Ruota le pagine PDF
Possiamo anche ruotare le pagine di un file PDF usando la libreria PyMuPDF. Utilizzeremo la funzione set_rotation per ruotare le pagine nel frammento di codice seguente:
Produzione
Come possiamo vedere, il documento è ruotato di 90 gradi.
Elimina pagine PDF
PyMuPDF può essere utilizzato anche per eliminare pagine di un file PDF. Utilizzeremo la funzione delete_page per eliminare le pagine. Di seguito è riportato il documento che è l'input e il codice eliminerà la sua seconda pagina:
Produzione
L'immagine sottostante mostra il file PDF modificato, dal quale è stata rimossa la seconda pagina.
Conclusione
PyMuPDF vanta notevoli punti di forza nell'unione e nella manipolazione delle pagine all'interno dei documenti PDF. La sua flessibilità ed efficienza nel ruotare, ritagliare, ridimensionare ed eliminare le pagine lo rendono una scelta solida per le attività di modifica dei PDF. Inoltre, la capacità di PyMuPDF di unire più documenti PDF senza problemi è un vantaggio notevole.
Tuttavia, la sua API relativamente complessa potrebbe presentare una curva di apprendimento per i nuovi arrivati e potrebbero esserci alcune limitazioni nella gestione di PDF estremamente grandi o complessi, il che potrebbe avere un impatto sulle prestazioni. Tuttavia, le sue ampie capacità in queste aree lo rendono uno strumento prezioso per coloro che cercano un controllo preciso sul contenuto PDF.