Libreria di fusione PDF Python open source
Prova questa libreria Python open source intuitiva che ti consente di dividere, unire, ruotare, scambiare ed eliminare pagine senza sforzo, rendendola uno strumento versatile per le tue esigenze di documenti PDF.
Cos'è PyMuPDF?
PyMuPDF, noto anche come Fitz, è una libreria Python open source che fornisce un set completo di strumenti per lavorare con file PDF. Con PyMuPDF, gli utenti possono eseguire in modo efficiente attività come l'apertura di PDF, l'estrazione di testo e immagini, la manipolazione delle proprietà della pagina come rotazione e ritaglio, la creazione di nuovi documenti PDF e la conversione di pagine PDF in immagini.
PyMuPDF supporta diverse funzionalità. Tuttavia, in questa recensione il nostro focus principale sarà sulle funzionalità di divisione, fusione e gestione delle pagine dei PDF della libreria. Per una valutazione approfondita delle capacità di estrazione e analisi, fai clic qui.
Iniziare con PyMuPDF
È necessaria la versione 3.8.0 di Python o successiva per installare e utilizzare PyMuPDF. Quindi, installa prima Python e poi usa i comandi seguenti per installare PyMuPDF sul tuo computer usando pip e ambiente virtuale.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Mac OS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
finestre
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Unisci più PDF in uno solo
Utilizzando la libreria PyMuPDF, possiamo combinare più PDF in un singolo file PDF in Python. Il seguente frammento di codice unisce due documenti PDF insieme accodandoli uno dopo l'altro e salvandoli come nuovo documento:
Dividi PDF in più file
È anche possibile dividere un documento PDF in più PDF in Python utilizzando la libreria PyMuPDF. Il seguente snippet di codice divide le prime due pagine di un documento e le memorizza come PDF separato:
Ruota le pagine PDF
Possiamo anche ruotare le pagine di un file PDF utilizzando la libreria PyMuPDF. Utilizzeremo la funzione set_rotation per ruotare le pagine nello snippet di codice seguente:
Produzione
Come possiamo vedere, il documento viene ruotato di 90 gradi.
Elimina pagine PDF
PyMuPDF può essere utilizzato anche per eliminare pagine di un file PDF. Utilizzeremo la funzione delete_page per eliminare le pagine. Di seguito è riportato il documento che costituisce l'input e il codice cancellerà la sua seconda pagina:
Produzione
L'immagine seguente mostra il file PDF modificato, da cui è stata rimossa la seconda pagina.
Conclusione
PyMuPDF vanta notevoli punti di forza nell'unione e nella manipolazione delle pagine all'interno dei documenti PDF. La sua flessibilità ed efficienza nella rotazione, ritaglio, ridimensionamento ed eliminazione delle pagine lo rendono una scelta affidabile per le attività di modifica dei PDF. Inoltre, la capacità di PyMuPDF di unire più documenti PDF senza problemi è un notevole vantaggio.
Tuttavia, la sua API relativamente complessa potrebbe presentare una curva di apprendimento per i nuovi arrivati e potrebbero esserci alcune limitazioni nella gestione di PDF estremamente grandi o complessi, che potrebbero influire sulle prestazioni. Tuttavia, le sue ampie capacità in queste aree lo rendono uno strumento prezioso per coloro che cercano un controllo preciso sul contenuto PDF.