Python PDF Merger Library med öppen källkod
Prova detta användarvänliga Python-bibliotek med öppen källkod som låter dig enkelt dela, gå med, rotera, byta och ta bort sidor, vilket gör det till ett mångsidigt verktyg för dina PDF-dokumentbehov.
Vad är PyMuPDF?
PyMuPDF, även känd som Fitz, är ett Python-bibliotek med öppen källkod som tillhandahåller en omfattande uppsättning verktyg för att arbeta med PDF-filer. Med PyMuPDF kan användare effektivt utföra uppgifter som att öppna PDF-filer, extrahera text och bilder, manipulera sidegenskaper som rotation och beskärning, skapa nya PDF-dokument och konvertera PDF-sidor till bilder.
PyMuPDF stöder flera funktioner. Men i denna recension kommer vårt primära fokus att ligga på PDF-delning, sammanslagning och sidhanteringsfunktioner i biblioteket. För en djupgående utvärdering av extraherings- och analysmöjligheter, vänligen klicka här.
Komma igång med PyMuPDF
Du behöver Python version 3.8.0 eller senare för att installera och använda PyMuPDF. Så installera först Python och använd sedan nedanstående kommandon för att installera PyMuPDF på din maskin med pip och virtuell miljö a>.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
MacOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Windows
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Slå ihop flera PDF-filer till en
Med PyMuPDF-biblioteket kan vi kombinera flera PDF-filer till en enda PDF-fil i Python. Följande kodsnutt sammanfogar två PDF-dokument genom att lägga till det ena efter det andra och spara det som ett nytt dokument:
Dela upp PDF i flera filer
Det är också möjligt att dela upp ett PDF-dokument i flera PDF-filer i Python med PyMuPDF-biblioteket. Följande kodavsnitt delar upp de två första sidorna i ett dokument och lagrar dem som en separat PDF:
Rotera PDF-sidor
Vi kan också rotera sidor i en PDF-fil med PyMuPDF-biblioteket. Vi kommer att använda funktionen set_rotation för att rotera sidorna i nedanstående kodavsnitt:
Produktion
Som vi kan se roteras dokumentet 90 grader.
Ta bort PDF-sidor
PyMuPDF kan också användas för att radera sidor i en PDF-fil. Vi kommer att använda funktionen delete_page för att ta bort sidorna. Följande är dokumentet som är indata och koden kommer att radera sin andra sida:
Produktion
Bilden nedan visar den ändrade PDF-filen, från vilken den andra sidan har tagits bort.
Slutsats
PyMuPDF har anmärkningsvärda styrkor i sammanslagning och sidmanipulation i PDF-dokument. Dess flexibilitet och effektivitet när det gäller att rotera, beskära, ändra storlek och ta bort sidor gör det till ett robust val för PDF-ändringsuppgifter. Dessutom är PyMuPDFs förmåga att sammanfoga flera PDF-dokument sömlöst en anmärkningsvärd fördel.
Dess relativt komplexa API kan dock presentera en inlärningskurva för nykomlingar, och det kan finnas vissa begränsningar i att hantera extremt stora eller komplexa PDF-filer, vilket kan påverka prestandan. Icke desto mindre gör dess omfattande kapacitet inom dessa områden det till ett värdefullt verktyg för dem som söker exakt kontroll över PDF-innehåll.