ספריית מיזוג PDF בקוד פתוח של Python
נסה את ספריית Python הידידותית למשתמש, בקוד פתוח המאפשרת לך לפצל, להצטרף, לסובב, להחליף ולמחוק דפים ללא מאמץ, מה שהופך אותה לכלי רב-תכליתי לצרכי מסמך ה-PDF שלך.
מה זה PyMuPDF?
PyMuPDF, הידועה גם בשם Fitz, היא ספריית Python בקוד פתוח המספקת סט מקיף של כלים לעבודה עם קבצי PDF. עם PyMuPDF, משתמשים יכולים לבצע ביעילות משימות כמו פתיחת קובצי PDF, חילוץ טקסט ותמונות, מניפולציה של מאפייני עמוד כמו סיבוב וחיתוך, יצירת מסמכי PDF חדשים והמרת דפי PDF לתמונות.
PyMuPDF תומך במספר תכונות. עם זאת, בסקירה זו ההתמקדות העיקרית שלנו תהיה בפיצול PDF, מיזוג וניהול דפים של הספרייה. להערכה מעמיקה של יכולות החילוץ והניתוח, אנא לחץ כאן.
תחילת העבודה עם PyMuPDF
אתה צריך Python גרסה 3.8.0 ומעלה כדי להתקין ולהשתמש ב-PyMuPDF. אז, תחילה התקן את Python ולאחר מכן השתמש בפקודות הבאות כדי להתקין PyMuPDF במחשב שלך באמצעות pip וסביבה וירטואלית.
לינוקס
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
MacOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
חלונות
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
חבר קובצי PDF מרובים לאחד
באמצעות ספריית PyMuPDF, אנו יכולים לשלב קובצי PDF מרובים לקובץ PDF בודד ב-Python. קטע הקוד הבא מחבר שני מסמכי PDF יחד על ידי הוספה אחד אחרי השני ושמור אותו כמסמך חדש:
פיצול PDF למספר קבצים
אפשר גם לפצל מסמך PDF למספר קובצי PDF ב-Python באמצעות ספריית PyMuPDF. קטע הקוד הבא מפצל את שני העמודים הראשונים של מסמך ומאחסן אותם כקובץ PDF נפרד:
סובב דפי PDF
אנו יכולים גם לסובב דפים של קובץ PDF באמצעות ספריית PyMuPDF. נשתמש בפונקציה set_rotation כדי לסובב את הדפים בקטע הקוד שלהלן:
תְפוּקָה
כפי שאנו יכולים לראות, המסמך מסובב ב-90 מעלות.
מחק דפי PDF
ניתן להשתמש ב-PyMuPDF גם כדי למחוק דפים של קובץ PDF. נשתמש בפונקציה delete_page כדי למחוק את הדפים. להלן המסמך שהוא הקלט והקוד ימחק את העמוד השני שלו:
תְפוּקָה
התמונה למטה מציגה את קובץ ה-PDF שהשתנה, ממנו הוסר העמוד השני.
סיכום
PyMuPDF מתגאה בחוזקות יוצאות דופן במיזוג ובמניפולציה של עמודים בתוך מסמכי PDF. הגמישות והיעילות שלו בסיבוב, חיתוך, שינוי גודל ומחיקת עמודים הופכים אותו לבחירה חזקה למשימות שינוי PDF. בנוסף, היכולת של PyMuPDF למזג מסמכי PDF מרובים בצורה חלקה היא יתרון בולט.
עם זאת, ה-API המורכב יחסית שלו עשוי להציג עקומת למידה עבור מצטרפים חדשים, וייתכנו מגבלות מסוימות בטיפול בקובצי PDF גדולים או מורכבים במיוחד, מה שעלול להשפיע על הביצועים. עם זאת, היכולות הנרחבות שלו בתחומים אלה הופכות אותו לכלי בעל ערך עבור אלה המחפשים שליטה מדויקת על תוכן PDF.