ספריית הערות PDF בקוד פתוח של Python
נסה את ספריית Python בחינם וקוד פתוח להוספה וחילוץ הערות ממסמכי PDF.
מה זה pypdf?
Pypdf היא ספריית python חינמית וקוד פתוח, הידועה במגוון התכונות שלה לטיפול במסמכי PDF בסביבת python. כלי זה אכן שימושי עבור מניפולציות שונות של PDF, אך אנו נתמקד בתכונות הקשורות להערות בסקירה זו.
תכונות בולטות של pypdf הקשורות להערות כוללות:
- הוספת הערות צורות: אנו יכולים לצייר צורות כמו קווים, מלבנים, אליפסות ומצולעים וכו' באזורים ספציפיים של דפי PDF כהערות.
- הוספת הערות טקסט: אנו יכולים להוסיף הערות טקסט למיקומים ספציפיים של דפי PDF.
- הוספת הערות קישור: אפשר להוסיף גם הערות קישור (כמו היפר-קישור) למסמכי PDF.
- חילוץ הערות: אנו יכולים לחזור ולחלץ מידע על כל ההערות במסמך PDF באמצעות ספריית pypdf.
תחילת העבודה עם pypdf
אתה צריך Python גרסה 3.6.0 ומעלה כדי להתקין ולהשתמש ב-pypdf. אז, תחילה התקן את Python ולאחר מכן השתמש בפקודות הבאות כדי להתקין pypdf במחשב שלך באמצעות pip וסביבה וירטואלית א>.
לינוקס
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
חלונות
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
הוסף הערת מלבן ל-PDF
אנו יכולים להוסיף הערות מלבניות למסמכי PDF באמצעות ספריית pypdf. נשתמש במחלקת Rectangle של המודול pypdf.annotations מספריית pypdf כדי להגדיר את המלבן. לאחר מכן נשתמש בשיטת add_annotations של המחלקה PDFWriter כדי להוסיף הערת מלבן ל-PDF.
בדוק את קטע הקוד למטה לקבלת הפרטים:
תְפוּקָה
בצילום המסך למטה, אתה יכול לראות שהמלבן נוסף כדי להוסיף הערות למילה קוד פתוח:
הוסף הערת טקסט ל-PDF
אנו יוצרים הערות טקסט באמצעות המחלקה Text מהמודול pypdf.annotations של ספריית pypdf. לאחר מכן נוכל להשתמש בשיטת add_annotations של המחלקה PDFWriter מספריית הpypdf כדי להוסיף הערה ל-PDF. הערת הטקסט מתווספת כסמל שמתרחב ומציג את הטקסט בעת לחיצה על הסמל. בדוק את קטע הקוד למטה לקבלת הפרטים:
תְפוּקָה
כפי שאנו יכולים לראות במסך המסך שלהלן, הקוד שלמעלה מוסיף סמל ל-PDF במיקום שצוין אשר מציג הערת טקסט בעת לחיצה על הסמל:
הוסף הערת קישור ל-PDF
הערות קישור נוצרות באמצעות המחלקה Link מהמודול pypdf.annotations. עם זאת, הבעיה עם הערת הקישור היא שהוא רק מוסיף את הקישור אבל הוא לא גלוי. כדי לטפל בבעיה זו, נשלב מלבן באמצעות המחלקה Rectangle מהמודול pypdf.annotations כפי שהסברנו קודם לכן. בדרך זו, המשתמש יכול לזהות ויזואלית את המיקום שבו מתווספת הערת הקישור. בדוק את קטע הקוד למטה להבנה טובה יותר:
תְפוּקָה
כפי שאנו יכולים לראות בפלט, המלבן משמש כאזור שבלחיצה עליו מפנה את המשתמש לקישור שצוין.
חלץ הערות מ-PDF
אנו יכולים לחלץ הערות מקובץ PDF באמצעות ספריית pypdf. אנו חוזרים על כל ההערות בדפי PDF ולאחר מכן משתמשים בשיטת get_object כדי לקבל את אובייקט ההערה. לאחר מכן אנו שואבים מידע רלוונטי מהאובייקט. בדוק את קטע הקוד למטה לקבלת הפרטים:
תְפוּקָה
כפי שאנו יכולים לראות בצילום המסך למטה, התוכנית החזירה את סוג ההערות ואת הקואורדינטות של ההערות במסמך ה-PDF:
סיכום
Pypdf מאפשר למפתחי Python להוסיף סוגים שונים של הערות לקובצי PDF ולגשת למידע חיוני על הערות, כגון סוגן ומיקומן, מה שהופך אותה לבחירה מעשית עבור משימות הדורשות הוספת הערות וחילוץ נתונים על הערות.