ספריית מטא נתונים של Python PDF בקוד פתוח
ספריית Python בחינם וקוד פתוח לקריאה ולעדכון מטא נתונים של מסמכי PDF.
מה זה pypdf?
Pypdf היא ספריית פיתון קוד פתוח רב-תכליתית הידועה במגוון התכונות שלה למניפולציה של PDF. ספרייה זו שימושית עבור מניפולציות שונות של PDF כמו ניתוח PDF ופיצול ומיזוג PDF וכו' אבל בסקירת מוצר זו, נתמקד רק בתכונות ניהול המטא נתונים של PDF.
להלן התכונות העיקריות של pypdf הקשורות למטא נתונים:
- קרא מטא נתונים של PDF: אתה יכול לקרוא מאפיינים (כגון מחבר, יוצר, מפיק, כותרת, נושא ומילות מפתח) של מסמכי PDF באמצעות pypdf.
- עדכן מטא נתונים של PDF: תוכל גם לעדכן מטא נתונים של מסמכי PDF באמצעות pypdf.
תחילת העבודה עם pypdf
אתה צריך Python גרסה 3.6.0 ומעלה כדי להתקין ולהשתמש ב-pypdf. אז, תחילה התקן את Python ולאחר מכן השתמש בפקודות הבאות כדי להתקין pypdf במחשב שלך באמצעות pip וסביבה וירטואלית א>.
לינוקס
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
חלונות
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
קריאת מטא נתונים של PDF
אנו יכולים לקרוא את המטא נתונים של מסמך PDF באמצעות ספריית pypdf. נקבל את המטא נתונים של PDF מהמאפייןmetadata של המחלקהPdfReader בספריית pypdf. בדוק את קטע הקוד שלהלן לפרטים:
תְפוּקָה
צילום המסך למטה מציג את המטא נתונים של קובץ ה-PDF שסופק:
עדכון מטא נתונים של PDF
אנו יכולים גם לעדכן מטא נתונים של מסמך PDF כגון מחבר, מפיק, נושא וכותרת וכו' באמצעות ספריית pypdf. נעביר אובייקט המכיל את מידע המטא נתונים לשיטת add_metadata של המחלקה PdfWriter בספריית pypdf כדי לעדכן/לכתוב מטא נתונים של מסמך ה-PDF. לפרטים, בדוק את קטע הקוד שלהלן:
מַסְקָנָה
לסיכום, pypdf מתגלה כספריית Python יוצאת דופן לקריאה ועדכון מטא נתונים של מסמכי PDF. מפתחים יכולים לקרוא ולעדכן בקלות מטא נתונים של מסמכי PDF ללא בעיות.