ไลบรารี่ข้อมูลเมตา PDF ของ Python โอเพ่นซอร์ส
ไลบรารี Python โอเพนซอร์สฟรีสำหรับอ่านและอัปเดตข้อมูลเมตาของเอกสาร PDF
pypdf คืออะไร?
Pypdf เป็นไลบรารี่โอเพ่นซอร์ส Python อเนกประสงค์ที่ขึ้นชื่อในเรื่องชุดฟีเจอร์ที่หลากหลายสำหรับการจัดการ PDF ไลบรารี่นี้มีประโยชน์สำหรับการจัดการ PDF ต่างๆ เช่น การแยก PDF และ การแยกและรวม PDF เป็นต้น แต่ในการรีวิวผลิตภัณฑ์นี้ เราจะเน้นเฉพาะฟีเจอร์การจัดการเมตาเดตา PDF เท่านั้น
ต่อไปนี้เป็นคุณสมบัติหลักของ pypdf ที่เกี่ยวข้องกับข้อมูลเมตา:
- อ่านข้อมูลเมตาของ PDF: คุณสามารถอ่านคุณสมบัติ (เช่น ผู้แต่ง ผู้สร้าง ผู้ผลิต ชื่อเรื่อง หัวเรื่อง และคำสำคัญ) ของเอกสาร PDF ได้โดยใช้ pypdf
- อัปเดตข้อมูลเมตาของ PDF: คุณสามารถอัปเดตข้อมูลเมตาของเอกสาร PDF ได้โดยใช้ pypdf
เริ่มต้นใช้งาน pypdf
คุณต้องใช้ Python เวอร์ชัน 3.6.0 ขึ้นไปจึงจะติดตั้งและใช้ pypdf ได้ ดังนั้น ให้ติดตั้ง Python ก่อน จากนั้นใช้คำสั่งด้านล่างเพื่อติดตั้ง pypdf บนเครื่องของคุณโดยใช้ pip และ สภาพแวดล้อมเสมือน
ลินุกซ์
python3 -m venv venv
source venv/bin/activate
pip install pypdf
ระบบปฏิบัติการ MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
หน้าต่าง
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
การอ่านข้อมูลเมตาของ PDF
เราสามารถอ่านข้อมูลเมตาของเอกสาร PDF ได้โดยใช้ไลบรารี pypdf เราจะรับข้อมูลเมตาของ PDF จากคุณสมบัติ metadata ของคลาส PdfReader ในไลบรารี pypdf ดูรายละเอียดได้จากโค้ดตัวอย่างด้านล่าง:
เอาท์พุต
ภาพหน้าจอด้านล่างนี้แสดงข้อมูลเมตาของไฟล์ PDF ที่ให้มา:
การอัปเดตข้อมูลเมตาของ PDF
เราสามารถอัปเดตข้อมูลเมตาของเอกสาร PDF เช่น ชื่อผู้แต่ง ผู้ผลิต หัวเรื่อง และชื่อเรื่อง เป็นต้น โดยใช้ไลบรารี pypdf เราจะส่งอ็อบเจ็กต์ที่มีข้อมูลเมตาไปยังเมธอด add_metadata ของคลาส PdfWriter ในไลบรารี pypdf เพื่ออัปเดต/เขียนข้อมูลเมตาของเอกสาร PDF สำหรับรายละเอียด โปรดดูตัวอย่างโค้ดด้านล่าง:
บทสรุป
โดยสรุป pypdf พิสูจน์แล้วว่าเป็นไลบรารี Python ที่ยอดเยี่ยมสำหรับการอ่านและอัปเดตข้อมูลเมตาของเอกสาร PDF นักพัฒนาสามารถอ่านและอัปเดตข้อมูลเมตาของเอกสาร PDF ได้อย่างง่ายดายโดยไม่มีปัญหาใดๆ