ไลบรารีคำอธิบายประกอบ PDF โอเพ่นซอร์ส Python
ลองใช้ไลบรารี Python แบบโอเพ่นซอร์สและฟรีนี้เพื่อเพิ่มและแยกคำอธิบายประกอบจากเอกสาร PDF
pypdf คืออะไร?
Pypdf เป็นไลบรารี Python แบบโอเพ่นซอร์สฟรีที่ขึ้นชื่อเรื่องชุดคุณสมบัติที่หลากหลายสำหรับการจัดการเอกสาร PDF ในสภาพแวดล้อมของ Python เครื่องมือนี้มีประโยชน์สำหรับการปรับแต่ง PDF ต่างๆ แต่เราจะเน้นไปที่คุณสมบัติที่เกี่ยวข้องกับคำอธิบายประกอบในการรีวิวนี้
คุณสมบัติเด่นของ pypdf ที่เกี่ยวข้องกับคำอธิบายประกอบ ได้แก่:
- การเพิ่มคำอธิบายประกอบรูปร่าง: เราสามารถวาดรูปร่าง เช่น เส้น สี่เหลี่ยม วงรี และรูปหลายเหลี่ยม ฯลฯ บนพื้นที่เฉพาะของหน้า PDF เพื่อเป็นคำอธิบายประกอบ
- การเพิ่มคำอธิบายประกอบแบบข้อความ: เราสามารถเพิ่มคำอธิบายประกอบแบบข้อความในตำแหน่งเฉพาะของหน้า PDF
- การเพิ่มคำอธิบายประกอบลิงก์: คุณสามารถเพิ่มคำอธิบายประกอบลิงก์ (เช่น ไฮเปอร์ลิงก์) ลงในเอกสาร PDF ได้ด้วย
- การแยกคำอธิบายประกอบ: เราสามารถวนซ้ำและแยกข้อมูลเกี่ยวกับคำอธิบายประกอบทั้งหมดในเอกสาร PDF โดยใช้ไลบรารี pypdf
เริ่มต้นใช้งาน pypdf
คุณต้องมี Python เวอร์ชัน 3.6.0 ขึ้นไปจึงจะติดตั้งและใช้ pypdf ได้ ขั้นแรกให้ติดตั้ง Python จากนั้นใช้คำสั่งด้านล่างเพื่อติดตั้ง pypdf บนเครื่องของคุณโดยใช้ pip และ สภาพแวดล้อมเสมือน.
ลินุกซ์
python3 -m venv venv
source venv/bin/activate
pip install pypdf
แมคโอเอส
python -m venv venv
source venv/bin/activate
pip install pypdf
หน้าต่าง
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
เพิ่มคำอธิบายประกอบแบบสี่เหลี่ยมผืนผ้าลงใน PDF
เราสามารถเพิ่มคำอธิบายประกอบแบบสี่เหลี่ยมผืนผ้าให้กับเอกสาร PDF โดยใช้ไลบรารี pypdf เราจะใช้คลาส Rectangle ของโมดูล pypdf.annotations จากไลบรารี pypdf เพื่อกำหนดสี่เหลี่ยม จากนั้น เราจะใช้เมธอด add_annotations ของคลาส PDFWriter เพื่อเพิ่มคำอธิบายประกอบแบบสี่เหลี่ยมผืนผ้าให้กับ PDF
ตรวจสอบข้อมูลโค้ดด้านล่างเพื่อดูรายละเอียด:
เอาท์พุต
ในภาพหน้าจอด้านล่าง คุณจะเห็นว่าสี่เหลี่ยมถูกเพิ่มเพื่อใส่คำอธิบายประกอบคำ โอเพ่นซอร์ส:
เพิ่มคำอธิบายประกอบข้อความลงใน PDF
เราสร้างคำอธิบายประกอบแบบข้อความโดยใช้คลาส ข้อความ จากโมดูล pypdf.annotations ของไลบรารี pypdf หลังจากนั้นเราสามารถใช้เมธอด add_annotations ของคลาส PDFWriter จากไลบรารี pypdf เพื่อเพิ่มคำอธิบายประกอบลงใน PDF คำอธิบายประกอบข้อความจะถูกเพิ่มเป็นไอคอนที่ขยายและแสดงข้อความเมื่อมีการคลิกไอคอน ตรวจสอบข้อมูลโค้ดด้านล่างเพื่อดูรายละเอียด:
เอาท์พุต
ดังที่เราเห็นใน screencast ด้านล่าง โค้ดด้านบนจะเพิ่มไอคอนลงใน PDF ที่ตำแหน่งที่ระบุ ซึ่งจะแสดงคำอธิบายประกอบข้อความเมื่อมีการคลิกไอคอน:
เพิ่มคำอธิบายประกอบลิงก์ลงใน PDF
คำอธิบายประกอบลิงก์ถูกสร้างขึ้นโดยใช้คลาส ลิงก์ จากโมดูล pypdf.annotations อย่างไรก็ตาม ปัญหาเกี่ยวกับคำอธิบายประกอบลิงก์คือเพิ่งเพิ่มลิงก์แต่ไม่สามารถมองเห็นได้ เพื่อแก้ไขปัญหานี้ เราจะรวมสี่เหลี่ยมผืนผ้าโดยใช้คลาส Rectangle จากโมดูล pypdf.annotations ตามที่เราอธิบายไว้ก่อนหน้านี้ ด้วยวิธีนี้ ผู้ใช้สามารถระบุตำแหน่งที่มีการเพิ่มคำอธิบายประกอบลิงก์ด้วยสายตาได้ ตรวจสอบข้อมูลโค้ดด้านล่างเพื่อความเข้าใจที่ดีขึ้น:
เอาท์พุต
ดังที่เราเห็นในผลลัพธ์ สี่เหลี่ยมผืนผ้าทำหน้าที่เป็นพื้นที่ที่เมื่อคลิก จะเปลี่ยนเส้นทางผู้ใช้ไปยังลิงก์ที่ระบุ
แยกคำอธิบายประกอบจาก PDF
เราสามารถแยกคำอธิบายประกอบจาก PDF โดยใช้ไลบรารี pypdf เราวนซ้ำคำอธิบายประกอบทั้งหมดบนหน้า PDF จากนั้นใช้วิธี get_object เพื่อรับวัตถุคำอธิบายประกอบ จากนั้นเราจะดึงข้อมูลที่เกี่ยวข้องออกจากออบเจ็กต์ ตรวจสอบข้อมูลโค้ดด้านล่างเพื่อดูรายละเอียด:
เอาท์พุต
ดังที่เราเห็นในภาพหน้าจอด้านล่าง โปรแกรมได้ส่งคืนประเภทคำอธิบายประกอบและพิกัดของคำอธิบายประกอบในเอกสาร PDF:
บทสรุป
Pypdf ช่วยให้นักพัฒนา Python เพิ่มคำอธิบายประกอบประเภทต่างๆ ลงใน PDF และเข้าถึงข้อมูลที่จำเป็นเกี่ยวกับคำอธิบายประกอบ เช่น ประเภทและตำแหน่ง ทำให้เป็นตัวเลือกที่ใช้งานได้จริงสำหรับงานที่ต้องเพิ่มคำอธิบายประกอบและแยกข้อมูลเกี่ยวกับคำอธิบายประกอบ