ไลบรารี่โอเพ่นซอร์สสำหรับเขียนคำอธิบาย PDF ด้วย Python
ลองใช้ไลบรารี Python โอเพนซอร์สและฟรีนี้สำหรับการเพิ่มและแยกคำอธิบายประกอบจากเอกสาร PDF
pypdf คืออะไร?
Pypdf เป็นไลบรารี Python ฟรีและโอเพ่นซอร์สที่ขึ้นชื่อในเรื่องชุดฟีเจอร์ที่หลากหลายสำหรับการจัดการเอกสาร PDF ในสภาพแวดล้อม Python เครื่องมือนี้มีประโยชน์สำหรับการจัดการ PDF ต่างๆ แต่เราจะเน้นที่ฟีเจอร์ที่เกี่ยวข้องกับคำอธิบายประกอบในบทวิจารณ์นี้
คุณสมบัติที่โดดเด่นของ pypdf ที่เกี่ยวข้องกับคำอธิบายประกอบได้แก่:
- การเพิ่มคำอธิบายรูปร่าง: เราสามารถวาดรูปร่างต่างๆ เช่น เส้น สี่เหลี่ยมผืนผ้า วงรี และรูปหลายเหลี่ยม ฯลฯ ลงบนพื้นที่เฉพาะของหน้า PDF เพื่อเป็นคำอธิบายประกอบได้
- การเพิ่มคำอธิบายข้อความ: เราสามารถเพิ่มคำอธิบายข้อความลงในตำแหน่งที่เจาะจงบนหน้า PDF ได้
- การเพิ่มคำอธิบายลิงก์: คุณสามารถเพิ่มคำอธิบายลิงก์ (เช่น ไฮเปอร์ลิงก์) ลงในเอกสาร PDF ได้เช่นกัน
- การแยกคำอธิบายประกอบ: เราสามารถทำซ้ำและแยกข้อมูลเกี่ยวกับคำอธิบายประกอบทั้งหมดในเอกสาร PDF ได้โดยใช้ไลบรารี pypdf
เริ่มต้นใช้งาน pypdf
คุณต้องใช้ Python เวอร์ชัน 3.6.0 ขึ้นไปจึงจะติดตั้งและใช้ pypdf ได้ ดังนั้น ให้ติดตั้ง Python ก่อน จากนั้นใช้คำสั่งด้านล่างเพื่อติดตั้ง pypdf บนเครื่องของคุณโดยใช้ pip และ สภาพแวดล้อมเสมือน
ลินุกซ์
python3 -m venv venv
source venv/bin/activate
pip install pypdf
ระบบปฏิบัติการ MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
หน้าต่าง
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
เพิ่มคำอธิบายรูปสี่เหลี่ยมผืนผ้าลงใน PDF
เราสามารถเพิ่มคำอธิบายรูปสี่เหลี่ยมผืนผ้าลงในเอกสาร PDF ได้โดยใช้ไลบรารี pypdf เราจะใช้คลาส Rectangle ของโมดูล pypdf.annotations จากไลบรารี pypdf เพื่อกำหนดรูปสี่เหลี่ยมผืนผ้า จากนั้นเราจะใช้เมธอด add_annotations ของคลาส PDFWriter เพื่อเพิ่มคำอธิบายรูปสี่เหลี่ยมผืนผ้าลงใน PDF
ตรวจสอบตัวอย่างโค้ดด้านล่างเพื่อดูรายละเอียด:
เอาท์พุต
ในภาพหน้าจอด้านล่าง คุณจะเห็นว่ามีการเพิ่มสี่เหลี่ยมผืนผ้าเพื่อใส่คำอธิบายในคำว่า โอเพ่นซอร์ส:
เพิ่มคำอธิบายข้อความลงใน PDF
เราสร้างคำอธิบายประกอบข้อความโดยใช้คลาส Text จากโมดูล pypdf.annotations ของไลบรารี pypdf หลังจากนั้นเราสามารถใช้เมธอด add_annotations ของคลาส PDFWriter จากไลบรารี pypdf เพื่อเพิ่มคำอธิบายประกอบลงใน PDF คำอธิบายประกอบข้อความจะถูกเพิ่มเป็นไอคอนที่ขยายและแสดงข้อความเมื่อคลิกไอคอน ดูรายละเอียดในโค้ดด้านล่าง:
เอาท์พุต
ตามที่เราเห็นในวิดีโอสาธิตด้านล่าง โค้ดด้านบนจะเพิ่มไอคอนลงใน PDF ในตำแหน่งที่ระบุ ซึ่งจะแสดงคำอธิบายข้อความเมื่อคลิกไอคอน:
เพิ่มคำอธิบายลิงก์ลงใน PDF
คำอธิบายประกอบลิงก์จะสร้างโดยใช้คลาส Link จากโมดูล pypdf.annotations อย่างไรก็ตาม ปัญหาเกี่ยวกับคำอธิบายประกอบลิงก์ก็คือ มันเพียงแค่เพิ่มลิงก์เข้าไปแต่ไม่สามารถมองเห็นได้ เพื่อแก้ไขปัญหานี้ เราจะรวมสี่เหลี่ยมผืนผ้าเข้าไปโดยใช้คลาส Rectangle จากโมดูล pypdf.annotations ตามที่ได้อธิบายไว้ก่อนหน้านี้ วิธีนี้จะช่วยให้ผู้ใช้สามารถระบุตำแหน่งที่เพิ่มคำอธิบายประกอบลิงก์ได้อย่างชัดเจน ดูโค้ดตัวอย่างด้านล่างเพื่อความเข้าใจที่ดีขึ้น:
เอาท์พุต
ตามที่เราเห็นในผลลัพธ์ สี่เหลี่ยมผืนผ้าทำหน้าที่เป็นพื้นที่ที่เมื่อคลิกแล้ว จะเปลี่ยนเส้นทางผู้ใช้ไปยังลิงก์ที่ระบุ
ดึงคำอธิบายจาก PDF
เราสามารถดึงคำอธิบายประกอบจาก PDF ได้โดยใช้ไลบรารี pypdf เราจะวนซ้ำผ่านคำอธิบายประกอบทั้งหมดในหน้า PDF จากนั้นจึงใช้เมธอด get_object เพื่อรับอ็อบเจ็กต์คำอธิบายประกอบ จากนั้นเราจะดึงข้อมูลที่เกี่ยวข้องจากอ็อบเจ็กต์นั้น ดูรายละเอียดได้จากโค้ดด้านล่าง:
เอาท์พุต
ตามที่เราเห็นในภาพหน้าจอด้านล่าง โปรแกรมได้ส่งคืนประเภทคำอธิบายประกอบและพิกัดของคำอธิบายประกอบในเอกสาร PDF:
บทสรุป
Pypdf ช่วยให้ผู้พัฒนา Python สามารถเพิ่มคำอธิบายประกอบประเภทต่างๆ ลงใน PDF และเข้าถึงข้อมูลที่จำเป็นเกี่ยวกับคำอธิบายประกอบ เช่น ประเภทและตำแหน่ง ทำให้เป็นตัวเลือกที่เหมาะสมสำหรับงานที่ต้องมีการเพิ่มคำอธิบายประกอบและแยกข้อมูลเกี่ยวกับคำอธิบายประกอบ