ไลบรารี่รวม PDF ของ Python แบบโอเพ่นซอร์ส
ลองใช้ไลบรารี Python โอเพ่นซอร์สที่ใช้งานง่ายนี้ ซึ่งช่วยให้คุณแยก รวม หมุน สลับ และลบหน้าได้อย่างง่ายดาย ทำให้เป็นเครื่องมืออเนกประสงค์สำหรับความต้องการเอกสาร PDF ของคุณ
PyMuPDF คืออะไร?
PyMuPDF หรือที่รู้จักกันในชื่อ Fitz เป็นไลบรารี Python โอเพนซอร์สที่มีชุดเครื่องมือที่ครอบคลุมสำหรับการทำงานกับไฟล์ PDF ด้วย PyMuPDF ผู้ใช้สามารถดำเนินการต่างๆ ได้อย่างมีประสิทธิภาพ เช่น การเปิด PDF การแยกข้อความและรูปภาพ การปรับแต่งคุณสมบัติของหน้า เช่น การหมุนและการครอบตัด การสร้างเอกสาร PDF ใหม่ และการแปลงหน้า PDF เป็นรูปภาพ
PyMuPDF รองรับฟีเจอร์ต่างๆ มากมาย อย่างไรก็ตาม ในบทวิจารณ์นี้ เราจะเน้นที่ฟีเจอร์การแยก รวม และจัดการหน้า PDF ของไลบรารีเป็นหลัก หากต้องการประเมินความสามารถในการแยกและวิเคราะห์แบบเจาะลึก โปรดคลิกที่นี่
เริ่มต้นใช้งาน PyMuPDF
คุณต้องใช้ Python เวอร์ชัน 3.8.0 ขึ้นไปจึงจะติดตั้งและใช้ PyMuPDF ได้ ดังนั้น ให้ติดตั้ง Python ก่อน จากนั้นใช้คำสั่งด้านล่างเพื่อติดตั้ง PyMuPDF บนเครื่องของคุณโดยใช้ pip และ สภาพแวดล้อมเสมือน
ลินุกซ์
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
ระบบปฏิบัติการ MacOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
หน้าต่าง
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
รวมไฟล์ PDF หลายไฟล์เป็นหนึ่งเดียว
การใช้ไลบรารี PyMuPDF ช่วยให้เรารวมไฟล์ PDF หลายไฟล์เป็นไฟล์ PDF ไฟล์เดียวใน Python ได้ โค้ดสั้นๆ ต่อไปนี้จะรวมเอกสาร PDF สองฉบับเข้าด้วยกันโดยผนวกทีละฉบับแล้วบันทึกเป็นเอกสารใหม่:
แยก PDF ออกเป็นหลายไฟล์
นอกจากนี้ คุณยังสามารถแยกเอกสาร PDF ออกเป็น PDF หลายไฟล์ใน Python ได้โดยใช้ไลบรารี PyMuPDF ตัวอย่างโค้ดต่อไปนี้จะแยกหน้าแรกสองหน้าของเอกสารและจัดเก็บเป็น PDF แยกกัน:
หมุนหน้า PDF
เราสามารถหมุนหน้าของไฟล์ PDF ได้โดยใช้ไลบรารี PyMuPDF เราจะใช้ฟังก์ชัน set_rotation เพื่อหมุนหน้าในโค้ดตัวอย่างด้านล่าง:
เอาท์พุต
ตามที่เราเห็น เอกสารมีการหมุน 90 องศา
ลบหน้า PDF
PyMuPDF ยังใช้ในการลบหน้าของไฟล์ PDF ได้ด้วย เราจะใช้ฟังก์ชัน delete_page เพื่อลบหน้าต่างๆ ต่อไปนี้คือเอกสารที่เป็นอินพุต และโค้ดจะลบหน้าที่สองของเอกสาร:
เอาท์พุต
รูปภาพด้านล่างแสดงไฟล์ PDF ที่ถูกแก้ไข โดยที่หน้าที่สองถูกลบออกไป
บทสรุป
PyMuPDF มีจุดแข็งที่โดดเด่นในการรวมและจัดการหน้าเอกสาร PDF ความยืดหยุ่นและประสิทธิภาพในการหมุน ครอบตัด ปรับขนาด และลบหน้าทำให้เป็นตัวเลือกที่แข็งแกร่งสำหรับงานแก้ไข PDF นอกจากนี้ ความสามารถของ PyMuPDF ในการผสานเอกสาร PDF หลายฉบับเข้าด้วยกันอย่างราบรื่นถือเป็นข้อได้เปรียบที่โดดเด่น
อย่างไรก็ตาม API ที่ค่อนข้างซับซ้อนอาจทำให้ผู้ใช้มือใหม่ต้องเรียนรู้ และอาจมีข้อจำกัดในการจัดการ PDF ที่มีขนาดใหญ่หรือซับซ้อนมาก ซึ่งอาจส่งผลต่อประสิทธิภาพการทำงาน อย่างไรก็ตาม ความสามารถที่ครอบคลุมในด้านเหล่านี้ทำให้เป็นเครื่องมือที่มีค่าสำหรับผู้ที่ต้องการควบคุมเนื้อหา PDF อย่างแม่นยำ