مكتبة دمج PDF بيثون مفتوحة المصدر
جرب مكتبة Python سهلة الاستخدام ومفتوحة المصدر والتي تسمح لك بتقسيم الصفحات والانضمام إليها وتدويرها وتبديلها وحذفها دون عناء، مما يجعلها أداة متعددة الاستخدامات لاحتياجات مستندات PDF الخاصة بك.
ما هو PyMuPDF؟
PyMuPDF، والمعروفة أيضًا باسم Fitz، هي مكتبة Python مفتوحة المصدر توفر مجموعة شاملة من الأدوات للعمل مع ملفات PDF. باستخدام PyMuPDF، يمكن للمستخدمين أداء مهام بكفاءة مثل فتح ملفات PDF، واستخراج النصوص والصور، ومعالجة خصائص الصفحة مثل التدوير والاقتصاص، وإنشاء مستندات PDF جديدة، وتحويل صفحات PDF إلى صور.
يدعم PyMuPDF العديد من الميزات. ومع ذلك، في هذه المراجعة، سيكون تركيزنا الأساسي على ميزات تقسيم ملفات PDF ودمجها وإدارة الصفحات الخاصة بالمكتبة. للحصول على تقييم متعمق لقدرات الاستخراج والتحليل، يرجى النقر هنا.
الشروع في العمل مع PyMuPDF
تحتاج إلى إصدار Python 3.8.0 أو أعلى لتثبيت PyMuPDF واستخدامه. لذا، قم أولاً بتثبيت Python ثم استخدم الأوامر أدناه لتثبيت PyMuPDF على جهازك باستخدام pip والبيئة الافتراضية.
لينكس
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
ماك
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
شبابيك
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
انضم إلى ملفات PDF متعددة في ملف واحد
باستخدام مكتبة PyMuPDF، يمكننا دمج ملفات PDF متعددة في ملف PDF واحد في Python. يقوم مقتطف التعليمات البرمجية التالي بربط مستندي PDF معًا عن طريق إلحاق واحد تلو الآخر وحفظه كمستند جديد:
تقسيم PDF إلى ملفات متعددة
من الممكن أيضًا تقسيم مستند PDF إلى ملفات PDF متعددة في Python باستخدام مكتبة PyMuPDF. يقوم مقتطف الكود التالي بتقسيم أول صفحتين من المستند ويخزنهما كملف PDF منفصل:
تدوير صفحات PDF
يمكننا أيضًا تدوير صفحات ملف PDF باستخدام مكتبة PyMuPDF. سنستخدم الدالة set_rotation لتدوير الصفحات في مقتطف الشفرة أدناه:
انتاج
كما نرى، يتم تدوير المستند بمقدار 90 درجة.
حذف صفحات PDF
يمكن أيضًا استخدام PyMuPDF لحذف صفحات ملف PDF. سنستخدم الدالة delete_page لحذف الصفحات. فيما يلي المستند الذي تم إدخاله وسيقوم الكود بحذف صفحته الثانية:
انتاج
تعرض الصورة أدناه ملف PDF المعدل، والذي تمت إزالة الصفحة الثانية منه.
خاتمة
يتميز PyMuPDF بنقاط قوة ملحوظة في الدمج ومعالجة الصفحات داخل مستندات PDF. إن مرونته وكفاءته في تدوير الصفحات وقصها وتغيير حجمها وحذفها تجعله خيارًا قويًا لمهام تعديل PDF. بالإضافة إلى ذلك، تعد قدرة PyMuPDF على دمج مستندات PDF متعددة بسلاسة ميزة ملحوظة.
ومع ذلك، قد تقدم واجهة برمجة التطبيقات (API) المعقدة نسبيًا منحنى تعليميًا للقادمين الجدد، وقد تكون هناك بعض القيود في التعامل مع ملفات PDF الكبيرة جدًا أو المعقدة، مما قد يؤثر على الأداء. ومع ذلك، فإن إمكانياته الواسعة في هذه المجالات تجعله أداة قيمة لأولئك الذين يسعون إلى التحكم الدقيق في محتوى PDF.