کتابخانه ادغام PDF پایتون منبع باز
این کتابخانه کاربرپسند و منبع باز Python را امتحان کنید که به شما امکان می دهد صفحات را بدون زحمت تقسیم کنید، بپیوندید، بچرخانید، مبادله کنید، و حذف کنید و آن را به ابزاری همه کاره برای نیازهای سند PDF خود تبدیل کنید.
PyMuPDF چیست؟
PyMuPDF، همچنین به عنوان Fitz شناخته می شود، یک کتابخانه پایتون منبع باز است که مجموعه ای جامع از ابزارها را برای کار با فایل های PDF ارائه می دهد. با PyMuPDF، کاربران می توانند کارهایی مانند باز کردن PDF، استخراج متن و تصاویر، دستکاری ویژگی های صفحه مانند چرخش و برش، ایجاد اسناد PDF جدید و تبدیل صفحات PDF به تصاویر را به طور موثر انجام دهند.
PyMuPDF از چندین ویژگی پشتیبانی می کند. با این حال، در این بررسی تمرکز اصلی ما بر روی تقسیم PDF، ادغام و ویژگی های مدیریت صفحه کتابخانه خواهد بود. برای ارزیابی عمیق قابلیتهای استخراج و تجزیه، لطفاً اینجا را کلیک کنید.
شروع کار با PyMuPDF
برای نصب و استفاده از PyMuPDF به نسخه 3.8.0 یا بالاتر پایتون نیاز دارید. بنابراین، ابتدا Python را نصب کنید و سپس از دستورات زیر برای نصب PyMuPDF بر روی دستگاه خود با استفاده از pip و محیط مجازی.
لینوکس
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
MacOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
ویندوز
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
چندین فایل PDF را به یکی بپیوندید
با استفاده از کتابخانه PyMuPDF، می توانیم چندین PDF را در یک فایل PDF واحد در پایتون ترکیب کنیم. قطعه کد زیر دو سند PDF را با پیوست کردن یکی پس از دیگری به یکدیگر متصل می کند و آن را به عنوان یک سند جدید ذخیره می کند:
PDF را به چندین فایل تقسیم کنید
همچنین می توان یک سند PDF را با استفاده از کتابخانه PyMuPDF به چندین PDF در پایتون تقسیم کرد. قطعه کد زیر دو صفحه اول یک سند را تقسیم می کند و آنها را به عنوان یک PDF جداگانه ذخیره می کند:
چرخاندن صفحات PDF
همچنین می توانیم صفحات یک فایل PDF را با استفاده از کتابخانه PyMuPDF بچرخانیم. ما از تابع set_rotation برای چرخاندن صفحات در قطعه کد زیر استفاده خواهیم کرد:
خروجی
همانطور که می بینیم، سند 90 درجه می چرخد.
حذف صفحات PDF
PyMuPDF همچنین می تواند برای حذف صفحات یک فایل PDF استفاده شود. ما از تابع delete_page برای حذف صفحات استفاده خواهیم کرد. در زیر سندی است که ورودی است و کد صفحه دوم آن را حذف می کند:
خروجی
تصویر زیر فایل PDF اصلاح شده را نشان می دهد که صفحه دوم از آن حذف شده است.
نتیجه گیری
PyMuPDF دارای نقاط قوت قابل توجهی در ادغام و دستکاری صفحه در اسناد PDF است. انعطاف پذیری و کارایی آن در چرخش، برش، تغییر اندازه و حذف صفحات، آن را به گزینه ای قوی برای کارهای اصلاح PDF تبدیل کرده است. علاوه بر این، توانایی PyMuPDF برای ادغام چندین سند PDF به طور یکپارچه یک مزیت قابل توجه است.
با این حال، API نسبتاً پیچیده آن ممکن است منحنی یادگیری را برای تازه واردان ارائه دهد و ممکن است محدودیتهایی در مدیریت فایلهای PDF بسیار بزرگ یا پیچیده وجود داشته باشد که میتواند بر عملکرد تأثیر بگذارد. با این وجود، قابلیت های گسترده آن در این زمینه ها آن را به ابزاری ارزشمند برای کسانی که به دنبال کنترل دقیق بر محتوای PDF هستند تبدیل می کند.