کتابخانه ادغام PDF پایتون منبع باز

این کتابخانه کاربرپسند و منبع باز Python را امتحان کنید که به شما امکان می دهد صفحات را بدون زحمت تقسیم کنید، بپیوندید، بچرخانید، مبادله کنید، و حذف کنید و آن را به ابزاری همه کاره برای نیازهای سند PDF خود تبدیل کنید.

PyMuPDF چیست؟

PyMuPDF، همچنین به عنوان Fitz شناخته می شود، یک کتابخانه پایتون منبع باز است که مجموعه ای جامع از ابزارها را برای کار با فایل های PDF ارائه می دهد. با PyMuPDF، کاربران می توانند کارهایی مانند باز کردن فایل های PDF، استخراج متن و تصاویر، دستکاری ویژگی های صفحه مانند چرخش و برش، ایجاد اسناد PDF جدید و تبدیل صفحات PDF به تصاویر را به طور موثر انجام دهند.

PyMuPDF از چندین ویژگی پشتیبانی می کند. با این حال، در این بررسی تمرکز اصلی ما بر روی تقسیم PDF، ادغام و ویژگی های مدیریت صفحه کتابخانه خواهد بود. برای ارزیابی عمیق قابلیت‌های استخراج و تجزیه، لطفاً اینجا را کلیک کنید.

GitHub

آمار GitHub

نام:
زبان:
ستاره ها:
چنگال:
مجوز:
آخرین به روز رسانی مخزن در

شروع کار با PyMuPDF

برای نصب و استفاده از PyMuPDF به نسخه 3.8.0 یا بالاتر پایتون نیاز دارید. بنابراین، ابتدا Python را نصب کنید و سپس از دستورات زیر برای نصب PyMuPDF بر روی دستگاه خود با استفاده از pip و محیط مجازی.

لینوکس


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

سیستم عامل مک


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

پنجره ها


python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf 

چندین فایل PDF را به یکی بپیوندید

با استفاده از کتابخانه PyMuPDF، می توانیم چندین PDF را در یک فایل PDF واحد در پایتون ترکیب کنیم. قطعه کد زیر دو سند PDF را با پیوست کردن یکی پس از دیگری به یکدیگر متصل می کند و آن را به عنوان یک سند جدید ذخیره می کند:

PDF را به چندین فایل تقسیم کنید

همچنین می توان یک سند PDF را با استفاده از کتابخانه PyMuPDF به چندین PDF در پایتون تقسیم کرد. قطعه کد زیر دو صفحه اول یک سند را تقسیم می کند و آنها را به عنوان یک PDF جداگانه ذخیره می کند:

چرخاندن صفحات PDF

ما همچنین می توانیم صفحات یک فایل PDF را با استفاده از کتابخانه PyMuPDF بچرخانیم. ما از تابع set_rotation برای چرخاندن صفحات در قطعه کد زیر استفاده خواهیم کرد:

خروجی

همانطور که می بینیم، سند 90 درجه می چرخد.

حذف صفحات PDF

PyMuPDF همچنین می تواند برای حذف صفحات یک فایل PDF استفاده شود. ما از تابع delete_page برای حذف صفحات استفاده خواهیم کرد. در زیر سندی است که ورودی است و کد صفحه دوم آن را حذف می کند:

خروجی

تصویر زیر فایل PDF اصلاح شده را نشان می دهد که صفحه دوم از آن حذف شده است.

نتیجه

PyMuPDF دارای نقاط قوت قابل توجهی در ادغام و دستکاری صفحات در اسناد PDF است. انعطاف پذیری و کارایی آن در چرخش، برش، تغییر اندازه و حذف صفحات، آن را به گزینه ای قوی برای کارهای اصلاح PDF تبدیل کرده است. علاوه بر این، توانایی PyMuPDF برای ادغام چندین سند PDF به طور یکپارچه یک مزیت قابل توجه است.

با این حال، API نسبتاً پیچیده آن ممکن است منحنی یادگیری را برای تازه واردان ارائه دهد، و ممکن است محدودیت‌هایی در مدیریت فایل‌های PDF بسیار بزرگ یا پیچیده وجود داشته باشد که می‌تواند بر عملکرد تأثیر بگذارد. با این وجود، قابلیت های گسترده آن در این زمینه ها آن را به ابزاری ارزشمند برای کسانی که به دنبال کنترل دقیق بر محتوای PDF هستند تبدیل می کند.

محصولات مشابه

 فارسی