Библиотека слияния PDF-файлов с открытым исходным кодом Python
Бесплатная библиотека Python с открытым исходным кодом для разделения, объединения, добавления, поворота и обрезки страниц PDF-документов.
Что такое pypdf?
pypdf — это бесплатная библиотека Python с открытым исходным кодом, которая позволяет выполнять некоторые операции с PDF-документами, такие как добавление, поворот, обрезка, разделение и объединение страниц PDF-файлов.
Некоторые из функций перечислены ниже:
- Объединение PDF-файлов. Вы можете объединить несколько PDF-документов в один PDF-файл с помощью pypdf. Это полезно для объединения отчетов, презентаций и других документов в формате PDF.
- Разделение PDF-файлов. Pypdf также поддерживает разделение PDF-файлов на несколько более мелких PDF-файлов. Это может быть удобно, если вы хотите разбить большой PDF-файл на отдельные разделы.
- Поворот страниц. Вы можете вращать отдельные страницы PDF-документа с помощью pypdf. Это полезно для исправления ориентации отсканированных документов или изображений.
Начало работы с pypdf
Для установки и использования pypdf вам потребуется Python версии 3.6.0 или выше. Итак, сначала установите Python, а затем используйте приведенные ниже команды для установки pypdf на свой компьютер, используя pip и виртуальная среда.
Линукс
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
Окна
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Добавление, поворот и обрезка страниц PDF
Вы можете использовать библиотеку pypdf в Python для управления PDF-файлами, например добавления, поворота, обрезки страниц и даже добавления действий JavaScript в PDF-документы с помощью классов PdfWriter и PdfReader. как показано в коде ниже:
Примечание. Если контент больше не виден, он не исчез. Обрезка работает путем настройки окна просмотра. Это означает, что обрезанный контент все еще можно восстановить.
Объединение PDF-файлов
Вы можете использовать библиотеку pypdf в Python для управления PDF-файлами, например для объединения нескольких PDF-файлов в один документ. Вы можете объединять PDF-файлы и манипулировать ими, используя функции класса PdfWriter, как показано в коде ниже:
Разделить PDF-документ
Мы можем разделить PDF-документ на несколько документов, используя различные функции классов PdfWriter и PdfReader в библиотеке pypdf. Приведенный ниже фрагмент кода делит предоставленный PDF-документ на две половины и сохраняет их как два отдельных PDF-файла:
Заключение
В заключение отметим, что возможности pypdf по слиянию являются образцовыми, демонстрируя мастерство библиотеки в работе с PDF-документами. Возможность pypdf легко объединять PDF-файлы делает его отличным выбором для задач, требующих сборки документов, создания отчетов или консолидации различных PDF-ресурсов. Его удобные функции и эффективные возможности объединения способствуют его репутации как ценного инструмента управления PDF-документами.