Библиотека метаданных Python с открытым исходным кодом для PDF-документов

Бесплатная библиотека Python с открытым исходным кодом для чтения, редактирования и обновления метаданных PDF-файлов.

Что такое PikePDF для Python?

PikePDF — это современная библиотека Python, предназначенная для бесшовной обработки PDF-файлов с мощными возможностями для работы с метаданными. Созданная на основе надежной библиотеки QPDF, PikePDF позволяет разработчикам легко добавлять, редактировать и удалять метаданные из файлов PDF, что делает ее важным инструментом для организации и обогащения информации документа. Если вам нужно обновить заголовки, авторов, поля тем или пользовательские записи метаданных, PikePDF предоставляет интуитивно понятный API на языке Python для программного управления этими данными. Она также поддерживает обработку встроенных метаданных для улучшенной классификации документов и возможности поиска, обеспечивая соответствие рабочим процессам, которые в значительной степени зависят от подробных описаний документов. Благодаря своей ориентации на надежность и производительность PikePDF идеально подходит для автоматизации задач управления метаданными в системах обработки документов или для улучшения рабочих процессов PDF, управляемых метаданными.

Возможности API PikePDF

PikePDF API for Python has rich set of features for working with the metadata of the PDF documents. Some of its features are as listed below.
  • Манипуляции с PDF-файлами: объединяйте, разделяйте, поворачивайте и изменяйте порядок страниц в PDF-файлах.
  • Обработка метаданных: добавляйте, редактируйте или удаляйте метаданные для улучшения организации и информации PDF-файла.
  • Шифрование и безопасность: шифруйте PDF-файлы с помощью паролей, разблокируйте защищенные PDF-файлы и управляйте настройками безопасности.
  • Восстановление поврежденных файлов: обнаружение и устранение проблем в поврежденных или испорченных PDF-документах.
  • Преобразование PDF/A: Преобразование PDF-файлов в формат PDF/A для долгосрочного архивирования и соблюдения нормативных требований.
  • Поддержка встроенных шрифтов: обработка встроенных шрифтов для обеспечения согласованности и совместимости текста.
  • Ориентация на производительность: оптимизирован для быстрой и надежной работы с большими или сложными PDF-файлами.
  • На основе QPDF: использует мощную библиотеку QPDF для расширенных возможностей обработки PDF-файлов.
  • Открытый исходный код: бесплатное использование, активно поддерживается сообществом разработчиков.

Преимущества использования API PikePDF

  • Управление метаданными: легко добавляйте, редактируйте или удаляйте метаданные для улучшения организации PDF-файлов и удобства поиска.
  • Поддержка PDF/A: конвертируйте PDF-файлы в архивные форматы, сохраняя или обновляя метаданные.
  • Устранение повреждений: Исправление и восстановление поврежденных PDF-файлов без потери метаданных.
  • Шифрование и безопасность: управляйте защитой паролем и шифрованием, сохраняя целостность метаданных.
  • Пользовательские метаданные: добавляйте пользовательские поля, чтобы адаптировать метаданные PDF к конкретным рабочим процессам или бизнес-требованиям.
  • Высокая производительность: оптимизирован для быстрой и эффективной обработки больших и сложных PDF-файлов.
  • Открытый исходный код: бесплатный и активно поддерживаемый, предлагающий надежное и экономически эффективное решение.
  • На основе QPDF: использует мощные функции QPDF для расширенных операций с PDF и метаданными.

Начало работы с API PikePDF для Python

GitHub

Статистика GitHub

Имя:
Язык:
Звезды:
Вилки:
Лицензия:
Репозиторий последний раз обновлялся на

Использование PikePDF в приложениях Python потребует установки Python 3.9+ версии на вашей системе. Поэтому сначала установите Python, а затем используйте команды ниже для установки API Hachoir на вашем компьютере с помощью pip и виртуальной среды.


pip install pikepdf

Работа с API PikePDF для Python — примеры

Вы можете использовать PikePDF для чтения, записи и обновления метаданных файлов PDF. API предоставляет простые в использовании методы и примеры для работы с файлами PDF из ваших приложений Python.

Чтение метаданных файла с помощью API PikePDF для Python

Чтение метаданных из файла PDF с помощью файла PikePDF — это просто. Вы можете использовать следующий пример кода для чтения метаданных из любого документа PDF.

Выход

При выполнении этого кода вывод будет примерно таким:


PDF Metadata:
/Title: Sample PDF Document
/Author: John Doe
/Subject: Example Usage
/Producer: Adobe PDF Library
/CreationDate: D:20241226093000Z

Если в файле отсутствуют метаданные, вывод будет пустым.

Запись метаданных в файл PDF с помощью API PikePDF для Python

PikePDF может записывать или обновлять метаданные PDF-файла. Библиотека позволяет изменять существующие поля метаданных или добавлять новые. Вот пример, демонстрирующий, как обновить метаданные в PDF-файле:

Вот некоторые общие стандартные поля, которые вы можете обновить:


Title: The title of the document.
Author: The author of the document.
Subject: The subject or topic of the document.
Keywords: Keywords associated with the document for search purposes.
Creator: The application that created the document.
Producer: The software that generated the PDF.
CreationDate: The date the document was created.
ModDate: The date the document was last modified.

Заключение по API PikePDF

PikePDF is a powerful and user-friendly Python library that simplifies the handling of PDF files, especially for metadata management. Built on the robust QPDF library, it offers seamless capabilities to read, write, and update metadata fields, enabling developers to organize, enrich, and customize PDF documents effectively. In addition to metadata operations, PikePDF excels at tasks like repairing corrupt PDFs, managing encryption, and converting files to PDF/A format, making it a versatile tool for a wide range of PDF-related workflows. Its open-source nature, active maintenance, and Pythonic API make it an excellent choice for developers looking for a reliable and efficient solution for PDF processing and metadata management. Whether you’re automating document workflows, ensuring compliance with archival standards, or enhancing PDF metadata for searchability, PikePDF provides the tools you need to work with PDFs effortlessly.

Похожие Продукты

 Русский