Pustaka Metadata Python Sumber Terbuka untuk Dokumen PDF
Pustaka Python gratis & sumber terbuka untuk membaca, mengedit, dan memperbarui metadata File PDF.
Apa itu PikePDF untuk Python?
PikePDF adalah pustaka Python modern yang dirancang khusus untuk manipulasi PDF yang lancar, dengan kemampuan canggih untuk bekerja secara khusus dengan metadata. Dibangun di atas pustaka QPDF yang tangguh, PikePDF memungkinkan pengembang untuk dengan mudah menambahkan, mengedit, dan menghapus metadata dari file PDF, menjadikannya alat penting untuk mengatur dan memperkaya informasi dokumen. Apakah Anda perlu memperbarui judul, penulis, bidang subjek, atau entri metadata khusus, PikePDF menyediakan API Pythonic dan intuitif untuk mengelola detail ini secara terprogram. Ia juga mendukung penanganan metadata tertanam untuk klasifikasi dan penelusuran dokumen yang ditingkatkan, memastikan kepatuhan dengan alur kerja yang sangat bergantung pada deskripsi dokumen terperinci. Dengan fokusnya pada keandalan dan kinerja, PikePDF ideal untuk mengotomatiskan tugas manajemen metadata dalam sistem pemrosesan dokumen atau meningkatkan alur kerja PDF yang digerakkan oleh metadata.
Fitur API PikePDF
PikePDF API for Python has rich set of features for working with the metadata of the PDF documents. Some of its features are as listed below.- Manipulasi PDF: Gabungkan, pisahkan, putar, dan susun ulang halaman dalam file PDF.
- Penanganan Metadata: Tambahkan, edit, atau hapus metadata untuk meningkatkan organisasi dan informasi PDF.
- Enkripsi dan Keamanan: Enkripsi PDF dengan kata sandi, buka kunci PDF yang diamankan, dan kelola pengaturan keamanan.
- Perbaiki Berkas yang Rusak: Deteksi dan perbaiki masalah pada dokumen PDF yang rusak atau korup.
- Konversi PDF/A: Konversi PDF ke format PDF/A untuk pengarsipan dan kepatuhan jangka panjang.
- Dukungan Font Tertanam: Menangani font tertanam untuk konsistensi dan kompatibilitas teks.
- Berorientasi pada Kinerja: Dioptimalkan untuk operasi yang cepat dan andal dengan PDF yang besar atau kompleks.
- Berdasarkan QPDF: Memanfaatkan pustaka QPDF yang canggih untuk kemampuan manipulasi PDF tingkat lanjut.
- Sumber Terbuka: Gratis untuk digunakan dan dipelihara secara aktif oleh komunitas pengembang.
Keuntungan menggunakan PikePDF API
- Manajemen Metadata: Tambahkan, edit, atau hapus metadata dengan mudah untuk meningkatkan pengorganisasian dan penelusuran PDF.
- Dukungan PDF/A: Mengonversi PDF ke format arsip sambil mempertahankan atau memperbarui metadata.
- Penanganan Korupsi: Perbaiki dan pulihkan file PDF yang rusak tanpa kehilangan metadata.
- Enkripsi dan Keamanan: Kelola perlindungan kata sandi dan enkripsi sambil menjaga integritas metadata.
- Metadata Kustom: Tambahkan bidang kustom untuk menyesuaikan metadata PDF untuk alur kerja atau persyaratan bisnis tertentu.
- Kinerja Tinggi: Dioptimalkan untuk pemrosesan file PDF yang besar dan kompleks secara cepat dan efisien.
- Sumber Terbuka: Gratis dan dipelihara secara aktif, menawarkan solusi yang andal dan hemat biaya.
- Berdasarkan QPDF: Memanfaatkan fitur-fitur hebat QPDF untuk operasi PDF dan metadata tingkat lanjut.
Memulai dengan PikePDF API untuk Python
Menggunakan PikePDF dalam aplikasi Python Anda akan mengharuskan Anda untuk menginstal Python versi 3.9+ pada sistem Anda. Jadi, pertama-tama instal Python lalu gunakan perintah di bawah ini untuk menginstal API Hachoir pada mesin Anda menggunakan pip dan lingkungan virtual.
pip install pikepdf
Bekerja dengan PikePDF API untuk Python - Contoh
Anda dapat menggunakan PikePDF untuk membaca, menulis, dan memperbarui informasi metadata file PDF. API menyediakan metode dan contoh yang mudah digunakan untuk bekerja dengan file PDF dari dalam aplikasi Python Anda.
Membaca Informasi Metadata File menggunakan PikePDF API untuk Python
Membaca informasi metadata dari berkas PDF menggunakan berkas PikePDF mudah dilakukan. Anda dapat menggunakan kode contoh berikut untuk membaca informasi metadata dari dokumen PDF apa pun.
Keluaran
Saat Anda menjalankan kode ini, outputnya akan mirip dengan berikut ini:
PDF Metadata:
/Title: Sample PDF Document
/Author: John Doe
/Subject: Example Usage
/Producer: Adobe PDF Library
/CreationDate: D:20241226093000Z
Jika tidak ada informasi metadata yang tersedia dalam berkas, output akan kosong.
Menulis Informasi Metadata ke File PDF menggunakan PikePDF API untuk Python
PikePDF dapat menulis atau memperbarui metadata dari sebuah berkas PDF. Pustaka ini memungkinkan Anda untuk mengubah bidang metadata yang ada atau menambahkan yang baru. Berikut ini adalah contoh yang menunjukkan cara memperbarui metadata dalam berkas PDF:
Berikut adalah beberapa bidang standar umum yang dapat Anda perbarui:
Title: The title of the document.
Author: The author of the document.
Subject: The subject or topic of the document.
Keywords: Keywords associated with the document for search purposes.
Creator: The application that created the document.
Producer: The software that generated the PDF.
CreationDate: The date the document was created.
ModDate: The date the document was last modified.