Perpustakaan Anotasi PDF Python Sumber Terbuka
Coba pustaka Python Gratis & Sumber Terbuka ini untuk menambahkan dan mengekstrak anotasi dari dokumen PDF.
Apa itu pypdf?
Pypdf adalah pustaka python sumber terbuka dan gratis yang dikenal dengan beragam fitur untuk menangani dokumen PDF di lingkungan python. Alat ini berguna untuk berbagai manipulasi PDF tetapi kami akan fokus pada fitur terkait anotasinya dalam ulasan ini.
Fitur penting pypdf yang terkait dengan anotasi meliputi:
- Menambahkan Anotasi Bentuk: Kita dapat menggambar bentuk seperti garis, persegi panjang, elips, poligon, dll. pada area tertentu di halaman PDF sebagai anotasi.
- Menambahkan Anotasi Teks: Kami dapat menambahkan anotasi teks ke posisi tertentu pada halaman PDF.
- Menambahkan Anotasi Tautan: Anda juga dapat menambahkan anotasi tautan (seperti hyperlink) ke dokumen PDF.
- Mengekstrak Anotasi: Kita dapat mengulangi dan mengekstrak informasi tentang semua anotasi dalam dokumen PDF menggunakan pustaka pypdf.
Memulai dengan pypdf
Anda memerlukan Python versi 3.6.0 atau lebih tinggi untuk menginstal dan menggunakan pypdf. Jadi, pertama-tama instal Python lalu gunakan perintah di bawah ini untuk menginstal pypdf di mesin Anda menggunakan pip dan lingkungan virtual.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
macOS
python -m venv venv
source venv/bin/activate
pip install pypdf
jendela
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Tambahkan Anotasi Persegi Panjang ke PDF
Kita dapat menambahkan anotasi persegi panjang ke dokumen PDF menggunakan perpustakaan pypdf. Kita akan menggunakan kelas Rectangle dari modul pypdf.annotations dari pustaka pypdf untuk mendefinisikan persegi panjang. Kemudian kita akan menggunakan metode add_annotations dari kelas PDFWriter untuk menambahkan anotasi persegi panjang ke PDF.
Periksa cuplikan kode di bawah ini untuk detailnya:
Keluaran
Pada tangkapan layar di bawah, Anda dapat melihat bahwa persegi panjang ditambahkan ke kata Sumber Terbuka anotasi:
Tambahkan Anotasi Teks ke PDF
Kami membuat anotasi teks menggunakan kelas Teks dari modul pypdf.annotations pada pustaka pypdf. Setelah itu kita bisa menggunakan metode add_annotations dari kelas PDFWriter dari pustaka pypdf untuk menambahkan anotasi ke PDF. Anotasi teks ditambahkan sebagai ikon yang meluas dan menampilkan teks saat ikon diklik. Periksa cuplikan kode di bawah ini untuk detailnya:
Keluaran
Seperti yang bisa kita lihat pada screencast di bawah, kode di atas menambahkan ikon ke PDF pada posisi tertentu yang menampilkan anotasi teks ketika ikon diklik:
Tambahkan Anotasi Tautan ke PDF
Anotasi link dibuat menggunakan kelas Link dari modul pypdf.annotations. Namun, masalah dengan anotasi tautan adalah ia hanya menambahkan tautan namun tidak terlihat. Untuk mengatasi masalah ini, kita akan menggabungkan persegi panjang menggunakan kelas Rectangle dari modul pypdf.annotations seperti yang telah kami jelaskan sebelumnya. Dengan cara ini, pengguna dapat mengidentifikasi secara visual lokasi penambahan anotasi tautan. Periksa cuplikan kode di bawah ini untuk pemahaman yang lebih baik:
Keluaran
Seperti yang bisa kita lihat di output, persegi panjang berfungsi sebagai area yang, ketika diklik, mengarahkan pengguna ke link yang ditentukan.
Ekstrak Anotasi dari PDF
Kita dapat mengekstrak anotasi dari PDF menggunakan perpustakaan pypdf. Kami mengulangi semua anotasi pada halaman PDF dan kemudian menggunakan metode get_object untuk mendapatkan objek anotasi. Kemudian kami mengekstrak informasi yang relevan dari objek tersebut. Periksa cuplikan kode di bawah ini untuk detailnya:
Keluaran
Seperti yang bisa kita lihat pada gambar di bawah, program telah mengembalikan jenis anotasi dan koordinat anotasi dalam dokumen PDF:
Kesimpulan
Pypdf memberdayakan pengembang Python untuk menambahkan berbagai jenis anotasi ke PDF dan mengakses informasi penting tentang anotasi, seperti jenis dan lokasinya, menjadikannya pilihan praktis untuk tugas-tugas yang memerlukan penambahan anotasi dan mengekstraksi data tentang anotasi.