1. Ürünler
  2.   Editör
  3.   Java
  4.   Apache PDFBox
 
  

Apache PDFBox: Java için Tam Donanımlı PDF Araç Seti

Metin çıkarma, belge düzenleme, form doldurma ve daha fazlası - tamamen Java ile

Apache PDFBox Nedir?

Apache PDFBox, Java'da PDF işleme için tasarlanmış güçlü bir açık kaynak kütüphanedir. Geliştiricilerin PDF belgelerini programatik olarak oluşturmasına, düzenlemesine ve içerik çıkarmasına olanak tanır. En popüler Java PDF kütüphanelerinden biri olan PDFBox, metin çıkarma, birden fazla PDF dosyasını birleştirme ve dijital imza ekleme gibi görevlerde üstün performans gösterir. Hafif bir API ve sıfır lisans maliyeti sunar. Java'da PDF ayrıştırma, PDF oluşturma veya PDF/A uyumluluğu gibi ihtiyaçlarınız için bu kütüphane, OCR entegrasyonu, form doldurma ve HTML'den PDF'e dönüştürme gibi gelişmiş özellikleri destekler. Maven desteği (örneğin, pdfbox-maven) ve kapsamlı dokümantasyon ile PDFBox, karmaşık iş akışlarını basitleştirir—kurumsal uygulamalar, belge otomasyonu ve veri çıkarma için idealdir. iText gibi alternatiflerle karşılaştırıldığında, Apache PDFBox açık kaynak esnekliği, aktif topluluğu ve çapraz platform uyumluluğu ile öne çıkar. Java kod örneklerini keşfetmek için PDFBox eğitimimize göz atın ve Java'da PDF manipülasyonunun tüm potansiyelini ortaya çıkarın.

PDFBox'un temel avantajları:

  • Tam çözüm: Hem çıkarma hem de oluşturma yetenekleri
  • Saf Java: Yerel bağımlılık yok
  • Aktif geliştirme: Apache Software Foundation tarafından destekleniyor
  • Kapsamlı özellikler: Metin çıkarma, bölme, birleştirme, imzalama
  • Form desteği: PDF formlarını okuma ve doldurma

Belge yönetim sistemleri, içerik çıkarma ve PDF otomasyonu için idealdir.

GitHub

GitHub İstatistikleri

İsim:
Dil:
Yıldızlar:
Çatallar:
Lisans:
Depo en son şu tarihte güncellendi:

Neden PDFBox'ı Tercih Etmelisiniz?

  • Olgunluk: 2002'den beri istikrarlı ve düzenli güncellemeler alıyor
  • Çok yönlülük: Hem okuma hem de yazma yetenekleri
  • Standart desteği: PDF 1.7 ve PDF/A belgelerini işler
  • Topluluk: Geniş kullanıcı tabanı ve kapsamlı dokümantasyon
  • Entegrasyon: Tüm Java tabanlı çerçevelerle uyumlu

Kurulum

PDFBox, Maven Central üzerinden kolay entegrasyon için kullanılabilir:

Maven



    org.apache.pdfbox
    pdfbox
    3.0.0


Gradle


implementation 'org.apache.pdfbox:pdfbox:3.0.0'

Sistem Gereksinimleri: Java 8 veya üzeri

Kod Örnekleri

PDFBox'un yeteneklerini gösteren pratik örnekler:

Apache PDFBox

Örnek 1: Java'da PDF Belgesinden Temel Metin Çıkarma

Bu örnek, biçimlendirme ve yapıyı koruyarak bir PDF belgesinden metin çıkarmayı gösterir. PDFBox, okuma sırasını ve karmaşık düzenleri koruyan gelişmiş metin çıkarma yetenekleri sunar.

Çıktı şunları içerir:

  • Yapılandırılmış metin içeriği
  • Sayfa sayfa çıkarma
  • Temel biçimlendirme koruması

Örnek 2: Java'da Sıfırdan PDF Belgesi Oluşturma

PDFBox, PDF okuma ve oluşturma konusunda üstündür. Bu örnek, metin ve temel biçimlendirme ile yeni bir PDF belgesi oluşturmayı gösterir.

Örnek 3: Java'da PDF Sayfalarına Üstbilgi ve Altbilgi Ekleme

PDFBox, Java uygulamanız içinden PDF sayfalarına üstbilgi ve altbilgi eklemek için kapsamlı destek sunar. Aşağıdaki kod örneği, bunu PDFBox Java API kullanarak nasıl yapacağınızı gösterir.

Gelişmiş Özellikler

PDFBox profesyonel PDF işleme desteği sunar:

  • Görüntü çıkarma: Gömülü görüntülere erişim:

    Görüntü Çıkarma

    
        PDDocument document = PDDocument.load(new File("document.pdf"));
        for (PDPage page : document.getPages()) {
            PDResources resources = page.getResources();
            for (COSName name : resources.getXObjectNames()) {
                PDXObject xobject = resources.getXObject(name);
                if (xobject instanceof PDImageXObject) {
                    BufferedImage image = ((PDImageXObject) xobject).getImage();
                    // Görüntüyü işle
                }
            }
        }
        
    
  • Belge bölme: PDF'leri birden fazla dosyaya ayırma:

    PDF Bölme

    
        Splitter splitter = new Splitter();
        List pages = splitter.split(document);
        for (int i = 0; i < pages.size(); i++) {
            pages.get(i).save("sayfa-" + (i+1) + ".pdf");
        }
        
    
  • Şifreli PDF'ler: Parola korumalı dosyaları işleme:

    Şifreli PDF

    
        String password = "secure123";
        FileInputStream fis = new FileInputStream("encrypted.pdf");
        PDDocument doc = PDDocument.load(fis, password);
        
    

PDFBox vs iText

PDFBox ve iText arasındaki 5 temel fark:

  • Lisans: PDFBox Apache lisanslı (açık kaynak), iText ise çoğu kullanım için ticari lisans gerektirir
  • Özellik Odaklılık: PDFBox dengeli okuma/yazma yetenekleri sunarken, iText PDF oluşturmada uzmanlaşmıştır
  • Performans: iText belge oluşturmada genellikle daha hızlıdır, PDFBox ise metin çıkarmada üstündür
  • Topluluk: PDFBox daha geniş açık kaynak kullanıcı kitlesine sahiptir, iText profesyonel destek sunar
  • Kullanım Senaryoları: PDFBox analiz ve temel düzenleme için idealken, iText yüksek hacimli PDF oluşturma için daha iyidir

Sonuç

Apache PDFBox, Java geliştiricileri için kapsamlı PDF işleme sunar. Şu durumlar için idealdir:

  • İçerik çıkarma: PDF'lerden metin ve veri madenciliği
  • Belge otomasyonu: Rapor ve form oluşturma
  • Belge yönetimi: PDF'leri bölme, birleştirme ve dönüştürme
  • Form işleme: Etkileşimli formları okuma ve doldurma

Açık kaynak lisansı ve kapsamlı özellik seti ile PDFBox, Java tabanlı PDF işleme için birinci sınıf bir seçimdir.

Benzer Ürünler

 Türkçe