1. מוצרים
  2.   עוֹרֵך
  3.   Java
  4.   Apache PDFBox
 
  

Apache PDFBox: ערכת כלים מלאה ל-PDF עבור Java

חלץ טקסט, ערוך מסמכים, מלא טפסים ועוד - הכל ב-Java טהור

מה זה Apache PDFBox?

Apache PDFBox היא ספריית Java קוד פתוח חזקה המיועדת לעיבוד PDF חלק ב-Java, המאפשרת למפתחים ליצור, לערוך ולחלץ תוכן ממסמכי PDF בצורה תוכניתית. כאחת מספריות ה-PDF הפופולריות ביותר ל-Java, PDFBox מצטיינת במשימות כמו חילוץ טקסט מ-PDFs, מיזוג קבצי PDF מרובים והוספת חתימות דיגיטליות - הכל עם API קל משקל וללא עלויות רישוי. בין אם אתה זקוק לניתוח PDF ב-Java, יצירת PDF או תאימות ל-PDF/A, ספרייה זו תומכת בתכונות מתקדמות כמו שילוב OCR, מילוי טפסים והמרת HTML ל-PDF. עם תלות מוכנות ל-Maven (למשל pdfbox-maven) ותיעוד מקיף, PDFBox מפשט תהליכי עבודה מורכבים - מה שהופך אותו לאידיאלי עבור יישומי ארגון, אוטומציה של מסמכים וחילוץ נתונים. בהשוואה לחלופות כמו iText, Apache PDFBox בולט בגמישות קוד הפתוח שלו, בקהילה הפעילה ובתאימות בין פלטפורמות. חקור את מדריך ה-PDFBox שלנו כדי לגלות דוגמאות קוד Java ולשחרר את מלוא הפוטנציאל של עריכת PDF ב-Java.

יתרונות עיקריים של PDFBox:

  • פיתרון מלא: יכולות חילוץ ויצירה
  • Java טהור: ללא תלות מקוריות
  • פיתוח פעיל: נתמך על ידי Apache Software Foundation
  • תכונות מקיפות: חילוץ טקסט, פיצול, מיזוג, חתימה
  • תמיכה בטפסים: קריאה ומילוי טפסי PDF

אידיאלי למערכות ניהול מסמכים, חילוץ תוכן ואוטומציה של PDF.

GitHub

סטטיסטיקות GitHub

שֵׁם:
שפה:
כוכבים:
מזלגות:
רישיון:
המאגר עודכן לאחרונה ב

למה לבחור ב-PDFBox?

  • בשלות: יציב מאז 2002 עם עדכונים סדירים
  • גמישות: יכולות קריאה וכתיבה
  • תמיכה בתקנים: מטפל במסמכי PDF 1.7 ו-PDF/A
  • קהילה: בסיס משתמשים גדול ותיעוד מקיף
  • שילוב: עובד עם כל המסגרות מבוססות Java

התקנה

PDFBox זמין דרך Maven Central לשילוב קל:

Maven



    org.apache.pdfbox
    pdfbox
    3.0.0


Gradle


implementation 'org.apache.pdfbox:pdfbox:3.0.0'

דרישות מערכת: Java 8 ומעלה

דוגמאות קוד

דוגמאות מעשיות ליכולות של PDFBox:

Apache PDFBox

דוגמה 1: חילוץ טקסט בסיסי ממסמך PDF ב-Java

דוגמה זו מדגימה כיצד לחלץ טקסט ממסמך PDF תוך שמירה על העיצוב והמבנה. PDFBox מספק יכולות חילוץ טקסט מתקדמות השומרות על סדר קריאה ומטפלות בפריסות מורכבות.

הפלט כולל:

  • תוכן טקסט מובנה
  • חילוץ לפי עמודים
  • שמירה על עיצוב בסיסי

דוגמה 2: יצירת מסמך PDF מאפס ב-Java

PDFBox מצטיינת הן בקריאת והן ביצירת PDFs. דוגמה זו מדגימה יצירת מסמך PDF חדש עם טקסט ועיצוב בסיסי.

דוגמה 3: הוספת כותרות עליונות ותחתונות לעמודי PDF ב-Java

PDFBox מספק תמיכה מקיפה להוספת כותרות עליונות ותחתונות לעמודי PDF מיישום ה-Java שלך. דוגמת הקוד הבאה מראה כיצד להשיג זאת באמצעות PDFBox API עבור Java.

תכונות מתקדמות

PDFBox תומך בעיבוד PDF מקצועי:

  • חילוץ תמונות: גישה לתמונות מוטבעות:

    חילוץ תמונות

    
        PDDocument document = PDDocument.load(new File("document.pdf"));
        for (PDPage page : document.getPages()) {
            PDResources resources = page.getResources();
            for (COSName name : resources.getXObjectNames()) {
                PDXObject xobject = resources.getXObject(name);
                if (xobject instanceof PDImageXObject) {
                    BufferedImage image = ((PDImageXObject) xobject).getImage();
                    // עיבוד תמונה
                }
            }
        }
        
    
  • פיצול מסמך: חלוקת PDFs לקבצים מרובים:

    פיצול PDF

    
        Splitter splitter = new Splitter();
        List pages = splitter.split(document);
        for (int i = 0; i < pages.size(); i++) {
            pages.get(i).save("page-" + (i+1) + ".pdf");
        }
        
    
  • PDFs מוצפנים: טיפול בקבצים מוגני סיסמה:

    PDF מוצפן

    
        String password = "secure123";
        FileInputStream fis = new FileInputStream("encrypted.pdf");
        PDDocument doc = PDDocument.load(fis, password);
        
    

PDFBox לעומת iText

להלן 5 הבדלים עיקריים בין PDFBox ל-iText:

  • רישיון: PDFBox מורשה תחת Apache (קוד פתוח), בעוד iText בעל רישיון מסחרי לרוב מקרי השימוש
  • מיקוד תכונות: PDFBox מספק יכולות קריאה/כתיבה מאוזנות, בעוד iText מתמחה ביצירת PDF
  • ביצועים: iText בדרך כלל מהיר יותר ביצירת מסמכים, בעוד PDFBox מצטיין בחילוץ טקסט
  • קהילה: ל-PDFBox אימוץ קוד פתוח רחב יותר, בעוד iText מציע תמיכה מקצועית
  • מקרי שימוש: PDFBox אידיאלי לניתוח ועריכה בסיסית, בעוד iText טוב יותר ליצירת PDF בהיקף גדול

סיכום

Apache PDFBox מספק עיבוד PDF מקיף למפתחי Java. אידיאלי עבור:

  • חילוץ תוכן: כריית טקסט ונתונים מ-PDFs
  • אוטומציה של מסמכים: יצירת דוחות וטפסים
  • ניהול מסמכים: פיצול, מיזוג והמרה של PDFs
  • עיבוד טפסים: קריאה ומילוי טפסים אינטראקטיביים

עם רישיון קוד הפתוח שלו וסט תכונות מקיף, PDFBox הוא הבחירה המובילה לעיבוד PDF מבוסס Java.

מוצרים דומים

 Hebrew