PDF Clown: API PDF น้ำหนักเบาสำหรับการทำงานกับเอกสาร PDF

สร้าง แก้ไข และวิเคราะห์ PDF แบบโปรแกรมมิ่งใน Java

PDF Clown คืออะไร?

PDF Clown เป็น Java API แบบโอเพนซอร์สที่ออกแบบมาสำหรับการสร้าง PDF แบบไดนามิก การแก้ไข และการดึงเนื้อหา ภายใต้สัญญาอนุญาต GNU AGPL ให้การควบคุมอย่างละเอียดแก่นักพัฒนาเหนือเอกสาร PDF รองรับคุณสมบัติต่างๆ เช่น การแสดงผลข้อความ กราฟิกแบบเวกเตอร์ หมายเหตุ การกรอกแบบฟอร์ม และแม้กระทั่งการจัดการวัตถุ PDF ระดับต่ำ ต่างจากทางเลือกอื่นๆ ที่มีน้ำหนักมากกว่า PDF Clown ให้ความสำคัญกับความเรียบง่ายและประสิทธิภาพ ทำให้เหมาะสำหรับแอปพลิเคชันที่ต้องการการประมวลผล PDF แบบน้ำหนักเบาโดยไม่เสียประสิทธิภาพการทำงาน โครงสร้างแบบโมดูลาร์ช่วยให้สามารถเลือกใช้คุณลักษณะได้ตั้งแต่การสร้าง PDF พื้นฐานไปจนถึงการจัดการแบบฟอร์มเชิงโต้ตอบขั้นสูง

PDF Clown มีเอกลักษณ์เฉพาะด้วยแนวทางการจัดการ PDF แบบเชิงวัตถุ โดยถือว่าทุกองค์ประกอบ (ข้อความ รูปภาพ เส้นทาง) เป็นเอนทิตีระดับแรก การออกแบบนี้ช่วยให้สามารถสร้างและแก้ไขเอกสารได้อย่างเป็นธรรมชาติ ไม่ว่าคุณจะสร้างรายงาน วิเคราะห์ PDF ที่มีอยู่ หรือเพิ่มองค์ประกอบเชิงโต้ตอบเช่นปุ่มและที่คั่นหนังสือ

ข้อได้เปรียบหลักของ PDF Clown:

  • การควบคุมอย่างละเอียด: การเข้าถึงวัตถุ PDF โดยตรง (เช่น สตรีม, ดิกชันนารี)
  • กราฟิกแบบเวกเตอร์: รองรับเส้นโค้ง Bézier รูปร่างและการแปลงรูปแบบ
  • แบบฟอร์มเชิงโต้ตอบ: สร้างและกรอกแบบฟอร์ม PDF (AcroForm/XFA)
  • การดึงเนื้อหา: วิเคราะห์ข้อความ รูปภาพและเมตาดาต้าจาก PDF ที่มีอยู่
  • น้ำหนักเบา: การพึ่งพาน้อยที่สุดและการใช้หน่วยความจำที่มีประสิทธิภาพ

เหมาะสำหรับการทำเอกสารอัตโนมัติ การดึงข้อมูลและการสร้าง PDF แบบไดนามิก

GitHub

สถิติ GitHub

ชื่อ:
ภาษา:
ดาว:
ส้อม:
ใบอนุญาต:
พื้นที่เก็บข้อมูลได้รับการอัปเดตครั้งล่าสุดเมื่อ

ทำไมต้องเลือก PDF Clown?

  • ความยืดหยุ่น: จัดการ PDF ในระดับสูงและระดับต่ำ
  • คุณสมบัติเชิงโต้ตอบ: รองรับหมายเหตุ ไฮเปอร์ลิงก์และมัลติมีเดีย
  • เหมาะสำหรับการดึงข้อมูล: ความสามารถในการดึงข้อความ/ทรัพยากรที่แข็งแกร่ง
  • ข้ามแพลตฟอร์ม: Java ล้วนโดยไม่มีโค้ดเนทีฟ
  • ความโปร่งใส: API ที่สะอาดพร้อมเอกสารประกอบที่ครอบคลุม

การติดตั้ง

เพิ่ม PDF Clown ผ่าน Maven หรือดาวน์โหลด JAR โดยตรง:

Maven



    org.pdfclown
    pdfclown
    1.0.2


ด้วยมือ (JAR)


ดาวน์โหลด: https://github.com/stefanochizzolini/PDFClown/releases

ข้อกำหนดของระบบ: Java 6+

ตัวอย่างโค้ด

PDF Clown เหมาะสำหรับสถานการณ์เช่นการสร้าง PDF ตั้งแต่เริ่มต้น การดึงข้อความและการแก้ไขเอกสารที่มีอยู่ ด้านล่างนี้คือตัวอย่างเชิงปฏิบัติ:

PDF Clown API สำหรับ Java

ตัวอย่าง 1: สร้างเอกสาร PDF พื้นฐานโดยใช้ PDFClown Java API

ตัวอย่างนี้แสดงวิธีการง่ายๆ ของ PDF Clown ในการสร้าง PDF โค้ดสร้างเอกสารเปล่า เพิ่มหน้าและแทรกข้อความที่มีสไตล์ด้วยฟอนต์ที่กำหนดเอง ต่างจากไลบรารีระดับสูง PDF Clown ต้องการการกำหนดตำแหน่งพิกัดอย่างชัดเจน (ผ่าน PrimitiveComposer) ให้การควบคุมเลย์เอาต์ที่แม่นยำถึงพิกเซล ตัวอย่างแสดงวิธีการตั้งค่าสไตล์ฟอนต์ วาดข้อความที่พิกัดเฉพาะและบันทึกผลลัพธ์ - เหมาะสำหรับแอปพลิเคชันที่ต้องการการควบคุมการจัดพิมพ์ที่แม่นยำ เช่น ป้ายชื่อหรือใบรับรอง

คลาส File และ Document จัดการการทำงานกับไฟล์ ในขณะที่ PrimitiveComposer จัดการการแสดงผลเนื้อหา

ตัวอย่าง 2: ดึงข้อความจาก PDF ที่มีอยู่ใน Java

ตัวอย่างนี้เน้นความสามารถในการดึงข้อความของ PDF Clown โค้ดวิเคราะห์ไฟล์ PDF วนลูปผ่านหน้าและดึงเนื้อหาข้อความพร้อมเมตาดาตาการจัดรูปแบบ (ฟอนต์ ขนาด ตำแหน่ง) มีประโยชน์สำหรับการทำเหมืองข้อมูล การจัดทำดัชนีการค้นหาหรือการย้ายเนื้อหา การใช้งานนี้แสดงให้เห็นถึงความสามารถของ PDF Clown ในการจัดการเลย์เอาต์ที่ซับซ้อน รวมถึงข้อความหลายคอลัมน์และองค์ประกอบที่หมุน คลาส TextExtractor ให้ตัวเลือกการกรองขั้นสูงเพื่อแยกพื้นที่ข้อความเฉพาะหรือละเว้นองค์ประกอบตกแต่ง

ตัวอย่าง 3: เพิ่มหมายเหตุใน PDF ด้วย Java

ตัวอย่างนี้แสดงการแก้ไข PDF เชิงโต้ตอบโดยเพิ่มหมายเหตุลิงก์ที่คลิกได้ โดยใช้คลาส LinkAnnotation ของ PDF Clown โค้ดกำหนดพื้นที่สี่เหลี่ยมบนหน้าที่เปิด URL เมื่อคลิก ตัวอย่างรวมการคำนวณขอบเขต การผูก URI action และการจัดสไตล์หมายเหตุ - เหมาะสำหรับการเพิ่มคุณค่าให้กับ PDF ด้วยองค์ประกอบเชิงโต้ตอบเช่นลิงก์สารบัญหรือการอ้างอิงภายนอก การสนับสนุนหมายเหตุของ PDF Clown รวมถึงตราประทับ หมายเหตุป๊อปอัพและมัลติมีเดีย ช่วยให้เอกสารมีปฏิสัมพันธ์ที่หลากหลาย

สรุป

PDF Clown เป็นตัวเลือกที่เหมาะสำหรับนักพัฒนา Java ที่ต้องการ:

  • การควบคุมระดับต่ำ: การจัดการวัตถุ PDF โดยตรง
  • การดึงเนื้อหา: การสกัดข้อความและทรัพยากรจาก PDF
  • PDF เชิงโต้ตอบ: แบบฟอร์ม ลิงก์และหมายเหตุ
  • การประมวลผลน้ำหนักเบา: การใช้ทรัพยากรขั้นต่ำ

ด้วยความสมดุลที่ไม่เหมือนใครระหว่างความเรียบง่ายและประสิทธิภาพ PDF Clown จึงเป็นเครื่องมือที่โดดเด่นสำหรับเวิร์กโฟลว์ PDF เฉพาะทางที่ความแม่นยำสำคัญกว่าเทมเพลตสำเร็จรูป

สินค้าที่คล้ายกัน

 Thai