1. 제품
  2.   편집자
  3.   Java
  4.   PDF Clown
 
  

PDF Clown: PDF 문서 작업을 위한 경량 Java API

Java에서 프로그래밍 방식으로 PDF 생성, 수정 및 분석

PDF Clown이란?

PDF Clown은 동적 PDF 생성, 편집 및 콘텐츠 추출을 위해 설계된 다용도 오픈소스 Java API입니다. GNU AGPL 라이선스로 제공되며, 텍스트 렌더링, 벡터 그래픽, 주석, 양식 채우기 및 저수준 PDF 객체 조작과 같은 기능을 지원하여 개발자에게 세밀한 제어 기능을 제공합니다. 무거운 대안과 달리 PDF Clown은 기능을 희생하지 않으면서도 경량 PDF 처리를 강조하여 기본적인 PDF 생성부터 고급 양식 처리까지 선택적 기능 사용이 가능한 모듈식 아키텍처를 갖추고 있습니다.

PDF Clown은 모든 요소(텍스트, 이미지, 경로)를 일급 객체로 취급하는 객체 지향적 접근 방식으로 PDF 조작을 수행합니다. 이 설계는 보고서 작성, 기존 PDF 파싱 또는 버튼 및 책갈피와 같은 대화형 요소 추가와 같은 작업을 직관적으로 수행할 수 있게 합니다.

PDF Clown의 주요 장점:

  • 세밀한 제어: PDF 객체(스트림, 딕셔너리 등)에 대한 직접 접근
  • 벡터 그래픽: 베지어 곡선, 도형 및 변환 지원
  • 대화형 양식: PDF 양식(AcroForm/XFA) 생성 및 채우기
  • 콘텐츠 추출: 기존 PDF에서 텍스트, 이미지 및 메타데이터 파싱
  • 경량: 최소 의존성 및 효율적인 메모리 사용

문서 자동화, 데이터 추출 및 동적 PDF 생성에 이상적입니다.

GitHub

GitHub 통계

이름:
언어:
별:
포크:
특허:
저장소가 마지막으로 업데이트된 시간:

PDF Clown을 선택하는 이유

  • 유연성: 고수준 및 저수준에서 PDF 조작 가능
  • 대화형 기능: 주석, 하이퍼링크 및 멀티미디어 지원
  • 추출 용이성: 강력한 텍스트/에셋 추출 기능
  • 크로스 플랫폼: 네이티브 코드 없는 순수 Java
  • 투명성: 명확한 API와 포괄적인 문서

설치 방법

Maven을 통해 PDF Clown을 추가하거나 JAR을 직접 다운로드하세요:

Maven



    org.pdfclown
    pdfclown
    1.0.2


수동 설치 (JAR)


다운로드: https://github.com/stefanochizzolini/PDFClown/releases

시스템 요구 사항: Java 6 이상

코드 예제

PDF Clown은 PDF 생성, 텍스트 추출 및 기존 문서 수정과 같은 시나리오에서 탁월합니다. 다음은 실제 예제입니다:

Java용 PDF Clown API

예제 1: PDFClown Java API로 기본 PDF 문서 생성

이 예제는 PDF Clown의 직관적인 PDF 생성 방식을 보여줍니다. 코드는 빈 문서를 생성하고 페이지를 추가한 후 사용자 정의 글꼴로 스타일이 적용된 텍스트를 삽입합니다. 고수준 라이브러리와 달리 PDF Clown은 PrimitiveComposer를 통해 명시적 좌표 위치 지정이 필요하여 픽셀 단위의 레이아웃 제어가 가능합니다. 이 예제는 글꼴 스타일 설정, 특정 좌표에 텍스트 그리기 및 출력 저장 방법을 보여주며, 라벨 또는 인증서와 같은 정밀한 타이포그래피 제어가 필요한 애플리케이션에 적합합니다.

FileDocument 클래스는 파일 작업을 처리하고, PrimitiveComposer는 콘텐츠 렌더링을 관리합니다.

예제 2: Java에서 기존 PDF의 텍스트 추출

이 예제는 PDF Clown의 텍스트 추출 기능을 강조합니다. 코드는 PDF 파일을 파싱하고 페이지를 반복하며 글꼴, 크기, 위치와 같은 서식 메타데이터와 함께 텍스트 콘텐츠를 추출합니다. 데이터 마이닝, 검색 인덱싱 또는 콘텐츠 마이그레이션에 유용하며, 이 구현은 다중 열 텍스트 및 회전된 요소를 포함한 복잡한 레이아웃을 처리하는 PDF Clown의 능력을 보여줍니다. TextExtractor 클래스는 특정 텍스트 영역을 분리하거나 장식 요소를 무시하기 위한 고급 필터링 옵션을 제공합니다.

예제 3: Java에서 PDF에 주석 추가

이 예제는 클릭 가능한 링크 주석을 추가하여 대화형 PDF 수정을 설명합니다. PDF Clown의 LinkAnnotation 클래스를 사용하여 페이지에 사각형 핫스팟을 정의하고 클릭 시 URL을 엽니다. 이 예제에는 경계 계산, URI 액션 바인딩 및 주석 스타일링이 포함되어 있으며, 목차 링크 또는 외부 참조와 같은 대화형 요소로 PDF를 향상시키는 데 이상적입니다. PDF Clown의 주석 지원은 스탬프, 팝업 노트 및 멀티미디어까지 확장되어 풍부한 문서 상호작용을 가능하게 합니다.

결론

PDF Clown은 다음과 같은 요구 사항이 있는 Java 개발자에게 이상적인 선택입니다:

  • 저수준 제어: 직접적인 PDF 객체 조작
  • 콘텐츠 추출: PDF에서 텍스트 및 에셋 추출
  • 대화형 PDF: 양식, 링크 및 주석
  • 경량 처리: 최소한의 리소스 사용

단순성과 강력한 기능의 독특한 조합으로, PDF Clown은 템플릿보다 정밀도가 중요한 특수 PDF 워크플로에서 두각을 나타내는 도구입니다.

유사한 제품

 한국인