1. 제품
  2.   주석
  3.   Python
  4.   pypdf
 
  

오픈소스 파이썬 PDF 주석 라이브러리

PDF 문서에 주석을 추가하고 추출하려면 무료 오픈 소스 Python 라이브러리를 사용해보세요.

pypdf란 무엇인가요?

Pypdf는 파이썬 환경에서 PDF 문서를 처리하기 위한 다양한 기능 세트로 유명한 무료 오픈 소스 파이썬 라이브러리입니다. 이 도구는 다양한 PDF 조작에 유용하지만 이 리뷰에서는 주석 관련 기능에 초점을 맞출 것입니다.

주석과 관련된 pypdf의 주요 기능은 다음과 같습니다.

  • 도형 주석 추가: PDF 페이지의 특정 영역에 선, 사각형, 타원, 다각형 등의 도형을 주석으로 그릴 수 있습니다.
  • 텍스트 주석 추가: PDF 페이지의 특정 위치에 텍스트 주석을 추가할 수 있습니다.
  • 링크 주석 추가: PDF 문서에 링크 주석(하이퍼링크 등)을 추가할 수도 있습니다.
  • 주석 추출: pypdf 라이브러리를 사용하여 PDF 문서의 모든 주석에 대한 정보를 반복하고 추출할 수 있습니다.
GitHub

GitHub 통계

이름:
언어:
별:
포크:
특허:
저장소가 마지막으로 업데이트된 시간:

pypdf 시작하기

pypdf를 설치하고 사용하려면 Python 버전 3.6.0 이상이 필요합니다. 따라서 먼저 Python을 설치한 다음 아래 명령을 사용하여 pip가상 환경을 사용하여 컴퓨터에 pypdf를 설치합니다.

리눅스


python3 -m venv venv
source venv/bin/activate
pip install pypdf

맥OS


python -m venv venv
source venv/bin/activate
pip install pypdf

윈도우


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

PDF에 사각형 주석 추가

pypdf 라이브러리를 사용하여 PDF 문서에 사각형 주석을 추가할 수 있습니다. pypdf 라이브러리의 pypdf.annotations 모듈의 Rectangle 클래스를 사용하여 사각형을 정의합니다. 그런 다음 PDFWriter 클래스의 add_annotations 메서드를 사용하여 PDF에 사각형 주석을 추가합니다.

자세한 내용은 아래 코드 조각을 확인하세요.

산출

아래 스크린샷에서는 오픈 소스라는 단어에 주석을 달기 위해 사각형이 추가된 것을 볼 수 있습니다.

PDF에 텍스트 주석 추가

pypdf 라이브러리의 pypdf.annotations 모듈에서 Text 클래스를 사용하여 텍스트 주석을 만듭니다. 그런 다음 pypdf 라이브러리의 PDFWriter 클래스의 add_annotations 메서드를 사용하여 PDF에 주석을 추가할 수 있습니다. 텍스트 주석은 아이콘을 클릭하면 확장되고 텍스트가 표시되는 아이콘으로 추가됩니다. 자세한 내용은 아래 코드 조각을 확인하세요.

산출

아래 스크린캐스트에서 볼 수 있듯이, 위의 코드는 PDF에 지정된 위치에 아이콘을 추가하고 아이콘을 클릭하면 텍스트 주석이 표시됩니다.

PDF에 링크 주석 추가

링크 주석은 pypdf.annotations 모듈의 Link 클래스를 사용하여 생성됩니다. 그러나 링크 주석의 문제점은 링크를 추가할 뿐이지 표시되지 않는다는 것입니다. 이 문제를 해결하기 위해 앞서 설명한 대로 pypdf.annotations 모듈의 Rectangle 클래스를 사용하여 사각형을 통합합니다. 이렇게 하면 사용자는 링크 주석이 추가된 위치를 시각적으로 식별할 수 있습니다. 더 잘 이해하려면 아래 코드 조각을 확인하세요.

산출

출력에서 볼 수 있듯이, 사각형은 클릭하면 사용자를 지정된 링크로 리디렉션하는 영역 역할을 합니다.

PDF에서 주석 추출

pypdf 라이브러리를 사용하여 PDF에서 주석을 추출할 수 있습니다. PDF 페이지의 모든 주석을 반복한 다음 get_object 메서드를 사용하여 주석 객체를 가져옵니다. 그런 다음 객체에서 관련 정보를 추출합니다. 자세한 내용은 아래 코드 조각을 확인하세요.

산출

아래 스크린샷에서 볼 수 있듯이, 프로그램은 PDF 문서에 있는 주석의 주석 유형과 좌표를 반환했습니다.

결론

Pypdf는 Python 개발자가 PDF에 다양한 유형의 주석을 추가하고 주석의 유형, 위치와 같은 주석의 필수 정보에 액세스할 수 있도록 지원하므로 주석을 추가하고 주석에 대한 데이터를 추출해야 하는 작업에 실용적인 선택입니다.

유사한 제품

 한국인