오픈소스 파이썬 PDF 메타데이터 라이브러리

PDF 문서의 메타데이터를 읽고 업데이트하는 무료 오픈 소스 Python 라이브러리입니다.

pypdf란 무엇인가요?

Pypdf는 PDF 조작을 위한 다양한 기능 세트로 유명한 다재다능한 오픈 소스 파이썬 라이브러리입니다. 이 라이브러리는 PDF 파싱PDF 분할 및 병합 등과 같은 다양한 PDF 조작에 유용하지만 이 제품 리뷰에서는 PDF 메타데이터 관리 기능에만 초점을 맞출 것입니다.

메타데이터와 관련된 pypdf의 주요 기능은 다음과 같습니다.

  • PDF 메타데이터 읽기: pypdf를 사용하여 PDF 문서의 속성(작성자, 제작자, 제작자, 제목, 주제, 키워드 등)을 읽을 수 있습니다.
  • PDF 메타데이터 업데이트: pypdf를 사용하여 PDF 문서의 메타데이터를 업데이트할 수도 있습니다.
GitHub

GitHub 통계

이름:
언어:
별:
포크:
특허:
저장소가 마지막으로 업데이트된 시간:

pypdf 시작하기

pypdf를 설치하고 사용하려면 Python 버전 3.6.0 이상이 필요합니다. 따라서 먼저 Python을 설치한 다음 아래 명령을 사용하여 pip가상 환경을 사용하여 컴퓨터에 pypdf를 설치합니다.

리눅스


python3 -m venv venv
source venv/bin/activate
pip install pypdf

맥OS


python -m venv venv
source venv/bin/activate
pip install pypdf

윈도우


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

PDF의 메타데이터 읽기

pypdf 라이브러리를 사용하여 PDF 문서의 메타데이터를 읽을 수 있습니다. pypdf 라이브러리의 PdfReader 클래스의 metadata 속성에서 PDF의 메타데이터를 가져옵니다. 자세한 내용은 아래 코드 조각을 확인하세요.

산출

아래 스크린샷은 제공된 PDF 파일의 메타데이터를 표시합니다.

PDF 메타데이터 업데이트

pypdf 라이브러리를 사용하여 저자, 제작자, 주제 및 제목 등과 같은 PDF 문서의 메타데이터를 업데이트할 수도 있습니다. pypdf 라이브러리의 PdfWriter 클래스의 add_metadata 메서드에 메타데이터 정보가 포함된 객체를 전달하여 PDF 문서의 메타데이터를 업데이트/쓰기합니다. 자세한 내용은 아래 코드 조각을 확인하세요.

결론

결론적으로, pypdf는 PDF 문서의 메타데이터를 읽고 업데이트하는 데 탁월한 Python 라이브러리임이 입증되었습니다. 개발자는 아무런 문제 없이 PDF 문서의 메타데이터를 쉽게 읽고 업데이트할 수 있습니다.

유사한 제품

 한국인