用于 PDF 元数据管理的免费 JavaScript 库
用于管理 PDF 文档元数据的免费开源 JavaScript 库。
什么是 pdf-lib?
Pdf-lib 是一个免费开源 JavaScript 库,用于处理 PDF 文档来执行操作,例如从头开始创建新 PDF、修改现有 PDF 或读取和更新 PDF 文档的元数据。我们已经讨论了 pdf-lib 的 PDF 编辑功能,但在本次回顾中,我们将仅关注 pdf-lib 的元数据管理功能,其中包括:
- 作者
- 创作者
- 制片人
- 标题
- 主题
- 关键词
- 语言
- 创建日期
- 修改日期
- 更新元数据:您还可以使用 pdf-lib 更新 PDF 文档的上述元数据。
pdf-lib 入门
安装 pdf-lib 有两种方法:
NPM模块
如果您使用npm或yarn作为包管理器,则可以使用npm模块:
使用 NPM 安装
npm install --save pdf-lib
使用纱线安装
yarn add pdf-lib
UMD模块
如果您不使用包管理器,则 UMD 模块可在 unpkg 和 jsDelivr CDN 上使用:
- https://unpkg.com/pdf-lib/dist/pdf-lib.js
- https://unpkg.com/pdf-lib/dist/pdf-lib.min.js
- https://cdn.jsdelivr.net/npm/pdf-lib/dist/pdf-lib.js
- https://cdn.jsdelivr.net/npm/pdf-lib/dist/pdf-lib.min.js
读取 PDF 的元数据
我们可以利用 pdf-lib 库来读取 PDF 文档的元数据。有许多函数,例如 getAuthor、getCreator、getCreationDate 等,允许访问或提取 PDF 文档的元数据在下面的代码片段中演示:
输出
上面的代码片段将显示 PDF 文档的元数据,如下所示:
编辑 PDF 元数据
我们还可以利用 pdf-lib 库来编辑或更新 PDF 文档的元数据。与获取函数(getAuthor、getCreator等)一样,pdf-lib也提供了设置函数(如setAuthor、setCreator等)来更新 PDF 文件的元数据。为了演示目的,我们将在下面的代码片段中使用 setAuthor 和 setTitle 函数来更新 PDF 文档的元数据:
结论
JavaScript 开发人员可以更轻松地使用 pdf-lib 库读取/提取和更新 PDF 文档的元数据。 API 非常简洁,提供标准的 set/get 函数来读取和更新 PDF 文档的属性。在我们的使用过程中,没有发现有关 PDF 元数据管理的问题。