用于 PDF 元数据管理的免费 JavaScript 库
用于管理 PDF 文档元数据的免费开源 JavaScript 库。
什么是 pdf-lib?
Pdf-lib 是一个免费的开源 JavaScript 库,用于处理 PDF 文档以执行各种操作,例如从头开始创建新的 PDF、修改现有 PDF 或读取和更新 PDF 文档的元数据。我们已经讨论了 pdf-lib 的 PDF 编辑功能,但在本篇评论中,我们将仅关注 pdf-lib 的元数据管理功能,其中包括:
- 作者
- 创建者
- 制片人
- 标题
- 主题
- 关键词
- 语言
- 创建日期
- 修改日期
- 更新元数据:您还可以使用 pdf-lib 更新上述 PDF 文档的元数据。
pdf-lib 入门
安装pdf-lib有两种方法:
NPM 模块
如果您使用 npm 或 yarn 作为包管理器,则可以使用 npm 模块:
使用 NPM 安装
npm install --save pdf-lib
使用 Yarn 安装
yarn add pdf-lib
UMD 模块
如果您没有使用包管理器,可以在 unpkg 和 jsDelivr CDN 上找到 UMD 模块:
- https://unpkg.com/pdf-lib/dist/pdf-lib.js
- https://unpkg.com/pdf-lib/dist/pdf-lib.min.js
- https://cdn.jsdelivr.net/npm/pdf-lib/dist/pdf-lib.js
- https://cdn.jsdelivr.net/npm/pdf-lib/dist/pdf-lib.min.js
读取 PDF 的元数据
我们可以利用 pdf-lib 库来读取 PDF 文档的元数据。有许多函数(如 getAuthor、getCreator、getCreationDate 等)允许访问或提取 PDF 文档的元数据,如以下代码片段所示:
输出
上面的代码片段将显示 PDF 文档的元数据,如下所示:
编辑 PDF 的元数据
我们还可以利用 pdf-lib 库来编辑或更新 PDF 文档的元数据。与 get 函数(getAuthor、getCreator 等)一样,pdf-lib 还提供 set 函数(如 setAuthor、setCreator 等)来更新 PDF 文件的元数据。我们将使用 setAuthor 和 setTitle 函数来更新 PDF 文档的元数据,以下代码片段仅用于演示目的:
结论
JavaScript 开发人员使用 pdf-lib 库可以更轻松地读取/提取和更新 PDF 文档的元数据。API 非常简洁,提供标准的设置/获取函数来读取和更新 PDF 文档的属性。在使用过程中,我们没有发现与 PDF 元数据管理有关的问题。