DOCX4J - SDK Java nguồn mở để làm việc với các tệp DOC & DOCX
API Java mã nguồn mở miễn phí và mạnh mẽ để tạo, chỉnh sửa và chuyển đổi tài liệu DOC & DOCX.
API Docx4J dành cho Java là gì?
Docx4J là một API Java nguồn mở được thiết kế để thao tác các tài liệu Microsoft Word ở định dạng DOCX. Được xây dựng trên tiêu chuẩn Open XML, Docx4J cho phép các nhà phát triển Java tạo, sửa đổi và tạo các tài liệu Word theo chương trình mà không cần dựa vào Microsoft Office. Với sự hỗ trợ để xử lý các thành phần phức tạp như bảng, hình ảnh, tiêu đề, chân trang, v.v., nó cho phép xử lý tài liệu liền mạch trong nhiều trường hợp sử dụng, bao gồm tạo báo cáo tự động, chuyển đổi tài liệu và tạo tài liệu dựa trên mẫu. API tích hợp tốt với JAXB, cung cấp một phương pháp tiếp cận hiệu quả để làm việc với các cấu trúc tài liệu dựa trên XML.
DOCX4J cho Java API - Các tính năng chính
Sau đây là một số tính năng chính của Docx4J API:
- Tạo và chỉnh sửa tài liệu: Docx4J cho phép các nhà phát triển tạo các tệp DOCX mới từ đầu, cũng như chỉnh sửa các tệp hiện có bằng cách thêm hoặc thay đổi văn bản, hình ảnh, bảng và các thành phần khác.
- Hỗ trợ định dạng Open XML: Vì DOCX dựa trên chuẩn Open XML nên Docx4J cung cấp một cách để làm việc trực tiếp với XML cơ bản của tài liệu Word, mang lại khả năng kiểm soát chi tiết đối với nội dung tài liệu.
- Xử lý các thành phần phức tạp của tài liệu: API hỗ trợ nhiều thành phần phức tạp của tài liệu, chẳng hạn như đầu trang và chân trang, đoạn văn, phần, danh sách, bảng, hình ảnh, siêu liên kết và chú thích.
- Kiểu và Định dạng: Docx4J cho phép các nhà phát triển áp dụng kiểu và định dạng tùy chỉnh cho văn bản, đoạn văn và các thành phần khác trong tài liệu, bao gồm phông chữ, màu sắc và căn chỉnh.
- Tạo tài liệu dựa trên mẫu: Hỗ trợ sử dụng mẫu DOCX, cho phép các nhà phát triển tạo nội dung động bằng cách điền chỗ giữ chỗ vào các mẫu có sẵn.
- Chuyển đổi tài liệu: API cung cấp khả năng chuyển đổi tài liệu DOCX sang các định dạng khác, chẳng hạn như PDF, HTML và hình ảnh (ví dụ: PNG), bằng cách tận dụng các thư viện hoặc định dạng khác.
- Hỗ trợ chữ ký số: Docx4J cho phép nhúng và xác thực chữ ký số trong tài liệu DOCX, tăng thêm một lớp bảo mật và xác thực.
- Tích hợp JAXB: Vì Docx4J được xây dựng xung quanh JAXB (Kiến trúc Java cho liên kết XML), nên nó cung cấp phương pháp liền mạch để sắp xếp và giải sắp xếp nội dung XML, giúp thao tác các phần tài liệu theo chương trình dễ dàng hơn.
- Điều chỉnh siêu dữ liệu: API cho phép làm việc với siêu dữ liệu tài liệu, chẳng hạn như thông tin tác giả, thuộc tính tài liệu và lịch sử sửa đổi.
- Gộp và tách tài liệu: Docx4J bao gồm các tính năng để ghép nhiều tài liệu Word thành một hoặc chia tài liệu thành các phần riêng biệt dựa trên các phần hoặc trang.
- Theo dõi thay đổi: Hỗ trợ xử lý tài liệu khi bật tính năng "theo dõi thay đổi", cho phép bạn kiểm tra hoặc quản lý các bản sửa đổi.
Bắt đầu với DocX4J cho API Java
Để bắt đầu sử dụng Docx4J API, trước tiên bạn cần cài đặt API vào dự án Java của mình.
Cài đặt
Để cài đặt Docx4J, bạn cần thêm phần phụ thuộc của nó vào dự án của mình bằng Maven:
<groupId>org.docx4j</groupId> <artifactId>docx4j-JAXB-Internal</artifactId> <version>8.0.0</version> </dependency> <dependency> <groupId>org.docx4j</groupId> <artifactId>docx4j-JAXB-ReferenceImpl</artifactId> <version>8.0.0</version> </dependency> <dependency> <groupId>org.docx4j</groupId> <artifactId>docx4j-JAXB-MOXy</artifactId> <version>8.0.0</version> </dependency>Ví dụ mã cho API Docx4J dành cho Java
DocX là một API mạnh mẽ cung cấp nhiều tính năng phong phú để làm việc với các tính năng của Tài liệu. Bạn có thể tìm thấy các ví dụ C# để tạo tài liệu Word, cập nhật tệp DOCX hiện có, Chèn Tiêu đề và Chân trang vào tài liệu và làm việc với hình ảnh trong phần này.
Làm thế nào để tạo một tệp DOCX trống bằng API DocX4J cho Java?
Bạn có thể tạo một tài liệu DOCX trống bằng API DocX4J. Sau đó, nó có thể được lưu vào đĩa dưới dạng tệp DOCX theo định dạng Microsoft Word 2007+ như được hiển thị trong mẫu mã sau:
Làm thế nào để mở tệp DOCX hiện có trong Java và sửa đổi nó trong Java?
Bạn có thể đọc tệp DOCX hiện có bằng API DocX4J và cập nhật nội dung của tệp đó. Sau khi thực hiện thay đổi, bạn có thể lưu tài liệu trở lại đĩa tương tự như tùy chọn "Lưu dưới dạng" có trong Microsoft Word.
Làm thế nào để thêm tiêu đề và chân trang vào tài liệu Word trong Java?
DocX4J API cho phép bạn thêm header và footer vào tài liệu Word từ bên trong ứng dụng Java của bạn. Bạn có thể thêm header vào tệp Word, sửa đổi nội dung, thêm footer và cập nhật nội dung như trong mẫu mã bên dưới.
Làm thế nào để chèn hình ảnh vào tệp Word DOCX trong Java?
Nếu bạn muốn chèn hình ảnh vào tệp Word DOCX bằng Java, API DocX4J cho phép các nhà phát triển Java xử lý hình ảnh nhúng trong tài liệu Word DOCX theo chương trình. Mẫu mã sau đây cho thấy cách chèn hình ảnh vào tệp DOCX trong Java.
Phần kết luận
Docx4J là một Java API mạnh mẽ và linh hoạt cho phép các nhà phát triển tạo, thao tác và quản lý các tài liệu DOCX theo chương trình. Tích hợp sâu với định dạng Open XML cho phép kiểm soát chi tiết các thành phần tài liệu như văn bản, bảng, hình ảnh, tiêu đề, chân trang và siêu dữ liệu. Với hỗ trợ tích hợp cho việc chuyển đổi tài liệu, tạo kiểu, chữ ký số và xử lý các thành phần phức tạp, Docx4J cung cấp giải pháp toàn diện cho nhiều tác vụ liên quan đến tài liệu. Cho dù bạn đang tạo báo cáo động, sửa đổi tài liệu Word hiện có hay chuyển đổi định dạng, Docx4J đều cung cấp tính linh hoạt và chức năng cần thiết để làm việc hiệu quả với các tài liệu Word trong các ứng dụng Java.