Thư viện Python mã nguồn mở để đọc Excel
Thư viện Python miễn phí và mã nguồn mở để đọc và trích xuất dữ liệu từ file Excel (XLS, XLSX).
API XLRD là gì?
XLRD là một thư viện Python mã nguồn mở nhẹ và hiệu quả được thiết kế để đọc dữ liệu từ file Excel. Nó hỗ trợ cả định dạng XLS cũ và định dạng XLSX mới hơn, biến nó thành một công cụ linh hoạt để trích xuất dữ liệu từ bảng tính. XLRD đặc biệt hữu ích cho các nhà phát triển cần xử lý file Excel theo chương trình, chẳng hạn như phân tích dữ liệu, báo cáo hoặc tự động hóa các tác vụ. Mặc dù XLRD chủ yếu tập trung vào việc đọc file Excel, nó có thể kết hợp với các thư viện khác như XLWT hoặc Openpyxl để thêm chức năng chỉnh sửa và ghi dữ liệu. API đơn giản và trực quan của nó giúp dễ dàng tích hợp vào các ứng dụng Python.
Tính năng của API XLRD
Dưới đây là một số tính năng chính của API XLRD:
- Đọc file Excel: XLRD có thể đọc cả định dạng file XLS và XLSX, giúp nó tương thích với nhiều loại file Excel.
- Trích xuất dữ liệu: Dễ dàng trích xuất dữ liệu từ các ô, hàng và cột trong trang tính Excel.
- Quản lý trang tính: Truy cập và điều hướng qua nhiều trang tính trong một tệp Excel.
- Loại dữ liệu: Hỗ trợ nhiều loại dữ liệu, bao gồm văn bản, số, ngày tháng và công thức.
- Nhẹ: XLRD là một thư viện nhẹ với các phụ thuộc tối thiểu, giúp dễ dàng cài đặt và sử dụng.
- Tương thích: Hoạt động liền mạch với các thư viện Python khác như XLWT và Openpyxl để mở rộng chức năng.
Định dạng file được hỗ trợ bởi XLRD
XLRD hỗ trợ các định dạng file sau:
Định dạng file | Định nghĩa |
---|---|
XLS | Định dạng file bảng tính Microsoft Excel 97-2003 |
XLSX | Định dạng file bảng tính Microsoft Excel 2007 trở lên |
Bắt đầu với XLRD
Bạn có thể cài đặt thư viện XLRD bằng pip. Dưới đây là cách bắt đầu:
Cài đặt
Cài đặt XLRD bằng lệnh pip sau:
Cài đặt XLRD
pip install xlrd
Ví dụ mã Python XLRD
Dưới đây là một số ví dụ về cách sử dụng thư viện XLRD để đọc và trích xuất dữ liệu từ file Excel.Ví dụ 1: Đọc file Excel
Ví dụ này minh họa cách mở file Excel và đọc dữ liệu từ một trang tính cụ thể.
Đọc file Excel với XLRD
import xlrd
# Mở file Excel
workbook = xlrd.open_workbook("ví_dụ.xls")
# Chọn trang tính đầu tiên
sheet = workbook.sheet_by_index(0)
# Đọc dữ liệu từ một ô cụ thể
giá_trị_ô = sheet.cell_value(0, 0) # Hàng 0, Cột 0
print("Giá trị ô:", giá_trị_ô)
Ví dụ 2: Lặp qua các hàng
Ví dụ này cho thấy cách lặp qua tất cả các hàng trong một trang tính và in giá trị của chúng.
Lặp qua các hàng
import xlrd
# Mở file Excel
workbook = xlrd.open_workbook("ví_dụ.xls")
sheet = workbook.sheet_by_index(0)
# Lặp qua tất cả các hàng
for chỉ_số_hàng in range(sheet.nrows):
hàng = sheet.row_values(chỉ_số_hàng)
print(f"Hàng {chỉ_số_hàng}: {hàng}")
Ví dụ 3: Trích xuất dữ liệu từ nhiều trang tính
Ví dụ này minh họa cách trích xuất dữ liệu từ nhiều trang tính trong một file Excel.
Trích xuất dữ liệu từ nhiều trang tính
import xlrd
# Mở file Excel
workbook = xlrd.open_workbook("ví_dụ.xls")
# Lặp qua tất cả các trang tính
for tên_trang_tính in workbook.sheet_names():
sheet = workbook.sheet_by_name(tên_trang_tính)
print(f"Tên trang tính: {tên_trang_tính}")
# In hàng đầu tiên của mỗi trang tính
hàng_đầu_tiên = sheet.row_values(0)
print("Hàng đầu tiên:", hàng_đầu_tiên)
Tài nguyên
Kết luận
XLRD là một thư viện Python mạnh mẽ và nhẹ để đọc và trích xuất dữ liệu từ file Excel. Sự đơn giản và khả năng tương thích với cả định dạng XLS và XLSX làm cho nó trở thành một lựa chọn tuyệt vời cho các nhà phát triển làm việc với dữ liệu Excel. Cho dù bạn đang phân tích dữ liệu, tự động hóa báo cáo hay tích hợp xử lý file Excel vào ứng dụng của mình, XLRD cung cấp các công cụ bạn cần để thực hiện công việc một cách hiệu quả. Kết hợp nó với các thư viện khác như XLWT hoặc Openpyxl để mở rộng chức năng, và bạn sẽ có một giải pháp hoàn chỉnh để làm việc với file Excel trong Python.
Sản Phẩm Tương Tự
- Apache POI XWPF | API Java nguồn mở để tạo và sửa đổi các tệp DOCX
- DocX | API .NET nguồn mở để tạo và sửa đổi các tệp DOCX
- Docx4J | API Java nguồn mở để tạo và sửa đổi các tệp DOC và DOCX
- ExcelDataReader | API .NET nguồn mở để đọc các tài liệu XLS, XLSX, CSV và Bảng tính
- FileFormat.Cells | Tạo và cập nhật các tệp Excel bằng C# .NET