Thư viện Python mã nguồn mở để đọc Excel

Thư viện Python miễn phí và mã nguồn mở để đọc và trích xuất dữ liệu từ file Excel (XLS, XLSX).

API XLRD là gì?

XLRD là một thư viện Python mã nguồn mở nhẹ và hiệu quả được thiết kế để đọc dữ liệu từ file Excel. Nó hỗ trợ cả định dạng XLS cũ và định dạng XLSX mới hơn, biến nó thành một công cụ linh hoạt để trích xuất dữ liệu từ bảng tính. XLRD đặc biệt hữu ích cho các nhà phát triển cần xử lý file Excel theo chương trình, chẳng hạn như phân tích dữ liệu, báo cáo hoặc tự động hóa các tác vụ. Mặc dù XLRD chủ yếu tập trung vào việc đọc file Excel, nó có thể kết hợp với các thư viện khác như XLWT hoặc Openpyxl để thêm chức năng chỉnh sửa và ghi dữ liệu. API đơn giản và trực quan của nó giúp dễ dàng tích hợp vào các ứng dụng Python.

Tính năng của API XLRD

Dưới đây là một số tính năng chính của API XLRD:

  • Đọc file Excel: XLRD có thể đọc cả định dạng file XLS và XLSX, giúp nó tương thích với nhiều loại file Excel.
  • Trích xuất dữ liệu: Dễ dàng trích xuất dữ liệu từ các ô, hàng và cột trong trang tính Excel.
  • Quản lý trang tính: Truy cập và điều hướng qua nhiều trang tính trong một tệp Excel.
  • Loại dữ liệu: Hỗ trợ nhiều loại dữ liệu, bao gồm văn bản, số, ngày tháng và công thức.
  • Nhẹ: XLRD là một thư viện nhẹ với các phụ thuộc tối thiểu, giúp dễ dàng cài đặt và sử dụng.
  • Tương thích: Hoạt động liền mạch với các thư viện Python khác như XLWT và Openpyxl để mở rộng chức năng.

Định dạng file được hỗ trợ bởi XLRD

XLRD hỗ trợ các định dạng file sau:

Định dạng fileĐịnh nghĩa
XLSĐịnh dạng file bảng tính Microsoft Excel 97-2003
XLSXĐịnh dạng file bảng tính Microsoft Excel 2007 trở lên
GitHub

Thống kê GitHub

Tên:
Ngôn ngữ:
Ngôi sao:
Nĩa:
Giấy phép:
Kho lưu trữ được cập nhật lần cuối lúc

Bắt đầu với XLRD

Bạn có thể cài đặt thư viện XLRD bằng pip. Dưới đây là cách bắt đầu:

Cài đặt

Cài đặt XLRD bằng lệnh pip sau:

Cài đặt XLRD


pip install xlrd

Ví dụ mã Python XLRD

Dưới đây là một số ví dụ về cách sử dụng thư viện XLRD để đọc và trích xuất dữ liệu từ file Excel.

Ví dụ 1: Đọc file Excel

Ví dụ này minh họa cách mở file Excel và đọc dữ liệu từ một trang tính cụ thể.

Đọc file Excel với XLRD


import xlrd

# Mở file Excel
workbook = xlrd.open_workbook("ví_dụ.xls")

# Chọn trang tính đầu tiên
sheet = workbook.sheet_by_index(0)

# Đọc dữ liệu từ một ô cụ thể
giá_trị_ô = sheet.cell_value(0, 0)  # Hàng 0, Cột 0
print("Giá trị ô:", giá_trị_ô)

Ví dụ 2: Lặp qua các hàng

Ví dụ này cho thấy cách lặp qua tất cả các hàng trong một trang tính và in giá trị của chúng.

Lặp qua các hàng


import xlrd

# Mở file Excel
workbook = xlrd.open_workbook("ví_dụ.xls")
sheet = workbook.sheet_by_index(0)

# Lặp qua tất cả các hàng
for chỉ_số_hàng in range(sheet.nrows):
    hàng = sheet.row_values(chỉ_số_hàng)
    print(f"Hàng {chỉ_số_hàng}: {hàng}")

Ví dụ 3: Trích xuất dữ liệu từ nhiều trang tính

Ví dụ này minh họa cách trích xuất dữ liệu từ nhiều trang tính trong một file Excel.

Trích xuất dữ liệu từ nhiều trang tính


import xlrd

# Mở file Excel
workbook = xlrd.open_workbook("ví_dụ.xls")

# Lặp qua tất cả các trang tính
for tên_trang_tính in workbook.sheet_names():
    sheet = workbook.sheet_by_name(tên_trang_tính)
    print(f"Tên trang tính: {tên_trang_tính}")
    
    # In hàng đầu tiên của mỗi trang tính
    hàng_đầu_tiên = sheet.row_values(0)
    print("Hàng đầu tiên:", hàng_đầu_tiên)

Tài nguyên

Kết luận

XLRD là một thư viện Python mạnh mẽ và nhẹ để đọc và trích xuất dữ liệu từ file Excel. Sự đơn giản và khả năng tương thích với cả định dạng XLS và XLSX làm cho nó trở thành một lựa chọn tuyệt vời cho các nhà phát triển làm việc với dữ liệu Excel. Cho dù bạn đang phân tích dữ liệu, tự động hóa báo cáo hay tích hợp xử lý file Excel vào ứng dụng của mình, XLRD cung cấp các công cụ bạn cần để thực hiện công việc một cách hiệu quả. Kết hợp nó với các thư viện khác như XLWT hoặc Openpyxl để mở rộng chức năng, và bạn sẽ có một giải pháp hoàn chỉnh để làm việc với file Excel trong Python.

Sản Phẩm Tương Tự

 Vietnamese