[Penghurai Dokumen API untuk Python API Python Sumber Terbuka untuk Menghurai Dokumen Temui perpustakaan Python sumber terbuka yang disesuaikan untuk menghuraikan dan mengekstrak teks, imej & maklumat lain daripada pelbagai format dokumen - PDF, DOC/DOCX, XLS/XLSX & HTML dsb. API Penghurai Dokumen untuk Termasuk Python EasyOCR OCR sedia perusahaan dengan sokongan 80+ bahasa dan model pra-latih untuk pengekstrakan teks tepat. PyMuPDF Pustaka parser PDF dalam Python untuk membaca, menghuraikan dan mengekstrak teks, imej & jadual dsb. daripada dokumen PDF. docTR API Python Sumber Terbuka untuk pengesanan dan pengenalan teks menggunakan pembelajaran mendalam. PaddleOCR Toolkit OCR teguh menyokong 100+ bahasa dengan model pra-latihan pdfminer.six Pustaka Python untuk menghuraikan, membaca dan mengekstrak teks dengan maklumat pemformatan daripada dokumen PDF. pypdf Pustaka penghurai PDF Python untuk membaca PDF dan mengekstrak teks, imej & lampiran daripada dokumen PDF. PyTesseract API Python sumber terbuka untuk mengekstrak teks daripada imej menggunakan Tesseract OCR. spaCy Pustaka NLP pantas dan cekap dengan model pra-latih untuk 20+ bahasa. Keras-OCR API Python ringan untuk pengenalpastian aksara optik (OCR) menggunakan Keras dan TensorFlow. trOCR Олон хэл дэх гараар бичигдсэн текст таних трансформатор дээр суурилсан OCR загвар.]