[מנתח מסמכים ממשקי API עבור Python ממשקי API של Python בקוד פתוח לניתוח מסמכים גלה ספריות Python בקוד פתוח המותאמות לניתוח וחילוץ טקסט, תמונות ומידע אחר ממגוון פורמטים של מסמכים - PDF, DOC/DOCX, XLS/XLSX ו-HTML וכו'. ממשקי API של מנתח מסמכים עבור Python כוללים docTR ממשק API פתוח ב-Python לזיהוי וזיהוי טקסט באמצעות למידה עמוקה. EasyOCR OCR ארגוני עם תמיכה ב-80+ שפות ומודלים מאומנים מראש לחילוץ טקסט מדויק pdfminer.six ספריית Python כדי לנתח, לקרוא ולחלץ טקסט עם מידע עיצוב ממסמכי PDF. PyMuPDF ספריית מנתח PDF ב-Python כדי לקרוא, לנתח ולחלץ טקסט, תמונות וטבלאות וכו' ממסמכי PDF. pypdf ספריית מנתח PDF של Python לקריאת קובצי PDF ולחילוץ טקסט, תמונות וקבצים מצורפים ממסמכי PDF. PyTesseract API מבוסס קוד פתוח בפייתון לחילוץ טקסט מתמונות באמצעות Tesseract OCR. Keras-OCR API קל משקל ב-Python לזיהוי תווים אופטי (OCR) באמצעות Keras ו-TensorFlow.]