[Dokumentų analizatorius API, skirtos Python Atvirojo kodo Python API, skirtos dokumentų analizei Atraskite atvirojo kodo Python bibliotekas, pritaikytas analizuoti ir išgauti tekstą, vaizdus ir kitą informaciją iš įvairių dokumentų formatų – PDF, DOC/DOCX, XLS/XLSX ir HTML ir kt. „Python Include“ dokumentų analizavimo API pdfminer.six Python biblioteka, skirta analizuoti, skaityti ir ištraukti tekstą su formatavimo informacija iš PDF dokumentų. PyMuPDF Python PDF analizavimo biblioteka, skirta skaityti, analizuoti ir išgauti tekstą, vaizdus, lenteles ir kt. iš PDF dokumentų. pypdf Python PDF analizavimo biblioteka, skirta skaityti PDF failus ir iš PDF dokumentų išgauti tekstą, vaizdus ir priedus.]