[문서 파서 Python용 API 문서 구문 분석을 위한 오픈 소스 Python API PDF, DOC/DOCX, XLS/XLSX, HTML 등 다양한 문서 형식에서 텍스트, 이미지 및 기타 정보를 구문 분석하고 추출하도록 맞춤화된 오픈 소스 Python 라이브러리를 찾아보세요. Python용 문서 파서 API에는 다음이 포함됩니다. pdfminer.six PDF 문서의 서식 정보를 사용하여 텍스트를 구문 분석하고 읽고 추출하는 Python 라이브러리입니다. PyMuPDF PDF 문서에서 텍스트, 이미지, 표 등을 읽고, 구문 분석하고, 추출하는 Python의 PDF 파서 라이브러리입니다. pypdf PDF를 읽고 PDF 문서에서 텍스트, 이미지 및 첨부 파일을 추출하는 Python PDF 파서 라이브러리입니다.]