[নথি পার্সার পাইথনের জন্য API ডকুমেন্ট পার্স করার জন্য ওপেন সোর্স পাইথন এপিআই ডকুমেন্ট ফরম্যাট - PDF, DOC/DOCX, XLS/XLSX এবং HTML ইত্যাদি থেকে পাঠ্য, ছবি এবং অন্যান্য তথ্য পার্স এবং এক্সট্রাক্ট করার জন্য তৈরি ওপেন-সোর্স পাইথন লাইব্রেরিগুলি আবিষ্কার করুন। পাইথন ইনক্লুডের জন্য ডকুমেন্ট পার্সার API docTR গভীর শিক্ষার উপর ভিত্তি করে ওপেন সোর্স পাইথন API, যা টেক্সট শনাক্তকরণ এবং স্বীকৃতির জন্য ব্যবহৃত হয়। EasyOCR ৮০+ ভাষা সমর্থিত প্রস্তুত OCR সলিউশন pdfminer.six Python লাইব্রেরি PDF ডকুমেন্ট থেকে ফরম্যাটিং তথ্য সহ টেক্সট পার্স, রিড এবং এক্সট্রাক্ট করতে। PyMuPDF পিডিএফ ডকুমেন্টগুলি থেকে পাঠ্য, চিত্র এবং টেবিল ইত্যাদি পড়তে, পার্স করতে এবং বের করতে পাইথনে পিডিএফ পার্সার লাইব্রেরি। pypdf পাইথন পিডিএফ পার্সার লাইব্রেরি পিডিএফ পড়তে এবং পিডিএফ ডকুমেন্ট থেকে টেক্সট, ইমেজ এবং অ্যাটাচমেন্ট বের করতে। PyTesseract Tesseract OCR ব্যবহার করে ছবি থেকে পাঠ্য বের করার জন্য ওপেন সোর্স পাইথন API।]