পাইথনে গভীর শিক্ষার উপর ভিত্তি করে OCR সমাধান

docTR ব্যবহার করে সুনির্দিষ্টভাবে টেক্সট শনাক্ত করুন এবং বিশ্লেষণ করুন।

পাইথনের জন্য docTR API কি?

docTR (ডকুমেন্ট টেক্সট রিকগনিশন) একটি ওপেন সোর্স গভীর শিক্ষার উপর ভিত্তি করে অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) লাইব্রেরি। এটি স্ক্যান করা ডকুমেন্ট, ছবি এবং PDF থেকে টেক্সট শনাক্তকরণ এবং স্বীকৃতির জন্য ব্যবহার করা হয়।

docTR উচ্চ নির্ভুলতা এবং দক্ষতার সাথে টেক্সট বের করতে সক্ষম এবং এটি স্বয়ংক্রিয় তথ্য নিষ্কাশন, কৃত্রিম বুদ্ধিমত্তা-ভিত্তিক টেক্সট স্বীকৃতি এবং ডকুমেন্ট ডিজিটাইজেশনের জন্য ব্যবহৃত হয়।

docTR API-এর মূল বৈশিষ্ট্য

  • উন্নত গভীর শিক্ষার OCR: নির্ভুল টেক্সট শনাক্তকরণ এবং স্বীকৃতির জন্য নিউরাল নেটওয়ার্ক ব্যবহার করে।
  • একাধিক ফরম্যাট সমর্থন: ছবি, PDF এবং স্ক্যান করা ডকুমেন্টের সাথে কাজ করতে পারে।
  • হাতের লেখা শনাক্তকরণ: হস্তলিখিত টেক্সট চমৎকার নির্ভুলতার সাথে শনাক্ত করতে পারে।
  • একাধিক ভাষার সমর্থন: বিভিন্ন ভাষা ও স্ক্রিপ্ট সমর্থন করে।
  • দ্রুত প্রসেসিং: GPU এক্সেলেরেশন ব্যবহার করে দ্রুত টেক্সট নিষ্কাশন করে।
  • ডকুমেন্ট লেআউট সংরক্ষণ: স্বীকৃতির সময় ডকুমেন্টের কাঠামো সংরক্ষণ করে।
  • স্কেলযোগ্য এবং ওপেন সোর্স: এটি বিনামূল্যে ব্যবহারযোগ্য এবং নিয়মিতভাবে উন্নত করা হয়।

docTR API ব্যবহার শুরু করা

docTR ইনস্টল করতে নিম্নলিখিত pip কমান্ড ব্যবহার করুন:

docTR ইনস্টল করুন


pip install python-doctr

দ্রুত প্রসেসিংয়ের জন্য GPU সক্রিয় করতে, অতিরিক্ত ডিপেন্ডেন্সি ইনস্টল করুন:

GPU নির্ভরতা ইনস্টল করুন


pip install tensorflow-gpu torch torchvision

টেক্সট নিষ্কাশনের জন্য docTR API-এর ব্যবহার

নিম্নলিখিত উদাহরণগুলো docTR ব্যবহার করে কীভাবে টেক্সট নিষ্কাশন করা যায় তা প্রদর্শন করে।

উদাহরণ ১: ছবির টেক্সট নিষ্কাশন

এই উদাহরণে একটি ছবি লোড করা হবে, docTR ব্যবহার করে OCR প্রয়োগ করা হবে এবং টেক্সট নিষ্কাশন করা হবে।

ছবির টেক্সট নিষ্কাশন


from doctr.io import DocumentFile
from doctr.models import ocr_predictor

doc = DocumentFile.from_images("sample.png")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

উদাহরণ ২: PDF ফাইল প্রক্রিয়াকরণ

এই উদাহরণে, docTR ব্যবহার করে একটি মাল্টি-পেজ PDF থেকে টেক্সট নিষ্কাশন করা হবে।

docTR API for OCR

PDF থেকে টেক্সট নিষ্কাশন


from doctr.io import DocumentFile
from doctr.models import ocr_predictor

doc = DocumentFile.from_pdf("sample.pdf")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

উদাহরণ ৩: হাতের লেখা শনাক্তকরণ

docTR ব্যবহার করে হাতের লেখা শনাক্ত করা সম্ভব। নিচের উদাহরণটি দেখুন।

হাতের লেখা শনাক্তকরণ


from doctr.models import ocr_predictor
from doctr.datasets import synthetic_documents

doc = synthetic_documents()[0]
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

Similar Products

 Bengali