کتابخانه پایتون تبدیل PDF به HTML/XML

کتابخانه رایگان و منبع باز Python برای تبدیل اسناد PDF به HTML و XML.

pdfminer.six چیست؟

pdfminer.six یک کتابخانه رایگان و متن باز پایتون است که می تواند برای تبدیل اسناد PDF به فرمت های دیگر استفاده شود.

در اینجا لیست مختصری از ویژگی های اصلی تبدیل PDF آن آمده است:

تبدیل PDF به HTML: اسناد PDF را با حفظ ساختار و طرح‌بندی سند به فرمت HTML تبدیل کنید.
تبدیل PDF به XML: فایل‌های PDF را به فرمت XML تبدیل کنید و همه جزئیات، از جمله فونت‌ها و عناصر دیگر را ثبت کنید.

آمار GitHub

نام:
زبان:
ستاره ها:
چنگال:
مجوز:
آخرین به روز رسانی مخزن در

شروع کار با pdfminer.six

برای نصب و استفاده از pypdf به نسخه 3.6.0 یا بالاتر پایتون نیاز دارید. بنابراین، ابتدا Python را نصب کنید و سپس از دستورات زیر برای نصب pypdf بر روی دستگاه خود با استفاده از pip و محیط مجازی.

لینوکس


python3 -m venv venv
source venv/bin/activate
pip install pdfminer.six

MacOS


python -m venv venv
source venv/bin/activate
pip install pdfminer.six

ویندوز


python3 -m venv venv
venv\Scripts\activate.bat
pip install pdfminer.six

کتابخانه پایتون تبدیل PDF به HTML/XML

کتابخانه رایگان و منبع باز Python برای تبدیل اسناد PDF به HTML و XML.

pdfminer.six چیست؟

آمار GitHub

شروع کار با pdfminer.six

لینوکس

MacOS

ویندوز

تبدیل PDF به HTML

خروجی

تبدیل PDF به XML

خروجی

نتیجه گیری

محصولات مشابه