PyMuPDF
Leabharlann Python Foinse Oscailte chun Meiteashonraí PDF a Bhainistiú
Bain triail as PyMuPDF, leabharlann Python Foinse In Aisce & Oscailte chun meiteashonraí doiciméad PDF a rochtain agus a mhodhnú.
Cad é PyMuPDF?
Is leabharlann Python foinse oscailte í PyMuPDF, ar a dtugtar Fitz freisin, a thairgeann go leor gnéithe ar nós PDF a pharsáil, PDFanna a scoilteadh agus a chumasc srl. ach ar an leathanach seo ní phléifimid ach conas is féidir le forbróirí Python úsáid a bhaint as leabharlann PyMuPDF chun tascanna a bhaineann le meiteashonraí PDF a láimhseáil mar:
- Léigh Meiteashonraí PDF: Tacaíonn PyMuPDF le rochtain a fháil ar mheiteashonraí doiciméad PDF ina bhfuil faisnéis ar nós údar, teideal, ábhar agus dáta cruthaithe etc.
- Athraigh Meiteashonraí PDF: Ceadaíonn an leabharlann freisin meiteashonraí doiciméad PDF a mhodhnú.
- Léigh Meiteashonraí XML: Tá meiteashonraí XML i ndoiciméid PDF freisin nach bhfuil teoranta d'airíonna caighdeánacha doiciméad amhail údar, teideal srl. agus is féidir meiteashonraí breise a bheith ann. Le PyMuPDF, is féidir le forbróirí é a léamh freisin.
- Athraigh Meiteashonraí XML: Is féidir le forbróirí meiteashonraí XML de PDF a athrú freisin trí úsáid a bhaint as leabharlann PyMuPDF.
Tús a chur le PyMuPDF
Teastaíonn uait Python leagan 3.8.0 nó níos airde chun PyMuPDF a shuiteáil agus a úsáid. Mar sin, suiteáil Python ar dtús agus ansin úsáid na horduithe thíos chun PyMuPDF a shuiteáil ar do mheaisín ag baint úsáide as pip agus timpeallacht fhíorúil.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
MacOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Windows
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Léigh meiteashonraí pdf
Is féidir linn meiteashonraí PDF a léamh trí úsáid a bhaint as an mball meiteashonraí de leabharlann PyMuPDF ina bhfuil inneachar iomlán meiteashonraí an doiciméid. Taispeánann an mhír chóid thíos conas meiteashonraí PDF a fháil ón mball meiteashonraí:
Taispeánann an screenshot thíos na meiteashonraí aisghafa ó PDF ag baint úsáide as PyMuPDF:
Eagarthóireacht meiteashonraí pdf
Is féidir linn meiteashonraí PDF a chur in eagar trí úsáid a bhaint as leabharlann PyMuPDF trí fhoclóir a thabhairt ina bhfuil na réimsí a theastaíonn uainn a athrú mar aon lena luachanna nua chuig an modh set_metadata mar a thaispeántar sa mhír cód thíos:
Léigh meiteashonraí XML PDF
Is féidir linn meiteashonraí XML de PDF a aisghabháil trí úsáid a bhaint as leabharlann PyMuPDF. Bainimid úsáid as an modh get_xml_metadata a sheolann na meiteashonraí XML ar fad ar ais mar a thaispeántar sa mhír cód thíos:
Taispeánann an screenshot thíos na meiteashonraí XML a fuarthas ó PDF ag baint úsáide as PyMuPDF:
Athraigh meiteashonraí XML de chomhaid PDF
Is féidir linn meiteashonraí XML PDF a shocrú nó a athrú trí úsáid a bhaint as an modh set_xml_metadata sa leabharlann PyMuPDF. Níl sé chomh simplí leis na meiteashonraí ar leibhéal na cáipéise a ionadú mar glacfaidh an set_xml_metadata teaghrán ar bith agus cuirfear an teaghrán a cuireadh ar aghaidh chuige in ionad na meiteashonraí XML iomlán.
Chun scriosadh neamhbheartaithe aon fhaisnéise meiteashonraí a sheachaint, bainimid na meiteashonraí iomlána XML mar theaghrán ar dtús leis an get_xml_metadata agus ansin úsáidimid an modh téada ionadaigh chun an téad atá uait a ionadú Ar deireadh, cuirimid an XML iomlán le réimsí athraithe ar aghaidh chuig an modh set_xml_metadata a athraíonn meiteashonraí XML iomlán an PDF. Seiceáil thíos blúire cód le haghaidh sonraí:
Conclúid
Go hachomair, is uirlis iontach é PyMuPDF le haghaidh tascanna a bhaineann le hionramháil meiteashonraí. Is féidir linn faisnéis meiteashonraí PDF a aisghabháil agus a athrú go héasca. Mar sin féin, tá laige shuntasach sa mhodh set_xml_metadata. Glacann an modh seo le haon teaghrán a cuireadh ar aghaidh chuige agus forscríobhann sé an XML roimhe seo leis, rud a d’fhéadfadh a bheith ina chúis le caillteanas neamhbheartaithe faisnéise chun an tsaincheist seo a sheachaint. Ní mór d’fhorbróirí a loighic a chur i bhfeidhm chun modhnuithe cearta i meiteashonraí XML a chinntiú.