Rekonèt tèks nan yon dosye PDF sou entènèt.


Li pa toujou posib pou retire yon tèks nan yon dosye PDF lè l sèvi avèk kopi konvansyonèl yo. Anpil fwa paj dokiman sa yo se kontni tcheke vèsyon papye yo. Pou konvèti dosye sa yo nan done tèks konplètman editabl, pwogram espesyal ak fonksyon Optical Character Recognition (OCR) yo itilize.

Solisyon sa yo trè difisil aplike ak, Se poutèt sa, koute yon anpil lajan. Si ou bezwen rekonèt tèks ak PDF regilyèman, li ta bon pou achte pwogram apwopriye a. Pou kèk ka ki ra, li ta pi lojik pou itilize youn nan sèvis ki disponib sou entènèt ak menm fonksyon.

Ki jan yo rekonèt tèks nan PDF sou entènèt

Natirèlman, OCR sèvis sou entènèt karakteristik seri a pi limite konpare ak solisyon Desktop plen. Men, ou ka travay ak resous sa yo swa pou gratis, oswa pou yon frè nominal. Bagay pwensipal lan se ki aplikasyon yo korespondan entènèt fè fas ak travay prensipal yo, sètadi rekonesans tèks, kòm byen.

Metòd 1: ABBYY FineReader sou entènèt

Konpayi devlopman sèvis la se youn nan lidè yo nan jaden an nan rekonesans optik dokiman. ABBYY FineReader pou Windows ak Mac se yon solisyon pwisan pou konvèti PDF nan tèks ak travay ak li.

Kontrepati entènèt la nan pwogram nan, nan kou, se enferyè a li nan fonctionnalités. Men, sèvis la ka rekonèt tèks nan analiz ak foto nan plis pase 190 lang. Sipòte konvèsyon nan dosye PDF nan dokiman Pawòl, Excel, elatriye.

ABBYY FineReader sou entènèt sèvis sou entènèt

  1. Anvan ou kòmanse travay ak zouti a, kreye yon kont sou sit la oswa ouvri sesyon an lè l sèvi avèk Facebook ou, Google oswa Microsoft kont.

    Pou ale nan fenèt la login, klike sou bouton an. "Login" nan ba meni anlè a.
  2. Yon fwa ou ouvri sesyon an, enpòte dokiman PDF vle a nan FineReader lè l sèvi avèk bouton an "Upload Files".

    Lè sa a, klike sou "Chwazi nimewo paj" ak presize span a vle pou rekonesans tèks.
  3. Next, chwazi lang yo prezante nan dokiman an, fòma a nan dosye a ki kapab lakòz, epi klike sou bouton an "Rekonèt".
  4. Apre pwosesis la, dire a ki depann antyèman sou gwosè a nan dokiman an, ou ka telechaje dosye a fini ak done tèks tou senpleman pa klike sou non li yo.

    Oswa ekspòtasyon li nan youn nan sèvis sa yo ki disponib nwaj la.

Sèvis la distenge, pwobableman, pa algoritm yo pi egzat rekonesans tèks nan imaj ak dosye PDF. Men, malerezman, se itilizasyon lib li limite a senk paj trete pa mwa. Pou travay avèk plis dokiman volumineuz, ou dwe achte yon abònman yon sèl-ane.

Sepandan, si fonksyon OCR a bezwen trè raman, ABBYY FineReader Online se yon gwo opsyon pou extraire tèks nan ti dosye PDF yo.

Metòd 2: Gratis sou entènèt OCR

Senp ak pratik sèvis pou numerize tèks. San nesesite pou enskripsyon, resous la pèmèt ou rekonèt 15 paj PDF konplè pou chak èdtan. Gratis sou entènèt OCR konplètman travay ak dokiman nan 46 lang ak san otorizasyon sipòte twa fòma ekspòtasyon tèks - DOCX, XLSX ak TXT.

Lè w ap enskri, itilizatè a kapab travay sou plizyè paj dokiman, men nimewo gratis la nan paj sa yo limite a 50 inite.

Gratis sou entènèt OCR sèvis sou entènèt

  1. Pou rekonèt tèks la nan PDF la kòm yon "envite", san otorizasyon sou resous la, sèvi ak fòm ki apwopriye a sou paj prensipal la nan sit la.

    Chwazi dokiman an vle lè l sèvi avèk bouton an "File", presize lang tèks prensipal la, fòma pwodiksyon, Lè sa a, rete tann pou dosye a chaje epi klike sou "Konvèti".
  2. Nan fen pwosesis la numérisation, klike sou "Download File Sòti" pou konsève dokiman ki fini ak tèks la sou òdinatè a.

Pou itilizatè otorize, sekans nan aksyon se yon ti jan diferan.

  1. Sèvi ak bouton an "Enskripsyon" oswa "Login" nan ba meni an tèt yo, respektivman, kreye yon kont gratis sou entènèt OCR oswa ale nan li.
  2. Apre otorizasyon nan panèl rekonesans, kenbe kle a "Ctrl", chwazi jiska de lang nan dokiman an sous soti nan lis yo bay la.
  3. Espesifye plis opsyon pou èkstraksyon tèks nan PDF epi klike sou bouton an. "Chwazi File" chaje dokiman an nan sèvis la.

    Lè sa a, yo kòmanse rekonesans, klike sou "Konvèti".
  4. Apre w fin travay dokiman an, klike sou lyen ak non dosye pwodiksyon an nan kolòn ki koresponn lan.

    Rezilta a rekonesans yo pral imedyatman ki estoke nan memwa a nan òdinatè w lan.

Si ou bezwen ekstrè tèks ki sòti nan yon ti dokiman PDF, ou ka san danje sèvi ak zouti ki dekri anwo a. Pou travay ak dosye gwo, ou pral gen achte senbòl adisyonèl nan gratis sou entènèt OCR oswa resort nan yon lòt solisyon.

Metòd 3: NewOCR

Konplètman gratis OCR-sèvis ki pèmèt ou ekstrè tèks soti nan pratikman nenpòt dokiman grafik ak elektwonik tankou DjVu ak PDF. Resous la pa enpoze restriksyon sou gwosè ak kantite dosye rekonèt, pa egzije enskripsyon, epi li ofri yon pakèt fonksyon ki gen rapò.

NewOCR sipòte 106 lang e se kapab kòrèkteman okipe menm ki ba-bon jan kalite analiz dokiman. Li posib yo manyèlman chwazi zòn nan pou rekonesans tèks sou paj la dosye.

Sou entènèt sèvis NewOCR

  1. Se konsa, ou ka kòmanse travay ak resous la imedyatman, san yo pa bezwen nan fè aksyon nesesè.

    Dirèkteman sou paj prensipal la gen yon fòm pou enpòte dokiman an sou sit la. Upload yon dosye nan NewOCR, sèvi ak bouton an "Chwazi dosye" nan seksyon an "Chwazi dosye ou". Lè sa a, nan jaden an "Langaj rekonesans (yo)" chwazi youn oswa plis lang nan dokiman an sous, Lè sa a, klike sou "Voye + OCR".
  2. Mete anviwònman rekonesans ou pi pito a, chwazi paj an vle ekstrè tèks la, epi klike sou bouton an. "OCR".
  3. Scroll down yon ti jan epi jwenn bouton an. Download.

    Klike sou li ak nan lis la drop-desann chwazi fòma a dokiman obligatwa pou telechaje. Apre sa, dosye a fini ak tèks la extrait yo pral telechaje nan òdinatè w lan.

Zouti a se pratik ak rekonèt tout karaktè nan yon kalite ase segondè. Sepandan, yo dwe pwosesis la nan chak paj nan dokiman an enpòte PDF dwe lanse poukont yo ak parèt nan yon dosye separe. Ou ka, nan kou, imedyatman kopi rezilta yo rekonesans nan papye a ak rantre yo ak lòt moun.

Men, yo bay nuans ki pi wo a, gwo kantite tèks lè l sèvi avèk NewOCR yo trè difisil ekstrè. Avèk menm dosye a ti dosye chay "ak yon Bang."

Metòd 4: OCR.Space

Yon resous senp ak konprann pou numerize tèks pèmèt ou rekonèt dokiman PDF yo ak pwodiksyon rezilta a nan yon dosye TXT. Pa gen limit sou kantite paj. Limit la sèlman se ke gwosè a nan dokiman an opinyon pa ta dwe depase 5 megabit.

OCR.Space sèvis sou entènèt

  1. Enskri pou travay avèk zouti a pa nesesè.

    Jis klike sou lyen an pi wo a ak Upload dokiman an PDF sou sit entènèt la nan òdinatè w lan lè l sèvi avèk bouton an "Chwazi dosye" oswa nan rezo a - pa referans.
  2. Nan lis la deroulan "Chwazi lang OCR" chwazi lang lan nan dokiman an enpòte.

    Lè sa a, kòmanse pwosesis la rekonesans tèks pa klike sou bouton an. "Kòmanse OCR!".
  3. Nan fen pwosesis dosye, wè rezilta a nan la "OCR'ed Result" epi klike sou Downloadpou telechaje dokiman TXT fini an.

Si ou jis bezwen ekstrè tèks la soti nan PDF la ak fòma final la pa enpòtan nan tout, OCR.Space se yon bon chwa. Dokiman sèlman an dwe "monoleng", paske rekonesans de oswa plis lang nan menm tan an nan sèvis la pa bay.

Gade tou: Gratis analogue FineReader

Evalye zouti sou entènèt yo prezante nan atik la, li ta dwe te note ke Online a FineReader soti nan ABBYY manch fonksyon an OCR pi byen epi avèk presizyon. Si presizyon nan maksimòm nan rekonesans tèks enpòtan pou ou, li pi bon espesyalman konsidere opsyon sa a. Men, pou peye pou li, gen plis chans, tou gen.

Si ou bezwen nimerik ti dokiman epi ou pare pou korije erè nan sèvis la tèt ou, li se rekòmande yo sèvi ak NewOCR, OCR.Space oswa gratis sou entènèt OCR.