4 tasuta veebipõhist tekstituvastustööriista panevad lõplikult proovile

4 tasuta veebipõhist tekstituvastustööriista panevad lõplikult proovile

Kui soovite trükitud teksti teisendada digitaalseks tekstiks, mida saate kopeerida, kleepida, redigeerida ja otsida, peate kasutama optilise märgituvastuse (OCR) skannerit.





Kui valite dokumendi skannimise või pildistamise, salvestatakse see sellises vormingus nagu JPEG või PDF. OCR tarkvara suudab seejärel ära tunda nendes dokumentides olevad tähed ja numbrid ning teisendada need otsitavaks PDF -failiks või failiks, mida saate redigeerida sellistes programmides nagu Microsoft Word.





Probleem on selles, et mõned OCR -skannerid töötavad palju paremini kui teised, kusjuures parimad on rahakotil üsna rasked.





Näiteks Omnipage18 maksab 150 dollarit, kuid on eriti hea erinevate keelte äratundmisel. Adobe Acrobat Pro DC maksab silmapaistvalt 400 dollarit, kuid on uskumatu täpsusega. ABBYY FineReader maksab 150 dollarit, kuid on suurepärane dokumentide, näiteks ajakirjade ja brošüüride teisendamiseks otsitavaks tekstiks. Katsetame ABBYY veebipakkumist hiljem selles artiklis.

Kui aga otsite tasuta alternatiive, mida saate lae alla ja Windowsis või OS X -is kasutamiseks peaksite proovima neid OCR -tööriistu. Aga kui soovite kasutada tasuta, võrgus OCR -tööriist, jätkake lugemist, nagu oleme proovinud paar esimest, allpool toodud tulemustega.



Test

Tundub, et enamik inimesi kasutab nüüd oma nutitelefoni nende jaoks skannimiseks, otsustasin seda kasutada Evernote'i skannitav rakendus (Tasuta iOS -is ja Androidis). Skaneerisin Richard Dawkini esimese lehe Mäele ronimine on ebatõenäoline , et näha, milliseid tulemusi saame väga lihtsa vormindamise korral. Skaneerisin ka Tim Ferrissi lehe 4-tunnine kokk proovida veidi keerukama vormindusega skannereid. Salvestasin kõik need failid PDF -failina.

Seejärel vaadati need dokumendid läbi mõned väidetavalt parimad online -OCR -tööriistad, et näha, kui hästi neil läks.





Tasuta online -OCR [pole enam saadaval]

Õnneks pole tasuta online -OCR -i kasutamiseks registreerimist vaja. Ja mul oli kahekordne mulje, kui nägin nende väidet säilitada minu dokumendi vormindus ja paigutus.

Sait väidab, et suudab sisendina toetada PDF-, GIF-, BMP-, JPEG-, TIFF- ja PNG -vormingut. Väljunditeks võivad olla DOC, PDF -tekstidokument, RTF ja TXT. Kahjuks ei saanud ma teada, kas neil on failisuuruse piirang.





Põhidokument PDF -failiks

Täiesti ideaalselt teisendatud. Rohkem polegi midagi öelda! Me läheme a väga hea algus.

Põhidokument DOC -le

Tundub, et tegelikud sõnad on veatult teisendatud, kui välja arvata mägi „Mount Rushmore“, mis on kuidagi AWOL. Vormindus on aga teine ​​lugu. Paljud komad asendati alljoontega ja kogu dokumendi punktidesse lisati juhuslikud tühikud. Kui näete hiljem, kuidas tasulisel tarkvaral selles testis läks, pole see halb pingutus üleüldse .

Kompleksne dokument PDF -i

Kompleksne dokument DOC -le

Seekord võttis teisendamine aega vaid 10 sekundit, tekst teisendati uuesti umbes 95% täpsusega. Esines mõningaid kummalisi tühikutega seotud probleeme ja tarkvaral oli probleeme dokumendi paremas ülanurgas oleva fondi teisendamisega ning mõni märk jäi siin -seal vahele.

Kohtuotsus

i2OCR

i2OCR esitab muljetavaldavaid väiteid. Tööriist tuvastab üle 60 keele, saab hakkama mitmeveeruliste paigutustega (eemaldades vormingu), tal pole failisuuruse piiranguid, saab üleslaaditud faile teisendada ja URL -idelt. Ja ka selle tööriista kasutamiseks ei pea te registreeruma.

Teenus töötab nii, et ekstraheerib lihtsalt pildi teie pildilt ja väljastab seejärel vormindamata teksti. Saate kiiresti parandada kõik vead kõrvuti asetatud vaates, enne teksti kopeerimist teistesse programmidesse või allalaadimist DOC-, PDF- või HTML-vormingus.

Märkus. Kui proovisin oma PDF -dokumente üles laadida, lükkas i2OCR need tagasi, seega pidin need JPEG -vormingusse teisendama (tehes neist ekraanipildi ja seejärel failid üles laadides).

Põhidokument lihttekstina

Kompleksne dokument lihttekstiks

Suurem osa tekstist teisendati ilma liigsete vigadeta, välja arvatud pealkiri ja retsept üleval paremal, mis oli selle tööriista jaoks loetamatu. Veergude teisendamine lihttekstiks ei olnud kaugeltki ideaalne. Kui soovite selle teisenduse toimivaks muuta, kuluks ridade ümberkujundamiseks sidusateks lauseteks palju aega.

Kohtuotsus

Online OCR

Online OCR toetab praegu 46 erinevat keelt ja saab teisendada PDF-, JPG-, BMP-, TIFF- ja GIF -vormingud Wordi, Exceli või tavalise teksti vormingusse. Sait väidab, et 'teisendatud dokumendid näevad välja täpselt nagu originaalid - tabelid, veerud ja graafika'.

Versioon, mida saate ilma registreerimiseta kasutada, võimaldab teisendada kuni 15 pilti tunnis (piirang 5 MB). Kui registreerute kontole, saate selle piirangu peale osta rohkem lehti, kuid saate teisendada ka mitmelehelisi dokumente ja ZIP-arhiive.

Põhidokument DOC -le

Põhidokument teisendati veatult peale rooma numbri Mina peale ei võeta. Nagu sait lubas, oli vormistus täpselt selline nagu raamatus. Kiitus selle tööriista eest.

Kompleksne dokument DOC -le

Olles pettunud eelmistes OCR -tööriistades keeruka dokumendi teisendamisel, avaldas mulle online OCR tohutult muljet. Paigutus oli peaaegu täiuslik, nagu näete ülal. Taaskord, retsepti ei võetud liiga hästi, kuid muud väikesed vead olid tühised.

Kohtuotsus

Täiesti fantastilised tulemused Online OCR -ist. Ainus negatiivne külg, mida ma näen, on see, et teisendatud dokumente ei ole võimalik PDF -vormingus alla laadida, kuna mainitud väljundvormingute hulka kuuluvad ainult DOCX, XLSX ja TXT.

ABBYY FineReader Online (10-leheküljeline prooviversioon)

Nagu varem mainitud, on ABBYY üks OCR -tarkvara turuliidritest, mille täielik allalaaditav programm maksab umbes 150 dollarit. Nad pakuvad küll 10-leheküljeline tasuta prooviperiood nende veebitööriista jaoks (registreerimine on vajalik). 5 -dollarise tellimuse korral võimaldab nende veebitööriist teil igal kuul teisendada 200 lehte.

Vastuvõetavad failid võivad olla kuni 100 MB mis tahes vormingus: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP ja PNG. ABBYY tunneb ära ka ligi 200 keelt. Väljundid on eriti muljetavaldavad, valides DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 ja EPUB.

Prooviperioodi jooksul saate isegi proovida mõnda BETA -funktsiooni. Esimene võimalus on tõlkida dokument teise keelde. Teine on eksportida teisendatud dokument pilvesalvestuskontole, olgu see siis Dropbox, Google Drive, Evernote, Microsoft OneDrive või Box.

Põhidokument DOCX -ile

Kompleksne dokument DOCX -ile

Pärast teisendamist oli dokumendi tekstis väga vähe vigu (peale selle retsepti fondiga taas võitleva OCR -i!), Kuid vormindamine jättis palju soovida.

Kolm veergu võtsid kuidagi kaks lehekülge, keskveeruga ainult ilmuvad teisel lehel. Kui sa tegelikult tahaksid teha selle teisendatud dokumendi puhul tõmbate oma juuksed välja.

Põhidokument PDF -failiks

Kompleksne dokument PDF -i

Kohtuotsus

Lõplik tulemus

Kui soovite, nagu enamik inimesi, lihtsalt skaneerida mõnda ajakirjaartiklit ja mõnda majapidamisarvet, ei pea te neid dokumente muutma. Seetõttu sobib otse PDF -failiks teisendamine teile, kuna saate siiski neid dokumente otsida. Selleks oli tasuta online -OCR kindlasti parim tasuta tööriist, mida testisime. Seda öeldes, kui olete valmis maksma 5 dollarit kuus peaaegu täiuslikkuse eest, ABBYY FineReader Online oli veidi täpsem.

Mis puutub dokumentide teisendamisse DOC -ks, siis meil ei õnnestunud leida ühtegi täiuslikku lahendust, kuid parimad tulemused tulid Online OCR . Teisendamine ei olnud täiuslik, kuid vormindamise terviklikkus jäi suures osas puutumatuks ja vead olid tühised. Kui võrrelda neid tulemusi ABBYY lisatasu pakkumisega, ei saa te jätta muljet.

Me ei lisanud sellesse postitusse Google Drive'i OCR -i võimalusi; natuke Google'i igakülgseks teadmiseks, kuid rohkem sellepärast, et tahtsime testida mõnda muud tasuta online -OCR -teenust.

Teile: Milliseid muid veebipõhiseid OCR -tööriistu soovitaksite meie lugejatele? Ja mida olete proovinud, mida te enam kunagi ei kasuta?

Jaga Jaga Piiksuma E -post Algaja juhend kõne animeerimiseks

Kõne animeerimine võib olla väljakutse. Kui olete valmis oma projektile dialoogi lisama, jagame teie jaoks protsessi.

vaarikas pi 3 b+ wifi
Loe edasi Seotud teemad
  • Internet
  • Tootlikkus
  • Faili teisendamine
  • OCR
Autori kohta Rob Nightingale(Avaldatud 272 artiklit)

Rob Nightingale on lõpetanud Suurbritannia ülikooli filosoofia erialal. Ta on töötanud sotsiaalmeedia juhi ja konsultandina üle viie aasta, pidades samal ajal töötubasid mitmes riigis. Viimased kaks aastat on Rob olnud ka tehnoloogiakirjanik, MakeUseOfi sotsiaalmeediahaldur ja uudiskirjade redaktor. Tavaliselt leiate ta reisimas maailmas, õppides videotöötlust ja katsetades fotograafiat.

Rohkem Rob Nightingale'ilt

Telli meie uudiskiri

Liituge meie uudiskirjaga, et saada tehnilisi näpunäiteid, ülevaateid, tasuta e -raamatuid ja eksklusiivseid pakkumisi!

Tellimiseks klõpsake siin