Reklame

Hvis du vil konvertere en trykt tekst til digital tekst, som du kan kopiere, indsætte, redigere og søge, skal du bruge OCR-scannere (Optical Character Recognition).

Når du vælger at scanne eller tage et foto af et dokument, gemmes dette i et format som JPEG eller PDF. OCR-software kan derefter genkende bogstaver og tal i disse dokumenter og konvertere dem til en søgbar PDF 4 metoder til at oprette og redigere PDF-filer gratisUd af alle de almindelige filtyper, der findes i vores computerverden, er PDF sandsynligvis en af ​​de mest restriktive, samtidig med at den er tilgængelig for alle at bruge (primært til at læse) ... Læs mere , eller i en fil, som du kan redigere i programmer som Microsoft Word.

Problemet er, at nogle OCR-scannere fungerer meget bedre end andre, hvor det allerbedste er temmelig tungt på tegnebogen.

Omnipage18 koster for eksempel $ 150, men er især god til at genkende forskellige sprog. Adobe Acrobat Pro DC koster en øjenvandende $ 400, men har utrolig nøjagtighed.

instagram viewer
ABBYY FineReader koster $ 150, men er fantastisk ved at konvertere dokumenter som magasiner og brochurer til søgbar tekst. Vi tester ABBYY's online tilbud senere i denne artikel.

Men hvis du er interesseret i gratis alternativer, som du kan Hent og brug på Windows eller OS X, skal du prøv disse OCR-værktøjer De 5 bedste OCR-værktøjer til udpakning af tekst fra billederNår du har papirstrimler, hvordan får du all den trykte tekst konverteret til noget, som et digitalt program vil kunne genkende og indeksere? Opbevar en god OCR-software i nærheden. Læs mere . Men hvis du hellere vil bruge en gratis, online OCR-værktøj, fortsæt med at læse, som vi har prøvet de øverste par, med resultaterne nedenfor.

Testen

Synes de fleste mennesker nu bruger deres smartphones til at gøre deres scanning efter dem Scan og administrer dine kvitteringer, spar plads, papir og tidPapirindtægter går let tabt, og det er svært at finde, når du har mest brug for dem. Heldigvis løser digital digital begge disse problemer. Læs mere , Besluttede jeg at bruge Evernotes Scannable-app (Gratis på iOS og Android). Jeg scannede den første side af Richard Dawkins Klatring Mount usandsynlig, for at se, hvilke resultater vi kunne få med meget grundlæggende formatering. Jeg scannede også en side af Tim Ferriss ' Den 4-timers kok at prøve scannerne med lidt mere kompliceret formatering. Jeg gemte hver af disse filer som en PDF.

Test af online OCR'er

Disse dokumenter blev derefter kørt gennem nogle af de angiveligt bedste online OCR-værktøjer for at se, hvor godt de gik.

Gratis online OCR [ikke længere tilgængelig]

Heldigvis kræves der ingen registrering for at bruge gratis online OCR. Og jeg blev dobbelt imponeret, da jeg så deres påstand om at beholde formateringen og layouten af ​​mit dokument.

Gratis online OCR

Webstedet hævder at være i stand til at understøtte PDF, GIF, BMP, JPEG, TIFF og PNG som input. Outputs kan enten være DOC, et PDF-tekstdokument, RTF og TXT. Desværre kunne jeg ikke finde ud af, om de havde en filstørrelsesgrænse.

Grundlæggende dokument til PDF
Konverteret helt perfekt. Der er ikke meget mere at sige! Vi er ude til en meget god start.

Grundlæggende dokument til DOC
De faktiske ord ser ud til at have konverteret fejlfrit bortset fra “ount” fra “Mount Rushmore” på en eller anden måde går AWOL. Formateringen er dog en anden historie. Mange kommaer blev erstattet med understregninger, og tilfældige mellemrum blev indsat på punkter i hele dokumentet. Når du senere ser, hvordan premiumsoftwaren klarede sig i denne test, er dette ikke en dårlig indsats overhovedet.

Kompleks dokument til PDF
Det tog 120 sekunder at konvertere dokumentet! Når den var fuldført, var al teksten blevet konverteret med ca. 95% nøjagtighed, skønt teksten i det separate felt øverst til højre på siden var uundersøgelig. Et par andre tegn i PDF-filen var også forkerte.

Kompleks dokument til DOC
Denne gang tog konverteringen kun 10 sekunder, hvor teksten igen blev konverteret med ca. 95% nøjagtighed. Der var nogle underlige mellemrumsproblemer, og softwaren havde problemer med at konvertere skrifttypen øverst til højre i dokumentet og gik glip af et par tegn her og der.

Dom
Hvis du vil konvertere enkeltformaterede dokumenter til PDF, er dette et fantastisk værktøj. Med hensyn til konvertering til DOC var resultaterne ikke noget at skrive hjem om.

i2OCR fremsætter nogle imponerende påstande. Værktøjet genkender over 60 sprog, kan håndtere layout i flere søjler (ved at fjerne formateringen), har ingen filstørrelsesgrænser, kan konvertere uploadede filer og fra URL'er. Og du behøver ikke at registrere dig for at bruge dette værktøj heller.

Tjenesten fungerer ved blot at udtrække teksten fra dit billede og derefter sende uformateret tekst. Du kan hurtigt rette eventuelle fejl i visningen side om side, før du kopierer teksten til andre programmer eller downloader som DOC, PDF eller HTML.

Bemærk: Da jeg prøvede at uploade mine PDF-dokumenter, blev disse afvist af i2OCR, så jeg var nødt til at konvertere disse til JPEG (ved at tage et skærmbillede af dem og derefter uploade filerne).

Grundlæggende dokument til almindelig tekstSkærmbillede 2016-02-11 kl. 12.30.28
På grund af den måde dette værktøj fungerer, går al formatering tabt, skønt konverteringen fra billede til tekst var næsten perfekt. Der var nogle små fejl, såsom afsnitafstand, og nogle kommaer blev erstattet med perioder, men dette er små knebler.

Kompleks dokument til almindelig tekstSkærmbillede 2016-02-11 kl. 12.39.48
Størstedelen af ​​teksten blev konverteret uden for mange fejl bortset fra titlen og opskriften øverst til højre, hvilket var ulæseligt for dette værktøj. Måden kolonnerne blev konverteret til almindelig tekst på var langt fra ideel. Hvis du vil gøre denne konvertering brugbar, ville der være meget tid til at omarrangere linjerne til sammenhængende sætninger.

Dom
I basisdokumenter fungerer i2OCR godt. Muligheden for at redigere teksten før download er også en meget flot touch. For mere komplekse dokumenter er konverteringen dog stadig ret nøjagtig, men den måde, teksten udsendes, vil ikke gøre dit liv meget lettere.

Online OCR understøtter i øjeblikket 46 forskellige sprog og kan konvertere PDF, JPG, BMP, TIFF og GIF til Word-, Excel- eller Plain Text-format. Webstedet hævder, at "konverterede dokumenter ligner nøjagtigt originalen - tabeller, kolonner og grafik".

Den version, du kan bruge uden at registrere dig, giver dig mulighed for at konvertere op til 15 billeder i timen (5 MB grænse). Hvis du tilmelder dig en konto, kan du købe flere sider oven på denne grænse, samtidig med at du også kan konvertere flersidede dokumenter og ZIP-arkiver.

Online OCR-resultater

Grundlæggende dokument til DOC
Basisdokumentet konverteres fejlfrit bortset fra det romerske tal jeg bliver ikke hentet. Som webstedet lovede, var formateringen nøjagtigt som i bogen. Kudos til dette værktøj.

Kompleks dokument til DOC
Efter at have været skuffet over de tidligere OCR-værktøjer ved konvertering af det komplekse dokument, blev jeg massivt imponeret over Online OCR. Layouten var næsten perfekt, som du kan se ovenfor. Endnu en gang blev opskriften ikke plukket op for godt, men andre mindre fejl var ubetydelige.

Dom

Helt fantastiske resultater fra Online OCR. Den eneste ulempe, jeg ser, er, at der ikke er nogen måde at downloade de konverterede dokumenter som PDF'er, da de nævnte outputformater kun inkluderer DOCX, XLSX og TXT.

Som nævnt tidligere er ABBYY en af ​​markedslederne inden for OCR-software, der koster omkring $ 150 for deres fulde, downloadbare program. De tilbyder en 10-siders gratis prøveversion til deres online værktøj (registrering kræves dog). For et abonnement på $ 5 giver deres onlineværktøj dig mulighed for at konvertere 200 sider hver måned.

ABBYY FineReader Online

Accepterede filer kan være op til 100 MB i et hvilket som helst af disse formater: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP og PNG. ABBYY genkender også næsten 200 sprog. Output er især imponerende med et valg mellem DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 og EPUB.

Du kan endda prøve et par BETA-funktioner under din prøveperiode. Den første er muligheden for at oversætte dit dokument til et andet sprog. Det andet er at eksportere dit konverterede dokument til din cloud-lagringskonto, hvad enten det er Dropbox, Google Drive, Evernote, Microsoft OneDrive eller Box.

Grundlæggende dokument til DOCX
De samlede resultater var gode, men ikke forbløffende i betragtning af at dette er et premiumprodukt. Flere kommaer og perioder blev udvekslet, flere inverterede kommaer blev erstattet med en asteriks, et par store bogstaver manglede, og et ord (bogstavelig) blev stavet forkert.

Kompleks dokument til DOCX
Når den var konverteret var der meget få fejl i teksten i dokumentet (bortset fra at OCR kæmpede med den opskrifts skrifttype igen!), Men formateringen efterlod meget at ønske.

ABBYY-resultat

De tre kolonner tog på en eller anden måde to sider op med den centrale kolonne kun vises på anden side. Hvis du faktisk ville gøre hvad som helst med dette konverterede dokument, vil du ende med at trække dit hår ud.

Grundlæggende dokument til PDF
Mens jeg gennemgik den konverterede PDF, kunne jeg slet ikke finde nogen fejl. Måske har vi fundet, hvor ABBYY udmærker sig. Fantastiske resultater.

Kompleks dokument til PDF
Igen kunne jeg ikke finde nogen fejl i denne konverterede fil. ABBYY ved selvfølgelig, hvordan man konverterer til PDF usædvanligt godt.

Dom
Hvis du er glad for at betale et par dollars, synes konvertering til PDF at fungere fænomenalt godt med denne service og være i stand til at synkronisere konverterede filer til dit skylager er især nyttigt, hvis du scanner en stor mængde Dokumenter. Som med de andre indstillinger, har ABBYY stadig ikke fundet ud af, hvordan man fejlagtigt konverterer dokumenter til DOC for nem redigering.

Det endelige resultat

Hvis du som de fleste mennesker bare ønsker at scanne et par magasinartikler og nogle husholdningsregninger, behøver du ikke at redigere disse dokumenter. Derfor vil konvertering direkte til en PDF være passende for dig, fordi du stadig kan søge i disse dokumenter. Til dette var Free Online OCR bestemt det bedste gratis værktøj, vi testede. Når det er sagt, hvis du er villig til at betale $ 5 pr. Måned for næsten perfektion, ABBYY's FineReader Online var lidt mere nøjagtig.

Når det kommer til konvertering af dokumenter til DOC, lykkedes det os ikke at finde nogen løsning, der var perfekt, men langt de bedste resultater kom fra Online OCR. Konverteringen var ikke perfekt, men formateringens integritet blev stort set holdt intakt, og fejl var ubetydelige. Når vi sammenligner disse resultater med "premium" -udbuddet fra ABBYY, kan du ikke hjælpe dig med at blive imponeret massivt.

Vi inkluderede ikke Google Drevs OCR-muligheder i dette indlæg lidt for Googles allerværhed, men mere for det faktum, at vi ønskede at teste et par andre gratis online OCR-tjenester derude.

Over til dig: Hvilke andre online OCR-værktøjer vil du anbefale vores læsere? Og hvilket har du prøvet, som du aldrig ville bruge igen?

Rob Nightingale er uddannet filosofi fra University of York, UK. Han har arbejdet som social media manager og konsulent i over fem år, mens han har givet workshops i flere lande. I de sidste to år har Rob også været teknologiforfatter og er MakeUseOfs Social Media Manager og Newsletter Editor. Du finder ham som regel på rejse...