Jak převést naskenované dokumenty do aplikace Word - šťastný Android

Pokud potřebujete digitalizovat knihu v textovém formátu, můžete mít několik otázek. Je to možné? Jak je to s kvalitou, je to dobré? Lze to nejen provést, ale existuje také několik způsobů, jak převést naskenovaný dokument do aplikace Word. Uvidíme:

  • Skenování dokumentu ve formátu PDF a jeho úpravy později s Adobe Acrobat XI Pro a uložit jej ve formátu Word. Verze Pro aplikace Acrobat je placená, ale můžete si zakoupit bezplatnou 30denní zkušební licenci.
  • Z webu OnlineOCR.net. Tato webová aplikace umožňuje převádět dokumenty ve formátech PDF, JPG, TIFF a GIF do formátu Word, Excel a text. V bezplatné verzi můžeme převést až 15 stránek za hodinu a dokumenty o maximálně jedné stránce.
  • Skenování dokumentu ve formátu (OCR) a uložit jej jako text. Poté můžeme otevřít Word a upravit nebo uložit ve formátu .doc.
  • Používání nějakého programu optického rozpoznávání znaků:
    •  VueScan (k dispozici pro Windows, Mac OS X a Linux)
    • Kooka(pro Linux)
    • Kancelářský objektiv (pro Android a ios)
    • CamScanner (pro Android a ios)

Nejefektivnějším způsobem ze všeho, co můžeme říci, je program Adobe Acrobat Pro, ale pouze v případě, že je skenování velmi, velmi čisté a vysoce kvalitní. Aplikace pro optické rozpoznávání znaků prošly dlouhou cestou, ale stále vykazují některé mezery s tučným písmem nebo kurzívou a přepis některých slov v závislosti na typu písma původního dokumentu může být špatný.

Zkuste naskenovat a předat tento dokument Wordu, abyste zjistili, co se stane

Ze samotného skeneru

Některé skenery obsahují ve svém vlastním skenovacím programu funkci optického rozpoznávání (OCR). Chcete-li naskenovat dokument do textu, stačí nastavit formát digitalizace a podívat se na formát, který odkazuje na OCR nebo podobný (záleží na značce / modelu skeneru).

Přejít z PDF do Wordu s Adobe Acrobat XI Pro

Jakmile Adobe Acrobat XI Pro (TADY máte 30denní zkušební verzi zdarma) přejděte na „Nástroje -> Rozpoznávání textu -> V tomto souboru”.

V okně „Rozpoznat text"Klikněte na"Upravit„A vyberte jazyk textu, výstupní styl a rozlišení.

Nakonec se vraťte k „Nástroje -> Úpravy obsahu -> Úpravy textu a obrázků„A pokud potřebujete opravit slovo, upravte text. Dokončete kliknutím na „Soubor -> Uložit jako„A uložte to ve formátu Word.

OnlineOCR

OnlineOCR je webová aplikace pro přenos obrázků nebo souborů PDF do aplikace Word a její použití je velmi snadné. Vysvětlím, jak to funguje: Enter //www.onlineocr.net/ a klikněte na „Zvolte soubor“. Vyberte naskenovaný dokument a poté vyberte jazyk a výstupní formát ze 2 rozevíracích nabídek, která máte ve středu obrazovky.

Dokončete kliknutím na „Konvertovat“. Pod ní se zobrazí náhled prostého textu, který můžete upravit, pokud potřebujete opravit některá slova. Nakonec klikněte na „Stáhnout výstupní soubor„A budete si moci stáhnout soubor ve formátu Word. Zde je příklad PDF převedeného do Wordu pomocí OnlineOCR:

  • Původní PDF:

  • Převedený dokument:

Pokud vám tato webová aplikace nevyhovuje, můžete zkusit jiné podobné alternativy, jako je FreeOCR nebo Free-Online-OCR.

Programy optického rozpoznávání znaků (OCR)

Pokud nechcete upravovat své dokumenty online a potřebujete desktopovou aplikaci, můžete použít aplikace jako např VueScan (který je kromě všudypřítomného Windows k dispozici také pro Mac a Linux).

Další možností je použít zařízení Android nebo iOS ke skenování dokumentu a jeho přímému převodu na text. Existují aplikace jako Kancelářský objektiv (v následujících situacích Android a ios) nebo CamScanner (v následujících situacích Android a ios), které provádějí celý proces ze stejné aplikace. V těchto případech se doporučuje obrázek před převedením na text vyčistit. Pokud se chcete o této metodě dozvědět více, podívejte se na TENTO PŘÍSPĚVEK.

Podle mého názoru je technika optického rozpoznávání znaků, i když se v posledních letech hodně zlepšila, stále zbývá jen pár světelných let od toho, aby byla dokonalou technikou. Spousta podrobností, spousta slov, která „překládá“, špatnými písmeny a symboly, které vrhají text. Stále mu chybí ta extra inteligence abys viděl, že «t &! $ olog1a»Nelze použít platný překlad žádného slova v textu. Stále nevidím čtení s porozuměním, ale jednoduché vizuální rozpoznání jednotlivých písmen, která tvoří slova, bez jejich integrace se zbytkem textu. Jsem však přesvědčen, že okamžik, kdy uděláme ten poslední velký skok, se každým dnem přibližuje.

Máte Telegram nainstalován? Získejte nejlepší příspěvek každého dne náš kanál. Nebo pokud chcete, zjistěte vše z našeho facebooková stránka.