Jak skenovat a upravit text (i do PDF)

Naskenovat dobře fotografii je mnohdy umění, naskenovat text je proti tomu jednodušší, ale o to více záleží jak následně s naskenovaným dokumentem naložíte. V článku se zabývám tím jak skenovat text a jak jej následně upravit aby při následném tisku byl výsledek co nejlepší.

Co je zajímavé na skenování textu je fakt, že dobré naskenování a následná uprava textu není ani zase tak složitá.

Možná to znáte. Potřebujete naskenovat (a vytisknout, tedy vlastně zkopírovat) zprávu od lékaře (třeba pro babičku), zajímavý článek nebo nějakou stranu z knihy. Zde je mých pár rad a zkušeností jak na to jít, aby skenování a úprava byla co nejsnazší a zároveň výsledek byl co nejlepší.

Na začátek shrnu, co jsem svými dosavadními pokusy zjistil:

  • to, jak nastavíte skener není zase tak důležité (níže podrobněji vysvětlím)
  • následně je možno strany (i více najednou) vyčistit
  • naskenované stránky je většinou potřeba drobně upravit
  • můžete je vytisknout a smazat – nebo – archívovat, nebo snížit podstatně jejich velikost a uložit je

Nastavení skeneru

Mnohé jednodušší skenery mají v podstatě jen možnost ovlivnit jas a kontrast. Mými pokusy jsem zjistil, že efektivnější je provést úpravu až v počítači, kdy sice je se skenovanou stranou jakoby dvojí práce (sken + úprava v PC), ale výsledek je mnohem lepší. V zásadě je tedy potřeba nastavit skener pouze tak, aby naskenovná strana nebyla příliš tmavá nebo příliš světlá. Pokud skenujete černobílou předlohu (stranu) doporučuj ji také skenovat černobíle – pracujeme tak s menším množství dat. Já doporučují dále skenovat do formátu PNG, který je bezztrátový a nerozostřuje text. Naopak formát JPG je sice úspornější ale text rozostřuje. Když ale skener neumí PNG, tak i JPG je použitelný.

Čištění

Vyčištění naskenované strany je velmi jednoduché. V podstatě stačí použít libovolný grafický editor, který pracuje s tzv. histogramem a umožňuje upravovat jeho krajní hodnoty. Fakticky posunutím těchto krajních hodnot, někdy také nazývaných černý a bílý bod odstraňujete z naskenované strány zbytečné informace. Posunem bílého bodu (hodnoty 255 a méně, kdy 255 je maximum) čistíte bílé plochy, kdy odstraňujete slabší odstíny šedé barvy = a odstraňujete tím tedy i nečistoty, nedokonalosti atd. Nesmíte to samozřejmě přehnat, jinak ztratíte kresbu. Naopak přidáváním hodnoty černého bodu ztmavujete písmo, text a kresbu. Zase ani zde to nesmíte přehnat jinak vám ztmavnou i místa, která nechcete. Já například používá hodnoty kolem: černý bod: 149 a bílý bod: 201 (dle naskenované předlohy se ale mohou lišit). Tato úprava se dá přirovnat k úpravě jasu a kontrastu, ale úprava úrovní je mnohem účinnější a zachovává lépe kresbu. Z programů zdarma můžete použít na úpravu úrovní třeba program XnView, ale asi i jakýkoliv jiný pokročilý grafický rastrový editor.

Drobné úpravy naskenovaných stran textu

Není to vždy nutné, ale pokud například naskenujete stránku nějaké knihy nebo jiného materiálu s vazbou, tak uprostřed vám většina skeneru zanechá černý pruh. Ten je dobré smazat. V ideálním případě je samozřejmě, když při skenování vůbec nevznikne  a je tedy dobré předlohu dostatečně ke skenovacímu “sklu” přitisknout. Po úpravě úrovní se černý pruh (pokud byla skenována kniha či předloha s hřbetem) zmenší, nyní je tedy záhodno odstranit jeho zbytky. Případně můžete vyčistit okraje a bílé plochy. Pokud je strana menší než skenovaný obraz, můžete ořezat nadbytečnou volnou plochu. Pouze zabírá místo pro data a text bude při tisku zbytečně menší… Použitelný je opět i “jednoduchý” program XnView, kdy doporučuji nastavit barvu pozadí na bílou (Úpravy -> Barva pozadí; v menu XnView) a následně jednoduše označíte tažením myši oblast a tlačítkem Delete ji smažete (do bíla). Typická může být i kresba skrčeného papíru, která se naskenuje. Zde ji můžete jednoduše smazat. Nese zbytečné nepotřebné informace a když naskenovanou stranu vytisknete nevypadá příliš dobře.

Vytištění, smazání, archivování

Následně máte jeden nebo více obrázků. Můžete je nyní vytisknout. Dále je možno obrázky dosud ve stupních šedi převést pouze do režimu “černá a bílá” (black and white). Ten znamená, že se odstraní všechny polotóny a ušetří se tak množství informací. Velikost souboru se zmenší, ale kupodivu se také někdy ztuční text. Tento krok tedy doporučuji nejdříve vyzkoušet. Obecně čím máte naskenováno na vyšší rozlišení (více než 300 DPI), tím je tento krok spíše aplikovatelný. Výborný je ale každopádně v tom, že zmenší velikost jedné naskenované stránky na 50 %. Režim “černá a bílá” ale není použitelný na fotografie a přechody. V těchto případech musíte nechat stupně šedi. Převod do černé a bílé provedete v XnView v menu takto: Obrázek -> Binární konverze -> Binární (bez ditherace). Mě osobně se tento krok někdy osvědčil a někdy nebyl vhodný. Chce to vyzkoušet na základě předlohy a její kvality.

Pokud nyní máte v počítači virtuální PDF tiskárnu (např. PDFCreator) můžete si stranu (strany) vytisknout (uložit) do formátu PDF. Opět v XnView označíte třeba 3 strany a necháte je vytisknout přes PDFCreator do formátu PDF. V případě, že máte soubory ve formátu PNG tak výsledná velikost PDF souboru je menší než součet velikostí PNG souborů. U JPG to snad lze taktéž předpokládat.

Uložení do PDF ale není nutné. XnView dovede vytisknou i více stran najedno, ale pro někoho je jeden PDF soubor šikovnější než více různě roztroušených souborů.

Výše uvedeným postupem jsem například naskenoval jednu A4 stranu lékařské zprávy. V PNG formátu měla naskenovaná strana 3 MB. Po vyčištění velikost klesla někde kolem 0,8 MB a následným uložením pouze do “černé a bílé” se velikost zredukovala na 0,3 MB. Nutno ale přiznat, že omezení na černou a bílou způsobilo, že text byl poněkud tučnější než na originálu. Zase ale na disku zabíral méně místa. Otázkou také je zda toto ztučnění nezpůsobuje moje inkoustová tiskárna. Používal jsem snadno ovladatelný a zdarma dostupný program XnView. Následně jsem ale stejnou činnost vyzkoušel i v grafickém editoru GIMP a samozřejmě jej lze také použít. I když je jeho ovládání drobně složitější, zase nabízí více (a paradoxně jednodušších) možností.

Tags:

Leave a Reply