Digitalizace knih je proces převodu fyzických knih a časopisů do digitálních médií, jako jsou obrázky, elektronický text nebo elektronické knihy (e-knihy), pomocí obrazového skeneru. Velké projekty digitalizace knih zpřístupnily mnoho knih online. Digitální knihy lze snadno distribuovat, reprodukovat a číst na obrazovce. Běžnými formáty souborů jsou DjVu, Portable Document Format (PDF) a Tag Image File Format (TIFF). Pro převod surových obrázků se používá optické rozpoznávání znaků (OCR), které převádí stránky knihy do digitálního textového formátu, jako je ASCII nebo jiný podobný formát, což snižuje velikost souboru a umožňuje př formátování, vyhledávání nebo zpracování textu jinými aplikacemi. Obrazové skenery mohou být manuální nebo automatické. V běžném komerčním obrazovém skeneru je kniha umístěna na plochou skleněnou desku (nebo podložku) a světelné a optické pole se pohybuje po knize pod sklem. U manuálních skenerů knih se skleněná deska rozšiřuje až k okraji skeneru, což usnadňuje zarovnání hřbetu knihy. Problém se skenováním vázaných knih spočívá v tom, že když je kniha, která není příliš tenká, položena naplocho, část stránky blízko hřbetu (žlábek) je výrazně zakřivená, což zkresluje text v této části skenu. Jedním z řešení je rozdělit knihu na jednotlivé stránky oříznutím nebo rozvázáním. Nedestruktivní metodou je držet knihu ve tvaru V a fotografovat ji, namísto toho, aby byla položena naplocho a skenována. Zakřivení ve žlábku je tímto způsobem mnohem méně výrazné. Stránky lze otáčet ručně nebo pomocí automatických zařízení pro přenos papíru. Na stránku se obvykle přitlačují průhledné plastové nebo skleněné listy, aby se vyrovnala. Po naskenování software upraví obrázky dokumentů jejich zarovnáním, oříznutím, úpravou obrázků a převedením do textového a finálního formátu e-knihy. Lidští korektoři obvykle kontrolují výstup, zda neobsahuje chyby. Skenování při 118 bodech na centimetr (300 dpi) je dostačující pro převod do výstupu digitálního textu, ale pro archivní reprodukci vzácných, propracovaných nebo ilustrovaných knih se používá mnohem vyšší rozlišení. Špičkové skenery schopné naskenovat tisíce stran za hodinu mohou stát tisíce dolarů, ale svépomocné (DIY) manuální skenery knih schopné naskenovat 1200 stran za hodinu byly vyrobeny za 300 USD.
Facebook Twitter