Digitalizace: Porovnání verzí

m (→‎Software: prolinkování na nově vytvořenou stránku o tematice OCR)
Značky: editace z Vizuálního editoru, možná chyba ve Vizuálním editoru
Značky: editace z Vizuálního editoru, možná chyba ve Vizuálním editoru
Řádek 48: Řádek 48:
 
* software pro skenování
 
* software pro skenování
  
* [[https://wikisofia.cz/index.php/OCR|OCR software]]
+
* [https://wikisofia.cz/index.php/OCR OCR software]
  
 
* [[FTP software]]
 
* [[FTP software]]

Verze z 2. 2. 2015, 02:36

Digitalizace je jednou z technologií reformátování dokumentů (tj. převod obsahu dokumentu na jiný nosič, médium). Při digitalizaci dochází k převodu analogových dokumentů (obrázky, text, audio, video) do digitální podoby.[1] Kromě klasických papírových dokumentů se digitalizuje i audio a video a novým trendem je digitalizace 3D objektů, například glóbů v Mapové sbírce Přírodovědecké fakulty UK. Další technologií pro reformátování dokumentů je například mikrofilmování.[2]

Důvody digitalizace

Paměťové instituce uchovávají velké množství starých, vzácných, převážně papírových dokumentů. Tyto dokumenty přirozeně fyzicky degradují a hrozí riziko ztráty informací v nich obsažených. Proto tyto instituce dokumenty reformátují. Jednou z hlavních motivací digitalizace byla a je ochrana analogových dokumentů. Digitální kopie snižují četnost manipulací s originálním dokumentem a zároveň má digitalizace zajistit uchování obsahu dokumentu pro další generace. Dalším důvodem digitalizačních aktivit je zpřístupnění. Digitalizace pro zpřístupnění v posledních letech převažuje nad ochrannou digitalizací.[3]

Výhody digitalizace a digitálních dokumentů

Mezi výhody digitalizace patří:

  • Digitalizace umožňuje zpřístupnit jinak těžko dostupné dokumenty (vzácné, křehké, vzdálené) a to odkudkoliv, kdykoliv (24/7) a pro více uživatelů najednou, stačí jen počítač a přístup na internet.
  • Digitální objekty lze poměrně snadno upravit, vylepšit. Například zvýraznění kontrastu černé a bílé u digitalizované fotografie může zlepšit čitelnost nápisů, viditelnost pozadí apod.[4]

Nevýhody digitalizace a digitálních dokumentů

Mezi nevýhody digitalizace patří:

  • Digitalizace je poměrně drahá a časově náročná, prestože se v počátcích digitalizačních aktivit považovala za levnější než správa fyzického fondu. (Marek, 2014b; The whole digital...2007)
  • Digitální dokumenty se vlivem zastarávání hardware a software stávají také předmětem ochrany, která je komplikovanější.[3] Britská knihovna (The British Library) dokonce přestala považovat digitalizaci za způsob ochrany analogových dokumentů.[5] Více viz dlouhodobá ochrana digitálních dokumentů.
  • Možnost úpravy digitálních dokumentů může v budoucnosti vést k pochybnostem o jejich autenticitě.

Digitalizace v České republice

Od konce 40. let 20. stol se v Národní knihovně začala používat technologie mikrofilmování pro ochranné reformátování.(Národní knihovna ČR, 2012) V 90. letech bylo mikrofilmování doplněno technologií digitalizace -jedná se o tzv. hybridní metodu reformátování. Dnes je hlavní metodou reformátování digitalizace.

První digitalizační projekty se u nás objevily v 90. letech 20. století ve velkých centrálních knihovnách. Pro menší instituce byla digitalizace příliš drahá. Nejdříve se digitalizovaly cenné, vzácné a ohrožené dokumenty. K popisu dokumentů se používaly proprietární (lokální, nestandardizované) metadatové standardy.[6]

Po roce 2000 měl technologický pokrok za následek zvýšení kvality a kvantity digitalizace. Technologie digitalizace a ukládání dokumentů se staly dostupnějšími a počet digitalizujících institucí se zvýšil, přestože financování knihoven se dramaticky snížilo. Evropské dotace a zvláště Norské fondy udržely digitalizační aktivity a umožnily několika větším institucím vybudování digitalizačních pracovišť (například Knihovna Akademie věd) a podpořily několik digitalizačních projektů (např. projekt HISPRA v Městské knihovně Praha). V tomto období došlo také ke vzniku několika významných projektů. Jedná se o volně přístupný (open source) systém pro správu digitálních dat a digitální knihovnu Kramerius, jenž dnes čítá okolo 8 milionů naskenovaných stran periodik a monografií; Manuscriptorium, digitální knihovnu zpřístupňující rukopisy, inkunábule, staré tisky a historické mapy a Webarchiv, jehož hlavním úkolem je archivace významnějších českých stránek (z domény .cz).

Po roce 2005 se začiná intenzivněji řešit dlouhodobá ochrana digitálních dokumentů. K popisu digitálních dokumentů se začínají používat mezinárodní metadatové standardy.[6]

Hardware a software

Hardware

Pro digitalizaci dokumentů je potřeba minimálně:

Software

Anderson a Maxwell (2014) doporučují:

  • software pro skenování

Uložení digitálních dat

Dnes je běžná kombinace offline uložení (pro archivaci) a online uložení (pro zpřístupnění). Digitální objekty se ukládají na:

  • optické disky-dnes méně časté, spíše pro menší objemy dat (např. digitální archiv optických disků CD-R Národní knihovny ČR)
  • magnetické pásky-používají se pro dlouhodobou archivaci digitálních dokumentů (např. robotická magnetopásková knihovna Národní knihovny ČR)
  • harddisky-používají se pro zpřístupňování digitálních objektů [7]

Proces digitalizace

Skenování dokumentů tvoří jen menší část celého procesu digitalizace. Jedná se o složitý a dlouhý proces sestávající z několika fází a kroků.

1. fáze

  • Výběr materiálu k digitalizaci na základě stanovených kritérií (zájem o dílo, jeho hodnota a vlastnosti, autorská práva apod.)
  • Příprava předloh na digitalizační proces (konzervace, restaurace)
  • Volba standardů (obrazové formáty, textové formáty, metadatové standardy…)

2. fáze

  • Převod dokumentu do digitální podoby
  • Úprava obrázku, použití OCR software
  • Kontrola kvality výsledku
  • Sběr metadat
  • Uložení

3. fáze

  • Zpřístupnění digitálních objektů na webovém serveru, v repozitáři

4. fáze

Odkazy

Reference

<references>/

Klíčová slova

reformátování, ochrana dokumentů, uložení digitálních dat

  1. Vrbenská, Františka. Digitalizace dokumentů. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2014-12-13]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001728&local_base=KTD.
  2. Marek, J. 2014. Digitalizace v knihovnách: Paměťové instituce a jejich role : důvody a podstata digitalizace [online prezentace]. [cit. 2014-06-08]. Prezentace v PDF.
  3. 3,0 3,1 Hutař, J. 2012. Digitalizace, popis pomocí metadat a jejich formáty. Praha: Univerzita Karlova v Praze, 2012. 244 s., 74 s. příl. Disertační práce. Univerzita Karlova v Praze, Ústav informačních studií a knihovnictví. Vedoucí práce Stanislav Kalkus.
  4. 4,0 4,1 Anderson, C.G & Maxwell,C. 2004. Starting a digitization center. 1st. pub. Oxford: Chandos Publishing, 2004, xi, 195 s. ISBN 1-84334-074-7.
  5. Cubr, L. 2010. Dlouhodobá ochrana digitálních dokumentů. 1. vyd. Praha: Národní knihovna České republiky, 2010, 154 s. ISBN 978-80-7050-588-5.
  6. 6,0 6,1 Melichar, M. & Hutař, J. 2013. České paměťové instituce a digitální data – historický exkurz, současný stav a předpokládaný vývoj. Duha [online]. 2013, roč. 27, č. 4 [cit. 2014-06-12]. Dostupný z WWW: <http://duha.mzk.cz/clanky/ceske-pametove-instituce-digitalni-data-historicky-exkurz-soucasny-stav-predpokladany-vyvoj>. ISSN 1804-4255.
  7. Melichar, M. & Hutař, J. České paměťové instituce a digitální data – historický exkurz, současný stav a předpokládaný vývoj. Duha [online]. 2014, roč. 28, č. 1 [cit. 2014-06-12]. Dostupný z WWW: <http://duha.mzk.cz/clanky/ceske-pametove-instituce-digitalni-data-historicky-exkurz-soucasny-stav-predpokladany-vyvoj-0>. ISSN 1804-4255.