Digitalizace: Porovnání verzí

m (→‎Software: prolinkování na nově vytvořenou stránku o tematice OCR)
Značky: editace z Vizuálního editoru, možná chyba ve Vizuálním editoru
 
(Není zobrazeno 10 mezilehlých verzí od 4 dalších uživatelů.)
Řádek 21: Řádek 21:
  
 
==Digitalizace v České republice==
 
==Digitalizace v České republice==
Od konce 40. let 20. stol se v Národní knihovně začala používat technologie mikrofilmování pro ochranné reformátování.(Národní knihovna ČR, 2012) V 90. letech bylo mikrofilmování doplněno technologií digitalizace -jedná se o tzv. hybridní metodu reformátování. Dnes je hlavní metodou reformátování digitalizace.<br /><br />
+
Ochranné mikrofilmování ohrožených dokumentů v Národní knihovně započalo na konci 40. let 20. století, kdy knihovna získala od Rockefellerovy nadace darem kameru Recordak. Reformátování se nejprve týkalo výhradně vzácných rukopisů, teprve v průběhu 60. let bylo zahájeno též zpracování novin a časopisů. <ref>Ochranné reformátování. NÁRODNÍ KNIHOVNA ČESKE REPUBLIKY. Národní knihovna České republiky [online]. 1.12.2012 [cit. 2016-02-03]. Dostupné z: http://text.nkp.cz/o-knihovne/odborne-cinnosti/sprava-a-ochrana-fondu/zzz_osof/mikrofilm</ref> V roce 1992 byl zahájen národní program ochranného mikrofilmování s názvem Kramerius. Projekt, jehož hlavním cílem bylo zpočátku zejména technická obnova mikrografických pracovišť, byl zaměřen zejména na ochranu dokumentů ohrožených kyselostí papíru. Později byl projekt doplněn o projekt [http://www.isvav.cz/projectDetail.do?rowId=KZ97P04UKK002 Digitalizace mikromédií], v rámci něhož bylo vybudováno první pracoviště pro digitalizaci mikrofilmů a mikrofiší v ČR. Pracoviště zajišťovalo vedle vlastní digitalizace rovněž tvorbu metadat a zpřístupňování dokumentů prostřednictvím internetu, lokální sítě NK ČR a CD-R médií.<ref>Digitalizace a digitální zpřístupnění dokumentů. NÁRODNÍ KNIHOVNA ČESKE REPUBLIKY. Národní knihovna České republiky [online]. 1.12.2012 [cit. 2016-02-03]. Dostupné z: http://wwwold.nkp.cz/pages/page.php3?page=weba_digitalizace.htm</ref><ref>POLIŠENSKÝ, Jiří. Projekt Digitalizace mikromédií v Národní knihovně ČR. Ikaros [online]. 1999, ročník 3, číslo 1 [cit. 2016-02-03]. urn:nbn:cz:ik-10246. ISSN 1212-5075. Dostupné z: http://ikaros.cz/node/10246 </ref> V roce 2003 bylo pracoviště Národní knihovny rozšířeno o hybridní (duální) kameru ProServ, opatřenou skenerem DualProfi. Zařízení již umožňovalo vedle reformátování na mikrofilm rovněž paralelní zpracování barevného digitálního obrazu. <ref> VRBENSKÁ, Františka. Digitální ohlédnutí: cesta za reformátováním Národních listů  [online]. In. Čtenář. 2008 [cit. 2016-02-03], č. 09. Dostupné online: http://ctenar.svkkl.cz/clanky/2008-roc-60/09-2008/digitalni-ohlednuti-cesta-za-reformatovanim-narodnich-listu-44-226.htm.</ref>
 +
 
 
První digitalizační projekty se u nás objevily v 90. letech 20. století ve velkých centrálních knihovnách. Pro menší instituce byla digitalizace příliš drahá. Nejdříve se digitalizovaly cenné, vzácné a ohrožené dokumenty. K popisu dokumentů se používaly proprietární (lokální, nestandardizované) [[metadatové standardy]].<ref name="meli">Melichar, M. & Hutař, J. 2013. České paměťové instituce a digitální data – historický exkurz, současný stav a předpokládaný vývoj. ''Duha'' [online]. 2013, roč. 27, č. 4 [cit. 2014-06-12]. Dostupný z WWW: <http://duha.mzk.cz/clanky/ceske-pametove-instituce-digitalni-data-historicky-exkurz-soucasny-stav-predpokladany-vyvoj>. ISSN 1804-4255.</ref><br /><br />
 
První digitalizační projekty se u nás objevily v 90. letech 20. století ve velkých centrálních knihovnách. Pro menší instituce byla digitalizace příliš drahá. Nejdříve se digitalizovaly cenné, vzácné a ohrožené dokumenty. K popisu dokumentů se používaly proprietární (lokální, nestandardizované) [[metadatové standardy]].<ref name="meli">Melichar, M. & Hutař, J. 2013. České paměťové instituce a digitální data – historický exkurz, současný stav a předpokládaný vývoj. ''Duha'' [online]. 2013, roč. 27, č. 4 [cit. 2014-06-12]. Dostupný z WWW: <http://duha.mzk.cz/clanky/ceske-pametove-instituce-digitalni-data-historicky-exkurz-soucasny-stav-predpokladany-vyvoj>. ISSN 1804-4255.</ref><br /><br />
Po roce 2000 měl technologický pokrok za následek zvýšení kvality a kvantity digitalizace. Technologie digitalizace a ukládání dokumentů se staly dostupnějšími a počet digitalizujících institucí se zvýšil, přestože financování knihoven se dramaticky snížilo. Evropské dotace a zvláště [http://www.eeagrants.cz/ Norské fondy] udržely digitalizační aktivity a umožnily několika větším institucím vybudování digitalizačních pracovišť (například [http://www.lib.cas.cz/ Knihovna Akademie věd]) a podpořily několik digitalizačních projektů (např. projekt HISPRA v [http://www.mlp.cz  Městské knihovně Praha]). V tomto období došlo také ke vzniku několika významných projektů. Jedná se o volně přístupný (open source) systém pro správu digitálních dat a digitální knihovnu [[Kramerius]], jenž dnes čítá okolo 8 milionů naskenovaných stran periodik a monografií[[Manuscriptorium]], digitální knihovnu zpřístupňující rukopisy, inkunábule, staré tisky a historické mapy a [[Webarchiv]], jehož hlavním úkolem je archivace významnějších českých stránek (z domény .cz).<br /><br />
+
Po roce 2000 měl technologický pokrok za následek zvýšení kvality a kvantity digitalizace. Technologie digitalizace a ukládání dokumentů se staly dostupnějšími a počet digitalizujících institucí se zvýšil, přestože financování knihoven se dramaticky snížilo. Evropské dotace a zvláště [http://www.eeagrants.cz/ Norské fondy] udržely digitalizační aktivity a umožnily několika větším institucím vybudování digitalizačních pracovišť (například [http://www.lib.cas.cz/ Knihovna Akademie věd]) a podpořily několik digitalizačních projektů (např. projekt HISPRA v [http://www.mlp.cz  Městské knihovně Praha]). V tomto období došlo také ke vzniku několika významných projektů. V roce 2003 iniciovala Národní knihovna vytvoření volně přístupného (open source) systém pro správu digitálních dat a [[digitální knihovna|digitální knihovnu]] [[Kramerius]], jenž dnes čítá okolo 8 milionů naskenovaných stran periodik a monografií. V roce 2004 byla spuštěna digitální knihovna [[Manuscriptorium]], zpřístupňující rukopisy, inkunábule, staré tisky a historické mapy. V roce 2000 vznikl v Národní knihovně, ve spolupráci s Moravskou zemskou knihovnou, projekt [[WebArchiv]]<ref>A. Brokeš. Projekt WebArchiv - archiv českého webu. Zpravodaj ÚVT MU. ISSN 1212-0901, 2008, roč. XVIII, č. 4, s. 10-13. Dostupný z WWW: http://webserver.ics.muni.cz/bulletin/articles/578.html</ref>, jehož hlavním úkolem je ''řešení problematiky archivace národního webu, tj. bohemikálních dokumentů zveřejněných v prostředí sítě Internet – shromažďování webových zdrojů, jejich archivace a ochrana a zajištění dlouhodobého přístupu k těmto archivovaným dokumentům.''<ref>http://www.webarchiv.cz/cs/o-webarchivu</ref>  
 +
 
 
Po roce 2005 se začiná intenzivněji řešit [[dlouhodobá ochrana digitálních dokumentů]].
 
Po roce 2005 se začiná intenzivněji řešit [[dlouhodobá ochrana digitálních dokumentů]].
 
K popisu digitálních dokumentů se začínají používat mezinárodní [[metadatové standardy]].<ref name="meli"/>
 
K popisu digitálních dokumentů se začínají používat mezinárodní [[metadatové standardy]].<ref name="meli"/>
 +
 +
V roce 2012 je zahájen provoz na digitalizačních pracovištích v Národní knihovně a Moravské zemské knihovně, vzniklých v rámci projektu Vytvoření Národní digitální knihovny. V letech 2012-2014 je v rámci projektu digitalizováno na 26 milionů stran dokumentů, do konce roku 2015 pak celkem 32 milionů stran. Rovněž na úrovni krajů vznikají v letech 2012-2014 v rámci Integrovaného operačního programu specializovaná digitalizační pracoviště - tzv. krajské digitalizační jednotky. Výsledky průzkumu realizovaného mezi českými knihovnami v červenci-srpnu 2015 Národní knihovnou a Knihovnou Akademie věd ČR ukazují, že k tomuto datu bylo digitalizováno celkem již cca 85 milionů stran dokumentů.
  
 
==Hardware a software==
 
==Hardware a software==
Řádek 48: Řádek 52:
 
* software pro skenování
 
* software pro skenování
  
* [[https://wikisofia.cz/index.php/OCR|OCR software]]
+
* [https://wikisofia.cz/index.php/OCR OCR software]
  
 
* [[FTP software]]
 
* [[FTP software]]
Řádek 86: Řádek 90:
  
 
===Reference===
 
===Reference===
<references>/
+
<references />
 +
 
 +
===Související články===
 +
* [[Národní digitální knihovna]]
 +
* [[Historie a současná situace v oblasti digitalizace kulturního dědictví a zpřístupňování jejích výstupů v ČR]]
 +
* [[Dlouhodobá ochrana digitálních dokumentů]]
 +
* [[Digitální knihovna]]
 +
* [[Proces digitalizace: přehled důvodů, cílů, přínosu i problémů, možnosti využití digitálních dat]]
 +
* [[Workflow digitalizace]]
 +
* [[Digitalizace a knihovnictví]]
  
 
===Klíčová slova===
 
===Klíčová slova===
Řádek 92: Řádek 105:
 
reformátování, ochrana dokumentů, uložení digitálních dat
 
reformátování, ochrana dokumentů, uložení digitálních dat
  
[[Kategorie: Informační studia a knihovnictví|*]]
+
[[Kategorie:Informační studia a knihovnictví]]
 +
[[Kategorie:Zpracování informací a informační servis]]
 +
[[Kategorie:Technický servis v knihovnách, archívech a muzeích]]

Aktuální verze z 19. 10. 2018, 18:18

Digitalizace je jednou z technologií reformátování dokumentů (tj. převod obsahu dokumentu na jiný nosič, médium). Při digitalizaci dochází k převodu analogových dokumentů (obrázky, text, audio, video) do digitální podoby.[1] Kromě klasických papírových dokumentů se digitalizuje i audio a video a novým trendem je digitalizace 3D objektů, například glóbů v Mapové sbírce Přírodovědecké fakulty UK. Další technologií pro reformátování dokumentů je například mikrofilmování.[2]

Důvody digitalizace

Paměťové instituce uchovávají velké množství starých, vzácných, převážně papírových dokumentů. Tyto dokumenty přirozeně fyzicky degradují a hrozí riziko ztráty informací v nich obsažených. Proto tyto instituce dokumenty reformátují. Jednou z hlavních motivací digitalizace byla a je ochrana analogových dokumentů. Digitální kopie snižují četnost manipulací s originálním dokumentem a zároveň má digitalizace zajistit uchování obsahu dokumentu pro další generace. Dalším důvodem digitalizačních aktivit je zpřístupnění. Digitalizace pro zpřístupnění v posledních letech převažuje nad ochrannou digitalizací.[3]

Výhody digitalizace a digitálních dokumentů

Mezi výhody digitalizace patří:

  • Digitalizace umožňuje zpřístupnit jinak těžko dostupné dokumenty (vzácné, křehké, vzdálené) a to odkudkoliv, kdykoliv (24/7) a pro více uživatelů najednou, stačí jen počítač a přístup na internet.
  • Digitální objekty lze poměrně snadno upravit, vylepšit. Například zvýraznění kontrastu černé a bílé u digitalizované fotografie může zlepšit čitelnost nápisů, viditelnost pozadí apod.[4]

Nevýhody digitalizace a digitálních dokumentů

Mezi nevýhody digitalizace patří:

  • Digitalizace je poměrně drahá a časově náročná, prestože se v počátcích digitalizačních aktivit považovala za levnější než správa fyzického fondu. (Marek, 2014b; The whole digital...2007)
  • Digitální dokumenty se vlivem zastarávání hardware a software stávají také předmětem ochrany, která je komplikovanější.[3] Britská knihovna (The British Library) dokonce přestala považovat digitalizaci za způsob ochrany analogových dokumentů.[5] Více viz dlouhodobá ochrana digitálních dokumentů.
  • Možnost úpravy digitálních dokumentů může v budoucnosti vést k pochybnostem o jejich autenticitě.

Digitalizace v České republice

Ochranné mikrofilmování ohrožených dokumentů v Národní knihovně započalo na konci 40. let 20. století, kdy knihovna získala od Rockefellerovy nadace darem kameru Recordak. Reformátování se nejprve týkalo výhradně vzácných rukopisů, teprve v průběhu 60. let bylo zahájeno též zpracování novin a časopisů. [6] V roce 1992 byl zahájen národní program ochranného mikrofilmování s názvem Kramerius. Projekt, jehož hlavním cílem bylo zpočátku zejména technická obnova mikrografických pracovišť, byl zaměřen zejména na ochranu dokumentů ohrožených kyselostí papíru. Později byl projekt doplněn o projekt Digitalizace mikromédií, v rámci něhož bylo vybudováno první pracoviště pro digitalizaci mikrofilmů a mikrofiší v ČR. Pracoviště zajišťovalo vedle vlastní digitalizace rovněž tvorbu metadat a zpřístupňování dokumentů prostřednictvím internetu, lokální sítě NK ČR a CD-R médií.[7][8] V roce 2003 bylo pracoviště Národní knihovny rozšířeno o hybridní (duální) kameru ProServ, opatřenou skenerem DualProfi. Zařízení již umožňovalo vedle reformátování na mikrofilm rovněž paralelní zpracování barevného digitálního obrazu. [9]

První digitalizační projekty se u nás objevily v 90. letech 20. století ve velkých centrálních knihovnách. Pro menší instituce byla digitalizace příliš drahá. Nejdříve se digitalizovaly cenné, vzácné a ohrožené dokumenty. K popisu dokumentů se používaly proprietární (lokální, nestandardizované) metadatové standardy.[10]

Po roce 2000 měl technologický pokrok za následek zvýšení kvality a kvantity digitalizace. Technologie digitalizace a ukládání dokumentů se staly dostupnějšími a počet digitalizujících institucí se zvýšil, přestože financování knihoven se dramaticky snížilo. Evropské dotace a zvláště Norské fondy udržely digitalizační aktivity a umožnily několika větším institucím vybudování digitalizačních pracovišť (například Knihovna Akademie věd) a podpořily několik digitalizačních projektů (např. projekt HISPRA v Městské knihovně Praha). V tomto období došlo také ke vzniku několika významných projektů. V roce 2003 iniciovala Národní knihovna vytvoření volně přístupného (open source) systém pro správu digitálních dat a digitální knihovnu Kramerius, jenž dnes čítá okolo 8 milionů naskenovaných stran periodik a monografií. V roce 2004 byla spuštěna digitální knihovna Manuscriptorium, zpřístupňující rukopisy, inkunábule, staré tisky a historické mapy. V roce 2000 vznikl v Národní knihovně, ve spolupráci s Moravskou zemskou knihovnou, projekt WebArchiv[11], jehož hlavním úkolem je řešení problematiky archivace národního webu, tj. bohemikálních dokumentů zveřejněných v prostředí sítě Internet – shromažďování webových zdrojů, jejich archivace a ochrana a zajištění dlouhodobého přístupu k těmto archivovaným dokumentům.[12]

Po roce 2005 se začiná intenzivněji řešit dlouhodobá ochrana digitálních dokumentů. K popisu digitálních dokumentů se začínají používat mezinárodní metadatové standardy.[10]

V roce 2012 je zahájen provoz na digitalizačních pracovištích v Národní knihovně a Moravské zemské knihovně, vzniklých v rámci projektu Vytvoření Národní digitální knihovny. V letech 2012-2014 je v rámci projektu digitalizováno na 26 milionů stran dokumentů, do konce roku 2015 pak celkem 32 milionů stran. Rovněž na úrovni krajů vznikají v letech 2012-2014 v rámci Integrovaného operačního programu specializovaná digitalizační pracoviště - tzv. krajské digitalizační jednotky. Výsledky průzkumu realizovaného mezi českými knihovnami v červenci-srpnu 2015 Národní knihovnou a Knihovnou Akademie věd ČR ukazují, že k tomuto datu bylo digitalizováno celkem již cca 85 milionů stran dokumentů.

Hardware a software

Hardware

Pro digitalizaci dokumentů je potřeba minimálně:

Software

Anderson a Maxwell (2014) doporučují:

  • software pro skenování

Uložení digitálních dat

Dnes je běžná kombinace offline uložení (pro archivaci) a online uložení (pro zpřístupnění). Digitální objekty se ukládají na:

  • optické disky-dnes méně časté, spíše pro menší objemy dat (např. digitální archiv optických disků CD-R Národní knihovny ČR)
  • magnetické pásky-používají se pro dlouhodobou archivaci digitálních dokumentů (např. robotická magnetopásková knihovna Národní knihovny ČR)
  • harddisky-používají se pro zpřístupňování digitálních objektů [13]

Proces digitalizace

Skenování dokumentů tvoří jen menší část celého procesu digitalizace. Jedná se o složitý a dlouhý proces sestávající z několika fází a kroků.

1. fáze

  • Výběr materiálu k digitalizaci na základě stanovených kritérií (zájem o dílo, jeho hodnota a vlastnosti, autorská práva apod.)
  • Příprava předloh na digitalizační proces (konzervace, restaurace)
  • Volba standardů (obrazové formáty, textové formáty, metadatové standardy…)

2. fáze

  • Převod dokumentu do digitální podoby
  • Úprava obrázku, použití OCR software
  • Kontrola kvality výsledku
  • Sběr metadat
  • Uložení

3. fáze

  • Zpřístupnění digitálních objektů na webovém serveru, v repozitáři

4. fáze

Odkazy

Reference

  1. Vrbenská, Františka. Digitalizace dokumentů. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2014-12-13]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001728&local_base=KTD.
  2. Marek, J. 2014. Digitalizace v knihovnách: Paměťové instituce a jejich role : důvody a podstata digitalizace [online prezentace]. [cit. 2014-06-08]. Prezentace v PDF.
  3. 3,0 3,1 Hutař, J. 2012. Digitalizace, popis pomocí metadat a jejich formáty. Praha: Univerzita Karlova v Praze, 2012. 244 s., 74 s. příl. Disertační práce. Univerzita Karlova v Praze, Ústav informačních studií a knihovnictví. Vedoucí práce Stanislav Kalkus.
  4. 4,0 4,1 Anderson, C.G & Maxwell,C. 2004. Starting a digitization center. 1st. pub. Oxford: Chandos Publishing, 2004, xi, 195 s. ISBN 1-84334-074-7.
  5. Cubr, L. 2010. Dlouhodobá ochrana digitálních dokumentů. 1. vyd. Praha: Národní knihovna České republiky, 2010, 154 s. ISBN 978-80-7050-588-5.
  6. Ochranné reformátování. NÁRODNÍ KNIHOVNA ČESKE REPUBLIKY. Národní knihovna České republiky [online]. 1.12.2012 [cit. 2016-02-03]. Dostupné z: http://text.nkp.cz/o-knihovne/odborne-cinnosti/sprava-a-ochrana-fondu/zzz_osof/mikrofilm
  7. Digitalizace a digitální zpřístupnění dokumentů. NÁRODNÍ KNIHOVNA ČESKE REPUBLIKY. Národní knihovna České republiky [online]. 1.12.2012 [cit. 2016-02-03]. Dostupné z: http://wwwold.nkp.cz/pages/page.php3?page=weba_digitalizace.htm
  8. POLIŠENSKÝ, Jiří. Projekt Digitalizace mikromédií v Národní knihovně ČR. Ikaros [online]. 1999, ročník 3, číslo 1 [cit. 2016-02-03]. urn:nbn:cz:ik-10246. ISSN 1212-5075. Dostupné z: http://ikaros.cz/node/10246
  9. VRBENSKÁ, Františka. Digitální ohlédnutí: cesta za reformátováním Národních listů [online]. In. Čtenář. 2008 [cit. 2016-02-03], č. 09. Dostupné online: http://ctenar.svkkl.cz/clanky/2008-roc-60/09-2008/digitalni-ohlednuti-cesta-za-reformatovanim-narodnich-listu-44-226.htm.
  10. 10,0 10,1 Melichar, M. & Hutař, J. 2013. České paměťové instituce a digitální data – historický exkurz, současný stav a předpokládaný vývoj. Duha [online]. 2013, roč. 27, č. 4 [cit. 2014-06-12]. Dostupný z WWW: <http://duha.mzk.cz/clanky/ceske-pametove-instituce-digitalni-data-historicky-exkurz-soucasny-stav-predpokladany-vyvoj>. ISSN 1804-4255.
  11. A. Brokeš. Projekt WebArchiv - archiv českého webu. Zpravodaj ÚVT MU. ISSN 1212-0901, 2008, roč. XVIII, č. 4, s. 10-13. Dostupný z WWW: http://webserver.ics.muni.cz/bulletin/articles/578.html
  12. http://www.webarchiv.cz/cs/o-webarchivu
  13. Melichar, M. & Hutař, J. České paměťové instituce a digitální data – historický exkurz, současný stav a předpokládaný vývoj. Duha [online]. 2014, roč. 28, č. 1 [cit. 2014-06-12]. Dostupný z WWW: <http://duha.mzk.cz/clanky/ceske-pametove-instituce-digitalni-data-historicky-exkurz-soucasny-stav-predpokladany-vyvoj-0>. ISSN 1804-4255.

Související články

Klíčová slova

reformátování, ochrana dokumentů, uložení digitálních dat