Životní cyklus digitálního dokumentu

Státnicová otáza: Popis životního cyklu digitálního dokumentu; jednotlivé kroky digitalizace, uložení, zpřístupnění

Se vznikem digitalizace se začaly utvářet digitální knihovny, které nabízí oproti tištěným dokumentům v knihovnách nezávislost a oddělitelnost obsahu dokumentu od nosiče dat.[1] V digitálních knihovnách jsou zpřístupňovány nejen knihovní sbírky, ale také archivní, muzejní, a právě v podobě digitálních dokumentů.

Vymezení pojmu digitální dokument, digitalizace a digitální knihovna

Digitální dokument je dokument v elektronické podobě, který může mít dvojí podobu vzniku. Digitální dokument mohl již v elektronické podobě vzniknout, tzv. „born-digital“,[2] tedy nemá svoji listinnou podobu. Druhou možností vzniku je převod z listinné podoby dokumentu do elektronické s pomocí procesu nazývající se digitalizace.[3]

Digitalizace je proces, kdy se z analogového dokumentu vytváří dokument digitální, což je jedna z forem ochrany nejen knihovních, ale i muzejních či archivních sbírek. Výhodou digitalizace je uchování obsahu dokumentu, který již nezanikne se zánikem nosiče, např. pokud jsou periodika z kyselého papíru digitalizována, bude jejich obsah uchován po další generace.[4] Digitalizace je jednou z metod reformátování neboli převodu obsahu na jiný nosič.[5]

S termínem digitalizace je spjat pojem digitální knihovna. Jedná se o elektronickou obdobu klasické knihovny, v níž jsou uchovávány a zpřístupňovány digitální dokumenty nebo sbírky.[6] Jako příklad digitálních knihoven můžeme uvést Kramerius, Manuscriptorium, z muzejních sbírek eSbírky a z archivnictví Národní digitální archiv, Badatelnu.eu a Monasterium.

Počátek digitalizace

Před samotným procesem digitalizace je dobré si ujasnit, co má být digitalizováno. Jak již bylo řečeno, můžeme přihlédnout ke stáří, vzácnosti dokumentu a jeho případnému poškození, tedy naším cílem bude zachovat obsah dokumentu převedením do digitální podoby. Kromě toho můžeme digitalizovat také např. díla, která jsou čtenářky zajímavá, často poptávaná. Výhodou digitalizace je např. možnost jednoduchého zvětšení písma bez potřeby lupy. Důležité je dodržování autorského zákona. Záleží na ochranné lhůtě daného díla, řídí se dle roku autorova úmrtí, stejně tak u periodik, kde není důležitý rok vydání ale autoři daného periodika. Obecně si knihovny stanovily, že budou digitalizovat do roku 1885. Novější díla je možné digitalizovat, ale pouze pro jejich archivaci, nikoli zpřístupnění.

V okamžiku, kdy jsou určené dokumenty k digitalizaci, je ještě třeba učinit několik opatření a rozhodnutí. Nejen v případě, kdy se jedná o cenné dokumenty, je třeba zvážit manipulaci s dokumentem tak, aby nijak neutrpěl. U cenných dokumentů je vhodné svěření jich ke konzervaci nebo restaurování. K samotné digitalizaci je třeba zařízení, které bude schopné vytvoření digitálního dokumentu v požadované velikosti. Pokud nejsme vlastníkem zařízení, musíme zvážit jeho pořízení, půjčení nebo pronajmutí. Zajistit musíme i software pomocí kterého vytvoříme formát digitálního dokumentu. Dále musíme mít prostor, kam dokument uložíme a vědět, jak ho budeme ochraňovat.[7]

Proces digitalizace, uložení a zpřístupnění digitálního dokumentu

Již víme, co budeme digitalizovat, máme zajištěnou prevenci poškození dokumentu. Nyní se zaměříme na proces digitalizace přes skener a software, který využijeme k vytvoření digitálního dokumentu. V případě, že potřebujeme do textu zasahovat, chceme jej upravovat, je nejjednodušší cestou využití OCR softwaru, což je technika optického rozpoznávání znaků. S naskenovaným obsahem pak můžeme dále pracovat jako s běžným počítačovým textem, můžeme ho editovat. V opačném případě využijeme běžného softwaru pro skenování, který nám vytvoří rastrový formát, formát obrázku. Formáty vhodné pro dlouhodobé uchování jsou např. PDF/A nebo JPEG 2000.[8] Takto vytvoříme celý dokument, např. digitální kopii knihy. K digitálnímu dokumentu jsou přidělena metadata, což jsou data o datech. Tato data jsou buď vložena do digitálního dokumentu, jsou tedy jeho součástí, anebo jsou uložena vedle digitálního dokumentu. Většinou je dokument uložen na harddisku nebo v datovém úložišti instituce, kde je i zálohován, a následně zpřístupněn v repozitáři nebo digitální knihovně.

Ideální postup digitalizace nelze stanovit. Vždy záleží na typu dokumentů, různých kontextech, ve kterých se digitalizuje. Digitalizaci může provádět buď sama instituce, nebo ji může zadat úkolem externím pracovníkům nebo společnosti. Nevylučuje se kombinace metody in-house a outsourcingu. Záleží, co daná instituce preferuje, zda má k dispozici pracovníky, které může školit na novou funkci nebo zda je pro instituci přijatelnější sepsat přesné smluvní podmínky a zajistit digitalizaci formou outsourcingu, což většinou bývá finančně méně nákladné. Také finanční zdroje mohou pocházet buď přímo z dané instituce, nebo z jiných zdrojů, např. programy na podporu zpřístupnění digitálních dokumentů (např. VISK 4, VISK 7)[9]. Každá instituce se může také zapojit do Registru digitalizace, centrální evidence digitalizovaných dokumentů, a zamezit tak duplicitnímu zpracování.[7]

Dlouhodobé ukládání

Se vzrůstající digitalizací a s počtem dokumentů vznikající v digitální podobě souvisí pojem LTP neboli Long-Term Preservation, dlouhodobá ochrana digitálních dokumentů. Tak jako jsou pro generace zachovány např. vzácné knihy, obrazy, musíme se dnes zabývat uchováním těchto dokumentů v digitální podobě. Pro ochranu a uchování dokumentů pro budoucí generace nepostačuje pouze převod tohoto dokumentu do digitální podoby, musíme zajistit odpovídající formát, software a hardware, který je dlouhodobého ukládání schopen a nemá životnost pouhé desítky let, jako např. CD-ROM (dnes již není samozřejmostí, že s nákupem osobního počítače bude uživatel vlastnit i CD mechaniku).

Problematikou uchování se v posledních desetiletí zabývá řada institucí a projektů. Příkladem takového projektu je LTP-pilot neboli Pilotní projekt pro low-barrier přístup k ochraně digitálního obsahu, který probíhal v období září roku 2014 až říjnu roku 2015. Projektem se zabývala Masarykova univerzita, Moravská zemská knihovna v Brně a přizvaní experti. Financování zajistil Fond rozvoje CASNET. Cílem bylo přezkoumat open-source možnosti nástroje Archivematica a jeho praktickou použitelnost pro dlouhodobou ochranu dokumentů. Základní myšlenkou Archivematici je propojit nabídku volně dostupných LTP nástrojů do uceleného celku podporujícího archivační procesy podle referenčního modelu OAIS neboli Open Archival Information System, který představuje standard v oblasti dlouhodobé digitální archivace. Archivematica také předpokládala propojení se systémy, které již knihovny pro správu a ukládání digitálních objektů využívají.[10]

Odkazy

Reference

  1. Dokument, informační pramen a informační zdroj – Wikisofia. Dostupné také z: https://wikisofia.cz/wiki/Dokument,_informační_pramen_a_informační_zdroj
  2. CUBR, Ladislav, HAVLOVÁ, Jaroslava. Dokument digitální původem. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-29]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000014624&local_base=KTD.
  3. Digitální dokument – WikiKnihovna [online]. Lucie Bělejová, 2012 [cit. 2018-5-29]. Dostupné z: http://wiki.knihovna.cz/index.php/digitální_dokument
  4. VRBENSKÁ, Františka. Digitalizace dokumentů. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-29]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001728&local_base=KTD.
  5. POLIŠENSKÝ, Jiří. Reformátování. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-29]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001720&local_base=KTD.
  6. CELBOVÁ, Ludmila. Digitální knihovna. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-29]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000000854&local_base=KTD.
  7. 7,0 7,1 Digitalizace v knihovnách / Digitalizace v paměťových institucích – Moodle pro výuku 1 Univerzita Karlova [online].Jindřich Marek s použitím materiálů Jana Hutaře, 2018 [cit. 2018-5-29]. Prezentace v PDF. Dostupné z: https://dl1.cuni.cz/enrol/index.php?id=3553
  8. Archívní formát PDF/A | EARCHIVACE [online]. [cit. 2018-5-29]. Dostupné z: http://www.earchivace.cz/legislativa-a-normy/typy-dokumentu-k-archivaci/
  9. VISK – WikiKnihovna [online]. Jitka Bugajevová, 2012 [cit. 2018-5-29]. Dostupné z: http://wiki.knihovna.cz/index.php/visk
  10. BARTOŠEK, Miroslav. Dlouhodobé uchování digitálních informací, Archivematica a projekt LTP-pilot. Duha [online]. 2015, roč. 29, č. 3 [cit. 2018-06-09]. Dostupný z WWW: <http://duha.mzk.cz/clanky/dlouhodobe-uchovani-digitalnich-informaci-archivematica-projekt-ltp-pilot>. ISSN 1804-4255.

Externí odkazy

Související články

Klíčová slova

digitální dokument, digitalizace, digitální knihovna