Digitalizace a knihovnictví/old

Elektronické publikování, digitální knihovny, proměna autority. Digitalizace dokumentů, záchrana kulturního dědictví, paměťové instituce. Technické řešení digitálních knihoven, metadata, formáty, standardy. Problematika indexace, prohledávání a archivace elektronických zdrojů. Problematika dostupnosti.

Přehled

Digitální knihovny mají potenciál nahradit roli tradičních knihoven jako sumáře znalostí lidstva. V dnešní době probíhá digitalizace hlavně vzácných starých tisků, zatímco digitalizace všech písemných informačních zdrojů není zatím z důvodu velké časové náročnosti realizovatelná. Vznikají informační systémy, které usnadňují budování digitálních sbírek, zpracovávají metadata, propojují různé archivy, zajišťují vyhledávání informací apod. Systémy umí pracovat s primárními i sekundárními informačními zdroji, šestří čas rešeršera a zvyšují dostupnost dokumentů. Příkladem současných systémů pro tvorbu digitálních knihoven je například DSpace, EPrints, Fedora, CDSWare a Greenstone. Tyto systémy za sebou mají zhruba 15 let vývoje (viz Bartošek, 2006). Digitální knihovnu připravuje také NK ČR, pro níž by se měl stát základem Karlovou Univerzitou již více než pět let budovaný WebArchiv. UK v roce 2006 zahájila také budování digitální knihovny z výstupů studia ze strany studentů i zaměstnanců. Významným produktem je Manuscriptorium, které umožňuje zjišťovat informace o historických knižních fondech pomocí internetu a připojuje i digitalizovanou knihovnu.

Obsah

4/7/08 Chitrov


Elektronické publikování

Hlavní článek: Elektronické publikování

Obecně je publikováním informací míněna příprava, tvorba, zachycení, transformace, ukládání a diseminace dokumentů a hovoříme-li o elektronickém publikování, pak je výsledkem této činnosti zpřístupnění dokumentů v digitální podobě. Za elektronickou publikaci můžeme tedy považovat v podstatě jakýkoli dokument zpřístupňovaný v elektronické podobě určitému okruhu uživatelů. Z toho mimo jiné vyplývá, že elektronické publikování začíná jako činnost, kterou mnozí z nás považují již za zcela samozřejmou součást své práce: tvorba dokumentů s využitím kancelářské výpočetní techniky. Pokud jsou výsledky této činnosti zpřístupněny určité skupině uživatelů, například v rámci výzkumných týmů v podnikovém intranetu, lokální síti nebo i síti globální, pak se skutečně jedná o jistou formu elektronického publikování.


Digitální knihovny

Digitální knihovna je sbírka elektronických informací organizovaných s cílem zajistit jejich dlouhodobé využívání. Termín digitální knihovna se objevil před lety především jako výraz realizace náročných představ o využívání vysoce výkonných počítačů a sítí pro vytváření, šíření, uchovávání, správu a využívání informací a dokumentů ve výzkumné a vzdělávací sféře. Není však omezen jen na tuto oblast, jak o tom svědčí řada současných projektů digitálních knihoven. Digitální informace zahrnované pod pojem digitální knihovna nejsou pojímány jen jako elektronická alternativa původní – většinou tištěné – verze, ale jedná se často o zcela nové informace, které nemají svoji papírovou verzi nebo jinou tradiční předlohu. Proto je také používán výraz digitální knihovna, nikoliv digitalizovaná knihovna. Je však nutné konstatovat, že řada projektů digitálních knihoven je zaměřena právě na digitalizaci tradičních, často historických, dokumentů. Cílem je zpřístupnit širokým (širším) vrstvám uživatelů jinak prakticky nedostupné historické dokumenty a prameny, jejichž původní podoba umožňuje z důvodu ochrany i komplikovaného přístupu (např. u rukopisů, obrazových a zvukových archivních dokumentů) jejich zpřístupnění jen velmi úzkému okruhu badatelů.


Digitalizace dokumentů, záchrana kulturního dědictví, paměťové instituce

Digitalizace vzácných dokumentů a knih je velmi důležitou činností, kterou se zabývá většina velkých knihoven. Zpřístupnění dokumentů v digitální podobě například na Internetu je důležité hlavně kvůli umožnění studentům a vědcům prohlížet si materiály, které by se jim dříve nemohly dostat do rukou.

Zpracovat koncepci trvalého uchování knihovních sbírek tradičních a elektronických dokumentů v knihovnách, jako důležité složky kulturního dědictví a umožnit jejich využívání současným i budoucím generacím je náročný úkol, je to „běh na dlouhou trať“ zahrnující vytvoření legislativních, organizačních a technických předpokladů pro shromažďování, trvalé uchování a zpřístupnění publikovaných digitálních a digitalizovaných dokumentů jako důležité složky kulturního dědictví. Problematika trvalého uchování (a zpřístupnění) knihovních sbírek tradičních a elektronických dokumentů je velmi komplexní a složitá. Vzhledem k hrozbě nenávratné ztráty podstatné části národního kulturního dědictví se jedná o téma v mezinárodním kontextu velmi živé a akcentované.

Některé země, především v Americe a Asii si toto riziko nenávratné ztráty kulturního dědictví uvědomily dříve než Evropa a jejich vlády vyčlenily nemalé prostředky na záchranu a zpřístupnění tradičních i digitálních dokumentů. V poslední době vzniká řada iniciativ a doporučení v této oblasti i v Evropě.Jednou z nejdůležitějších je Iniciativa Komise evropských společenství ze 30. září 2005 známá pod názvem i2010: Digitální knihovny http://europa.eu.int/information_society/activities/digital_libraries/doc/cs_comm_digital_libraries.pdf hovoří velmi jasnou a naléhavou řečí a apeluje na vlády členských zemí, aby podpořily urychlení digitalizace, zvýšily dostupnost informací a zajistily dlouhodobé uchovávání digitálního obsahu. V ČR plán digitalizace probíhá na základě koncepce vznikle na podkladě zadání formulovaného jako dílčí cíl Koncepce rozvoje knihoven v České republice na léta 2004 až 2010 [Usnesení vlády ČR ze dne 7. července 2004 č. 679]

Koncepce vychází z platné české legislativy pro danou oblast, kterou představují především: Knihovní zákon http://knihovnam.nkp.cz/sekce.php3?page=03_Leg/01_LegPod/Zakon257.htm Zákon o neperiodických publikacích http://www.nkp.cz/pages/weba_zakonpv_neper.htm Tiskový zákon http://knihovnam.nkp.cz/sekce.php3?page=03_Leg/01_LegPod/Zakon46.htm, a Autorský zákon http://knihovnam.nkp.cz/sekce.php3?page=03_Leg/01_LegPod/x00-121.htm

Digitalizace vzácných dokumentů a knih je velmi důležitou činností, kterou se zabývá většina velkých knihoven. Národní knihovna České republiky se může chlubit projektem Národní digitální knihovna, který je tvořen vybraným souborem publikovaných digitálních i digitalizovaných dokumentů, kvalifikovaných jako základ národního kulturního dědictví určeného k trvalému uchování a zpřístupnění současným i budoucím uživatelům. Digitální dokumenty tvořící jádro národního kulturního dědictví jsou shromažďovány, uchovávány a zpřístupňovány v rámci tří národních programů: Memoria (Manuscriptorium - digitalizované historické dokumenty), Kramerius (digitalizované novodobé dokumenty) a WebArchiv (publikované digitální dokumenty). Všechny tyto programy se budou i nadále rozvíjet a budou obohaceny výstupy z dalších programů a projektů. Národní digitální knihovna se bude postupně transformovat ve spolehlivý repozitář odpovídající jednoznačně daným mezinárodním kritériím.



Technické řešení digitálních knihoven

K tomu, aby mohl vzniknout globální systém kooperujících digitálních knihoven, je třeba vytvořit a uvést do života potřebnou globální informační infrastrukturu. Obecná architektura digitální knihovny navržená na dostatečně vysoké úrovni abstrakce umožňuje formalizovat představy o funkcích a fungování digitálních knihoven a současně identifikovat „middleware“ internetu potřebný pro realizaci distribuovaných digitálních informačních služeb (všechny dnešní systémy digitálních knihoven jsou realizovány ve webovém prostředí internetu).

Nejpropracovanější obecnou architekturu digitálních knihoven podali Kahn a Wilensky; experimentální systém vycházející z této architektury byl pak realizován např. v rámci projektu National Digital Library Project v Kongresové knihovně. Základním prvkem architektury je digitální objekt, datová struktura pro základní samostatně použitelnou informační jednotku tvořená dvěmi základními částmi: obsahem (content) a klíčovými metadaty (tvořenými globálním jednoznačným identifikátorem digitálního objektu, označovaným jako handle, a dalšími blíže nespecifikovanými neměnnými metaúdaji, např. „autor“). Obsahem digitálního objektu může být sekvence bitů reprezentující konkrétní digitální materiál (může být zahrnut i ve vícero formách), množina jiných datových objektů (složený objekt), množina identifikátorů objektů (metaobjekt), případně jiné datové typy – model tak poskytuje dostatečnou flexibilitu pro reprezentaci libovolně složitých informačních objektů a vztahů mezi nimi. Digitální objekty mohou být buď proměnlivé (obsah objektu lze měnit i po jeho uložení do repozitáře – ať již jde o jednorázové změny nebo přímo dynamické informační objekty), nebo fixní.


Metadata

V samém centru pozornosti výzkumu digitálních knihoven jsou tři vzájemně se podmiňující komponenty: metadata, interoperabilita a globální vyhledávání zdrojů. V opravdu fungující globální digitální knihovně je zapotřebí metadat pro podporu interoperability, stejně jako interoperabilita metadat; aby bylo možné v systému digitálních knihoven vyhledávat, musí jednotlivé komponenty navzájem určitým způsobem kooperovat (být interoperabilní) a naopak dosažení vysokého stupně interoperability je podmíněno existencí globální vyhledávací infrastruktury. Metadata, neboli informace o informacích, představují věčné téma jak ve světe knihoven (připomeňme jen klasické katalogy), tak ve světě informačních technologií (databázová schémata, například). Oproti klasickým knihovním metadatům, která vznikají obvykle jednotným způsobem s velkým podílem ruční práce vyškolených specialistů, a za účelem dosažení co nejúplnějšího popisu informačního zdroje, mají síťová metadata řadu odlišností: především bývají specializovaná (popisná, strukturální, administrativní, formátově závislá), úzce zaměřená na konkrétní použití (vyhledávání, ochrana duševního vlastnictví, hodnocení obsahu, dlouhodobé uchovávání, interoperabilita) a aplikační oblast (vědní disciplína, komunita uživatelů). Různých formátů síťových metadat je obrovské množství, stejně tak jako jejich použití a určení. Výzkum v oblasti metadat je možné rozdělit do dvou hlavních proudů: prvním z nich je návrh nových metadatových schémat pro konkrétní oblast použití (například Dublin Core pro jednoduchý popis zdrojů za účelem jejich efektivnějšího vyhledání, TEI pro značkování textových dokumentů s využitím SGML nebo XML, metadata na podporu dlouhodobého uchovávání digitální informace, INDECS – metadata na podporu e-commerce, ONIX – metadata pro elektronickou výměnu informací o produkci knižního průmyslu, aj.). Druhou oblast představuje určitá standardizace zápisu (s využitím formátu XML) a možnost propojování specializovaných a distribuovaných síťových metadat do složitějších metadatových struktur (např. systémy založené na RDF – Resource Description Format nebo meta-metadatové schéma METS).



Problematika indexace

Čím více se při výměně informací (resp. obchodu) snižuje potřeba fyzického kontaktu mezi uživatelem informace a jejím poskytovatelem (resp. mezi kupujícím a prodávajícím), tím víc roste potřeba být schopen věci jednoznačně pojmenovávat a identifikovat. Schopnost jednoznačně globálně identifikovat informační objekty (a tuto identifikaci dynamicky jednoznačně propojit s informačním objektem nacházejícím se kdekoliv v globální síti) je zcela zásadní pro nasazení jakéhokoliv distribuovaného globálního informačního systému.

Koncept URN Stávající internet zatím nenabízí dostatečně univerzální, všeobecně podporovaný a rozšířený identifikační systém pro informační objekty, který by splňoval základní požadavky zformulované již počátkem 90. let pro koncepci URN, Uniform Resource Name, a to:

globální rozsah: dané jméno je celosvětově jednoznačné a nezávislé na lokaci; perzistence: přidělené jméno trvá „na věky“, i po zaniknutí popisované entity; škálovatelnost jméno musí být použitelné pro jakýkoliv představitelný typ entity; legacy support systém musí podporovat existující identifikační systémy; rozšiřitelnost musí být umožněno budoucí rozšíření identifikačního schématu

Stávající URL tyto požadavky nesplňuje, neboť identifikuje lokaci, nikoliv entitu (intelektuální obsah). Smyslem návrhu URN je naopak identifikovat entitu bez ohledu na její momentální umístění; musí ovšem existovat tzv. směrovací mechanismus, který pro zadané URN zjistí aktuální umístění entity tímto URN identifikované.

Knihovny se problémem identifikace fyzických informačních zdrojů zabývají již dlouho; popišme současný stav a nástroje, které jsou k dispozici i digitálním knihovnám.

Klasické identifikátory: ISBN, ISSN, SICI/BICI, ISTC Již zhruba 30 let používají knihovny a nakladatelé identifikaci ISBN (International Standard Book Number), ISSN (International Standard Serial Number) a další identifikátory k identifikaci tištěných publikací neboli projevu díla (v terminologii modelu FRBR). Digitální knihovny a elektronické publikování však vyžadují komplexnější vícevrstvou identifikaci, počínaje samotnými autory a konče těmi nejmenšími jednotkami informací, s nimiž lze v internetu samostatně manipulovat a prodávat je, jako jsou např. články v časopisech. Současný stav v oblasti standardů je následující: a) autoři: ISADN (International Standard Authority Data Number) – umožňuje jednoznačně identifikovat každého autora. Zatím v praxi nerealizováno (již několik let se diskutuje o otázce skutečné potřebnosti a technické realizovatelnosti tohoto identifikátoru) b) dílo: ISTC (International Standard Textual Work Code) – pro textová díla ISAN (International Standard Audiovisual Number) – pro audiovizuální díla ISWC (International Standard Musical Work Code) – pro hudební díla. Standardy ISAN a ISWC jsou již několik let platnými standardy ISO; práce na ISTC postoupily v září 2004 do závěrečné schvalovací fáze. c) projev: ISBN, ISSN, ISMN a další identifikátory, které se využívají již dlouhou dobu. d) komponenta: SICI (Serial Item and Contribution Identifier) – pro články BICI (Book Item and Component Identifier) – pro kapitoly v knize, obrázky, poznámky apod. Norma SICI existuje jako ANSI/NISO standard již od roku 1996, ale zatím se v praxi moc nevyužívá; má však budoucnost. BICI byl v pozici pracovního návrhu a jeho další osud je nejasný.

Více viz : http://knihovna.nkp.cz/NKKR0404/0404233.html

Problematika dostupnosti

Tradiční model knihovních služeb, založený na půjčování fyzických věcí, které knihovny vlastní, se do digitálního prostředí nepřevádí snadno. Podle stávajících právních předpisů EU a mezinárodních dohod lze materiál získaný digitalizací zpřístupnit on-line pouze tehdy, jde-li o volné dílo, nebo s výslovným souhlasem držitelů práv. Pokud jde o literaturu, znamená to, že bez autorskoprávních omezení jsou dostupná pouze díla ze začátku 20. století a starší, v závislosti na roce úmrtí autora. Avšak i když u díla již vypršela lhůta autorskoprávní ochrany, není situace vždy jasná. Právy mohou být zatížena různá vydání díla, které samo o sobě již chráněno není, například právy k předmluvám, přebalu a sazbě. On-line knihovny nabízející díla, která nejsou volná, není uskutečnitelná bez zásadní změny autorského práva, nebo bez dohod uzavřených pro jednotlivé případy s držiteli práv. V této souvislosti je velmi důležité vyjasnění a průhlednost stavu autorskoprávní ochrany děl. V některých případech budou náklady na stanovení stavu díla z hlediska práv duševního vlastnictví vyšší než náklady na jeho digitalizaci a zpřístupnění on-line. To se zejména týká takzvaných "osiřelých děl" – filmů či knih, u kterých je velmi obtížné či nemožné stanovit, kdo jsou držitelé práv. Tyto prvky jsou zdůrazněny v pracovním dokumentu a on-line konzultaci, které doprovází toto sdělení. Otázky týkající se dostupnosti on-line nejsou omezeny jen na práva duševního vlastnictví. Zveřejnění materiálu on-line neznamená, že jej uživatel bude moci snadno najít, a už vůbec ne, že jej bude možno prohledávat a využívat. Jsou nezbytné vhodné služby, které uživateli umožní obsah najít a pracovat s ním. To předpokládá strukturovaný a kvalitní popis obsahu, a to jak sbírek, tak i položek v nich, a podporu pro jeho využívání (např. anotace).


Literatura, zdroje a zajímavé odkazy:

1) Jedličková, Petra. Elektronické publikování. Ikaros [online]. 1999, roč. 3, č. 3 [cit. 2008-05-12]. Dostupný na World Wide Web: <http://www.ikaros.cz/node/314>. URN-NBN:cz-ik314. ISSN 1212-5075.

2) http://knihovna.vsb.cz/internet/digitalniknihovny.htm

3) http://www1.cuni.cz/~brt/dk/dk2.htm

4) http://knihovnam.nkp.cz/docs/Koncepcetext.doc

5) http://cs.wikipedia.org/wiki/Projekt_Gutenberg

6) http://www.lupa.cz/clanky/digitalizace-knihoven-je-beh-na-dlouhou-trat/

7) http://knihovnam.nkp.cz/docs/Koncepcetext.doc

8) http://www.aib.sk/infos/infos2003/18.htm

9) http://www.infolib.sk/index/open_file.php?file=INFOS2007/Prochaskova_Iva_1_novy.htm

10) http://knihovna.nkp.cz/NKKR0404/0404233.html

11) http://knihovna.nkp.cz/Nkkr9904/9904173.html

12) http://www.ics.muni.cz/zpravodaj/articles/274.html

13) http://knihovna.nkp.cz/knihovnaplus51/digitalni_knihovnyEU.htm


Dění v oblasti digitálních knihoven mapuje řada časopisů, konferencí, specializovaných workshopů a také courseware – kurzů na vysokých školách. Mezi nejvýznamnější časopisy patří:

D-Lib Magazine – elektronický časopis zaměřený hlavně na prakticky orientovaný výzkum v oblasti digitálních knihoven; vychází měsíčně od roku 1995 v CNRI s podporou DARPA. Je volně dostupný na webu a v současnosti je patrně nejprestižnějším zdrojem odborných informací o dění v oblasti digitálních knihoven.

International Journal on Digital Libraries – klasický tištěný časopis z nakladatelství Springer-Verlag. Specializuje se spíše na teoretický výzkum, vychází od roku 1997, bohužel však s nepravidelnou periodicitou.

Ariadne – elektronický časopis pro informační specialisty zejména z Velké Británie. Informuje o aktivitách z oblasti digitálních knihoven, vydává ho čtvrtletně UKOLN (UK Office for Library and Information Networking); volně dostupný na webu

RLG DigiNews – elektronický časopis zaměřený na oblast digitalizace a uchovávání digitální informace. Je vydáván Cornellovou univerzitou ve spolupráci s organizací Research Libraries Group (RLG) sdružující kolem 160 výzkumně zaměřených knihoven, archivů a dalších paměťových institucí převážně z USA. Vychází dvakrát měsíčně, je volně dostupný na webu.

Anotovaná bibliografie

4/7/08 Tománek

BARTOŠEK, Miroslav. Technologie digitálních knihoven; Inforum 2006 (dostupný z url: http://www.inforum.cz/archiv/inforum2006/prispevek.php-prispevek=12.htm)

Abstrakt: Digitální knihovny mají za sebou zhruba 15 let rozvoje. Cílem příspěvku je poskytnout přehled o technologiích tvořících základní kameny soudobé infrastruktury digitálních knihoven, a to v oblastech budování sbírek, metadat, identifikace a interoperability. Zmíněny jsou i nejvyužívanější volně dostupné systémy na podporu realizace digitálních knihoven. V závěru příspěvku je připojeno krátké zamyšlení nad novým vymezením digitálních knihoven v éře googlizace.


HUTAŘ, Jan. Vyhledávání v archivu českých webových zdrojů; Inforum 2006 (dostupný z url: http://www.inforum.cz/archiv/inforum2006/prispevek.php-prispevek=30.htm)

Abstrakt: Po pěti letech řešení projektu nazvaného WebArchiv umožnili řešitelé přístup do části webového archivu. Příspěvek seznámí s technickým zázemím, objasní jak byl archiv zpřístupněn, co lze v archivu nalézt v současné době a co lze v blízké budoucnosti očekávat ve zlepšení možností zpřístupňování archivovaných zdrojů (mj. začlenění do plánované Digitální knihovny NK ČR apod.). Druhá část příspěvku se bude zabývat vývojem a aplikací technického řešení (implementace SW, HW).


KREJČÍŘ, Vlastimil. Systémy pro tvorbu digitálních knihoven; Inforum 2006 (dostupný z url: http://www.inforum.cz/archiv/inforum2006/prispevek.php-prispevek=24.htm)

Abstrakt: Příspěvek přináší stručný popis a porovnání vybraných volně dostupných systémů pro tvorbu digitálních knihoven. Těmito vybranými systémy jsou DSpace, EPrints, Fedora, CDSWare a Greenstone.


TESAŘOVÁ, Lucia. Zpřístupňování digitálních dokumentů na UK v Praze; Inforum 2006 (dostupný z url: http://www.inforum.cz/archiv/inforum2006/prispevek.php-prispevek=48.htm)

Abstrakt: V roce 2006 zahájila Univerzita Karlova v Praze pilotní projekt budování centrálního digitálního repozitáře, který bude zastřešovat jednotlivé podprojekty a aktivity v oblasti digitalizace a zpřístupňování digitálních dokumentů na UK. Centrální digitální repozitář UK je chápán jako soubor služeb, které univerzita členům své komunity nabízí, a to za účelem správy, zpřístupňování a rozšiřování digitálních (born digital) a digitalizovaných dokumentů, které Univerzita Karlova a členové její komunity (tj. studenti, fakulty, vědecko-pedagogičtí pracovníci, externí vědečtí pracovníci, zaměstnanci apod.) vytvořili a vytvoří. Významným přínosem digitálního repozitáře je jednak usnadnění komunikace v oblasti vědecko-pedagogické činnosti a jednak v oblasti vědeckého publikování. Digitální repozitář zároveň umožňuje zvýšit prestiž univerzity zviditelněním výsledků práce členů její komunity.


CELBOVÁ, Iva. Univerzální vyhledávací portál jako integrační řešení pro digitální knihovny; Inforum 2006 (dostupný z url: http://www.inforum.cz/archiv/inforum2006/prispevek.php-prispevek=14.htm)

Abstrakt: Vedle tradičních dokumentů knihovny 21. století pracují také s elektronickými daty, ať už se sekundárními informacemi o dokumentech (bibliografické záznamy, metadata), tak s primárními dokumenty (digitalizované a digitální dokumenty, ale také plnotextové elektronické informační zdroje/databáze). Ve vztahu k elektronickým zdrojům knihovny řeší nejen možnosti jejich získávání, archivace a zpřístupňování, ale stále častěji také otázky propojení sekundárních informací a primárních dokumentů, propojení více různých zdrojů, jak v těchto zdrojích efektivně vyhledávat a jak informace zpřístupňovat, to vše v jednotném přívětivém uživatelském rozhraní, s využitím požadovaných standardů. Zabývají se budováním digitálních knihoven.


VOJTÁŠEK, Filip. Dlouhodobá archivace digitálních dokumentů. Ikaros [online]. 2000, roč. 4, č. 10 [cit. 2008-04-06]. Dostupný na World Wide Web: <http://www.ikaros.cz/node/675>. URN-NBN:cz-ik675. ISSN 1212-5075.

Abstrakt: Článek se zabývá problematikou dlouhodobé archivace digitálních dokumentů. Vzhledem k měnícímu se technickému a programovému vybavení je zajištění přístupu k dlouhodobě archivovaným dokumentům v elektronické podobě obtížné. Článek definuje digitální dokument, zabývá se paradigmatem archivace digitálních dokumentů a navrhuje strategie uchovávání těchto dokumentů.


CELBOVÁ, Iva. Domácí elektronické online zdroje zpřístupněny díky projektu WebArchiv. Ikaros [online]. 2006, roč. 10, č. 1 [cit. 2008-04-06]. Dostupný na World Wide Web: <http://www.ikaros.cz/node/2100>. URN-NBN:cz-ik2100. ISSN 1212-5075.

Abstrakt: U příležitosti zpřístupnění části digitálního archivu WebArchiv uspořádalo oddělení elektronických online zdrojů Národní knihovny ČR v úterý 6. prosince 2005 informační setkání, na kterém vystoupili pracovníci tohoto oddělení a na které byli pozváni zástupci knihoven, vydavatelů a sdělovacích prostředků. Cílem setkání bylo především seznámit s dosavadním vývojem a perspektivami projektu WebArchiv, nastínit podmínky spolupráce s vydavateli elektronických online zdrojů a představit stávající technické zázemí projektu.


MANUCSRPTORIUM.CZ

Manuscriptorium je systém shromažďující a zpřístupňující na Internetu informace o historických knižních fondech, provázaný s digitální knihovnou digitalizovaných dokumentů. Provoz Manuscriptoria je financován Národní knihovnou ČR, provozovatelem této služby je firma AiP Beroun s.r.o. Cílem je budování virtuálního badatelského prostředí pro oblast historických fondů. (http://www.manuscriptorium.com)


TURNING THE PAGES

Projekt Britské knihovny zpřístupňující nejcennější artefakty z jejích sbírek v digitální podobě prostřednictvím internetu. (http://www.bl.uk/onlinegallery/ttp/ttpbooks.html)

Demonstrace

případová studie (příklad projektu Manuscriptorium) a přehled největších projektů digitalizace kulturního dědictví ve světě

4/7/08 Chitrov


Manuscriptorium http://www.manuscriptorium.com/Site/ENG/default_eng.asp

je systém shromažďující a zpřístupňující na Internetu informace o historických knižních fondech, provázaný s digitální knihovnou digitalizovaných dokumentů. Provoz Manuscriptoria je financován Národní knihovnou ČR, provozovatelem této služby je firma AiP Beroun s.r.o.


Aktuální stav

Existuje digitální knihovna rukopisů, starých tisků a dalších vzácných dokumentů. Jako každá knihovna se skládá z katalogu, kterým je v tomto případě Otevřený Katalog Historických Fondů (OKHF) a vlastních digitálních dokumentů, které jsou uloženy v datovém úložišti. OKHF soustřeďuje informace (metadata) o fyzických dokumentech (rukopisech atd.) ve formě tzv. evidenčních záznamů ve formátu XML. Úložiště pak obsahuje digitální kopie podmnožiny z těchto katalogizovaných dokumentů ve formě tzv. komplexních digitálních dokumentů (KDD).

Principiálně systém Manuscriptorium centrálně soustřeďuje metadata v OKHF a zajišťuje přístup k digitalizovaným dokumentům na datových úložištích provozovatele i vzdálených úložištích partnerů.


Cíle Manuscriptoria

Jsou položeny základy, dovolující shromažďovat a zpřístupňovat existující data. Dalším cílem je budování virtuálního badatelského prostředí pro oblast historických fondů. Probíhá rozšiřování digitálních prezentací těchto fondů (obrazových, textových) a jejich zpřístupňování, vzniká virtuální digitální knihovna obrazových kopií a plných textů. Zabezpečuje se propojení k dalším datům majícím vztah k těmto fondům (studie, další popisná metadata, další elektronické dokumenty/objekty) a také poskytování informací jiným systémům standardizovanými postupy (komunikačními rozhraními) (Z39.50, OAI-MPH)


Historie Manuscriptoria

Manuscriptorium je výsledkem aktivit, které se započaly v souvislosti s iniciativou UNESCO „Memory of the World“ v roce 1992. Aktivity pokračovaly vytyčením úkolů navazujícího českého programu Memoriae Mundi Series Bohemica (MMSB), řešením souvisejících aktuálních požadavků a praktickým provozem. Záhy byly rozpoznány požadavky na dlouhodobou udržitelnost projektu a stanoveny cíle směřující k vybudování elektronického badatelského prostředí pro oblast historických knižních fondů. V Manuscriptoriu jsou soustřeďovány informace poskytnuté spolupracujícími partnery, přispěvateli z knihoven, archivů a muzeí.

Praktické zkušenosti a spolupráce odborníků z technické a knihovnické oblasti vedli k formulaci základních thesí, které jsou pilíři Manuscriptoria.


Projekt Gutenberg (anglicky Project Gutenberg, často se zkracuje na PG) je dobrovolnická snaha digitalizovat, archivovat a distribuovat kulturní díla. Byl založen v roce 1971 a je nejstarší digitální knihovnou. Většina děl jsou plné texty knih se statusem volného díla. Projekt se snaží zpřístupnit díla ze své sbírky tak svobodně, jak je to jen možné, a v otevřených formátech, které je možno používat téměř na každém počítači.(http://www.gutenberg.org)


Evropská knihovna (http://www.theeuropeanlibrary.org/portal/ The European Library, zkratka TEL) je webovou službou, která nabízí přístup ke zdrojům 47 národních knihoven v Evropě, včetně Vatikánu. Zdroje jsou klasické i digitální a obsahují knihy, časopisy, zvukové dokumenty a další sbírky. Portál Evropské knihovny nabízí zdarma vyhledávání a dodávání metadatových záznamů a také digitálních dokumentů. Evropskou knihovnu spravuje konsorcium 23 národních knihoven, které podporují a rozvíjejí služby portálu. Evropská knihovna je branou ke sbírkám evropských národních knihoven. Umožňuje jednoduchou a účinnou cestu, jak se dostat k velmi kvalitním informačním zdrojům z různých oborů. Evropská knihovna otevírá svět znalostí, informací a kultury ze všech evropských národních knihoven.