Využití formátu XML v knihovnických aplikacích
XML[1], neboli Extensible Markup Language (česky rozšiřitelný značkovací jazyk) je všeobecný značkovací jazyk, který je standardizován organizací W3C (ta standardizuje například i HTML). XML je primárně určeno pro serializaci dat a jejich výměnu.
XML je tedy možné využívat jako univerzální výměnný formát (jako je například UNIMARC, MARC21 či BIBFRAME).
Je důležité si hned v začátku říci, že XML NENÍ vhodný formát pro ukládání práci s daty přímo v AKS (automatizovaném knihovním systému). XML JE URČEN pro přenos dat mezi informačními systémy.
Aktuální využití v knihovních aplikacích
OAI-PMH[2][3]
OAI-PMH je protkol pro sklízení metadat z dostupných repozitářů. Jedná se o obecný protokol, formát je navržen tak aby bylo možné jej flexibilně upravovat pro komunitu, která jej využívá. V prostředí českého knihovnictví využívá protokolu OAI například harvester SKČR (Souborný katalog České republiky - Caslin, http://www.caslin.cz/). Dalším nově vzniklým systémem, který využívá protokolu OAI-PMH je Centrální portál knihoven (https://www.knihovny.cz). Oba projekty využívají OAI-PMH ke sběru nových a upravených titulů v partnerských knihovnách, aby bylo možné tituly vystavit na jednotném místě (globálním online katalogu). Protokol jednou za čas zažádá server (knihovnu) o určitý metadatový set (souhrn nový či změněných dat) za určité období, tento set stáhne a vystaví či aktualizuje svůj katalog. OAI-PMH v českých knihovnách slouží ke stahování datových balíků s bibliografickými záznamy. Data pro harvester OAI-PMH jsou vystavována pomocí HTTP protokolu, nejčastěji pomocí katalogů typu OPAC.[4]
Sdílení záznamů IS
Některé moderní AKS umí využívat přenosu XML souborů z jiných IS (Informační systémy). Například AKS Tritius v rámci svých RESTových služeb umí stahovat či nabízet studentské práce[5].
Migrace, konverze a přenos dat
Při změně AKS či při konverzi záznamů (např. v roce 2015/2016 docházelo ke konverzím z UNIMARC na MARC21) je vhodné umístit záznamy mimo databázi, kde bude možné s nimi pracovat. Zde se jeví použití XML formátu jako naprosto vhodné. Díky systému a struktuře XML, včetně možnosti zavedení vlastních značek, je možné záznamy uložit mimo databázi AKS, zde je zpracovat přímo v AKS formátu a poté nahrát zpět do databáze.
Dříve se poměrně běžně užíval export knihovních jednotek, které spadali do tzv. výměnných souborů. Export proběhl ve formátu XML do souboru ISO a byl odeslán do jiné knihovny či pobočky mateřské knihovny. Takto fungoval (a na některých místech stále funguje) i systém, kdy ke katalogizaci jednotek docházelo v centrálních (krajských či městských) knihovnách, které distribuovali fyzické knihy i jejich metadatové záznamy do dalších, výrazně menších, knihoven. Jednalo se o spolupráci především mezi velkými profesionálními knihovnami a malými neprofesionálními (často obecními) knihovnami. Díky této spolupráci mohla velká knihovna nabízet ve svém katalogu knihy malé knihovny a malá knihovna nebyla administrativně zatížena katalogizací titulů.
Aplikované XML, projekty[6]
The Washington Research Library Consortium
WRLC využívá XML k zpřístupnění částí svých databází (knihovní katalogy, digitální kolekce dat, atd.) pro komerční i Open Source aplikace a platformy třetích stran. Systém nazvali ALADIN (Access to Library And Database Information Network).
Library of Congress, MARC XML
V roce 2002 zveřejnila Library of Congress specifikace formátu MARC XML[7]. Specifikovány jsou čísti MODS (Metadata Object Description Schema, metadatové popisné údaje), MADS (metadatové autoritní záznamy) a XML DTD (Document Type Definition, definice typu dokumentu - odkaz na konkrétní schéma pro strukturu dat).
The eScholarship initiative v California Digital Library
California Digital Library využívá XML k ukládání celých knih ve své digitální databázi. Využívají flexibility XML i k tomu, aby si uživatel sám mohl vytvořit preferovaný typ zobrazení záznamu i knihy.
Budoucnost
XML je velice flexibilní formát, díky MARC XML specifikaci, jednoduchosti implementace a šíření dat pomocí protokolu HTTP je dost pravděpodobné, že se formát rozšíří hlavně jako zdroj dávkových dat (plánovaný/pravidelný sběr většího množství dat). Díky možnostem komprese a On Demand (na vyžádání) systémům je možné, že XML či MARC XML vstoupí i do protokolů pro okamžitou výměnu dat (kooperace při katalogizaci, sdílená katalogizace bibliografických a autoritních záznamů). Došlo by tak k nahrazení protokolu Z39.50 a jemu podobných.
Reference
- ↑ PŘISPĚVATELÉ, Wikipedie. Extensible Markup Language. Wikipedie: Otevřená encyklopedie, 2016. Dostupné také z: https://cs.wikipedia.org/wiki/Extensible_Markup_Language
- ↑ HANOUSEK, Tomáš. OAI-PMH pro začátečníky: Příloha č. 4 k výzkumné zprávě projektu VE20072009004. Národní archiv České Republiky, 21 s.
- ↑ THE, Library of Congress. Sample OAI-PMH requests: Sample Requests Using the Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH v 2.0). The Library of Congress. Dostupné také z: https://memory.loc.gov/ammem/oamh/oai_request.html
- ↑ Koha: česká komunita, OAI-PMH. Koha, česká komunita. Dostupné také z: http://www.knihovni-system-koha.cz/index.php/funkce/oai-pmh
- ↑ Tritius: Open Tritius. Tábor: LANius a.s, 2016. Dostupné také z: http://www.tritius.cz/open-tritius
- ↑ BANERJEE, Kyle. How Does XML Help Libraries?. Computers in Libraries, 2002. Dostupné také z: http://www.infotoday.com/cilmag/sep02/banerjee.htm
- ↑ MARC in XML. Library of Congress, 2008. Dostupné také z: https://www.loc.gov/marc/marcxml.html