Služby discovery systémů pro knihovny.

Discovery systémy pro knihovny by měly umožnit jednotné vyhledávání a dodávání dokumentů ze všech sbírek, ať už se jedná o fyzické fondy, digitální knihovny nebo elektronické informační zdroje.^[1]

Web-scale discovery systémy umožňují knihovnám zajistit přístup k jejich sbírkám, zdrojům a službám za použití současných internetových technologií a konceptů. Tyto systémy mají podle Marshalla Breedinga čtyři charakteristické rysy (BREEDING, 2012)^[2]

rozsáhlé technologické platformy (large-scale technology platforms),
aplikace doručované prostřednictvím multiuživatelského softwaru jako služby (applications delivered throught multitenent software as a service),
masivně agregovaný přístup k datům (massively aggregated approaches to data),
uspořádání charakterizované vysokou mírou spolupráce mezi zúčastněnými knihovnami (highly cooperative arrangements among participating libraries).

Obsah

1 Sjednocení indexu a centrální vyhledávání
2 Web scale discovery
3 Kritéria fungování discovery systémů
4 Odkazy

Sjednocení indexu a centrální vyhledávání

Tento model se osvědčil při konstrukci webových vyhledávačů. Ve sjednocování vyhledávacích komponent postupuje o další krok: místo nativních indexů jednotlivých zdrojů je vytvořen centrální index, který je prohledáván centrálním vyhledávacím strojem. Jak je ze schématu na obrázku 1 patrné, tento technologický model už se liší od vyhledávání v jednom zdroji pouze v jedné komponentě, kterou jsou distribuované samostatné heterogenní zdroje. Obdobně jako potřeboval centralizovaný vyhledávač konektory k prohledávaným zdrojům, potřebuje takové konektory centrální indexovač. Centrální index může být vytvořen dvěma způsoby: buď ho indexovač vygeneruje přímo z primárních dokumentů (tzv. sklizeň – harvesting nebo též prolézání – crawling zdrojů) a tím vlastně zopakuje aktivity, které už proběhly při tvorbě nativních indexů, nebo je možné převzít a sloučit už existující nativní indexy (tato operace bývá označována jako sklizeň metadat – metadata harvesting).^[3]

Obrázek 1: Sjednocení indexu

Web scale discovery

Producenti softwaru nabízející tuto technologii knihovnám pro ni používají název discovery vyhledávání, případně obtížně přeložitelný novotvar web scale discovery. Discovery by bylo možné do češtiny přeložit jako objev, nález, ale i zpřístupnění. Web scale (doslova webový rozsah) poukazuje na podobnost s "google vyhledáváním" a na obrovské množství zdrojů, jež je možné do centrálního indexu zahrnout. Na rozdíl od tzv. katalogů nové generace, které používají technologii "discovery layer" k vytvoření jednotného indexu pro všechny lokálně vlastněné knihovní kolekce (navíc se jedná zpravidla pouze o strukturovaný index na monografické či seriálové bibliografické úrovni), web scale discovery umožňuje sjednotit index jak pro lokální, tak pro vzdálený obsah (např. pro licencované online databáze, ale i pro zdroje volně dostupné v prostředí Internetu), a to včetně indexace plných textů. Slovo scale navíc evokuje termín "scalability", tedy škálovatelnost neboli rozšiřitelnost.^[3]

EBSCO Discovery Service

Jednou ze služeb typu discovery je EBSCO Discovery Service (EDS) od společnosti EBSCO Publishing. Vývoj tohoto produktu začal v roce 2008, v následujícím roce proběhlo testování a ke zprovoznění došlo začátkem roku 2010.^[2]

EDS je z velké části postavena na infrastruktuře a rozhraní, které připomíná databázové rozhraní EBSCOhost. To se poprvé objevilo v roce 1994. Přístup do EDS je poskytován na hostitelské platformě.^[2]

Základem pro vyhledávání je centrální index (uvádí se jako EDS Foundation Index nebo EDS Base Index, případně EDS Index). Tento index obsahuje metadata od desítek tisíc poskytovatelů obsahu (cca 20.000 producentů dat a 70.000 knižních vydavatelů), repozitáře typu open access (DOAJ, OAISTER, arXiv.org) a také různé lokální zdroje jednotlivých knihoven, tj. online katalogy knihoven, digitalizované sbírky či institucionální repozitáře. Zdroje mohou být založené na různých metadatových schématech (MARC, Dublin Core, XML či EAD). EDS pracuje s různými mechanizmy dodávání obsahu, ať už OAI-PMH nebo FTP. Nejsou stanoveny požadavky na minimální záznam. Metadata z integrovaných zdrojů jsou transformována do základního schématu EBSCOhost.^[2]

Obrázek 2: Vstupní obrazovka EDS pro NK ČR

U zobrazených výsledků hledání lze zjistit, ze které z integrovaných databází záznam pochází. Centrální index tak má pro každou instituci vlastní nastavení, zohledňující její dostupné zdroje.^[2]

Primo

Primo Discovery and Delivery (dále také jako Primo) funguje na principu dvou indexů, centrálního a lokálního. Údaje získané od primárních a sekundárních vydavatelů a agregátorů a informace z open access repozitářů jsou obsaženy v centrálním indexu nazývaném Primo Central. Tento index je vždy poskytován jako služba formou výpočetního oblaku. Primo Central se zaměřuje na vědecké publikace (časopisecké články, recenze, e-knihy, konferenční materiály, disertace) nabízené primárními a sekundárními vydavateli a agregátory.^[2]

ANL+

V českém prostředí zatím není k dispozici rozhraní Primo Discovery and Delivery v ostrém nasazení nad sbírkami jedné či více knihoven. S tvorbou lokálního indexu a jeho využití prostřednictvím Primo se můžeme setkat u projektu ANL+, který je součástí Jednotné informační brány, druhou variantou zpřístupnění je klasické rozhraní JIB, které využívá možnosti MetaLib (paralelní vyhledávání založení na federativním vyhledávání).^[2]

ANL+ je experimentální zdroj poskytující informace o článcích publikovaných v českých novinách, časopisech a dalších pokračujících zdrojích od roku 2011. ANL+ navazuje na bázi ANL, kterou společně vytvářely od roku 1992 Národní knihovna České republiky, Moravská zemská knihovna v Brně, krajské knihovny a odborné knihovny.^[2]

Index Primo Central

Primo Central uvolnila společnost ExLibris začátkem roku 2011. NK ČR se stala první institucí, která o aktivaci služby Primo Central požádala. Uživatelé Jednotné informační brány tak mohou od 21. února 2011 v prostředí Jednotné informační brány (JIB) využívat dvě konfigurace Primo Central. V tomto případě tedy není index Primo Central integrován přímo v "domovském" rozhraní Primo Discovery and Delivery, ale je propojen s rozhraním, které pro uživatele JIB poskytuje systém MetaLib.^[2]

Summon

Společnost Serials Solutions začala vyvíjet vlastní nástroj typu discovery v roce 2008. Veřejně byl Summon ohlášen v lednu 2009, na vývoj systému se podíleli i další partneři a první beta verzi Summon zveřejnila Dartmouth College Library v červnu 2009. V Evropě zpřístupnila svou instalaci beta verze University of Liverpool Library téměř vzápětí poté, 6. července 2009. Summon pracuje s jedním centralizovaným indexem, do něhož plyne obsah získávaný z komerčních i volných zdrojů. V oblasti licencovaného obsahu spolupracuje Summon s vydavateli a agregátory, cílem je získat oprávnění indexovat plný text přímo u poskytovatelů obsahu. Dále Summon indexuje a využívá strukturovaná metadata poskytovaná vydavateli a agregátory. Dalším zdrojem obsahu pro centralizovaný index Summon je indexace open access repozitářů a v neposlední řadě jsou součástí centralizovaného indexu Summon také data z lokálních sbírek knihoven, které Summon využívají.^[2]

WorldCat Local

Obdobně jako tvůrci ostatních již zmíněných centrálních indexů i WorldCat Local do svého indexu zahrnuje údaje z repozitářů s otevřeným přístupem, které jsou samozřejmě volně přístupné pro všechny zákazníky WorldCat Local. Ve WorldCat Local je dál možné nalézt metadata e-knih poskytnutá komerčními agregátory a vydavateli či pocházející z masové digitalizace např. od Google. WorldCat Local využívá proxy servery aplikované v knihovnách pro poskytování vzdáleného přístupu k licencovanému obsahu, spolupracuje s link-resolvery knihovny a znalostní bází WorldCat jako prostředníkem k licencovanému obsahu; zákazníci musí mít záznamy jednotek svých periodických publikací uvedené ve WorldCat.^[2]

Kritéria fungování discovery systémů

Jsou rozdělena do dvou skupin: první se týká přímo koncových uživatelů a druhá je více relevantní pro provoz z pohledu knihovny.^[3]

Pro koncové uživatele
- nastavitelné řazení výsledkové množiny knihovnou (konfigurovatelná relevance)
- personalizace řazení výsledkové množiny koncovým uživatelem (obor, úroveň)
- nastavitelné chování faset
- přímá integrace se čtenářským kontem v katalogu a nahrazení rozhraní katalogu
- nabídka dodání dokumentů
- deduplikace a seskupení výsledkové množiny
- spolupráce s doporučujícími službami
- spolupráce s citačními nástroji a podpora formátu RIS
- spolupráce se sociálními sítěmi
- viditelnost lokálních zdrojů na internetu
- jednotné přihlášení (SSO, shibboleth) v rámci dalších aplikací instituce

Pro efektivní činnost knihovny
- pokrytí vyhledávání v centrálním indexu
- statistiky a analytické údaje o chování uživatelů a používání systému
- existence dokumentovaného a otevřeného API rozhraní pro funkční rozšíření vlastními vývojovými pracovníky
- správa vlastních zdrojů (indexování a normalizace záznamů)
- provoz formou lokální instalace
- provoz formou služby
- pořizovací / roční cena
- nárůst roční ceny v dalších letech
- lokalizace a lokální technická podpora

Odkazy

Reference

↑ VOJNAR, Martin. Jak si vybrat vhodný discovery systém. Ikaros [online]. 2012, ročník 16, číslo 12 [cit. 2016-12-29]. urn:nbn:cz:ik-14003. ISSN 1212-5075. Dostupné z: http://ikaros.cz/node/14003
↑ ^2,00 ^2,01 ^2,02 ^2,03 ^2,04 ^2,05 ^2,06 ^2,07 ^2,08 ^2,09 ^2,10 COUFALOVÁ, Jindřiška; KOŠŤÁLOVÁ, Karolína; ŠŤASTNÁ, Petra. Zkušenosti služeb Národní knihovny s centrálními indexy a web-scale discovery systémy. Knihovna plus [online]. 2012, č. 1 [cit. 2016-12-29]. ISSN 1801-5948. Dostupný z WWW: <http://knihovna.nkp.cz/knihovnaplus121/coufal.htm
↑ ^3,0 ^3,1 ^3,2 KUČEROVÁ, Helena. Metavyhledávání a jeho typy: příspěvek k terminologické diskusi. Knihovna plus [online]. 2011, č. 2 [cit. 2016-12-29]. ISSN 1801-5948. Dostupný z: http://knihovna.nkp.cz/knihovnaplus112/kucer.htm

Použitá literatura

VOJNAR, Martin. Jak si vybrat vhodný discovery systém. Ikaros [online]. 2012, ročník 16, číslo 12 [cit. 2016-12-29]. urn:nbn:cz:ik-14003. ISSN 1212-5075. Dostupné z: http://ikaros.cz/node/14003
KUČEROVÁ, Helena. Metavyhledávání a jeho typy: příspěvek k terminologické diskusi. Knihovna plus [online]. 2011, č. 2 [cit. 2016-12-29]. ISSN 1801-5948. Dostupný z: http://knihovna.nkp.cz/knihovnaplus112/kucer.htm
KOLÍN, Adam. Využívanost discovery systému Summon v Národní lékařské knihovně – naše dvouleté zkušenosti s provozem služby. Lékařská knihovna [online]. 2016, roč. 21, č. 1-2 [cit. 2016-12-29]. ISSN 1804-2031. Dostupné z: https://casopis.nlk.cz/archiv/2016-21-1-2/vyuzivanost-discovery-systemu-summon-v-nlk/
COUFALOVÁ, Jindřiška; KOŠŤÁLOVÁ, Karolína; ŠŤASTNÁ, Petra. Zkušenosti služeb Národní knihovny s centrálními indexy a web-scale discovery systémy. Knihovna plus [online]. 2012, č. 1 [cit. 2016-12-29]. ISSN 1801-5948. Dostupný z WWW: <http://knihovna.nkp.cz/knihovnaplus121/coufal.htm>.

Externí odkazy

Související články

Zdroje obrázků

Kučerová, Helena. Metavyhledávání a jeho typy: příspěvek k terminologické diskusi. Knihovna plus [online]. 2011, č. 2 [cit. 2016-12-29]. ISSN 1801-5948. Dostupný z: http://knihovna.nkp.cz/knihovnaplus112/kucer.htm

Klíčová slova

centrální index (centralized index), jednotný index (unified single index), Národní knihovna ČR (National Library of the Czech Republic), integrace katalogu (collection integration), web-scale discovery, EBSCO Discovery Service, Primo Discovery and Delivery, lokální Primo index (local Primo index), Summon, WorldCat Local, česká článková databáze ANL+ (Czech article database ANL+), Jednotná informační brána (Uniform Information Gateway), modely vyhledávání informací (Information Retrieval Models), metavyhledávání (Metasearch), federativní vyhledávání (Federated Search)

[VOJNAR-1] VOJNAR, Martin. Jak si vybrat vhodný discovery systém. Ikaros [online]. 2012, ročník 16, číslo 12 [cit. 2016-12-29]. urn:nbn:cz:ik-14003. ISSN 1212-5075. Dostupné z: http://ikaros.cz/node/14003

[COUFALOV.C3.81-2] 2,00 ^2,01 ^2,02 ^2,03 ^2,04 ^2,05 ^2,06 ^2,07 ^2,08 ^2,09 ^2,10 COUFALOVÁ, Jindřiška; KOŠŤÁLOVÁ, Karolína; ŠŤASTNÁ, Petra. Zkušenosti služeb Národní knihovny s centrálními indexy a web-scale discovery systémy. Knihovna plus [online]. 2012, č. 1 [cit. 2016-12-29]. ISSN 1801-5948. Dostupný z WWW: <http://knihovna.nkp.cz/knihovnaplus121/coufal.htm

[KU.C4.8CEROV.C3.81-3] 3,0 ^3,1 ^3,2 KUČEROVÁ, Helena. Metavyhledávání a jeho typy: příspěvek k terminologické diskusi. Knihovna plus [online]. 2011, č. 2 [cit. 2016-12-29]. ISSN 1801-5948. Dostupný z: http://knihovna.nkp.cz/knihovnaplus112/kucer.htm

[1]

[2]

[3]