Služby discovery systémů pro knihovny.

Discovery systémy pro knihovny by měly umožnit jednotné vyhledávání a dodávání dokumentů ze všech sbírek, ať už se jedná o fyzické fondy, digitální knihovny nebo elektronické informační zdroje.[1]

Web-scale discovery systémy umožňují knihovnám zajistit přístup k jejich sbírkám, zdrojům a službám za použití současných internetových technologií a konceptů. Tyto systémy mají podle Marshalla Breedinga čtyři charakteristické rysy (BREEDING, 2012)[2]

  • rozsáhlé technologické platformy (large-scale technology platforms),
  • aplikace doručované prostřednictvím multiuživatelského softwaru jako služby (applications delivered throught multitenent software as a service),
  • masivně agregovaný přístup k datům (massively aggregated approaches to data),
  • uspořádání charakterizované vysokou mírou spolupráce mezi zúčastněnými knihovnami (highly cooperative arrangements among participating libraries).

Sjednocení indexu a centrální vyhledávání

Tento model se osvědčil při konstrukci webových vyhledávačů. Ve sjednocování vyhledávacích komponent postupuje o další krok: místo nativních indexů jednotlivých zdrojů je vytvořen centrální index, který je prohledáván centrálním vyhledávacím strojem. Jak je ze schématu na obrázku 1 patrné, tento technologický model už se liší od vyhledávání v jednom zdroji pouze v jedné komponentě, kterou jsou distribuované samostatné heterogenní zdroje. Obdobně jako potřeboval centralizovaný vyhledávač konektory k prohledávaným zdrojům, potřebuje takové konektory centrální indexovač. Centrální index může být vytvořen dvěma způsoby: buď ho indexovač vygeneruje přímo z primárních dokumentů (tzv. sklizeň – harvesting nebo též prolézání – crawling zdrojů) a tím vlastně zopakuje aktivity, které už proběhly při tvorbě nativních indexů, nebo je možné převzít a sloučit už existující nativní indexy (tato operace bývá označována jako sklizeň metadat – metadata harvesting).[3]

Obrázek 1: Sjednocení indexu

Web scale discovery

Producenti softwaru nabízející tuto technologii knihovnám pro ni používají název discovery vyhledávání, případně obtížně přeložitelný novotvar web scale discovery. Discovery by bylo možné do češtiny přeložit jako objev, nález, ale i zpřístupnění. Web scale (doslova webový rozsah) poukazuje na podobnost s "google vyhledáváním" a na obrovské množství zdrojů, jež je možné do centrálního indexu zahrnout. Na rozdíl od tzv. katalogů nové generace, které používají technologii "discovery layer" k vytvoření jednotného indexu pro všechny lokálně vlastněné knihovní kolekce (navíc se jedná zpravidla pouze o strukturovaný index na monografické či seriálové bibliografické úrovni), web scale discovery umožňuje sjednotit index jak pro lokální, tak pro vzdálený obsah (např. pro licencované online databáze, ale i pro zdroje volně dostupné v prostředí Internetu), a to včetně indexace plných textů. Slovo scale navíc evokuje termín "scalability", tedy škálovatelnost neboli rozšiřitelnost.[3]

EBSCO Discovery Service

Jednou ze služeb typu discovery je EBSCO Discovery Service (EDS) od společnosti EBSCO Publishing. Vývoj tohoto produktu začal v roce 2008, v následujícím roce proběhlo testování a ke zprovoznění došlo začátkem roku 2010.[2]

EDS je z velké části postavena na infrastruktuře a rozhraní, které připomíná databázové rozhraní EBSCOhost. To se poprvé objevilo v roce 1994. Přístup do EDS je poskytován na hostitelské platformě.[2]

Základem pro vyhledávání je centrální index (uvádí se jako EDS Foundation Index nebo EDS Base Index, případně EDS Index). Tento index obsahuje metadata od desítek tisíc poskytovatelů obsahu (cca 20.000 producentů dat a 70.000 knižních vydavatelů), repozitáře typu open access (DOAJ, OAISTER, arXiv.org) a také různé lokální zdroje jednotlivých knihoven, tj. online katalogy knihoven, digitalizované sbírky či institucionální repozitáře. Zdroje mohou být založené na různých metadatových schématech (MARC, Dublin Core, XML či EAD). EDS pracuje s různými mechanizmy dodávání obsahu, ať už OAI-PMH nebo FTP. Nejsou stanoveny požadavky na minimální záznam. Metadata z integrovaných zdrojů jsou transformována do základního schématu EBSCOhost.[2]

Obrázek 2: Vstupní obrazovka EDS pro NK ČR

U zobrazených výsledků hledání lze zjistit, ze které z integrovaných databází záznam pochází. Centrální index tak má pro každou instituci vlastní nastavení, zohledňující její dostupné zdroje.[2]

Primo

Primo Discovery and Delivery (dále také jako Primo) funguje na principu dvou indexů, centrálního a lokálního. Údaje získané od primárních a sekundárních vydavatelů a agregátorů a informace z open access repozitářů jsou obsaženy v centrálním indexu nazývaném Primo Central. Tento index je vždy poskytován jako služba formou výpočetního oblaku. Primo Central se zaměřuje na vědecké publikace (časopisecké články, recenze, e-knihy, konferenční materiály, disertace) nabízené primárními a sekundárními vydavateli a agregátory.

ANL+

V českém prostředí zatím není k dispozici rozhraní Primo Discovery and Delivery v ostrém nasazení nad sbírkami jedné či více knihoven. S tvorbou lokálního indexu a jeho využití prostřednictvím Primo se můžeme setkat u projektu ANL+, který je součástí Jednotné informační brány, druhou variantou zpřístupnění je klasické rozhraní JIB, které využívá možnosti MetaLib (paralelní vyhledávání založení na federativním vyhledávání).[2]

ANL+ je experimentální zdroj poskytující informace o článcích publikovaných v českých novinách, časopisech a dalších pokračujících zdrojích od roku 2011. ANL+ navazuje na bázi ANL, kterou společně vytvářely od roku 1992 Národní knihovna České republiky, Moravská zemská knihovna v Brně, krajské knihovny a odborné knihovny.[2]

Index Primo Central

Kritéria fungování discovery systémů

Summon

WorldCat Local

Jsou rozdělena do dvou skupin: první se týká přímo koncových uživatelů a druhá je více relevantní pro provoz z pohledu knihovny.[3]

  • Pro koncové uživatele
    • nastavitelné řazení výsledkové množiny knihovnou (konfigurovatelná relevance)
    • personalizace řazení výsledkové množiny koncovým uživatelem (obor, úroveň)
    • nastavitelné chování faset
    • přímá integrace se čtenářským kontem v katalogu a nahrazení rozhraní katalogu
    • nabídka dodání dokumentů
    • deduplikace a seskupení výsledkové množiny
    • spolupráce s doporučujícími službami
    • spolupráce s citačními nástroji a podpora formátu RIS
    • spolupráce se sociálními sítěmi
    • viditelnost lokálních zdrojů na internetu
    • jednotné přihlášení (SSO, shibboleth) v rámci dalších aplikací instituce
  • Pro efektivní činnost knihovny
    • pokrytí vyhledávání v centrálním indexu
    • statistiky a analytické údaje o chování uživatelů a používání systému
    • existence dokumentovaného a otevřeného API rozhraní pro funkční rozšíření vlastními vývojovými pracovníky
    • správa vlastních zdrojů (indexování a normalizace záznamů)
    • provoz formou lokální instalace
    • provoz formou služby
    • pořizovací / roční cena
    • nárůst roční ceny v dalších letech
    • lokalizace a lokální technická podpora

Odkazy

Reference

  1. VOJNAR, Martin. Jak si vybrat vhodný discovery systém. Ikaros [online]. 2012, ročník 16, číslo 12 [cit. 2016-12-29]. urn:nbn:cz:ik-14003. ISSN 1212-5075. Dostupné z: http://ikaros.cz/node/14003
  2. 2,0 2,1 2,2 2,3 2,4 2,5 2,6 COUFALOVÁ, Jindřiška; KOŠŤÁLOVÁ, Karolína; ŠŤASTNÁ, Petra. Zkušenosti služeb Národní knihovny s centrálními indexy a web-scale discovery systémy. Knihovna plus [online]. 2012, č. 1 [cit. 2016-12-29]. ISSN 1801-5948. Dostupný z WWW: <http://knihovna.nkp.cz/knihovnaplus121/coufal.htm
  3. 3,0 3,1 3,2 KUČEROVÁ, Helena. Metavyhledávání a jeho typy: příspěvek k terminologické diskusi. Knihovna plus [online]. 2011, č. 2 [cit. 2016-12-29]. ISSN 1801-5948. Dostupný z: http://knihovna.nkp.cz/knihovnaplus112/kucer.htm

Použitá literatura

Externí odkazy

Související články

  • [[]]

Zdroje obrázků

Klíčová slova

centrální index (centralized index), jednotný index (unified single index), Národní knihovna ČR (National Library of the Czech Republic), integrace katalogu (collection integration), web-scale discovery, EBSCO Discovery Service, Primo Discovery and Delivery, lokální Primo index (local Primo index), Summon, WorldCat Local, česká článková databáze ANL+ (Czech article database ANL+), Jednotná informační brána (Uniform Information Gateway), modely vyhledávání informací (Information Retrieval Models), metavyhledávání (Metasearch), federativní vyhledávání (Federated Search)