Pojednejte o vývoji a teorii vyhledávacích systémů typu OPAC z hlediska rešeršních technik a komunikace člověk-počítač.: Porovnání verzí

 
Řádek 112: Řádek 112:
 
Př.: television not cable bude obsahovat záznamy, v nichž je uvedeno slovo "television", ale ne ty, ve kterých je i slovo "cable".
 
Př.: television not cable bude obsahovat záznamy, v nichž je uvedeno slovo "television", ale ne ty, ve kterých je i slovo "cable".
  
'''Proximitní operátory'''<ref>Dostupné také z: http://eifl.nkp.cz/vyhl.htm</ref><br />
+
'''Proximitní operátory'''
 
 
 
Proximitní vyhledávání je způsob jak vyhledat dvě či více slov, která se vyskytují ve specifické skupině slov.
 
Proximitní vyhledávání je způsob jak vyhledat dvě či více slov, která se vyskytují ve specifické skupině slov.
 
Proximitní operátory jsou tvořeny písmenem (N nebo W) a číslem, které určuje počet slov.
 
Proximitní operátory jsou tvořeny písmenem (N nebo W) a číslem, které určuje počet slov.

Aktuální verze z 1. 2. 2017, 20:14

OPAC

(Online Public Access Catalogue) – veřejný online katalog dostupný uživatelům knihovny. Kromě vyhledávání zpřístupňuje také řadu dalších služeb – správu uživatelského konta, přístup k dalším informačním zdrojům atd.

Technologický vývoj se stále zlepšuje a zdokonaluje možnosti využítí služeb a přístupu k fondům knihoven. Rozvoj formátu MARC (USMARC, UNIMARC) zlepšuje obsah záznamů, přístup k záznamům a práci s nimi. Katalogy stále více usnadňují vyhledávání ve vzdálených bázích, rozšiřují a zvětšují přístup.

V současné době se rozvíjí 3. generace OPACů. Hlavním cílem je vyvinout jednotné rozhraní pro přístup k tradičním i digitálním informačním zdrojům knihoven.Velký vliv na jejich rozvoj má prostředí www. OPAC zprostředkovává informace uživatelům přímo v prostředí internetu. OPAC jako nástroj pro přístup ke knihovním fondům vychází z analýzy požadavků a chování uživatelů.

Důraz kladen na:
  • vyhledávání
  • zobrazení informací
  • možnost získat dokument.

Charakteristické vlastnosti jednotlivých generací OPAC katalogů:

[1]

OPAC 1. generace

  • vychází z klasického automatizovaného knihovnického systému
  • přístupné v rámci knihovní sítě
  • vyhledávání – příkazový jazyk

OPAC 2. generace

  • aplikace + databáze (aplikace pracují online nad databází knihovního systému)
  • vyhledávání - slova, slovní spojení; booleovské a proximitní operátory

OPAC 3. generace

  • hyperkatalogy
  • databáze oddělená od aplikace
  • vyhledávání – rozklad pojmů na podpojmy, vážení podpojmů, řazení dle míry relevance

Z uživatelského hlediska OPAC 3. generace:

  • jednoduché vyhledávací okno
  • lemmatizace
  • fasetové rozdělení
  • RSS
  • snadno čitelná adresa dokumentu
  • řazení dokumentů dle relevanceřazení dokumentů podle relevance
  • obohacování záznamů (tagy, obálky, obsahy…)
  • přímo dostupný plný text dokumentů
  • propojení se sociálními sítěmi a externími webovými stránkami

Online katalogy 1. generace byly často z hlediska manipulace posuzovány jako horší, než katalogy tradiční, lístkové či formou mikrofiší. Opakovaly stejné principy vyhledávání - přístup na základě porovnávání frází formulovaných a zapsaných uživatelem s frázemi uloženými v paměti počítače.

  • z hlediska uživatele byly obtížně srozumitelné, protože používaly speciální knihovnickou terminologii
  • neexistence selekčních údajů, tj. nemožnost vyhledat podle libovolného (klíčového) slova z názvu nebo předmětového hesla
  • nemožnost modifikace a opravy rešeršního dotazu po získání prvních rešeršních výsledků

Online katalogy 2. generace jsou spojením interaktivních katalogů 1. generace s komerčními vyhledávacími systémy. Vývoj nebyl jednotný, některé OPACy 1. generace postupně zařadily rešeršní techniky 2. generace, další typy OPAC byly koncipovány jako komerční systémy pro vyhledávání z databází. Mnoho katalogů 2. generace umožňovalo omezit vyhledávání na vyhledávání v požadovaných polích, provést zkrácení selekčních údajů, vykonat rešerše podle zkrácených slov a limitovat vyhledávání rokem vydání dokumentu, jazykem, typem dokumentu atp.

Z hlediska rešeršních technik kombinuje OPAC 2. generace přístup tradičních katalogů pro vyhledávání podle prekoordinovaných frází a volby z abecedních seznamů položek s přístupem vyhledávání podle klíčových slov podle booleovských operátorů. Mechanismus rešerše podle klíčových slov a frází je vždy jejich přesným porovnáváním, netolerují ani změny v pořadí slov. Důraz je proto kladen na dialog, respektive na organizaci dialogu. Využívá též metodu postkoordinované rešerše ve specifických polích jako částečnou kompenzaci absence abstrakt a textu.

Dialog člověk – počítač se více orientuje na laické uživatele, zahrnuje:

  • menu
  • zprávy
  • instrukce
  • návrhy

Inovace ve 3. generaci OPACů se týkala především v přesunutí dotazovacích technik více na systém, který uživateli pomáhá při formulaci kritérií rešeršního dotazu. Další priority pro zlepšení dialogu se týkaly slovníku (jazyku) uživatele systému a pomoci při orientaci v sémantickém kontextu prováděných rešerší. Při zkoumání užitečnosti různých prostředků se experimentálně potvrdila účinnost Deweyho desetinného třídění a jeho indexů. Systematický a kontextový přístup klasifikačního systému má lepší rešeršníí výsledky než kombinace pre- a postkoordinovaných tradičních rešeršních metod. Propojuje různé klasifikační třídy a oblasti, upřesňuje hierarchické schéma a plně využívá propojení ve struktuře fondu. V jiném experimentálním projektu byly zkoumány termíny používané uživateli z hlediska řízeného slovníku a přirozeného jazyka. Průnik termínů přirozeného jazyka odpovídajících řízenému slovníku byl velmi malý a ukázal na nezbytnost pomoci při výběru slovníku:

  • sémantické nástroje
  • usnadnění kontextové orientace
  • tezaury
  • slovníky a seznamy synonym

Příklady OPACů 3. generace

OPACů třetí, nové generace, je v současné době v provozu ve světových a již také českých knihovnách[2] velké množství. Existují komerční i open source řešení. Následují vybrané příklady systémů obou kategorií. [3]

Komerční OPACy 3. generace
  • AquaBrowser
  • Carmen
  • Encore
  • Primo
Open source OPACy 3. generace

Discovery systémy

Mezi OPACy nové generace jsou někdy řazeny také tzv. discovery systémy, např.:


využití techniky expertních systémů:

těžko se účinně aplikují na rozsáhlý multidisciplinární soubor OPAC, nicméně z jejich vývoje a využití prostředků pro konverzaci s uživatelem o předmětu rešerše lze vycházet při dalším vývoji a orientaci:

  • tezaury
  • sémantické pojmové sítě
  • fasetové třídění
  • klasifikace
  • proces heuristického výběru
  • reprezentace booleovských taktik
  • modelování uživatelů

Booleovské operátory

Booleovská logika definuje vazby mezi jednotlivými slovy ve vyhledávacím řetězci. Booleovské vyhledávací operátory AND, OR, NOT umožňují rozšíření či zúžení dotazu.[4]

  • Operátor AND znamená, že v záznamu musí být obsažena všechna slova uvedená v řetězci.

Př.: travel and Europe bude ve výsledku obsahovat články, v nichž se vyskytuje výraz "travel" a zároveň výraz "Europe".

  • Operátor OR znamená, že v záznamu bude nejméně jeden z požadovaných termínů.

Př.: college or university bude obsahovat záznamy, ve kterých se vyskytuje výraz "college" nebo "university", případně oba dva.

  • Operátor NOT vylučuje z vyhledávání slova, která by neměla být v záznamech obsažena.

Př.: television not cable bude obsahovat záznamy, v nichž je uvedeno slovo "television", ale ne ty, ve kterých je i slovo "cable".

Proximitní operátory Proximitní vyhledávání je způsob jak vyhledat dvě či více slov, která se vyskytují ve specifické skupině slov. Proximitní operátory jsou tvořeny písmenem (N nebo W) a číslem, které určuje počet slov. Proximitní operátor je umístěn mezi jednotlivá slova ve vyhledávacím řetězci.

Zúžení rešerše (Limiters)

  • Full Text - zúžení výsledných článků pouze na plné texty
  • Journal - název časopisu, ze kterého mají být výsledné články (napsat v odpovídajícím tvaru - např. Newsweek)
  • Scholarly (Peer Reviewed Journals) - omezení pouze na lektorované časopis
  • Date Published - zúžení výběru článků za konkrétní časové období (možno zadat měsíc a rok)
  • Publication Type - omezení podle typu publikace (např. periodika, noviny, knihy)
  • Document Type - zúžení podle druhu dokumentu (např. článek, recenze, případová studie, rozhovor, bibliografie)

Rozšíření rešerše (Expanders)

  • Also search within the full text of the articles - bude vyhledávat zadané slovo v plném textu článků, stejně jako v abstraktech
  • Automatically "And" search terms - automaticky přidává mezi zadané termíny operátor and bez nutnosti vypisovat ho do rešeršního dotazu
  • Also search for related words - zahrne do dotazu synonyma, množná čísla a další vztažné termíny k zadanému slovu


citace:

  1. ŠEVČÍKOVÁ, Barbora. Knihovny současnosti: Sborník z 18. konference, konané ve dnech 14.–16. zá ř í 2010 v Se č i u Chrudimi [online]. In: . 2010 [cit. 2017-01-19]. Dostupné z: <http://docplayer.cz/459984-Knihovny-soucasnosti.html/
  2. Dostupné také z: https://www.jcu.cz/o-univerzite/aktuality/akademicka-knihovna-spustila-ebsco-discovery-service
  3. Dostupné také z: https://wikisofia.cz/wiki/OPAC
  4. Dostupné také z: http://eifl.nkp.cz/vyhl.htm

použitá literatura:


http://uisk.ff.cuni.cz/wp-content/uploads/sites/62/2016/01/OPAC-Syst%C3%A9my-a-rozhran%C3%AD-a-jejich-v%C3%BDvoj-%C4%8D%C3%A1st-I._Huta%C5%99.pdf
KOVÁŘ, Blahoslav. Věcné pořádání informací a selekční jazyky. 1. Praha: UVTEI, 1981, s. 13.