Výhody a úskalí základních typů indexace
Indexace (též indexování) v relačních databázových systémech znamená „automatické vybrání všech hodnot předem určených položek (…) z databázové tabulky a jejich setřídění do indexového souboru“.[1] V textových databázích při indexaci vybíráme jen slova nebo výrazy, podle kterých lze záznam vyhledat, nikoliv celé hodnoty textových položek. Česká terminologická databáze knihovnictví a informační vědy definuje pojem indexace jako „proces vyjádření obsahu dokumentu pomocí prvků selekčního jazyka, obvykle s cílem umožnit zpětné vyhledávání“. S touto definicí se takřka shoduje i Petr Strossa, který vysvětluje termín indexace jako proces, během kterého dochází k „přiřazení selekčních obrazů dokumentům nebo dotazům“.[1]
Obsah
Rozdělení indexace
Indexace se rozlišuje podle použitých metod na pojmovou a slovní indexaci. Podle použitých postupů se indexace dělí na intelektuální, automatickou a poloautomatickou.[2]
Automatická indexace
Od 90. let minulého století se stále častěji setkáváme s automatickou indexací. Jde o proces, při kterém se využívá umělá inteligence neboli počítačové programy, aby rozpoznali v textu relevantní pojmy, které charakterizují dokument. Indexaci, kterou provádí odborný pracovník (tzv. indexátor), předčí v mnohém – zejména je levnější a rychlejší. Přestože se vývoj programů pro automatickou indexaci pohybuje rychle vpřed, vývojáři se stále potýkají s řadou problémů.
Intelektuální indexace
Problémům, se kterými se indexátoři setkávají při automatické indexaci, se lze do jisté míry vyhnout využitím intelektuální indexace. Proces je to sice časově i finančně náročnější a zvládne se většinou zpracovat mnohem menší množství textu, za to ale z hlediska kvality jde přesnější formu indexace. Největší výhodou odborníka indexátora je, že dovede text interpretovat v kontextu, a tím dokáže předejít lingvistickým problémům, s kterými se potýkáme při automatické indexaci.[3]
Odkazy
Reference
- ↑ 1,0 1,1 STROSSA, Petr. Vybrané kapitoly z počítačového zpracování přirozeného jazyka. Opava: Slezská univerzita, 1999. ISBN 8072480413.
- ↑ BALÍKOVÁ, Marie. Indexace. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2016-05-25]. Dostupné z:http://aleph.nkp.cz/F/?func=direct&doc_number=000001549&local_base=KTD.
- ↑ BLAŽEK, Jakub. 2008. Srovnání automatické a intelektuální indexace. Inflow: information journal [online]. 1(4) [cit. 2016-05-25]. Dostupné z: http://www.inflow.cz/srovnani-automaticke-intelektualni-indexace
Použitá literatura
- BRATKOVÁ, Eva. Digitální knihovny ve vědě a technice: Poznámky z přednášky. ZS 2015/2016. UISK, FF, UK.
- KOVÁŘ, Blahoslav. 1981. Věcné pořádání informací a selekční jazyky. Praha: Ústředí vědeckých, technických a ekonomických informací. Učební texty UVTEI.
- KOVÁŘ, Blahoslav. 1982. Věcné pořádání informací a selekční jazyky. Praha: Ústředí vědeckých, technických a ekonomických informací. Učební texty UVTEI.
- SCHWARZ, Josef. 2008. Současný stav a trendy automatické indexace dokumentů. Ikaros [online]. 7(3) [cit. 2016-05-27]. Dostupné z: http://ikaros.cz/soucasny-stav-a-trendy-automaticke-indexace-dokumentu