Systémy organizace informací a znalostí: Porovnání verzí
Řádek 7: | Řádek 7: | ||
=== '''Požadavky na systém organizace znalostí''' === | === '''Požadavky na systém organizace znalostí''' === | ||
− | * sémantická síla - přesnost a úplnost vyjádření obsahu zdroje i | + | * sémantická síla - přesnost a úplnost vyjádření obsahu zdroje i dotazu |
* flexibilita, expanzivnost | * flexibilita, expanzivnost | ||
* interoperabilita - struktury, syntaxe, sémantiky, různé obory, různá prostředí (web, OPAC) | * interoperabilita - struktury, syntaxe, sémantiky, různé obory, různá prostředí (web, OPAC) |
Aktuální verze z 5. 6. 2018, 08:07
Termín "systém organizace znalostí" (knowledge organization system) se začal objevovat v 90. letech 20 století. V červnu 1998 bylo v Pittsburghu ustavující setkání Pracovní skupiny pro síťově propojené systémy organizace znalostí, které bylo pořádané v rámci konference ACM Digital Libraries '98. Podle G. Hodgeové byl tento termín vytvořen právě na tomto setkání.[1]
Systém organizace znalostí - schéma, modelující strukturu (tj. prvky a vzájemné vztahy) organizované množiny znalostí. Funkcí systému organizace znalostí je podpora procesů organizace znalostí a přístupu ke znalostem. Základním strukturním prvkem systému organizace znalostí je pojem. Jádrem fyzické reprezentace každého systému organizace znalostí je slovník, tj. formální vyjádření pojmů. Ten je používán pro vyjádření jak sémantiky, tak syntaxe organizovaného celku, případně i pravidel určujících používání struktury.[2]
Obsah
Organizace znalostí
Organizace a reprezentace zaznamenaných znalostí s cílem zajistit efektivní využívání údajů, informací a poznatků obsažených v informačních zdrojích. Pořádání informací zahrnuje vytváření organizovaných souborů identifikačních a obsahových informací získaných informační analýzou dokumentu podle předem stanoveného systému. Podle typu vstupních informací se vyčleňuje identifikační pořádání informací a věcné pořádání informací.[3]
Požadavky na systém organizace znalostí
- sémantická síla - přesnost a úplnost vyjádření obsahu zdroje i dotazu
- flexibilita, expanzivnost
- interoperabilita - struktury, syntaxe, sémantiky, různé obory, různá prostředí (web, OPAC)
- jednoduchá struktura - jednoduché používání, správa a údržba
- uživatelský komfort - optimální přístupové body, podpora při vyhledávání
Struktura systému organizace znalostí
Základní prvky struktury systému organizace znalostí jsou slova (termíny), která vyjadřují pojmy, jejichž význam je definován v řízeném slovníku.
V současné době, kdy je základním trendem směřování k propojeným datům v sémantickém webu, vyjadřujeme strukturu systému organizace znalostí jazykem RDF. Jádrem RDF jsou tvrzení tvořená trojicemi subjekt(podmět) – predikát/vlastnost(přísudek/atribut) – objekt(předmět)
Dalšími strukturálními prvky systému organizace znalostí jsou hierarchie vlastností a hierarchie vztahů. Termíny (slova) jež vyjadřují prvky těchto tří klasifikací (věci, vlastnosti věcí, vztahy věcí) lze navzájem libovolně kombinovat do trojic RDF.[1]
Vztahy v organizaci informací a znalostí
Vztahy v organizaci informací a znalostí umožňují strukturování, reprezentují status quo, ale dovolují i jeho změny.
Formální vlastnosti vztahů
Formální vyjádření vztahů tvoří tři komponenty.
- samotný vztah, nebo spojení
- účastník, věc, nebo entita ve vztahu
- role účastníka ve vztahu
Formální vlastnosti vztahů se týkají některého z těchto komponentů, nebo jejich kombinací.[4]
Symetrie vztahu - pokud jsou role entit zúčastněných ve vztahu stejné, jedná se o symetrický vztah, pokud jsou role různé, jde o vztah asymetrický
Směr vztahu - můžeme rozlišit vztahy jednosměrné a obousměrné
Stupeň vztahu - označuje počet entit, které do vztahu vstupují
Násobnost vztahu - označuje počet prvnků ve smyslu instancí či individuí dané třídy
Reflexivita vztahu - označuje vztah entity s ní samou
Tranzitivita vztahu - označuje přenositelnost vztahu
Dynamika vztahu - označuje interaktivitu vztahu (zda umožňuje komunikaci a interakci účastníků)
Všechny uvedené formální vlastnosti lze vzájemně kombinovat.[4]
Základní typy jazykových vztahů
- Paradigmatické vztahy - vztahy, jejichž význam je relativně nezávislý na kontextu. Slouží ke konstrukci zobecněných, vícenásobně použitelných sémantických systémů (například tezaurů), tím, že jazykovými prostředky vyjadřují vztahy jednotek obsahu.[4]
- Vztah ekvikalence - formální vztah, kde různé pojmy jsou vyjádřeny stejným preferovaným termínem nebo symbolem třídy.[5](synonymie x homonymie)
- Hierarchický vztah - formální vztah mezi dvěma entitami (termíny, třídami), kde jedna je podřízena druhé.[6] (generická x partitivní x instanční)
- Vztah asociace - reciproční sémantický vztah mezi lexikálními jednotkami, které nejsou členy stejné třídy ekvivalence a mezi kterými nelze definovat hierarchický vztah, avšak funkční, formální, prostorová nebo časová souvislost mezi nimi je natolik závažná, že je účelné pro potřeby vyhledávání jejich vzájemnou vazbu vyjádřit.[7]
- Syntadigmatické vztahy - vztahy mezi větším množstvím prvků jazyka v konkrétním výrazu (například ve větě). Slouží ke konstrukci jedinečných, ad hoc systémů, jejichž význam se mění podle toho, v jakém kontextu jsou prvky jazyka použity.[4]
Obsahová analýza
Obsahová analýza se zaměřuje na určení jednotek obsahu. Cílem je vyjádřit smysl sdělení obsaženého v informačním zdroji, typicky prostřednictvím nějakých jazykových výrazů.[4]
Indexace - proces vyjádření obsahu dokumentu pomocí prvků selekčního jazyka, obvykle s cílem umožnit zpětné vyhledávání. Podle použitých metod se rozlišuje pojmová a slovní indexace, podle použitých postupů se rozlišuje intelektuální, automatická a poloautomatická indexace. Z hlediska použitých selekčních jazyků se rozlišuje prekoordinovaná indexace a postkoordinovaná indexace.[8]
Typy indexace
Podle postupů:
- intelektuální indexace - proces indexace realizovaný lidmi (indexátory).
- automatická indexace - proces indexace realizovaný pomocí automatických postupů ve všech jeho fázích, tj. při výběru relevantních výrazů z textu v přirozeném jazyce a přiřazování termínů řízeného slovníku.[9]
- poloautomatická indexace - Proces indexace spočívající v kombinaci automatických a intelektuálních postupů.[10]
Podle použitých selekčních jazyků:
- Prekoordinovaná indexace - indexace dokumentů, při které je uspořádání termínů nebo třídicích znaků dáno selekčním jazykem.[11]
- Postkoordinovaná indexace - indexace bez předem stanoveného uspořádání lexikálních jednotek nebo klasifikačních znaků obsažených v selekčním obrazu dokumentu. Ke koordinaci (kombinaci) lexikálních jednotek dochází až při vyhledávání.[12]
Pracovní postup popisování nebo identifikace dokumentu ve vztahu k jeho věcnému obsahu:
- analýza dokumentu a určení věcného obsahu
- identifikace hlavních pojmů
- vyjádření těchto pojmů lexikálními jednotkami selekčního jazyka
Sémantický web
Sémantický web - je rozšířením současného webu, v němž informace mají přidělený dobře definovaný význam, který počítačům a lidem umožňuje lépe spolupracovat. Sémantický web představuje reprezentaci dat na webu. Je založen na technologii Resource Description Framework (RDF), která integruje širokou škálu aplikací využívajících syntaktický zápis v XML a identifikátory URI pro pojmenovávání.[13]
Propojená data - je název metodiky pro publikování strukturovaných dat způsobem, který umožní jejich vzájemné propojování a opakované využití v rámci sémantického dotazování.
RDF(Resource Description Framework) - standard, který poskytuje jednoduchý model pro popis webových zdrojů.
ISO NORMY
České normy
ČSN ISO 5963 - Dokumentace. Metody analýzy dokumentů, určování jejich obsahu a výběru lexikálních jednotek selekčního jazyka
ČSN ISO 214 - Dokumentace. Abstrakty pro publikace a dokumentaci
ČSN ISO 1087-1 - Terminologická práce - Slovník - Část1: Teorie a aplikace
ČSN ISO 704 - Terminologická práce: principy a metody
ČSN ISO 999 - Informace a dokumentace. Zásady zpracování, uspořádání a grafické úpravy rejstříků
Mezinárodní normy
ISO 25964-1 - Information and documentation - Thesauri and interoperability with others vocabularies (Part 1: Thesauri for information retrieval)
ISO 25964-2 - Information and documentation - Thesauri and interoperability with others vocabularies (Part 2: Interoperability with other vocabularies)
Využití systémů organizace znalostí
Příklady systémů organizace znalostí:
- Mezinárodní desetinné třídění (MDT)
- Deweyho desetinné třídění
- Soubor národních autorit ČR
- Library of Congress Subject Headings
Odkazy
Reference
- ↑ 1,0 1,1 BRATKOVÁ, Eva; KUČEROVÁ, Helena. Systémy organizace znalostí a jejich typologie. Knihovna [online]. 2014, roč. 25, č. 2, s. 5-29 [cit. 2018-05-10]. Dostupný z WWW: <http://knihovna.nkp.cz/knihovna142/142005.htm>. ISSN 1801-3252
- ↑ KUČEROVÁ, Helena. systém organizace znalostí. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-29]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000016487&local_base=KTD.
- ↑ BALÍKOVÁ, Marie. pořádání informací. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-07]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001604&local_base=KTD.
- ↑ 4,0 4,1 4,2 4,3 4,4 KUČEROVÁ, Helena. Organizace znalostí: klíčová témata. První vydání. Praha: Univerzita Karlova, nakladatelství Karolinum, 2017. 269 stran. ISBN 978-80-246-3587-3.
- ↑ BALÍKOVÁ, Marie. vztah ekvivalence. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-17]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001664&local_base=KTD.
- ↑ BALÍKOVÁ, Marie. hierarchický vztah. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-17]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001540&local_base=KTD.
- ↑ BALÍKOVÁ, Marie. asociativní vztah. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-17]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001504&local_base=KTD.
- ↑ BALÍKOVÁ, Marie. indexace. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-17]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001549&local_base=KTD.
- ↑ BALÍKOVÁ, Marie. automatická indexace. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-17]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001507&local_base=KTD.
- ↑ BALÍKOVÁ, Marie. poloautomatická indexace. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-17]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001596&local_base=KTD.
- ↑ BALÍKOVÁ, Marie. prekoordinovaná indexace. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-17]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001609&local_base=KTD.
- ↑ BALÍKOVÁ, Marie. postkoordinovaná indexace. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-17]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001605&local_base=KTD.
- ↑ MATULÍK, Petr, PITNER, Tomáš. Sémantický web a jeho technologie. Zpravodaj ÚVT MU. 2004, roč. XIV,, č. 3, s. 15-17. Dostupný z WWW: <http://www.ics.muni.cz/zpravodaj/articles/296.html>. ISSN 1212-0901
Doporučená literatura
BRATKOVÁ, Eva; KUČEROVÁ, Helena. Systémy organizace znalostí a jejich typologie. Knihovna [online]. 2014, roč. 25, č. 2, s. 5-29 [cit. 2018-05-10]. Dostupný z WWW: <http://knihovna.nkp.cz/knihovna142/142005.htm>. ISSN 1801-3252
KUČEROVÁ, Helena. Organizace znalostí: klíčová témata. První vydání. Praha: Univerzita Karlova, nakladatelství Karolinum, 2017. 269 stran. ISBN 978-80-246-3587-3
Související články
- Systémy pořádání informací a znalostí
- Vztahy mezi prvky jazyka
- Automatická indexace
- Výhody a úskalí základních typů indexace