Systémy organizace informací a znalostí: Porovnání verzí

Řádek 23: Řádek 23:
 
* uživatelský komfort - optimální přístupové body, podpora při vyhledávání<br />
 
* uživatelský komfort - optimální přístupové body, podpora při vyhledávání<br />
 
== '''Struktura systému organizace znalostí''' ==
 
== '''Struktura systému organizace znalostí''' ==
* Deskriptory - Lexikální jednotka tezauru užívaná při indexaci k označení určitého pojmu v dokumentu nebo rešeršním požadavku. Vyjadřuje sémantickou dominantu zastupující celou třídu podmíněné ekvivalence: ostatní podmíněně ekvivalentní slova a slovní spojení označovaná jako synonyma a kvazisynonyma se považují za nedeskriptory a jsou odkázány na deskriptory. Deskriptory spolu s nedeskriptory tvoří lexikum tezauru.<ref>Balíková, Marie. deskriptor. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-28]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001515&local_base=KTD.</ref>
+
Základní '''prvky''' struktury systému organizace znalostí jsou slova (termíny), která vyjadřují pojmy, jejichž význam je definován v řízeném slovníku.<br />
* Nedeskriptory - Lexikální jednotka tezauru, která je tvořena synonymem nebo jiným ekvivalentem termínu zařazeného jako deskriptor. Nedeskriptor se nepoužívá pro indexaci, slouží pouze jako uživatelský vstup do tezauru odkazující prostřednictvím vztahu ekvivalence k příslušnému deskriptoru.<ref>Balíková, Marie. nedeskriptor. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-28]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001581&local_base=KTD.</ref>
+
 
* Prvky -
+
V současné době, kdy je základním trendem směřování k propojeným datům v sémantickém webu, vyjadřujeme  strukturu systému organizace znalostí  jazykem RDF. Jádrem RDF jsou tvrzení  tvořená  trojicemi '''subjekt'''(podmět) – '''predikát/vlastnost'''(přísudek/atribut) – '''objekt'''(předmět)<br />
* Vztahy -
 
* Funkce<br />
 
  
 
== '''Základní typy jazykových vztahů''' ==
 
== '''Základní typy jazykových vztahů''' ==

Verze z 28. 5. 2018, 09:20

Stránka ve výstavbě
Inkwell icon - Noun Project 2512.svg Na této stránce se právě pracuje. Prosím needitujte tuto stránku, dokud na ní zůstává tato šablona. Předejdete tak editačnímu konfliktu. Prosím dodržte lhůtu pěti dnů od doby, kdy byla tato zpráva vložena (přesné datum vyhledejte v historii). Poté neváhejte šablonu odstranit. Inkwell icon - Noun Project 2512.svg

Systém organizace znalostí (Knowledge Organization System)

Termín "systém organizace znalostí" (knowledge organization system) se začal objevovat v 90. letech 20 stoeltí. V červnu 1998 bylo v Pittsbughu ustavující setkání Pracovní skupiny pro síťově propojené systémy organizace znalostí, které bylo pořádané v rámci konference ACM Digital Libraries '98. Podle G. Hodgeové byt tento termín vytvořen právě na tomto setkání.[1]

Systém organizace znalostí - schéma, modelující strukturu (tj. prvky a vzájemné vztahy) organizované množiny znalostí. Funkcí systému organizace znalostí je podpora procesů organizace znalostí a přístupu ke znalostem. Základním strukturním prvkem systému organizace znalostí je pojem. Jádrem fyzické reprezentace každého systému organizace znalostí je slovník, tj. formální vyjádření pojmů. Ten je používán pro vyjádření jak sémantiky, tak syntaxe organizovaného celku, případně i pravidel určujících používání struktury.[2]


Organizace znalostí

Organizace a reprezentace zaznamenaných znalostí s cílem zajistit efektivní využívání údajů, informací a poznatků obsažených v informačních zdrojích. Pořádání informací zahrnuje vytváření organizovaných souborů identifikačních a obsahových informací získaných informační analýzou dokumentu podle předem stanoveného systému. Podle typu vstupních informací se vyčleňuje identifikační pořádání informací a věcné pořádání informací.[3]

Identifikační pořádání informací proces pořádání informací, při kterém jsou informace získané identifikační analýzou dokumentu pořádány podle identifikačních údajů (autor, název dokumentu, korporace odpovědná za obsah dokumentu).

Věcné pořádání informací specifický proces pořádání informací, při kterém jsou informace získané obsahovou analýzou dokumentu vyjádřeny pořádacími znaky věcných selekčních jazyků. Podle typu pořádacích znaků a principu organizace informací se vyčleňuje předmětové a systematické pořádání informací.[4] Předmětové pořádání informací - druh věcného pořádání informací, při kterém je obsah dokumentu vyjádřen pomocí abecedně uspořádaných hesel, popř. lexikálních jednotek.[5] Systematické pořádání informací - věcné pořádání informací realizované prostřednictvím systematického selekčního jazyka.[6]

Požadavky na systém organizace znalostí

  • sémantická síla - přesnost a úplnost vyjádření obsahu zdroje i dotau
  • flexibilita, expanzívnost
  • interoperabilita - struktury, syntaxe, sémantiky, různé obory, různá prostředí (web, OPAC)
  • jednoduchá struktura - jednoduché používání, správa a údržba
  • uživatelský komfort - optimální přístupové body, podpora při vyhledávání

Struktura systému organizace znalostí

Základní prvky struktury systému organizace znalostí jsou slova (termíny), která vyjadřují pojmy, jejichž význam je definován v řízeném slovníku.

V současné době, kdy je základním trendem směřování k propojeným datům v sémantickém webu, vyjadřujeme strukturu systému organizace znalostí jazykem RDF. Jádrem RDF jsou tvrzení tvořená trojicemi subjekt(podmět) – predikát/vlastnost(přísudek/atribut) – objekt(předmět)

Základní typy jazykových vztahů


  • Paradigmatické vztahy - vztahy, jejichž význam je relativně nezávislý na kontextu. Slouží ke konstrukci zobecněných, vícenásobně použitelných sémantických systémů (například tezaurů), tím že jazykovými prostředky vyjadřují vztahy jednotek obsahu.[7]
Vztah ekvikalence - formální vztah, kde různé pojmy jsou vyjádřeny stejným preferovaným termínem nebo symbolem třídy.[8](synonymie x homonymie)
Hierarchický vztah - formální vztah mezi dvěma entitami (termíny, třídami), kde jedna je podřízena druhé.[9] (generická x partitivní x instanční)
Vztah asociace - reciproční sémantický vztah mezi lexikálními jednotkami, které nejsou členy stejné třídy ekvivalence a mezi kterými nelze definovat hierarchický vztah, avšak funkční, formální, prostorová nebo časová souvislost mezi nimi je natolik závažná, že je účelné pro potřeby vyhledávání jejich vzájemnou vazbu vyjádřit.[10]


  • Syntadigmatické vztahy - vztahy mezi větším množstvím prvků jazyka v konkrétním výrazu (například ve větě). Slouží ke konstrukci jedinečných, ad hoc systémů, jejichž význam se mění podle toho, v jakém kontextu jsou prvky jazyka použity.[11]


Obsahová analýza


Obsahová analýza se zaměřuje na určení jednotek obsahu. Cílem je vyjádřit smysl sdělení obsaženého v informačním zdroji, typicky prostřednictvím nějakých jazykových výrazů.[12]

Indexace - proces vyjádření obsahu dokumentu pomocí prvků selekčního jazyka, obvykle s cílem umožnit zpětné vyhledávání. Podle použitých metod se rozlišuje pojmová a slovní indexace, podle použitých postupů se rozlišuje intelektuální, automatická a poloautomatická indexace. Z hlediska použitých selekčních jazyků se rozlišuje prekoordinovaná indexace a postkoordinovaná indexace.[13]

Typy indexace

Podle postupů:

  • intelektuální indexace - proces indexace realizovaný lidmi (indexátory).
  • automatická indexace - proces indexace realizovaný pomocí automatických postupů ve všech jeho fázích, tj. při výběru relevantních výrazů z textu v přirozeném jazyce a přiřazování termínů řízeného slovníku.[14]
  • poloautomatická indexace - Proces indexace spočívající v kombinaci automatických a intelektuálních postupů.[15]

Podle použitých selekčních jazyků:

  • Prekoordinovaná indexace - indexace dokumentů, při které je uspořádání termínů nebo třídicích znaků dáno selekčním jazykem.[16]
  • Postkoordinovaná indexace - indexace bez předem stanoveného uspořádání lexikálních jednotek nebo klasifikačních znaků obsažených v selekčním obrazu dokumentu. Ke koordinaci (kombinaci) lexikálních jednotek dochází až při vyhledávání.[17]

Pracovní postup popisování, nebo identifikace dokumentu ve vztahu na jeho věcný obsaha:

  1. analýza dokumentu a určení věcného obsahu
  2. identifikace hlavních pojmů
  3. vyjádření těchto pojmů lexikálními jednotkami selekčního jazyka

Sémantický web


Sémantický web - je rozšířením současného webu, v němž informace mají přidělen dobře definovaný význam, který počítačům a lidem umožňuje lépe spolupracovat. Sémantický web představuje reprezentaci dat na webu. Je založen na technologii Resource Description Framework (RDF), která integruje širokou škálu aplikací využívajících syntaktický zápis v XML a identifikátory URI pro pojmenovávání[18]
Propojená data - je název metodiky pro publikování strukturovaných dat způsobem, který umožní jejich vzájemné propojování a opakované využití v rámci sémantického dotazování.
RDF(Resource Description Framework) - standard, který poskytuje jednoduchý model pro popis webových zdrojů.

ISO NORMY


České normy
ČSN ISO 5963 - Dokumentace. Metody analýzy dokumentů, určování jejich obsahu a výběru lexikálních jednotek selekčního jazyka
ČSN ISO 214 - Dokumentace. Abstrakty pro publikace a dokumentaci
ČSN ISO 1087-1 - Terminologická práce - Slovník - Část1: Teorie a aplikace
ČSN ISO 704 - Terminologická práce: principy a metody
ČSN ISO 999 - Informace a dokumentace. Zásady zpracování, uspořádání a grafické úpravy rejstříků

Mezinárodní normy
ISO 25964-1 - Information and documentation - Thesauri and interoperability with others vocabularies (Part 1: Thesauri for information retrieval)
ISO 25964-2 - Information and documentation - Thesauri and interoperability with others vocabularies (Part 2: Interoperability with other vocabularies)

Využití systémů organizace znalostí


Příklady z různých oborů



Reference

  1. BRATKOVÁ, Eva; KUČEROVÁ, Helena. Systémy organizace znalostí a jejich typologie. Knihovna [online]. 2014, roč. 25, č. 2, s. 5-29 [cit. 2018-05-10]. Dostupný z WWW: <http://knihovna.nkp.cz/knihovna142/142005.htm>. ISSN 1801-3252
  2. KUČEROVÁ, Helena. Systém organizace znalostí. Praha: Národní knihovna ČR, 2003. Dostupné také z: http://aleph.nkp.cz/F/?func=direct
  3. BALÍKOVÁ, Marie. pořádání informací. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-07]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001604&local_base=KTD.
  4. Balíková, Marie. věcné pořádání informací. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-10]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001658&local_base=KTD.
  5. Balíková, Marie. předmětové pořádání informací. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-10]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001616&local_base=KTD.
  6. Balíková, Marie. systematické pořádání informací. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-10]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001645&local_base=KTD.
  7. KUČEROVÁ, Helena. Organizace znalostí: klíčová témata. Praha: Karolinum, 2017. ISBN 978-80-246-3587-3
  8. Balíková, Marie. vztah ekvivalence. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-17]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001664&local_base=KTD.
  9. Balíková, Marie. hierarchický vztah. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-17]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001540&local_base=KTD.
  10. Balíková, Marie. asociativní vztah. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-17]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001504&local_base=KTD.
  11. name="Kucerova"
  12. name="Kucerova"
  13. Balíková, Marie. indexace. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-17]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001549&local_base=KTD.
  14. Balíková, Marie. automatická indexace. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-17]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001507&local_base=KTD.
  15. Balíková, Marie. poloautomatická indexace. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-17]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001596&local_base=KTD.
  16. Balíková, Marie. prekoordinovaná indexace. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-17]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001609&local_base=KTD.
  17. Balíková, Marie. postkoordinovaná indexace. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2018-05-17]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001605&local_base=KTD.
  18. MATULÍK, Petr, PITNER, Tomáš. Sémantický web a jeho technologie. Zpravodaj ÚVT MU. 2004, roč. XIV,, č. 3, s. 15-17. Dostupný z WWW: <http://www.ics.muni.cz/zpravodaj/articles/296.html>. ISSN 1212-0901