Stránka ve výstavbě
Inkwell icon - Noun Project 2512.svg Na této stránce se právě pracuje. Prosím needitujte tuto stránku, dokud na ní zůstává tato šablona. Předejdete tak editačnímu konfliktu. Jestliže uběhla od poslední editace doba alespoň dvou dnů, neváhejte tuto šablonu odstranit. Inkwell icon - Noun Project 2512.svg

Definice

Definice České terminologické databáze knihovnictví a informační vědy (TDKIV) vychází normativního terminologického zdroje, podle kterého je to "analýza dokumentu, která má stanovit jeho obsahové prvky a jejich vzájemné vztahy[1] Dalším výkladovým zdrojem byl Terminologický slovník knihovnický a bibliografický Hany Vodičkové a Jiřího Cejpka[2]. Databází TDKIV je ve výsledku obsahová analýza představena jako: "analýza obsahu dokumentu zahrnující metody a pravidla pro stanovení tematiky dokumentu, příp. časového a prostorového hlediska, čtenářského určení a formy dokumentu. Slovní vyjádření obsahu dokumentu v přirozeném jazyce je transformováno do věcných selekčních údajů v procesu věcného pořádání nebo do vět v procesu sémantické redukce textu dokumentu"[3].

Obsahová analýza jako druh informační analýzy

Obsahová analýza je Blahoslavem Kovářem charakterizována jako jeden ze dvou druhů informační analýzy. Výsledkem informační analýzy je množina slov přirozeného jazyka, které můžeme rozdělit na identifikační a obsahové (tematické) údaje představující obraz (profil) dokumentu. Identifikační analýza vychází z identifikačních údajů. Obsahová analýza vychází z obsahových (tematických) údajů a je nezbytnou podmínkou a základem věcného pořádání informací[4].

Metody a techniky obsahové analýzy

Norma ČSN ISO 5963 (01 0174)

Norma ČSN ISO 5963 (01 0174) Dokumentace. Metody analýzy dokumentů, určování jejich obsahu a výběru lexikálních jednotek selekčního jazyka je obdobou mezinárodní normy ISO 5963. Tato norma popisuje doporučené obecné metody analýzy dokumentů a slouží jako pomůcka indexátorům. Tvůrci normy připomínají, že norma není aplikovatelná v systémech automatického indexování. Zaměřuje se na úvodní fáze indexování a neřeší konkrétní postupy jednotlivých systémů indexování. Vyjadřuje se k určování obsahu pri analýze dokumentu, identifikaci hlavních pojmů a k vyjádření těchto pojmů lexikálními jednotkami selekčního jazyka[5]:

  • Analýza dokumentu - Norma se zvlášť zmiňuje dva základní fyzické formy dokumentů, kterými jsou tištěné a netištěné (audiovizuální, vizuální a zvukové) dokumenty. Podrobněji se k jako typickým dokumentům knihoven a informačních pracovišť vyjadřuje k tištěným dokumentům. Pro správné porozumění je důležité posouzení všech důležitých částí dokumentům. Dle normy by měla být zvláštní pozornost věnována následujícím položkám:
  • název,
  • referát, byl-li zpracován,
  • obsah,
  • úvod, úvodní věty kapitol nebo odstavců a závěr,
  • ilustrace, diagramy, tabulky a jejich popisy,
  • slova nebo skupiny slov, které jsou podtrženy nebo tištěny neobvyklým typem písma.
  • Identifikace pojmů - Sledují se pojmy, které tvoří podstatu popisu předmětu dokumentu. Norma nabízí jako příklady obecné faktory, které by měla jednotlivá pracoviště dle svých priorit sledovat:
  • Zabývá se dokument předmětem nějaké činnoti?
  • Obsahuje předmět nějaký činný pojem (např. činnost, operace, proces)?
  • Je předmět činnosti identifikován?
  • Zabává se dokument nositelem činnosti?
  • Odkazuje se na zvláštní prostředky k provádění činnosti (nástroje, techniky nebo metody)?
  • Byly tyto faktory hodnoceny v kontextu konkrétního umístění nebo prostředí?
  • Jsou stanoveny nějaké závislé nebo nezávislé proměnné?
  • Bylo o tématu pojednáno z nějakého speciálního hlediska, které se obvykle nespojuje s oborem výzkumu?
Počet indexovaných pojmů souvisí se sledovaným účelem činnosti indexace. Při výběru by měl indexátor vybírat pojmy, které by daná skupina uživatelů považovala za nejpřesnější. Počet termínů nebo deskriptorů by se neměl omezovat, určován by měl být množstvím obsažených informací a potřebami uživatelů rejstříku. Pojmy by se měly určovat co nejspecifičtěji. Obecnějším pojmům se dává přednost, pokud by přílišná specifičnost mohla negativně ovlivnit efektivnost systému indexování. Dalším důvodem může být, pokud autor pojem dostatečně nerozvinul.
  • Výběr lexikálních jednotek selekčního jazyka - Využívány by měly být doporučené termíny. Nové pojmy by měly být prověřeny z hlediska přesnosti a přijatelnosti pomocí referenčních nástrojů (uznávané slovníky a encyklopedie, tezaury a klasifikační systémy jednotlivých oborů).
  • Kontrola kvality - Kvalita a konzistence indexování je ovlivněna zejména odbornou kvalifikací indexátora a kvalitou indexačních nástrojů. Pro konzistenci indexování je nutná je osobní nezúčastněnost indexátora bez subjektivních soudů. Kvalitu indexování ovlivňuje i přímý kontakt indexátora s uživateli a otevřenost používaného selekčního jazyka k přidávání nových termínů a dalších aktualizacích.

Výsledky obsahové analýzy

Bezprostředním výsledkem obsahové analýzy dokumentu je obraz (profil) dokumentu, který je přetvářen do různých druhů redukovaných textů a selekčních obrazů dokumentu. Redukované texty využívají přirozeného jazyka, formalizovaný nebo umělý jakyk je užíván při vytváření selekčních obrazů dokumentu [6].

Redukované texty

  • Referát je "redukovaný text, který bez doplňkových nebo hodnotících informací charakterizuje obsah dokumentu. Základními vlastnostmi referátu jsou výstižnost, přehlednost, jasnost, stručnost, přesnost, objektivnost a čtivost. Referát je formulován v přirozeném jazyce - obvykle ve větách, někdy však jen v heslovité podobě, telegrafickým stylem. Referát může používat textových formulací z referovaného dokumentu, ale jako celek je formulován nově. Ve spojení s bibliografickými záznamy referovaných dokumentů se referáty publikují v referátových publikacích (např. referátové bibliografie, referátová periodika apod.) Podle charakteru zpracování lze vydělit informativní, indikativní, kritický, modulární, analytický, monografický, přehledový, výběrový a autorský referát[7]."
  • Anotace"je stručný komentář nebo výklad dokumentu nebo jeho obsahu, nebo dokonce jen velmi stručný popis, obvykle připojený jako poznámka k bibliografickému záznamu dokumentu[8]."
  • Abstrakt bývá někdy spojován vztahem ekvivalence s referátem [9]. je normou ČSN ISO 214 představen jako text, který je "stručnou a přesnou reprezentací obsahu dokumentu bez vlastní interpretace nebo hodnocení a bez rozlišení autorství abstraktu".

Věcné selekční jazyky

Věcnéselekční jazyky se v základním členění dělí na prekoordnované a poskoordinované, speciální nebo univerzální. Můžeme je a také podle různého stupně formalizace.

Související anglická terminologie

Nové trendy

Reference

  1. Slovník: ČSN ISO 5127 (01 0162). 1. vyd. Praha: Český normalizační institut, 1995, 19 s.
  2. VODIČKOVÁ, Hana a Jiří CEJPEK. Terminologický slovník knihovnický a bibliografický. 1. vyd. Praha: Státní pedagogické nakladatelství, 1965, 119, [1] s.
  3. BALÍKOVÁ, Marie. Obsahová analýza. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2015-12-10].Dostupné z: http://1url.cz/Mn8h
  4. KOVÁŘ, Blahoslav. Obsahová analýza dokumentu. Praha: Ústředí vědeckých, technických a ekonomických informací, 1974, 44 s.
  5. Metody analýzy dokumentů, určování jejich obsahu a výběru lexikálních jednotek selekčního jazyka: ČSN ISO 5963 (01 0174). 1. vyd. Praha: Český normalizační institut, 1995, 10 s.
  6. HYHLÍKOVÁ, Věra. Informační analýza dokumentu. Praha: Ústředí vědeckých, technických a ekonomických informací, 1984, 80 s.
  7. ŠVEJDA, Jan. Referát. Národní knihovna ČR, 2003-. Dostupné také z: http://1url.cz/rnm9
  8. Dokumentace: abstrakty pro publikace a dokumentaci. 1. vyd. Praha: Český normalizační institut, 2001, 15 s.
  9. ŠVEJDA, Jan. Referát. Národní knihovna ČR, 2003-. Dostupné také z: http://1url.cz/rnm9