Obsahovou analýzou se rozumí soustava metod a pravidel zaměřených na zachycení obsahu či tematiky dokumentu a dalších pro daný účel významných hledisek (forma dokumentu, uživatelské určení, časové a prostorové hledisko).


Definice

Českou terminologickou databází knihovnictví a informační vědy (dále TDKIV) je představena jako: "analýza obsahu dokumentu zahrnující metody a pravidla pro stanovení tematiky dokumentu, příp. časového a prostorového hlediska, čtenářského určení a formy dokumentu. Slovní vyjádření obsahu dokumentu v přirozeném jazyce je transformováno do věcných selekčních údajů v procesu věcného pořádání nebo do vět v procesu sémantické redukce textu dokumentu"[1].

Obsahová analýza jako druh informační analýzy

Obsahová analýza je Blahoslavem Kovářem charakterizována jako jeden ze dvou druhů informační analýzy. Výsledkem informační analýzy je množina slov přirozeného jazyka, které můžeme rozdělit na identifikační a obsahové (tematické) údaje představující obraz (profil) dokumentu. Identifikační analýza vychází z identifikačních údajů. Obsahová analýza vychází z obsahových (tematických) údajů a je nezbytnou podmínkou a základem věcného pořádání informací[2].

Obsahová analýza jako výzkumná metoda

Vícehledisková analýza dokumentů je používanou výzkumnou metodou v kvantitativním i kvalitativním výzkumu a je užívána zejména v sociologii, psychologii a historických vědách. Zvláštní význam má zejména při zkoumání časově či prostorově vzdálených událostí a jevů, kdy je třeba posoudit relevanci a poznávací hodnotu dokumentů. Posuzují se podle formálních, vnitřních i vnějších kritérií: [3]

  • Typ dokumentu.
  • Vnější znaky dokumentu - (např. fyzický stav, způsob zpracování).
  • Vnitřní znaky dokumentu - zkoumá se obsahová stránka dokumentu provedením tzv. interní evaluace dokumentu.
  • Intencionalita dokumentu - zkoumá se míra možného zkreslení informací vlivem např. ideologie, stupně vzdělání či zaměření autora.
  • Blízkost dokumentu - zvažuje se časová, prostorová a sociální blízkost.
  • Původ dokumentu.

Metody a techniky obsahové analýzy

Norma ČSN ISO 5963 (01 0174)

Norma ČSN ISO 5963 (01 0174) Dokumentace. Metody analýzy dokumentů, určování jejich obsahu a výběru lexikálních jednotek selekčního jazyka je obdobou mezinárodní normy ISO 5963. Tato norma popisuje doporučené obecné metody analýzy dokumentů a slouží jako pomůcka indexátorům. Tvůrci normy připomínají, že norma není aplikovatelná v systémech automatického indexování. Zaměřuje se na úvodní fáze indexování a neřeší konkrétní postupy jednotlivých systémů indexování. Vyjadřuje se k určování obsahu při analýze dokumentu, identifikaci hlavních pojmů a k vyjádření těchto pojmů lexikálními jednotkami selekčního jazyka[4]:

  • Analýza dokumentu - Norma se zvlášť zmiňuje dva základní fyzické formy dokumentů, kterými jsou tištěné a netištěné (audiovizuální, vizuální a zvukové) dokumenty. Podrobněji se k jako typickým dokumentům knihoven a informačních pracovišť vyjadřuje k tištěným dokumentům. Pro správné porozumění je důležité posouzení všech důležitých částí dokumentům. Dle normy by měla být zvláštní pozornost věnována následujícím položkám:
  • název,
  • referát, byl-li zpracován,
  • obsah,
  • úvod, úvodní věty kapitol nebo odstavců a závěr,
  • ilustrace, diagramy, tabulky a jejich popisy,
  • slova nebo skupiny slov, které jsou podtrženy nebo tištěny neobvyklým typem písma.
  • Identifikace pojmů - Sledují se pojmy, které tvoří podstatu popisu předmětu dokumentu. Norma nabízí jako příklady obecné faktory, které by měla jednotlivá pracoviště dle svých priorit sledovat:
  • Zabývá se dokument předmětem nějaké činnosti?
  • Obsahuje předmět nějaký činný pojem (např. činnost, operace, proces)?
  • Je předmět činnosti identifikován?
  • Zabývá se dokument nositelem činnosti?
  • Odkazuje se na zvláštní prostředky k provádění činnosti (nástroje, techniky nebo metody)?
  • Byly tyto faktory hodnoceny v kontextu konkrétního umístění nebo prostředí?
  • Jsou stanoveny nějaké závislé nebo nezávislé proměnné?
  • Bylo o tématu pojednáno z nějakého speciálního hlediska, které se obvykle nespojuje s oborem výzkumu?
Počet indexovaných pojmů souvisí se sledovaným účelem činnosti indexace. Při výběru by měl indexátor vybírat pojmy, které by daná skupina uživatelů považovala za nejpřesnější. Počet termínů nebo deskriptorů by se neměl omezovat, určován by měl být množstvím obsažených informací a potřebami uživatelů rejstříku. Pojmy by se měly určovat co nejspecifičtěji. Obecnějším pojmům se dává přednost, pokud by přílišná specifičnost mohla negativně ovlivnit efektivnost systému indexování. Dalším důvodem může být, pokud autor pojem dostatečně nerozvinul.
  • Výběr lexikálních jednotek selekčního jazyka - Využívány by měly být doporučené termíny. Nové pojmy by měly být prověřeny z hlediska přesnosti a přijatelnosti pomocí referenčních nástrojů (uznávané slovníky a encyklopedie, tezaury a klasifikační systémy jednotlivých oborů).
  • Kontrola kvality - Kvalita a konzistence indexování je ovlivněna zejména odbornou kvalifikací indexátora a kvalitou indexačních nástrojů. Pro konzistenci indexování je nutná je osobní nezúčastněnost indexátora bez subjektivních soudů. Kvalitu indexování ovlivňuje i přímý kontakt indexátora s uživateli a otevřenost používaného selekčního jazyka k přidávání nových termínů a dalších aktualizacích.

Výsledky obsahové analýzy

Bezprostředním výsledkem obsahové analýzy dokumentu je obraz (profil) dokumentu, který je přetvářen do různých druhů redukovaných textů a selekčních obrazů dokumentu. Redukované texty využívají přirozeného jazyka, formalizovaný nebo umělý jazyk je užíván při vytváření selekčních obrazů dokumentu [5].

Redukované texty

  • Referát je podle České terminologické databáze knihovnictví a informační vědy (dále TDKIV) "redukovaný text, který bez doplňkových nebo hodnotících informací charakterizuje obsah dokumentu. Základními vlastnostmi referátu jsou výstižnost, přehlednost, jasnost, stručnost, přesnost, objektivnost a čtivost. Referát je formulován v přirozeném jazyce - obvykle ve větách, někdy však jen v heslovité podobě, telegrafickým stylem. Referát může používat textových formulací z referovaného dokumentu, ale jako celek je formulován nově. Ve spojení s bibliografickými záznamy referovaných dokumentů se referáty publikují v referátových publikacích (např. referátové bibliografie, referátová periodika apod.) Podle charakteru zpracování lze vydělit informativní, indikativní, kritický, modulární, analytický, monografický, přehledový, výběrový a autorský referát[6]."
  • Abstrakt bývá často spojován vztahem ekvivalence s referátem [6]. Normou ČSN ISO 214 je abstrakt představen jako text, který je "stručnou a přesnou reprezentací obsahu dokumentu bez vlastní interpretace nebo hodnocení a bez rozlišení autorství abstraktu". Norma dále určuje, že abstrakt má být v nejvyšší možné míře informativní(s obsahem velkého množství kvantitativních a/nebo kvalitativních) informací z dokumentu). U obsáhlejších či pojmově bohatých dokumentů se připouští zpracování "abstraktu, který je jen indikativním nebo popisným vodítkem pro určení druhu dokumentu, hlavních probíraných témat a způsobu prezentace."[7]
  • Anotace je podle TDKIV "redukovaný text stručně charakterizující obsah dokumentu a popř. informující o autorovi, zaměření, vědecké nebo umělecké hodnotě dokumentu. Anotace může mít vysvětlující nebo doporučující charakter a obsahovat informace převzaté z jiných dokumentů. Funkce anotace je především signální (upozorňuje na existenci anotovaného dokumentu)"..."Podle charakteru zpracování lze vydělit informativní, doporučující, textologickou, analytickou, skupinovou, bibliografickou, nakladatelskou, redakční a autorskou anotaci.[8]."

Věcné selekční jazyky

Věcné selekční jazyky se v základním členění dělí na prekoordinované a poskoordinované, speciální nebo univerzální. Můžeme je a také podle jejich formalizace či přímo umělosti jazyka[5]:

  • Formalizované selekční jazyky[5] v systémech předmětového pořádání a deskriptorových selekčních systémech (předmětová hesla , soubory deskriptorů, unitermy),
  • Umělé selekční jazyky[5] v klasifikačních systémech (např. MDT).

Související anglická terminologie

Pro obsahovou analýzu se v angličtině používají termíny "content analysis" nebo "subject analysis".

"Aboutness"

V oblasti informační vědy jsou v souvislosti s obsahovou analýzou a organizací znalostí obecně používány nové pojmy, které se snaží zachytit nový pohled na práci s informacemi, která je ovlivněna masovým rozšířením elektronicky dostupných dokumentů a zdrojů. Nové akcenty se objevují v souvislosti s prací se sémantickou stránkou informace a v rámci iniciativ sémantického webu se hovoří o pojmu "aboutness", který se snaží pojmenovat to, co je obsahovou analýzou zachycováno. Čeština k tomuto termínu postrádá přesný ekvivalent, takže se v tomto významu používají slova námět, obsah, předmět či téma[9].

Odkazy

Reference

  1. BALÍKOVÁ, Marie. Obsahová analýza. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2015-12-10].Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001586&local_base=ktd
  2. KOVÁŘ, Blahoslav. Obsahová analýza dokumentu. Praha: Ústředí vědeckých, technických a ekonomických informací, 1974, 44 s.
  3. HENDL, Jan. Kvalitativní výzkum: základní teorie, metody a aplikace. 3. vyd. Praha: Portál, 2012, 407 s.
  4. Metody analýzy dokumentů, určování jejich obsahu a výběru lexikálních jednotek selekčního jazyka: ČSN ISO 5963 (01 0174). 1. vyd. Praha: Český normalizační institut, 1995, 10 s.
  5. 5,0 5,1 5,2 5,3 HYHLÍKOVÁ, Věra. Informační analýza dokumentu. Praha: Ústředí vědeckých, technických a ekonomických informací, 1984, 80 s.
  6. 6,0 6,1 ŠVEJDA, Jan. Referát. In. Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha: Národní knihovna ČR, 2003-[cit. 2015-10-13]. Dostupné také z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001770&local_base=KTD
  7. Dokumentace: abstrakty pro publikace a dokumentaci. 1. vyd. Praha: Český normalizační institut, 2001, 15 s.
  8. ŠVEJDA, Jan. Anotace. In. Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha: Národní knihovna ČR, 2003-[cit. 2015-10-13]. Dostupné také z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001780&local_base=KTD
  9. KUČEROVÁ, Helena Co analyzujeme při obsahové analýze dokumentů? K pojmu aboutness v organizaci znalostí = What Do we Analyze during Subject Analysis of Documents? The Concept of Aboutness in Knowledge Organization. Knihovna: knihovnická revue, 2014, vol. 25, č. 1, s. 36-54. [online]. 2014 [cit. 2015-11-3]. Dostupné z: http://hdl.handle.net/10760/28005

Doporučená literatura

  • HENDL, Jan. Kvalitativní výzkum: základní teorie, metody a aplikace. 3. vyd. Praha: Portál, 2012, 407 s.
  • KOVÁŘ, Blahoslav. Obsahová analýza dokumentu. Praha: Ústředí vědeckých, technických a ekonomických informací, 1974, 44 s.
  • KUČEROVÁ, Helena Co analyzujeme při obsahové analýze dokumentů? K pojmu aboutness v organizaci znalostí = What Do we Analyze during Subject Analysis of Documents? The Concept of Aboutness in Knowledge Organization. Knihovna: knihovnická revue, 2014, vol. 25, č. 1, s. 36-54. [online]. 2014 [cit. 2015-11-3]. Dostupné z: http://hdl.handle.net/10760/28005

Externí odkazy

Související články

Klíčová slova

obsahová analýza, indexace, věcné zpracování, výzkumné metody