Obsahová analýza: Porovnání verzí

Značky: editace z Vizuálního editoru, možná chyba ve Vizuálním editoru
 
(Není zobrazeno 73 mezilehlých verzí od 4 dalších uživatelů.)
Řádek 1: Řádek 1:
<div style="background: white; border: solid 1px blue; -moz-border-radius: 15px; -webkit-border-radius: 15px; border-radius: 15px;">
+
'''Obsahovou analýzou''' se rozumí soustava metod a pravidel zaměřených na zachycení obsahu či tematiky dokumentu a dalších pro daný účel významných hledisek (forma dokumentu, uživatelské určení, časové a prostorové hledisko).  
<div style="border: solid 2px blue; margin: 2px; text-align: center; padding: 10px; -moz-border-radius: 15px; -webkit-border-radius: 15px; border-radius: 15px;">
+
 
<div style="font-size: 125%; text-align: center">'''Stránka ve výstavbě'''</div>
 
{|
 
|width=10% align=center|[[Soubor:Inkwell icon - Noun Project 2512.svg|60px]]
 
|width=80%|''Na této stránce se právě pracuje. Prosím needitujte tuto stránku, dokud na ní zůstává tato šablona. Předejdete tak [[Nápověda:Editační konflikt|editačnímu konfliktu]]. {{#if: {{{1|}}} | Prosím dodržte lhůtu {{{1}}} od doby, kdy byla tato zpráva vložena (přesné datum vyhledejte v historii). Poté neváhejte šablonu odstranit.| Jestliže uběhla od poslední editace doba alespoň dvou dnů, neváhejte tuto šablonu odstranit.}}''
 
|width=10% align=center|[[Soubor:Inkwell icon - Noun Project 2512.svg|60px]]
 
|}
 
</div>
 
</div>
 
  
 
==Definice==
 
==Definice==
Definice '''České terminologické databáze knihovnictví a informační vědy (TDKIV)''' vychází normativního terminologického zdroje, podle kterého je to "analýza dokumentu, která má stanovit jeho obsahové prvky a jejich vzájemné vztahy<ref><i>Slovník: ČSN ISO 5127 (01 0162)</i>. 1. vyd. Praha: Český normalizační institut, 1995, 19 s.</ref> Dalším výkladovým zdrojem byl Terminologický slovník knihovnický a bibliografický Hany Vodičkové a Jiřího Cejpka<ref>VODIČKOVÁ, Hana a Jiří CEJPEK. <i>Terminologický slovník knihovnický a bibliografický</i>. 1. vyd. Praha: Státní pedagogické nakladatelství, 1965, 119, [1] s.</ref>.
+
Českou terminologickou databází knihovnictví a informační vědy (dále TDKIV) je představena jako: ''"analýza obsahu dokumentu zahrnující metody a pravidla pro stanovení tematiky dokumentu, příp. časového a prostorového hlediska, čtenářského určení a formy dokumentu. Slovní vyjádření obsahu dokumentu v přirozeném jazyce je transformováno do věcných selekčních údajů v procesu věcného pořádání nebo do vět v procesu sémantické redukce textu dokumentu"''“<ref name="balíková">BALÍKOVÁ, Marie. Obsahová analýza. In: ''KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV)'' [online]. Praha : Národní knihovna ČR, 2003- [cit. 2015-12-10].Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001586&local_base=ktd</ref>.
Databází TDKIV je ve výsledku obsahová analýza představena jako: ''"analýza obsahu dokumentu zahrnující metody a pravidla pro stanovení tematiky dokumentu, příp. časového a prostorového hlediska, čtenářského určení a formy dokumentu. Slovní vyjádření obsahu dokumentu v přirozeném jazyce je transformováno do věcných selekčních údajů v procesu věcného pořádání nebo do vět v procesu sémantické redukce textu dokumentu"''“<ref name="balíková">BALÍKOVÁ, Marie. Obsahová analýza. In: ''KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV)'' [online]. Praha : Národní knihovna ČR, 2003- [cit. 2015-12-10].Dostupné z: http://1url.cz/Mn8h</ref>.  
+
 
 +
==Druh informační analýzy==
 +
 
 +
Obsahová analýza je Blahoslavem Kovářem charakterizována jako jeden ze dvou druhů '''informační analýzy'''. Výsledkem informační analýzy je množina slov přirozeného jazyka, které můžeme rozdělit na identifikační a obsahové (tematické) údaje představující obraz (profil) dokumentu.
 +
 
 +
'''Identifikační analýza''' vychází z identifikačních údajů a je nezbytnou podmínkou a nepostradatelným základem '''identifikačního pořádání informací'''.
 +
 
 +
'''Obsahová analýza''' vychází z obsahových (tematických) údajů a je nezbytnou podmínkou a základem '''věcného pořádání informací.'''
 +
 
 +
=== Identifikační analýza ===
 +
Cílem je odhalit všechny údaje, jež podle struktury jmenného záznamu patří do jeho popisné části. Jsou to ve stručnosti – název, podnázev, údaje o původcích, označení vydání, nakladatelské údaje, údaje o rozsahu a knihopisná poznámka. Každý z těchto identifikačních údajů plní funkci selekčního údaje, podle něhož jsou vyhledávány odpovídající dokumenty a jednotlivé informace.
 +
=== Obsahová analýza ===
 +
Obsahová (tematická) analýza dokumentu vyžaduje rozbor a pečlivou prohlídku těch míst a prvků dokumentu, které obsahují důležité obsahové (tematické) údaje. Jimi jsou název a podnázev dokumentu, původce, nakladatelské údaje, vročení, úvod, předmluva, doslov, obsah, rejstříky a výběrové podrobné čtení dokumentu. Cílem je odhalit v dokumentu soubor slov přirozeného jazyka, který formuluje obsah (předmět, téma) dokumentu a použít tento soubor k formulaci textu referátu, anotace, případně recenze, které jsou vytvářeny na objednávku specialistů při adresních rešerších. Obsahová analýza se dále uplatňuje u předmětových pořádacích soustav k formulaci předmětových hesel, k výběru deskriptorů z tezaurů, které představují selekční jazyk značně formalizovaný a u systematických pořádacích soustav jej převést do znaků (symbolů) zvoleného pořádacího systému, které představují umělý selekční jazyk.''' '''<ref>KOVÁŘ, Blahoslav. <i>Obsahová analýza dokumentu</i>. Praha: Ústředí vědeckých, technických a ekonomických
 +
informací, 1974, 44 s.</ref>
 +
 
 +
==Výzkumná metoda==
 +
Vícehledisková analýza dokumentů je používanou [[Výzkumné metody|výzkumnou metodou]] v kvantitativním i kvalitativním výzkumu a je užívána zejména v [[Sociologie|sociologii]], [[Psychologie|psychologii]] a historických vědách. Zvláštní význam má zejména při zkoumání časově či prostorově vzdálených událostí a jevů, kdy je třeba posoudit relevanci a poznávací hodnotu dokumentů. Posuzují se podle formálních, vnitřních i vnějších kritérií: <ref>HENDL, Jan. <i>Kvalitativní výzkum: základní teorie, metody a aplikace</i>. 3. vyd. Praha: Portál, 2012, 407 s.</ref>
 +
* Typ dokumentu.
 +
* Vnější znaky dokumentu - (např. fyzický stav, způsob zpracování).
 +
* Vnitřní znaky dokumentu - zkoumá se obsahová stránka dokumentu provedením tzv. interní evaluace dokumentu.
 +
* Intencionalita dokumentu - zkoumá se míra možného zkreslení informací vlivem např. ideologie, stupně vzdělání či zaměření autora.
 +
* Blízkost dokumentu - zvažuje se časová, prostorová a sociální blízkost.
 +
* Původ dokumentu.
  
==Obsahová analýza jako druh informační analýzy==
+
==Metody a techniky==
  
'''Obsahová analýza''' je Blahoslavem Kovářem charakterizována jako jeden ze dvou druhů '''informační analýzy'''. Výsledkem informační analýzy je množina slov přirozeného jazyka, které můžeme rozdělit na identifikační a obsahové (tematické) údaje představující obraz (profil) dokumentu. '''Identifikační analýza''' vychází z identifikačních údajů. '''Obsahová analýza''' vychází z obsahových (tematických) údajů a je nezbytnou podmínkou a základem věcného pořádání informací<ref>KOVÁŘ, Blahoslav. <i>Obsahová analýza dokumentu</i>. Praha: Ústředí vědeckých, technických a ekonomických informací, 1974, 44 s.</ref>.
+
===Techniky===
  
==Metody a techniky obsahové analýzy==
+
====Automatická indexace====
 +
[[Automatická indexace]] je proces indexace s využitím strojového zpracování textu a automatického výběru termínů či automatického přiřazování termínů [[Selekční jazyk|selekčního jazyka]].<ref>BALÍKOVÁ, Marie. Automatická indexace. In: ''KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV)'' [online]. Praha: Národní knihovna ČR, 2003-. Dostupné také z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001507&local_base=KTD</ref>
 +
====Intelektuální indexace====
 +
Intelektuální indexace je proces indexace realizovaný lidmi (indexátory). Tento způsob zpracování je zatížen subjektivitou, je časově i intelektuálně velmi náročný, oproti automatické indexaci však indexátoři nemají problémy s interpretací přirozeného jazyka.<ref name="AI">SCHWARZ, Josef. Současný stav a trendy automatické indexace dokumentů: přehledová studie. In: ''Ikaros'' [online]. 2003, '''7'''(3). Dostupné také z: http://ikaros.cz/soucasny-stav-a-trendy-automaticke-indexace-dokumentu</ref>
 +
====Konceptuální analýza====
 +
Konceptuální analýza je založena na zaznamenávání existence a frekvence výskytu (kvantifikaci) určených znaků a následné komparaci určitých jevů.<ref name="OA">DVOŘÁKOVÁ, Ilona. <i>Obsahová analýza / formální obsahová analýza / kvantitativní obsahová analýza</i>. 2010. Dostupné také z: http://www.antropoweb.cz/media/webzin/webzin_2_2010/Dvorakova__I-2-2010.pdf</ref>
 +
====Relační analýza====
 +
Relační analýza zaznamenává kromě výskytu znaků také vztahy mezi nimi, k této analýze je využívána [[Sémantika|sémantika]], lingvistika a sledování prostorové blízkosti slov.<ref name="OA"/>
  
 
===Norma ČSN ISO 5963 (01 0174)===
 
===Norma ČSN ISO 5963 (01 0174)===
'''Norma ČSN ISO 5963 (01 0174) Dokumentace. Metody analýzy dokumentů, určování jejich obsahu a výběru lexikálních jednotek selekčního jazyka''' je obdobou mezinárodní normy ISO 5963. Tato norma popisuje doporučené obecné metody analýzy dokumentů a slouží jako pomůcka indexátorům. Tvůrci normy připomínají, že norma není aplikovatelná v systémech automatického indexování. Zaměřuje se na úvodní fáze indexování a neřeší konkrétní postupy jednotlivých systémů indexování. Vyjadřuje se k určování obsahu pri analýze dokumentu, identifikaci hlavních pojmů a k vyjádření těchto pojmů lexikálními jednotkami selekčního jazyka<ref><i>Metody analýzy dokumentů, určování jejich obsahu a výběru lexikálních jednotek selekčního jazyka: ČSN ISO 5963 (01 0174)</i>. 1. vyd. Praha: Český normalizační institut, 1995, 10 s.</ref>:
+
Norma ČSN ISO 5963 (01 0174) Dokumentace. Metody analýzy dokumentů, určování jejich obsahu a výběru lexikálních jednotek selekčního jazyka je obdobou mezinárodní normy ISO 5963. Tato norma popisuje doporučené obecné metody analýzy dokumentů a slouží jako pomůcka indexátorům. Tvůrci normy připomínají, že norma není aplikovatelná v systémech automatického indexování. Zaměřuje se na úvodní fáze indexování a neřeší konkrétní postupy jednotlivých systémů indexování. Vyjadřuje se k určování obsahu při analýze dokumentu, identifikaci hlavních pojmů a k vyjádření těchto pojmů lexikálními jednotkami selekčního jazyka<ref><i>Metody analýzy dokumentů, určování jejich obsahu a výběru lexikálních jednotek selekčního jazyka: ČSN ISO 5963 (01 0174)</i>. 1. vyd. Praha: Český normalizační institut, 1995, 10 s.</ref>:
 
* '''Analýza dokumentu''' - Norma se zvlášť zmiňuje dva základní fyzické formy dokumentů, kterými jsou tištěné a netištěné (audiovizuální, vizuální a zvukové) dokumenty. Podrobněji se k jako typickým dokumentům knihoven a informačních pracovišť vyjadřuje k tištěným dokumentům. Pro správné porozumění je důležité posouzení všech důležitých částí dokumentům. Dle normy by měla být zvláštní pozornost věnována následujícím položkám:
 
* '''Analýza dokumentu''' - Norma se zvlášť zmiňuje dva základní fyzické formy dokumentů, kterými jsou tištěné a netištěné (audiovizuální, vizuální a zvukové) dokumenty. Podrobněji se k jako typickým dokumentům knihoven a informačních pracovišť vyjadřuje k tištěným dokumentům. Pro správné porozumění je důležité posouzení všech důležitých částí dokumentům. Dle normy by měla být zvláštní pozornost věnována následujícím položkám:
 
:* název,
 
:* název,
Řádek 30: Řádek 51:
 
:* slova nebo skupiny slov, které jsou podtrženy nebo tištěny neobvyklým typem písma.
 
:* slova nebo skupiny slov, které jsou podtrženy nebo tištěny neobvyklým typem písma.
 
* '''Identifikace pojmů''' - Sledují se pojmy, které tvoří podstatu popisu předmětu dokumentu. Norma nabízí jako příklady obecné faktory, které by měla jednotlivá pracoviště dle svých priorit sledovat:
 
* '''Identifikace pojmů''' - Sledují se pojmy, které tvoří podstatu popisu předmětu dokumentu. Norma nabízí jako příklady obecné faktory, které by měla jednotlivá pracoviště dle svých priorit sledovat:
:* Zabývá se dokument předmětem nějaké činnoti?
+
:* Zabývá se dokument předmětem nějaké činnosti?
 
:* Obsahuje předmět nějaký činný pojem (např. činnost, operace, proces)?
 
:* Obsahuje předmět nějaký činný pojem (např. činnost, operace, proces)?
 
:* Je předmět činnosti identifikován?
 
:* Je předmět činnosti identifikován?
:* Zabává se dokument nositelem činnosti?
+
:* Zabývá se dokument nositelem činnosti?
 
:* Odkazuje se na zvláštní prostředky k provádění činnosti (nástroje, techniky nebo metody)?
 
:* Odkazuje se na zvláštní prostředky k provádění činnosti (nástroje, techniky nebo metody)?
 
:* Byly tyto faktory hodnoceny v kontextu konkrétního umístění nebo prostředí?
 
:* Byly tyto faktory hodnoceny v kontextu konkrétního umístění nebo prostředí?
Řádek 43: Řádek 64:
  
 
==Výsledky obsahové analýzy==
 
==Výsledky obsahové analýzy==
Bezprostředním výsledkem obsahové analýzy dokumentu je obraz (profil) dokumentu, který je přetvářen do různých druhů redukovaných textů a selekčních obrazů dokumentu. Redukované texty využívají přirozeného jazyka, formalizovaný nebo umělý jakyk je užíván při vytváření selekčních obrazů dokumentu <ref name="hyhlikova">HYHLÍKOVÁ, Věra. <i>Informační analýza dokumentu</i>. Praha: Ústředí vědeckých, technických a ekonomických informací, 1984, 80 s.</ref>.
+
Bezprostředním [[Výsledky obsahové analýzy|výsledkem obsahové analýzy]] dokumentu je obraz (profil) dokumentu, který je přetvářen do různých druhů redukovaných textů a selekčních obrazů dokumentu. Redukované texty využívají přirozeného jazyka, formalizovaný nebo umělý jazyk je užíván při vytváření selekčních obrazů dokumentu <ref name="hyhlikova">HYHLÍKOVÁ, Věra. <i>Informační analýza dokumentu</i>. Praha: Ústředí vědeckých, technických a ekonomických informací, 1984, 80 s.</ref>.
===Redukované texty===
 
* '''Referát''' je podle České terminologické databáze knihovnictví a informační vědy (dále TDKIV) "''redukovaný text, který '''bez doplňkových nebo hodnotících informací charakterizuje obsah dokumentu'''. Základními vlastnostmi referátu jsou výstižnost, přehlednost, jasnost, stručnost, přesnost, objektivnost a čtivost. Referát je formulován v přirozeném jazyce - obvykle ve větách, někdy však jen v heslovité podobě, telegrafickým stylem. Referát může používat textových formulací z referovaného dokumentu, ale jako celek je formulován nově. Ve spojení s bibliografickými záznamy referovaných dokumentů se referáty publikují v referátových publikacích (např. referátové bibliografie, referátová periodika apod.) Podle charakteru zpracování lze vydělit informativní, indikativní, kritický, modulární, analytický, monografický, přehledový, výběrový a autorský referát''<ref>ŠVEJDA, Jan. Referát. In. ''Česká terminologická databáze knihovnictví a informační vědy (TDKIV)'' [online]. Praha: Národní knihovna ČR, 2003-[cit. 2015-10-13]. Dostupné také z: http://1url.cz/rnm9</ref>."
 
* '''Anotace''' je podle TDKIV ''"redukovaný text '''stručně charakterizující obsah dokumentu a popř. informující o autorovi, zaměření, vědecké nebo umělecké hodnotě dokumentu'''. Anotace '''může mít vysvětlující nebo doporučující charakter a obsahovat informace převzaté z jiných dokumentů'''. Funkce anotace je především signální (upozorňuje na existenci anotovaného dokumentu)"..."Podle charakteru zpracování lze vydělit informativní, doporučující, textologickou, analytickou, skupinovou, bibliografickou, nakladatelskou, redakční a autorskou anotaci.''<ref>ŠVEJDA, Jan. Anotace. In. ''Česká terminologická databáze knihovnictví a informační vědy (TDKIV)'' [online]. Praha: Národní knihovna ČR, 2003-[cit. 2015-10-13]. Dostupné také z:  http://1url.cz/anyM</ref>."
 
* '''Abstrakt''' bývá často spojován vztahem ekvivalence s '''referátem''' <ref>ŠVEJDA, Jan. Referát. In. ''Česká terminologická databáze knihovnictví a informační vědy (TDKIV)'' [online]. Praha: Národní knihovna ČR, 2003-[cit. 2015-10-13]. Dostupné také z: http://1url.cz/rnm9</ref>. Normou ČSN ISO 214 je abstrakt představen jako text, který je "''stručnou a přesnou reprezentací obsahu dokumentu bez vlastní interpretace nebo hodnocení a bez rozlišení autorství abstraktu''". Norma dále určuje, že abstrakt má být v nejvyšší možné míře '''informativní'''(s obsahem velkého množství kvantitativních a/nebo kvalitativních) informací z dokumentu). U obsáhlejších či pojmově bohatých dokumentů se připouští zpracování "abstraktu, který je jen '''indikativním''' nebo popisným vodítkem pro určení druhu dokumentu, hlavních probíraných témat a způsobu prezentace."<ref><i>Dokumentace: abstrakty pro publikace a dokumentaci</i>. 1. vyd. Praha: Český normalizační institut, 2001, 15 s.</ref>
 
 
 
===Věcné selekční jazyky===
 
Věcné [[Selekční jazyky|selekční jazyky]] se v základním členění dělí na prekoordnované a poskoordinované, speciální nebo univerzální. Můžeme je a také podle jejich formalizace či přímo umělosti jazyka<ref name="hyhlikova" />:
 
* '''Formalizované selekční jazyky''' v systémech předmětového pořádání a deskriptorových selekčních systémemch (předmětová hesla, soubory deskriptorů, unitermy),
 
* '''Umělé selekční jazyky''' v klasifikačních systémech (např. [[Mezinárodní desetinné třídění|MDT]]).
 
  
 
==Související anglická terminologie==
 
==Související anglická terminologie==
 
+
Pro obsahovou analýzu se v angličtině používají termíny '''"content analysis"''' nebo '''"subject analysis"'''.
==Nové trendy==
+
==="Aboutness"===
 +
V oblasti informační vědy jsou v souvislosti s obsahovou analýzou a  organizací znalostí obecně používány nové pojmy, které se snaží zachytit nový pohled na práci s informacemi, která je ovlivněna masovým rozšířením elektronicky dostupných dokumentů a zdrojů. Nové akcenty se objevují v souvislosti s prací se [[Sémantika a syntaxe informace|sémantickou stránkou informace]] a v rámci iniciativ [[sémantický web|sémantického webu]] se hovoří o pojmu "aboutness", který se snaží pojmenovat to, co je obsahovou analýzou zachycováno. Čeština k tomuto termínu postrádá přesný ekvivalent, takže se v tomto významu používají slova námět, obsah, předmět či téma<ref>KUČEROVÁ, Helena Co analyzujeme při obsahové analýze dokumentů? K pojmu aboutness v organizaci znalostí = What Do we Analyze during Subject Analysis of Documents? The Concept of Aboutness in Knowledge Organization. ''Knihovna: knihovnická revue'', 2014, vol. 25, č. 1, s. 36-54. [online]. 2014 [cit. 2015-11-3]. Dostupné z: http://hdl.handle.net/10760/28005</ref>.
  
 
==Odkazy==
 
==Odkazy==
  
== Reference ==
+
=== Reference ===
 
<references/>
 
<references/>
  
===Použitá literatura===
+
===Doporučená literatura===
 +
* HENDL, Jan. ''Kvalitativní výzkum: základní teorie, metody a aplikace''. 3. vyd. Praha: Portál, 2012, 407 s.
 +
* KOVÁŘ, Blahoslav. ''Obsahová analýza dokumentu''. Praha: Ústředí vědeckých, technických a ekonomických informací, 1974, 44 s.
 +
* KUČEROVÁ, Helena Co analyzujeme při obsahové analýze dokumentů? K pojmu aboutness v organizaci znalostí = What Do we Analyze during Subject Analysis of Documents? The Concept of Aboutness in Knowledge Organization. ''Knihovna: knihovnická revue'', 2014, vol. 25, č. 1, s. 36-54. [online]. 2014 [cit. 2015-11-3]. Dostupné z: http://hdl.handle.net/10760/28005
  
 
===Externí odkazy===
 
===Externí odkazy===
 +
* [https://cs.wikipedia.org/wiki/Obsahová_analýza  Obsahová analýza – Wikipedie]
 +
* [http://wiki.knihovna.cz/index.php?title=Obsahová_analýza  Obsahová analýza – WikiKnihovna]
 +
* [http://aleph.nkp.cz/F/?func=direct&doc_number=000001586&local_base=ktd Obsahová analýza (TDKIV)]
 +
* [http://aleph.nkp.cz/F/?func=direct&doc_number=000001770&local_base=KTD Referát (TDKIV)]
 +
* [http://aleph.nkp.cz/F/?func=direct&doc_number=000001780&local_base=KTD Anotace (TDKIV)]
  
 
===Související články===
 
===Související články===
 
[[Kategorie:Informační studia a knihovnictví]]
 
 
*[[Automatická indexace]]
 
*[[Automatická indexace]]
 +
*[[Poslání, pracovní metody a výsledky obsahové analýzy]]
 
*[[Selekční jazyky]]
 
*[[Selekční jazyky]]
 +
*[[Vliv interpretace textu na výsledky textové a obsahové analýzy]]
 +
 +
===Klíčová slova===
 +
obsahová analýza, indexace, věcné zpracování, výzkumné metody
 +
 +
[[Kategorie:Zpracování informací a informační servis]]

Aktuální verze z 13. 6. 2016, 14:08

Obsahovou analýzou se rozumí soustava metod a pravidel zaměřených na zachycení obsahu či tematiky dokumentu a dalších pro daný účel významných hledisek (forma dokumentu, uživatelské určení, časové a prostorové hledisko).


Definice

Českou terminologickou databází knihovnictví a informační vědy (dále TDKIV) je představena jako: "analýza obsahu dokumentu zahrnující metody a pravidla pro stanovení tematiky dokumentu, příp. časového a prostorového hlediska, čtenářského určení a formy dokumentu. Slovní vyjádření obsahu dokumentu v přirozeném jazyce je transformováno do věcných selekčních údajů v procesu věcného pořádání nebo do vět v procesu sémantické redukce textu dokumentu"[1].

Druh informační analýzy

Obsahová analýza je Blahoslavem Kovářem charakterizována jako jeden ze dvou druhů informační analýzy. Výsledkem informační analýzy je množina slov přirozeného jazyka, které můžeme rozdělit na identifikační a obsahové (tematické) údaje představující obraz (profil) dokumentu.

Identifikační analýza vychází z identifikačních údajů a je nezbytnou podmínkou a nepostradatelným základem identifikačního pořádání informací.

Obsahová analýza vychází z obsahových (tematických) údajů a je nezbytnou podmínkou a základem věcného pořádání informací.

Identifikační analýza

Cílem je odhalit všechny údaje, jež podle struktury jmenného záznamu patří do jeho popisné části. Jsou to ve stručnosti – název, podnázev, údaje o původcích, označení vydání, nakladatelské údaje, údaje o rozsahu a knihopisná poznámka. Každý z těchto identifikačních údajů plní funkci selekčního údaje, podle něhož jsou vyhledávány odpovídající dokumenty a jednotlivé informace.

Obsahová analýza

Obsahová (tematická) analýza dokumentu vyžaduje rozbor a pečlivou prohlídku těch míst a prvků dokumentu, které obsahují důležité obsahové (tematické) údaje. Jimi jsou název a podnázev dokumentu, původce, nakladatelské údaje, vročení, úvod, předmluva, doslov, obsah, rejstříky a výběrové podrobné čtení dokumentu. Cílem je odhalit v dokumentu soubor slov přirozeného jazyka, který formuluje obsah (předmět, téma) dokumentu a použít tento soubor k formulaci textu referátu, anotace, případně recenze, které jsou vytvářeny na objednávku specialistů při adresních rešerších. Obsahová analýza se dále uplatňuje u předmětových pořádacích soustav k formulaci předmětových hesel, k výběru deskriptorů z tezaurů, které představují selekční jazyk značně formalizovaný a u systematických pořádacích soustav jej převést do znaků (symbolů) zvoleného pořádacího systému, které představují umělý selekční jazyk. [2]

Výzkumná metoda

Vícehledisková analýza dokumentů je používanou výzkumnou metodou v kvantitativním i kvalitativním výzkumu a je užívána zejména v sociologii, psychologii a historických vědách. Zvláštní význam má zejména při zkoumání časově či prostorově vzdálených událostí a jevů, kdy je třeba posoudit relevanci a poznávací hodnotu dokumentů. Posuzují se podle formálních, vnitřních i vnějších kritérií: [3]

  • Typ dokumentu.
  • Vnější znaky dokumentu - (např. fyzický stav, způsob zpracování).
  • Vnitřní znaky dokumentu - zkoumá se obsahová stránka dokumentu provedením tzv. interní evaluace dokumentu.
  • Intencionalita dokumentu - zkoumá se míra možného zkreslení informací vlivem např. ideologie, stupně vzdělání či zaměření autora.
  • Blízkost dokumentu - zvažuje se časová, prostorová a sociální blízkost.
  • Původ dokumentu.

Metody a techniky

Techniky

Automatická indexace

Automatická indexace je proces indexace s využitím strojového zpracování textu a automatického výběru termínů či automatického přiřazování termínů selekčního jazyka.[4]

Intelektuální indexace

Intelektuální indexace je proces indexace realizovaný lidmi (indexátory). Tento způsob zpracování je zatížen subjektivitou, je časově i intelektuálně velmi náročný, oproti automatické indexaci však indexátoři nemají problémy s interpretací přirozeného jazyka.[5]

Konceptuální analýza

Konceptuální analýza je založena na zaznamenávání existence a frekvence výskytu (kvantifikaci) určených znaků a následné komparaci určitých jevů.[6]

Relační analýza

Relační analýza zaznamenává kromě výskytu znaků také vztahy mezi nimi, k této analýze je využívána sémantika, lingvistika a sledování prostorové blízkosti slov.[6]

Norma ČSN ISO 5963 (01 0174)

Norma ČSN ISO 5963 (01 0174) Dokumentace. Metody analýzy dokumentů, určování jejich obsahu a výběru lexikálních jednotek selekčního jazyka je obdobou mezinárodní normy ISO 5963. Tato norma popisuje doporučené obecné metody analýzy dokumentů a slouží jako pomůcka indexátorům. Tvůrci normy připomínají, že norma není aplikovatelná v systémech automatického indexování. Zaměřuje se na úvodní fáze indexování a neřeší konkrétní postupy jednotlivých systémů indexování. Vyjadřuje se k určování obsahu při analýze dokumentu, identifikaci hlavních pojmů a k vyjádření těchto pojmů lexikálními jednotkami selekčního jazyka[7]:

  • Analýza dokumentu - Norma se zvlášť zmiňuje dva základní fyzické formy dokumentů, kterými jsou tištěné a netištěné (audiovizuální, vizuální a zvukové) dokumenty. Podrobněji se k jako typickým dokumentům knihoven a informačních pracovišť vyjadřuje k tištěným dokumentům. Pro správné porozumění je důležité posouzení všech důležitých částí dokumentům. Dle normy by měla být zvláštní pozornost věnována následujícím položkám:
  • název,
  • referát, byl-li zpracován,
  • obsah,
  • úvod, úvodní věty kapitol nebo odstavců a závěr,
  • ilustrace, diagramy, tabulky a jejich popisy,
  • slova nebo skupiny slov, které jsou podtrženy nebo tištěny neobvyklým typem písma.
  • Identifikace pojmů - Sledují se pojmy, které tvoří podstatu popisu předmětu dokumentu. Norma nabízí jako příklady obecné faktory, které by měla jednotlivá pracoviště dle svých priorit sledovat:
  • Zabývá se dokument předmětem nějaké činnosti?
  • Obsahuje předmět nějaký činný pojem (např. činnost, operace, proces)?
  • Je předmět činnosti identifikován?
  • Zabývá se dokument nositelem činnosti?
  • Odkazuje se na zvláštní prostředky k provádění činnosti (nástroje, techniky nebo metody)?
  • Byly tyto faktory hodnoceny v kontextu konkrétního umístění nebo prostředí?
  • Jsou stanoveny nějaké závislé nebo nezávislé proměnné?
  • Bylo o tématu pojednáno z nějakého speciálního hlediska, které se obvykle nespojuje s oborem výzkumu?
Počet indexovaných pojmů souvisí se sledovaným účelem činnosti indexace. Při výběru by měl indexátor vybírat pojmy, které by daná skupina uživatelů považovala za nejpřesnější. Počet termínů nebo deskriptorů by se neměl omezovat, určován by měl být množstvím obsažených informací a potřebami uživatelů rejstříku. Pojmy by se měly určovat co nejspecifičtěji. Obecnějším pojmům se dává přednost, pokud by přílišná specifičnost mohla negativně ovlivnit efektivnost systému indexování. Dalším důvodem může být, pokud autor pojem dostatečně nerozvinul.
  • Výběr lexikálních jednotek selekčního jazyka - Využívány by měly být doporučené termíny. Nové pojmy by měly být prověřeny z hlediska přesnosti a přijatelnosti pomocí referenčních nástrojů (uznávané slovníky a encyklopedie, tezaury a klasifikační systémy jednotlivých oborů).
  • Kontrola kvality - Kvalita a konzistence indexování je ovlivněna zejména odbornou kvalifikací indexátora a kvalitou indexačních nástrojů. Pro konzistenci indexování je nutná je osobní nezúčastněnost indexátora bez subjektivních soudů. Kvalitu indexování ovlivňuje i přímý kontakt indexátora s uživateli a otevřenost používaného selekčního jazyka k přidávání nových termínů a dalších aktualizacích.

Výsledky obsahové analýzy

Bezprostředním výsledkem obsahové analýzy dokumentu je obraz (profil) dokumentu, který je přetvářen do různých druhů redukovaných textů a selekčních obrazů dokumentu. Redukované texty využívají přirozeného jazyka, formalizovaný nebo umělý jazyk je užíván při vytváření selekčních obrazů dokumentu [8].

Související anglická terminologie

Pro obsahovou analýzu se v angličtině používají termíny "content analysis" nebo "subject analysis".

"Aboutness"

V oblasti informační vědy jsou v souvislosti s obsahovou analýzou a organizací znalostí obecně používány nové pojmy, které se snaží zachytit nový pohled na práci s informacemi, která je ovlivněna masovým rozšířením elektronicky dostupných dokumentů a zdrojů. Nové akcenty se objevují v souvislosti s prací se sémantickou stránkou informace a v rámci iniciativ sémantického webu se hovoří o pojmu "aboutness", který se snaží pojmenovat to, co je obsahovou analýzou zachycováno. Čeština k tomuto termínu postrádá přesný ekvivalent, takže se v tomto významu používají slova námět, obsah, předmět či téma[9].

Odkazy

Reference

  1. BALÍKOVÁ, Marie. Obsahová analýza. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2015-12-10].Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001586&local_base=ktd
  2. KOVÁŘ, Blahoslav. Obsahová analýza dokumentu. Praha: Ústředí vědeckých, technických a ekonomických informací, 1974, 44 s.
  3. HENDL, Jan. Kvalitativní výzkum: základní teorie, metody a aplikace. 3. vyd. Praha: Portál, 2012, 407 s.
  4. BALÍKOVÁ, Marie. Automatická indexace. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha: Národní knihovna ČR, 2003-. Dostupné také z: http://aleph.nkp.cz/F/?func=direct&doc_number=000001507&local_base=KTD
  5. SCHWARZ, Josef. Současný stav a trendy automatické indexace dokumentů: přehledová studie. In: Ikaros [online]. 2003, 7(3). Dostupné také z: http://ikaros.cz/soucasny-stav-a-trendy-automaticke-indexace-dokumentu
  6. 6,0 6,1 DVOŘÁKOVÁ, Ilona. Obsahová analýza / formální obsahová analýza / kvantitativní obsahová analýza. 2010. Dostupné také z: http://www.antropoweb.cz/media/webzin/webzin_2_2010/Dvorakova__I-2-2010.pdf
  7. Metody analýzy dokumentů, určování jejich obsahu a výběru lexikálních jednotek selekčního jazyka: ČSN ISO 5963 (01 0174). 1. vyd. Praha: Český normalizační institut, 1995, 10 s.
  8. HYHLÍKOVÁ, Věra. Informační analýza dokumentu. Praha: Ústředí vědeckých, technických a ekonomických informací, 1984, 80 s.
  9. KUČEROVÁ, Helena Co analyzujeme při obsahové analýze dokumentů? K pojmu aboutness v organizaci znalostí = What Do we Analyze during Subject Analysis of Documents? The Concept of Aboutness in Knowledge Organization. Knihovna: knihovnická revue, 2014, vol. 25, č. 1, s. 36-54. [online]. 2014 [cit. 2015-11-3]. Dostupné z: http://hdl.handle.net/10760/28005

Doporučená literatura

  • HENDL, Jan. Kvalitativní výzkum: základní teorie, metody a aplikace. 3. vyd. Praha: Portál, 2012, 407 s.
  • KOVÁŘ, Blahoslav. Obsahová analýza dokumentu. Praha: Ústředí vědeckých, technických a ekonomických informací, 1974, 44 s.
  • KUČEROVÁ, Helena Co analyzujeme při obsahové analýze dokumentů? K pojmu aboutness v organizaci znalostí = What Do we Analyze during Subject Analysis of Documents? The Concept of Aboutness in Knowledge Organization. Knihovna: knihovnická revue, 2014, vol. 25, č. 1, s. 36-54. [online]. 2014 [cit. 2015-11-3]. Dostupné z: http://hdl.handle.net/10760/28005

Externí odkazy

Související články

Klíčová slova

obsahová analýza, indexace, věcné zpracování, výzkumné metody