Poslání, pracovní metody a výsledky obsahové analýzy
Na této stránce se právě pracuje. Prosím needitujte tuto stránku, dokud na ní zůstává tato šablona. Předejdete tak editačnímu konfliktu. Jestliže uběhla od poslední editace doba alespoň dvou dnů, neváhejte tuto šablonu odstranit. |
Obsahová analýza je metoda, která umožňuje objektivně zachytit obsah dokumentu pomocí přirozeného či umělého jazyka ve formě redukovaného textu či věcných selekčních údajů. Analýza dokumentu může probíhat automaticky pomocí strojového zpracování nebo v procesu intelektuálního zpracování lidmi, případně kombinací obou uvedených přístupů v hybridních systémech. Obsahová analýza je využívána nejen v procesu pořádání informací, ale také jako metoda kvalitativního a kvantitativního výzkumu.
Definice obsahové analýzy
TDKIV definuje obsahovou analýzu z hlediska knihovnické terminologie takto: Obsahová analýza je „analýza obsahu dokumentu zahrnující metody a pravidla pro stanovení tematiky dokumentu, příp. časového a prostorového hlediska, čtenářského určení a formy dokumentu. Slovní vyjádření obsahu dokumentu v přirozeném jazyce je transformováno do věcných selekčních údajů v procesu věcného pořádání nebo do vět v procesu sémantické redukce textu dokumentu“.[1]
V rámci výzkumných metod lze obsahovou analýzu definovat jako „výzkumnou techniku pro vytváření replikovatelných a validních úsudků z textů (nebo jiných smysluplných věcí) na kontexty vytváření jejich obsahů“.[2]
Přístupy
Automatická indexace
Automatická indexace je proces indexace s využitím strojového zpracování textu a automatického výběru termínů či automatického přiřazování termínů selekčního jazyka.[3] Výhodami automatické indexace jsou rychlost zpracování a objektivita. Nevýhodou tohoto zpracování je neschopnost postihnout jazyková specifika textu (např. homonymie, různé tvary slov, atp.). Automatická indexace je dále dělena na automatickou extrakci a automatické přiřazování. Automatická extrakce je založena na výběru termínů přímo z textu dokumentu, při tomto procesu jsou využívány statistické a matematicko-lingvistické metody. Automatické přiřazování je založeno na nápodobě intelektuálního procesu indexace – pracuje s výsledky automatické extrakce nebo přímo s plným textem.[4]
Intelektuální indexace
Intelektuální indexace je proces indexace realizovaný lidmi (indexátory). Tento způsob zpracování je zatížen subjektivitou, je časově i intelektuálně velmi náročný, oproti automatické indexaci však indexátoři nemají problémy s interpretací přirozeného jazyka.[4]
Konceptuální analýza
Konceptuální analýza je založena na zaznamenávání existence a frekvence výskytu (kvantifikaci) určených znaků a následné komparaci určitých jevů.[5]
Relační analýza
Relační analýza zaznamenává kromě výskytu znaků také vztahy mezi nimi, k této analýze je využívána sémantika, lingvistika a sledování prostorové blízkosti slov.[5]
Pracovní metody
Česká státní norma ISO 5963 (01 0174) stanovuje 3 fáze postupu indexování:
1. Analýza dokumentu a určení věcného obsahu
Při určování obsahu dokumentu je třeba věnovat pozornost názvu, obsahu úvodu, úvodním větám kapitol/odstavců a závěru, ilustracím, diagramům, tabulkám a jejich popisům a zvýrazněným slovům v textu.
2. Identifikace hlavních pojmů obsažených v předmětu
Během identifikace pojmů by měly být brány v potaz následující faktory:
- Zabývá se dokument předmětem nějaké činnosti?
- Obsahuje předmět nějaký činný pojem (např. činnost, operace, proces)?
- Je předmět činnosti identifikován?
- Zabývá se dokument nositelem činnosti?
- Odkazuje se na zvláštní prostředky k provádění činnosti (např. zvláštní nástroje, techniky nebo metody)?
- Byly tyto faktory hodnoceny v kontextu konkrétního umístění nebo prostředí?
- Jsou stanoveny nějaké závislé nebo nezávislé proměnné?
- Bylo o tématu pojednáno z nějakého speciálního hlediska, které se obvykle nespojuje s oborem výzkumu (např. sociologický výzkum náboženství)?
3. Vyjádření těchto pojmů lexikálními jednotkami selekčního jazyka
Mohou být využity pojmy již zastoupené v selekčním jazyce či nové termíny (v tomto případě je třeba tyto pojmy prověřit např. v oborových slovnících, encyklopediích, tezaurech či klasifikačních systémech).[6]
Česká státní norma ISO 214 (01 0148) určuje pravidla zpracování informativních abstraktů dokumentů. Abstrakt by měl obsahovat cíl (tj. záměry výzkumu/důvody k napsání dokumentu), použité metody a techniky, zjištěné skutečnosti a závěry, z těchto skutečností vyplývající a případně další vedlejší informace.[7]
Výsledky
Výsledkem obsahové analýzy je množina slov přirozeného jazyka, které formulují obsah (předmět/téma) dokumentu, jeho části nebo jednotlivé informace. Výsledkem obsahové analýzy může být abstrakt (referát), anotace, předmětové heslo, deskriptor nebo znak (symbol) pořádacího systému.[8]
Abstrakt (referát)
Norma ISO 214 definuje abstrakt jako „stručnou a přesnou reprezentaci obsahu dokumentu bez vlastní interpretace nebo hodnocení a bez rozlišování autorství abstraktu“. Abstrakty lze rozdělit na informativní a indikativní. Informativní abstrakt zobecňuje podstatné kvantitativní/kvalitativní informace z dokumentu. Indikativní abstrakt se používá jako shrnutí rozsáhlých textů, vystihuje hlavní probíraná témata, způsob prezentace těchto témat a druh dokumentu.[7]
Anotace
Anotace je „kratší sdělení, které charakterizuje dokument, pokud jde o obsah, hodnotu, účel, vnější formu a původ“. Funkcí anotace je prohloubení informací získaných z bibliografických údajů. B. Kovář dělí anotaci na informativní, doporučující, všeobecnou a specializovanou. Informativní anotace je krátká zpráva o tematice dokumentu. Doporučující anotace udává vhodnost dokumentu pro určité kategorie uživatelů. Všeobecná anotace popisuje dokument jako celek pro široký okruh uživatelů. Specializovaná anotace charakterizuje dokument podle určitých aspektů, je určena pro odborníky z užšího, vymezeného vědního oboru.[8]
Předmětové heslo
Předmětové heslo je prekoordinovaný pořádací prostředek, slovní (verbální) vyjádření předmětu dokumentu, tj. jeho tématu, případně vedlejších témat.[8]
Deskriptor
Deskriptor je normalizované a předepsané pořádací a selekční heslo, které vylučuje další ekvivalentní slova z užívání v daném selekčním jazyku. Složená témata jsou pomocí deskriptorů vyjadřována postkoordinovaně, tj. spojováním a kombinací hesel. Termíny lze vyhledávat v řízených slovnících deskriptorů, které obsahují synonyma (tzv. nedeskriptory) a jinak spjatá slova (např. nadřazené, podřazené, asociované termíny).[8]
Znak (symbol) pořádacího systému
V procesu systematického pořádání je verbálně vyjádřený obsah dokumentu vřazován do systému lidského poznání, přičemž výrazy přirozeného jazyka jsou převedeny na výrazové prostředky jazyka umělého, tj. znaky, symboly (notace). Příklady takových systémů jsou Mezinárodní desetinné třídění (MDT) nebo Deweyho desetinné třídění (DDT).[8]
Odkazy
Reference
- ↑ BALÍKOVÁ, Marie. Obsahová analýza. Praha: Národní knihovna ČR, 2003-. Dostupné také z: http://aleph.nkp.cz/F/?func=direct
- ↑ HÁJEK, Martin. Čtenář a stroj::Vybrané metody sociálněvědní analýzy textů: Čtenář a stroj:Vybrané metody sociálněvědní analýzy textů. Vyd. 1. Praha: Sociologické nakladatelství, 2014. ISBN 978-80-7419-161-9.
- ↑ BALÍKOVÁ, Marie. Automatická indexace. Praha: Národní knihovna ČR, 2003-. Dostupné také z: http://aleph.nkp.cz/F/6INQPAN8IVHV35PLFX25FER36614QC7KER4J48D22LDGIQ8U4L-26896?func=full-set-set
- ↑ 4,0 4,1 SCHWARZ, Josef. Současný stav a trendy automatické indexace dokumentů::přehledová studie: Současný stav a trendy automatické indexace dokumentů:přehledová studie. 2003. Dostupné také z: http://www.ikaros.cz/node/1300
- ↑ 5,0 5,1 DVOŘÁKOVÁ, Ilona. Obsahová analýza / formální obsahová analýza / kvantitativní obsahová analýza. 2010. Dostupné také z: http://www.antropoweb.cz/media/webzin/webzin_2_2010/Dvorakova__I-2-2010.pdf
- ↑ ČSN ISO 5963 (01 0174). Dokumentace. Metody analýzy dokumentů, určování jejich obsahu a výběru lexikálních jednotek selekčního jazyka. 1. vyd. Praha: Český normalizační institut, 1995.
- ↑ 7,0 7,1 ČSN ISO 214 (01 0148). Dokumentace - abstrakty pro publikace a dokumentaci. Praha: Český normalizační institut, 2001.
- ↑ 8,0 8,1 8,2 8,3 8,4 KOVÁŘ, Blahoslav. Obsahová analýza dokumentu. Praha: ÚVTEI, 1974.
Doporučená literatura
- ČSN ISO 214. Dokumentace - abstrakty pro publikace a dokumentaci. Praha: Český normalizační institut, 2001. 16 s. Třídící znak 01 0148.
- ČSN ISO 5963. Dokumentace. Metody analýzy dokumentů, určování jejich obsahu a výběru lexikálních jednotek selekčního jazyka. 1. vyd. Praha: Český normalizační institut, 1995. 10 s. Třídící znak 01 0174.
- HÁJEK, Martin. Čtenář a stroj: vybrané metody sociálněvědní analýzy textů. Vyd. 1. Praha: Sociologické nakladatelství (SLON), 2014. 226 s. ISBN 978-80-7419-161-9.
- HYHLÍKOVÁ, Věra. Informační analýza dokumentu. Praha: UVTEI-Institut pro mimoškolní vzdělávání, 1984. 80 s. Učební texty / UVTEI; 19.
- KOVÁŘ, Blahoslav. Obsahová analýza dokumentu. Praha: ÚVTEI, 1974. 44 s. Metodický leták; sv. 105.
- KUČEROVÁ, Helena. Co analyzujeme při obsahové analýze dokumentů? K pojmu aboutness v organizaci znalostí. Knihovna: knihovnická revue, 2014, 25(1), s. 36-54. ISSN 1801-3252. Dostupné také z: http://knihovna.nkp.cz/knihovna141/141036.htm.
Související články
- Analýza vybraných trendů ve věcném pořádání a vyhledávání informací
- Automatická indexace
- Obsahová analýza
- Tradiční systémy pořádání informací a znalostí - vlastnosti a možnosti jejich využití
- Typy redukovaného textu – pracovní postupy a využití
- Vliv interpretace textu na výsledky textové a obsahové analýzy
Klíčová slova
indexace, obsahová analýza, věcné pořádání informací, výzkumné metody