Elektronické archivy ve vybraných oborech vědy a výzkumu a jejich propojování na základě protokolu OAl-PMH: Porovnání verzí
Značka: editace z Vizuálního editoru |
|||
(Nejsou zobrazeny 4 mezilehlé verze od jednoho dalšího uživatele.) | |||
Řádek 1: | Řádek 1: | ||
− | Hlavní myšlenka elektronických archivů klade důraz na volnou přístupnost metadat pro uživatele a pracovníky informačních potažmo paměťových institucí. Umožnění takové přístupnosti je v souladu s principem [[Systém výzkumu, metody informační vědy a vědecká komunikace|vědecké komunikace]]. Doporučeným standardem pro komunikaci metadat je protokol [[OAI-PMH]] (Protocol for Metadata Harvesting). Všeobecně prostředí elektronických archivů umožňuje rychlou a bezplatnou komunikaci informací. Dalo by se také říci, že elektronické archivy spolu s volně přístupnými online časopisy patří ke dvěma základním formám otevřeného elektronického publikování ve vědě a podporují tím myšlenku [[Open Access|otevřených přístupů]]. | + | Hlavní myšlenka elektronických archivů klade důraz na volnou přístupnost [[Metadata|metadat]] pro uživatele a pracovníky informačních potažmo paměťových institucí. Umožnění takové přístupnosti je v souladu s principem [[Systém výzkumu, metody informační vědy a vědecká komunikace|vědecké komunikace]]. Doporučeným standardem pro komunikaci metadat je protokol [[OAI-PMH]] (Protocol for Metadata Harvesting). Všeobecně prostředí elektronických archivů umožňuje rychlou a bezplatnou komunikaci [[Informace|informací]]. Dalo by se také říci, že elektronické archivy spolu s volně přístupnými online časopisy patří ke dvěma základním formám otevřeného [[Elektronické publikování|elektronického publikování]] ve vědě a podporují tím myšlenku [[Open Access|otevřených přístupů]]. |
− | === Charakteristika archivů elektronických tisků === | + | ===Charakteristika archivů elektronických tisků=== |
− | * uložení preprintů/postprintů vědeckých článků | + | *uložení [[Preprint|preprintů]]/postprintů vědeckých článků |
− | * vstup do archivu - jen autoři textů a správci archivu | + | *vstup do archivu - jen autoři textů a správci archivu |
− | * archivy mají moderátory – formální kontrola, správné zařazení | + | *archivy mají moderátory – formální kontrola, správné zařazení |
− | * v archivech probíhá diskuse o článku a autor jej opravuje | + | *v archivech probíhá diskuse o článku a autor jej opravuje |
− | * auto-archivace '''–''' forma,kdy sám autor uloží článek do repozitáře a provede bibliografické zpracování pomocí interaktivního formuláře pro tvorbu metadat | + | *auto-archivace '''–''' forma, kdy sám autor uloží článek do repozitáře a provede bibliografické zpracování pomocí interaktivního formuláře pro tvorbu metadat |
− | === Typologie e-archivů / repozitářů === | + | ===Typologie e-archivů / repozitářů=== |
− | * '''místně''': lokální / národní / mezinárodní | + | *'''místně''': lokální / národní / mezinárodní |
− | * '''obsahově:''' univerzální / víceoborové / oborové n. tematické | + | *'''obsahově:''' univerzální / víceoborové / oborové n. tematické |
− | * '''centralizace:''' centralizované (s jediným repozitářem) / distribuované – „virtuální“ (s více repozitáři a centrální databází metadat včetně jednotného rozhraní pro vyhledávání distribuované systémy bývají označovány termínem | + | *'''centralizace:''' centralizované (s jediným repozitářem) / distribuované – „virtuální“ (s více repozitáři a centrální [[Databáze|databází]] metadat včetně jednotného rozhraní pro vyhledávání distribuované systémy bývají označovány termínem „[[digitální knihovna]]“ |
<br /> | <br /> | ||
− | === Principy propojování otevřených archivů: === | + | ===Principy propojování otevřených archivů:=== |
1. mechanismus ukládání jednotek (digitální dokument i metadata) | 1. mechanismus ukládání jednotek (digitální dokument i metadata) | ||
Řádek 33: | Řádek 33: | ||
<br /> | <br /> | ||
− | === [[OAI-PMH]] === | + | ===[[OAI-PMH]]=== |
Detailní popis protokolu je uveden pod stejnojmenným heslem. Zde jen připomeneme některé jeho důležité vlastnosti. | Detailní popis protokolu je uveden pod stejnojmenným heslem. Zde jen připomeneme některé jeho důležité vlastnosti. | ||
− | * V současné chvíli se propojování uskutečňuje zejména formou '''sběru a transferu medatat,''' nikoliv samotným sdílením digitálních dokumentů. | + | *V současné chvíli se propojování uskutečňuje zejména formou '''sběru a transferu medatat,''' nikoliv samotným sdílením digitálních dokumentů. |
− | * Propojování je možné pomocí 6 '''základních příkazů''' definovaných v rámci protokolu OAI-PMH tj. Identify, ListMetadataFormats, ListSets, ListIdentifiers, ListRecords, GetRecords | + | *Propojování je možné pomocí 6 '''základních příkazů''' definovaných v rámci protokolu OAI-PMH tj. Identify, ListMetadataFormats, ListSets, ListIdentifiers, ListRecords, GetRecords |
<u>Dublin Core a XML v OAI-PMH</u> | <u>Dublin Core a XML v OAI-PMH</u> | ||
− | Ke komunikaci metadat je využíván formát založený na sémantice '''Dublin Core''' a z hlediska syntaxe '''jazyk XML'''. | + | Ke komunikaci metadat je využíván formát založený na sémantice '''Dublin Core'''<ref>Dublin Core https://dublincore.org </ref> a z hlediska syntaxe '''jazyk XML'''. |
− | Získávané záznamy pomocí těchto formátů | + | Získávané záznamy pomocí těchto formátů, mají 3 části: |
(Header) hlavičku | (Header) hlavičku | ||
Řádek 58: | Řádek 58: | ||
Protokol – soubor pravidel, který definuje nějaký proces nebo činnost | Protokol – soubor pravidel, který definuje nějaký proces nebo činnost | ||
− | Protokol (Internet) – pravidla pro komunikaci | + | Protokol ([[Internet]]) – pravidla pro komunikaci |
Harvesting – sběr metadat z distribuovaných repozitářů do centrálního datového skladu | Harvesting – sběr metadat z distribuovaných repozitářů do centrálního datového skladu | ||
Řádek 69: | Řádek 69: | ||
<br /> | <br /> | ||
− | === Příklady jednotlivých digitálních archivů === | + | ===Příklady jednotlivých digitálních archivů=== |
− | + | Obory Informační vědy | |
− | + | arXiv.org<ref>arXiv https://arxiv.org</ref> | |
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
+ | *založen v roce1991 v Los Alamos, Cornellova univerzita | ||
+ | *dohled – Poradní rada | ||
+ | *vlastní [[Software|SW]] aplikace | ||
+ | *obory na které je archiv zaměřen: fyzika, matematika, počítačová věda, kvantitativní biologie, [[statistika]]… | ||
+ | *více než půlmilionu e-dokumentů | ||
+ | *formáty ukládaných textů: LaTeX, PDF, [[Charakterizujte formáty souborů HTML a XML. Popište, k čemu se používají. Uveďte několik základních značek HTML a popište jejich význam.|HTML]], Postscript | ||
+ | *metadata: název, autoři, abstrakt, poznámky, číslo zprávy (u výzkumu), předmětová skupina, informace o časopisu, který tento článek publikoval, [[DOI]], třídění MCS (Mathematical Subject Classification) | ||
+ | *každý dokument má svůj jedinečný identifikátor | ||
− | |||
− | + | ''E-LIS''<ref>E-LIS http://eprints.rclis.org</ref> | |
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | + | *Funguje od roku 2003 | |
+ | *Obory na které je archiv zaměřen: [[Informační věda a knihovnictví|knihovnictví a informační věda]] (Eprints in Library and Information Science) | ||
+ | *Nejsou jazyková ani geografická omezení tzn. nalezneme i články v Čj, nicméně klíčová slova jsou v Aj | ||
+ | *SW – ''Eprints'' | ||
+ | *Mnoho formátů (povinná je 1 kopie ve formátu HTML – pro účely trvalého uložení), doporučován je formát PDF | ||
+ | *ParaCite Toolkit- propojování citovaných dokumentů s jejich plnými texty | ||
+ | *Vlastní oborová klasifikace "JITA" | ||
+ | *Nejde jen o post/preprinty –vztahuje se i na knihy, konference apod. (23 typů) | ||
− | + | DLIST | |
− | |||
− | |||
− | + | *Od roku 2002 | |
+ | *Obory, na které je archiv zaměřen: knihovnictví a informační věda, informační vzdělávání | ||
+ | *menší | ||
+ | ''DoIS'' | ||
− | + | *2001 | |
+ | *nejnovější informací z oboru | ||
+ | *hybridní – záznamy volně i komerčně dostupných dokumentů | ||
+ | *řízeno dobrovolníky z mnoha zemí | ||
+ | *metadata - [[ReDIF]] (Research Documentation Information Format) | ||
− | |||
− | + | ''@SIC'' | |
− | + | *''Archive Ouverte en Science de l´Information et de la Communication'' | |
+ | *zahrnuje plné texty dokumentů | ||
+ | *obory: ''věda o informacích a komunikaci'' | ||
− | |||
− | + | Další příklady archivů, seřazených podle oborovosti | |
− | |||
− | + | <u>Medicína:</u> | |
− | + | Clinical Medicine and Health Research Netprints (clinmed) | |
+ | |||
+ | PubMedCentra | ||
+ | |||
+ | |||
+ | <u>Ekonomika</u> | ||
+ | |||
+ | Research Papers in Economics (RePEc) | ||
+ | |||
+ | Computer Science Teaching Center (CSTC) | ||
+ | |||
+ | |||
+ | <u>Víceoborové</u> | ||
+ | |||
+ | Social Science Research Network | ||
+ | |||
+ | ====Reference==== | ||
+ | <references /> | ||
+ | |||
+ | ====Doporučená literatura==== | ||
+ | |||
+ | #PLANKOVÁ J. (2008) Otevřené archivy elektronických tisků a digitální knihovny pro obor informační věda a knihovnictví: Ikaros, 12(5) | ||
+ | #Open Archive Initiative: Protocol for Metadata Harvesting [webpage] Retrieved from https://www.openarchives.org/pmh/ | ||
+ | #BRATKOVÁ E. (2008). Otevřený přístup a digitální knihovny v oblasti vědy a výzkumu: vybrané systémy. Praha: Univerzita Karlova | ||
+ | |||
+ | ====Související články==== | ||
+ | [[Otevřený přístup (Open Access) k informacím ve vědě a výzkumu, jeho vývoj,hlavní zdroje, jejich registry a podpora v globálním rámci|OAI-PMH]] | ||
+ | |||
+ | [[Otevřený přístup (Open Access) k informacím ve vědě a výzkumu, jeho vývoj,hlavní zdroje, jejich registry a podpora v globálním rámci|Open Access]] | ||
+ | |||
+ | [[archiv]] | ||
+ | |||
+ | [[Využití formátu XML v knihovnických aplikacích]]<br />[[OAIS Referenční model Otevřeného archivního informačního systému]] | ||
+ | |||
+ | ====Klíčová slova==== | ||
+ | Elektronický archiv, propojování, metadata, vědecká komunikace, elektronický dokument, přístup, protokol, OAI- PMH, agregace, harvestování dat | ||
+ | |||
+ | [[Kategorie:Informační studia a knihovnictví]] | ||
+ | [[Kategorie: Státnicové otázky UISK]] |
Aktuální verze z 28. 12. 2020, 21:58
Hlavní myšlenka elektronických archivů klade důraz na volnou přístupnost metadat pro uživatele a pracovníky informačních potažmo paměťových institucí. Umožnění takové přístupnosti je v souladu s principem vědecké komunikace. Doporučeným standardem pro komunikaci metadat je protokol OAI-PMH (Protocol for Metadata Harvesting). Všeobecně prostředí elektronických archivů umožňuje rychlou a bezplatnou komunikaci informací. Dalo by se také říci, že elektronické archivy spolu s volně přístupnými online časopisy patří ke dvěma základním formám otevřeného elektronického publikování ve vědě a podporují tím myšlenku otevřených přístupů.
Obsah
Charakteristika archivů elektronických tisků
- uložení preprintů/postprintů vědeckých článků
- vstup do archivu - jen autoři textů a správci archivu
- archivy mají moderátory – formální kontrola, správné zařazení
- v archivech probíhá diskuse o článku a autor jej opravuje
- auto-archivace – forma, kdy sám autor uloží článek do repozitáře a provede bibliografické zpracování pomocí interaktivního formuláře pro tvorbu metadat
Typologie e-archivů / repozitářů
- místně: lokální / národní / mezinárodní
- obsahově: univerzální / víceoborové / oborové n. tematické
- centralizace: centralizované (s jediným repozitářem) / distribuované – „virtuální“ (s více repozitáři a centrální databází metadat včetně jednotného rozhraní pro vyhledávání distribuované systémy bývají označovány termínem „digitální knihovna“
Principy propojování otevřených archivů:
1. mechanismus ukládání jednotek (digitální dokument i metadata)
2. systémy dlouhodobého uložení a uchování jednotek
3. řízená politika uložení a ochrany digitálních jednotek
4. otevřené rozhraní ke sběru dat zprostředkovatelským systémem (poskytovatelem služby)
OAI-PMH
Detailní popis protokolu je uveden pod stejnojmenným heslem. Zde jen připomeneme některé jeho důležité vlastnosti.
- V současné chvíli se propojování uskutečňuje zejména formou sběru a transferu medatat, nikoliv samotným sdílením digitálních dokumentů.
- Propojování je možné pomocí 6 základních příkazů definovaných v rámci protokolu OAI-PMH tj. Identify, ListMetadataFormats, ListSets, ListIdentifiers, ListRecords, GetRecords
Dublin Core a XML v OAI-PMH
Ke komunikaci metadat je využíván formát založený na sémantice Dublin Core[1] a z hlediska syntaxe jazyk XML.
Získávané záznamy pomocí těchto formátů, mají 3 části:
(Header) hlavičku
(Metadata) informace o původu záznamu
(About) informace o možnostech využití záznamu a dokumentu- nepovinné
Důležité pojmy v kontextu protokolu OAI-PMH:
Protokol – soubor pravidel, který definuje nějaký proces nebo činnost
Protokol (Internet) – pravidla pro komunikaci
Harvesting – sběr metadat z distribuovaných repozitářů do centrálního datového skladu
Harvester – aplikace pro realizaci požadavků OAI-PMH
Poskytovatel dat (Data Provider) – producent označovaný také jako „agregátor“ udržuje jeden nebo více repozitářů, které podporují OAI-PMH
Repozitář – síťové dostupný server, schopný správně zpracovat OAI-PMH protokoly
Příklady jednotlivých digitálních archivů
Obory Informační vědy
arXiv.org[2]
- založen v roce1991 v Los Alamos, Cornellova univerzita
- dohled – Poradní rada
- vlastní SW aplikace
- obory na které je archiv zaměřen: fyzika, matematika, počítačová věda, kvantitativní biologie, statistika…
- více než půlmilionu e-dokumentů
- formáty ukládaných textů: LaTeX, PDF, HTML, Postscript
- metadata: název, autoři, abstrakt, poznámky, číslo zprávy (u výzkumu), předmětová skupina, informace o časopisu, který tento článek publikoval, DOI, třídění MCS (Mathematical Subject Classification)
- každý dokument má svůj jedinečný identifikátor
E-LIS[3]
- Funguje od roku 2003
- Obory na které je archiv zaměřen: knihovnictví a informační věda (Eprints in Library and Information Science)
- Nejsou jazyková ani geografická omezení tzn. nalezneme i články v Čj, nicméně klíčová slova jsou v Aj
- SW – Eprints
- Mnoho formátů (povinná je 1 kopie ve formátu HTML – pro účely trvalého uložení), doporučován je formát PDF
- ParaCite Toolkit- propojování citovaných dokumentů s jejich plnými texty
- Vlastní oborová klasifikace "JITA"
- Nejde jen o post/preprinty –vztahuje se i na knihy, konference apod. (23 typů)
DLIST
- Od roku 2002
- Obory, na které je archiv zaměřen: knihovnictví a informační věda, informační vzdělávání
- menší
DoIS
- 2001
- nejnovější informací z oboru
- hybridní – záznamy volně i komerčně dostupných dokumentů
- řízeno dobrovolníky z mnoha zemí
- metadata - ReDIF (Research Documentation Information Format)
@SIC
- Archive Ouverte en Science de l´Information et de la Communication
- zahrnuje plné texty dokumentů
- obory: věda o informacích a komunikaci
Další příklady archivů, seřazených podle oborovosti
Medicína:
Clinical Medicine and Health Research Netprints (clinmed)
PubMedCentra
Ekonomika
Research Papers in Economics (RePEc)
Computer Science Teaching Center (CSTC)
Víceoborové
Social Science Research Network
Reference
- ↑ Dublin Core https://dublincore.org
- ↑ arXiv https://arxiv.org
- ↑ E-LIS http://eprints.rclis.org
Doporučená literatura
- PLANKOVÁ J. (2008) Otevřené archivy elektronických tisků a digitální knihovny pro obor informační věda a knihovnictví: Ikaros, 12(5)
- Open Archive Initiative: Protocol for Metadata Harvesting [webpage] Retrieved from https://www.openarchives.org/pmh/
- BRATKOVÁ E. (2008). Otevřený přístup a digitální knihovny v oblasti vědy a výzkumu: vybrané systémy. Praha: Univerzita Karlova
Související články
Využití formátu XML v knihovnických aplikacích
OAIS Referenční model Otevřeného archivního informačního systému
Klíčová slova
Elektronický archiv, propojování, metadata, vědecká komunikace, elektronický dokument, přístup, protokol, OAI- PMH, agregace, harvestování dat