Elektronické archivy ve vybraných oborech vědy a výzkumu a jejich propojování na základě protokolu OAl-PMH: Porovnání verzí
Značka: editace z Vizuálního editoru |
|||
(Nejsou zobrazeny 3 mezilehlé verze od jednoho dalšího uživatele.) | |||
Řádek 1: | Řádek 1: | ||
− | Hlavní myšlenka elektronických archivů klade důraz na volnou přístupnost metadat pro uživatele a pracovníky informačních potažmo paměťových institucí. Umožnění takové přístupnosti je v souladu s principem [[Systém výzkumu, metody informační vědy a vědecká komunikace|vědecké komunikace]]. Doporučeným standardem pro komunikaci metadat je protokol [[OAI-PMH]] (Protocol for Metadata Harvesting). Všeobecně prostředí elektronických archivů umožňuje rychlou a bezplatnou komunikaci informací. Dalo by se také říci, že elektronické archivy spolu s volně přístupnými online časopisy patří ke dvěma základním formám otevřeného elektronického publikování ve vědě a podporují tím myšlenku [[Open Access|otevřených přístupů]]. | + | Hlavní myšlenka elektronických archivů klade důraz na volnou přístupnost [[Metadata|metadat]] pro uživatele a pracovníky informačních potažmo paměťových institucí. Umožnění takové přístupnosti je v souladu s principem [[Systém výzkumu, metody informační vědy a vědecká komunikace|vědecké komunikace]]. Doporučeným standardem pro komunikaci metadat je protokol [[OAI-PMH]] (Protocol for Metadata Harvesting). Všeobecně prostředí elektronických archivů umožňuje rychlou a bezplatnou komunikaci [[Informace|informací]]. Dalo by se také říci, že elektronické archivy spolu s volně přístupnými online časopisy patří ke dvěma základním formám otevřeného [[Elektronické publikování|elektronického publikování]] ve vědě a podporují tím myšlenku [[Open Access|otevřených přístupů]]. |
===Charakteristika archivů elektronických tisků=== | ===Charakteristika archivů elektronických tisků=== | ||
− | *uložení preprintů/postprintů vědeckých článků | + | *uložení [[Preprint|preprintů]]/postprintů vědeckých článků |
*vstup do archivu - jen autoři textů a správci archivu | *vstup do archivu - jen autoři textů a správci archivu | ||
Řádek 11: | Řádek 11: | ||
*v archivech probíhá diskuse o článku a autor jej opravuje | *v archivech probíhá diskuse o článku a autor jej opravuje | ||
− | *auto-archivace '''–''' forma,kdy sám autor uloží článek do repozitáře a provede bibliografické zpracování pomocí interaktivního formuláře pro tvorbu metadat | + | *auto-archivace '''–''' forma, kdy sám autor uloží článek do repozitáře a provede bibliografické zpracování pomocí interaktivního formuláře pro tvorbu metadat |
===Typologie e-archivů / repozitářů=== | ===Typologie e-archivů / repozitářů=== | ||
Řádek 19: | Řádek 19: | ||
*'''obsahově:''' univerzální / víceoborové / oborové n. tematické | *'''obsahově:''' univerzální / víceoborové / oborové n. tematické | ||
− | *'''centralizace:''' centralizované (s jediným repozitářem) / distribuované – „virtuální“ (s více repozitáři a centrální databází metadat včetně jednotného rozhraní pro vyhledávání distribuované systémy bývají označovány termínem | + | *'''centralizace:''' centralizované (s jediným repozitářem) / distribuované – „virtuální“ (s více repozitáři a centrální [[Databáze|databází]] metadat včetně jednotného rozhraní pro vyhledávání distribuované systémy bývají označovány termínem „[[digitální knihovna]]“ |
<br /> | <br /> | ||
Řádek 43: | Řádek 43: | ||
<u>Dublin Core a XML v OAI-PMH</u> | <u>Dublin Core a XML v OAI-PMH</u> | ||
− | Ke komunikaci metadat je využíván formát založený na sémantice '''Dublin Core''' a z hlediska syntaxe '''jazyk XML'''. | + | Ke komunikaci metadat je využíván formát založený na sémantice '''Dublin Core'''<ref>Dublin Core https://dublincore.org </ref> a z hlediska syntaxe '''jazyk XML'''. |
− | Získávané záznamy pomocí těchto formátů | + | Získávané záznamy pomocí těchto formátů, mají 3 části: |
(Header) hlavičku | (Header) hlavičku | ||
Řádek 58: | Řádek 58: | ||
Protokol – soubor pravidel, který definuje nějaký proces nebo činnost | Protokol – soubor pravidel, který definuje nějaký proces nebo činnost | ||
− | Protokol (Internet) – pravidla pro komunikaci | + | Protokol ([[Internet]]) – pravidla pro komunikaci |
Harvesting – sběr metadat z distribuovaných repozitářů do centrálního datového skladu | Harvesting – sběr metadat z distribuovaných repozitářů do centrálního datového skladu | ||
Řádek 70: | Řádek 70: | ||
===Příklady jednotlivých digitálních archivů=== | ===Příklady jednotlivých digitálních archivů=== | ||
− | arXiv.org<ref>https://arxiv.org</ref> | + | Obory Informační vědy |
+ | |||
+ | arXiv.org<ref>arXiv https://arxiv.org</ref> | ||
*založen v roce1991 v Los Alamos, Cornellova univerzita | *založen v roce1991 v Los Alamos, Cornellova univerzita | ||
*dohled – Poradní rada | *dohled – Poradní rada | ||
− | *vlastní SW aplikace | + | *vlastní [[Software|SW]] aplikace |
− | *obory na které je archiv zaměřen: fyzika, matematika, počítačová věda, kvantitativní biologie, | + | *obory na které je archiv zaměřen: fyzika, matematika, počítačová věda, kvantitativní biologie, [[statistika]]… |
*více než půlmilionu e-dokumentů | *více než půlmilionu e-dokumentů | ||
− | *formáty ukládaných textů: LaTeX, PDF, HTML, Postscript | + | *formáty ukládaných textů: LaTeX, PDF, [[Charakterizujte formáty souborů HTML a XML. Popište, k čemu se používají. Uveďte několik základních značek HTML a popište jejich význam.|HTML]], Postscript |
− | *metadata: název, autoři, abstrakt, poznámky, číslo zprávy (u výzkumu), předmětová skupina, informace o časopisu, který tento článek publikoval, DOI, třídění MCS (Mathematical Subject Classification) | + | *metadata: název, autoři, abstrakt, poznámky, číslo zprávy (u výzkumu), předmětová skupina, informace o časopisu, který tento článek publikoval, [[DOI]], třídění MCS (Mathematical Subject Classification) |
*každý dokument má svůj jedinečný identifikátor | *každý dokument má svůj jedinečný identifikátor | ||
− | ''E-LIS''<ref>http://eprints.rclis.org</ref> | + | ''E-LIS''<ref>E-LIS http://eprints.rclis.org</ref> |
*Funguje od roku 2003 | *Funguje od roku 2003 | ||
− | *Obory na které je archiv zaměřen: knihovnictví a informační věda (Eprints in Library and Information Science) | + | *Obory na které je archiv zaměřen: [[Informační věda a knihovnictví|knihovnictví a informační věda]] (Eprints in Library and Information Science) |
*Nejsou jazyková ani geografická omezení tzn. nalezneme i články v Čj, nicméně klíčová slova jsou v Aj | *Nejsou jazyková ani geografická omezení tzn. nalezneme i články v Čj, nicméně klíčová slova jsou v Aj | ||
*SW – ''Eprints'' | *SW – ''Eprints'' | ||
Řádek 96: | Řádek 98: | ||
*Od roku 2002 | *Od roku 2002 | ||
− | *Obory na které je archiv zaměřen: knihovnictví a informační věda, informační vzdělávání | + | *Obory, na které je archiv zaměřen: knihovnictví a informační věda, informační vzdělávání |
*menší | *menší | ||
− | * | + | |
+ | ''DoIS'' | ||
+ | |||
+ | *2001 | ||
+ | *nejnovější informací z oboru | ||
+ | *hybridní – záznamy volně i komerčně dostupných dokumentů | ||
+ | *řízeno dobrovolníky z mnoha zemí | ||
+ | *metadata - [[ReDIF]] (Research Documentation Information Format) | ||
+ | |||
+ | |||
+ | ''@SIC'' | ||
+ | |||
+ | *''Archive Ouverte en Science de l´Information et de la Communication'' | ||
+ | *zahrnuje plné texty dokumentů | ||
+ | *obory: ''věda o informacích a komunikaci'' | ||
Řádek 104: | Řádek 120: | ||
− | Medicína: | + | <u>Medicína:</u> |
Clinical Medicine and Health Research Netprints (clinmed) | Clinical Medicine and Health Research Netprints (clinmed) | ||
Řádek 111: | Řádek 127: | ||
− | Ekonomika | + | <u>Ekonomika</u> |
Research Papers in Economics (RePEc) | Research Papers in Economics (RePEc) | ||
Řádek 118: | Řádek 134: | ||
− | Víceoborové | + | <u>Víceoborové</u> |
+ | |||
+ | Social Science Research Network | ||
+ | |||
+ | ====Reference==== | ||
+ | <references /> | ||
+ | |||
+ | ====Doporučená literatura==== | ||
+ | |||
+ | #PLANKOVÁ J. (2008) Otevřené archivy elektronických tisků a digitální knihovny pro obor informační věda a knihovnictví: Ikaros, 12(5) | ||
+ | #Open Archive Initiative: Protocol for Metadata Harvesting [webpage] Retrieved from https://www.openarchives.org/pmh/ | ||
+ | #BRATKOVÁ E. (2008). Otevřený přístup a digitální knihovny v oblasti vědy a výzkumu: vybrané systémy. Praha: Univerzita Karlova | ||
+ | |||
+ | ====Související články==== | ||
+ | [[Otevřený přístup (Open Access) k informacím ve vědě a výzkumu, jeho vývoj,hlavní zdroje, jejich registry a podpora v globálním rámci|OAI-PMH]] | ||
+ | |||
+ | [[Otevřený přístup (Open Access) k informacím ve vědě a výzkumu, jeho vývoj,hlavní zdroje, jejich registry a podpora v globálním rámci|Open Access]] | ||
+ | |||
+ | [[archiv]] | ||
+ | |||
+ | [[Využití formátu XML v knihovnických aplikacích]]<br />[[OAIS Referenční model Otevřeného archivního informačního systému]] | ||
+ | |||
+ | ====Klíčová slova==== | ||
+ | Elektronický archiv, propojování, metadata, vědecká komunikace, elektronický dokument, přístup, protokol, OAI- PMH, agregace, harvestování dat | ||
− | + | [[Kategorie:Informační studia a knihovnictví]] | |
+ | [[Kategorie: Státnicové otázky UISK]] |
Aktuální verze z 28. 12. 2020, 21:58
Hlavní myšlenka elektronických archivů klade důraz na volnou přístupnost metadat pro uživatele a pracovníky informačních potažmo paměťových institucí. Umožnění takové přístupnosti je v souladu s principem vědecké komunikace. Doporučeným standardem pro komunikaci metadat je protokol OAI-PMH (Protocol for Metadata Harvesting). Všeobecně prostředí elektronických archivů umožňuje rychlou a bezplatnou komunikaci informací. Dalo by se také říci, že elektronické archivy spolu s volně přístupnými online časopisy patří ke dvěma základním formám otevřeného elektronického publikování ve vědě a podporují tím myšlenku otevřených přístupů.
Obsah
Charakteristika archivů elektronických tisků
- uložení preprintů/postprintů vědeckých článků
- vstup do archivu - jen autoři textů a správci archivu
- archivy mají moderátory – formální kontrola, správné zařazení
- v archivech probíhá diskuse o článku a autor jej opravuje
- auto-archivace – forma, kdy sám autor uloží článek do repozitáře a provede bibliografické zpracování pomocí interaktivního formuláře pro tvorbu metadat
Typologie e-archivů / repozitářů
- místně: lokální / národní / mezinárodní
- obsahově: univerzální / víceoborové / oborové n. tematické
- centralizace: centralizované (s jediným repozitářem) / distribuované – „virtuální“ (s více repozitáři a centrální databází metadat včetně jednotného rozhraní pro vyhledávání distribuované systémy bývají označovány termínem „digitální knihovna“
Principy propojování otevřených archivů:
1. mechanismus ukládání jednotek (digitální dokument i metadata)
2. systémy dlouhodobého uložení a uchování jednotek
3. řízená politika uložení a ochrany digitálních jednotek
4. otevřené rozhraní ke sběru dat zprostředkovatelským systémem (poskytovatelem služby)
OAI-PMH
Detailní popis protokolu je uveden pod stejnojmenným heslem. Zde jen připomeneme některé jeho důležité vlastnosti.
- V současné chvíli se propojování uskutečňuje zejména formou sběru a transferu medatat, nikoliv samotným sdílením digitálních dokumentů.
- Propojování je možné pomocí 6 základních příkazů definovaných v rámci protokolu OAI-PMH tj. Identify, ListMetadataFormats, ListSets, ListIdentifiers, ListRecords, GetRecords
Dublin Core a XML v OAI-PMH
Ke komunikaci metadat je využíván formát založený na sémantice Dublin Core[1] a z hlediska syntaxe jazyk XML.
Získávané záznamy pomocí těchto formátů, mají 3 části:
(Header) hlavičku
(Metadata) informace o původu záznamu
(About) informace o možnostech využití záznamu a dokumentu- nepovinné
Důležité pojmy v kontextu protokolu OAI-PMH:
Protokol – soubor pravidel, který definuje nějaký proces nebo činnost
Protokol (Internet) – pravidla pro komunikaci
Harvesting – sběr metadat z distribuovaných repozitářů do centrálního datového skladu
Harvester – aplikace pro realizaci požadavků OAI-PMH
Poskytovatel dat (Data Provider) – producent označovaný také jako „agregátor“ udržuje jeden nebo více repozitářů, které podporují OAI-PMH
Repozitář – síťové dostupný server, schopný správně zpracovat OAI-PMH protokoly
Příklady jednotlivých digitálních archivů
Obory Informační vědy
arXiv.org[2]
- založen v roce1991 v Los Alamos, Cornellova univerzita
- dohled – Poradní rada
- vlastní SW aplikace
- obory na které je archiv zaměřen: fyzika, matematika, počítačová věda, kvantitativní biologie, statistika…
- více než půlmilionu e-dokumentů
- formáty ukládaných textů: LaTeX, PDF, HTML, Postscript
- metadata: název, autoři, abstrakt, poznámky, číslo zprávy (u výzkumu), předmětová skupina, informace o časopisu, který tento článek publikoval, DOI, třídění MCS (Mathematical Subject Classification)
- každý dokument má svůj jedinečný identifikátor
E-LIS[3]
- Funguje od roku 2003
- Obory na které je archiv zaměřen: knihovnictví a informační věda (Eprints in Library and Information Science)
- Nejsou jazyková ani geografická omezení tzn. nalezneme i články v Čj, nicméně klíčová slova jsou v Aj
- SW – Eprints
- Mnoho formátů (povinná je 1 kopie ve formátu HTML – pro účely trvalého uložení), doporučován je formát PDF
- ParaCite Toolkit- propojování citovaných dokumentů s jejich plnými texty
- Vlastní oborová klasifikace "JITA"
- Nejde jen o post/preprinty –vztahuje se i na knihy, konference apod. (23 typů)
DLIST
- Od roku 2002
- Obory, na které je archiv zaměřen: knihovnictví a informační věda, informační vzdělávání
- menší
DoIS
- 2001
- nejnovější informací z oboru
- hybridní – záznamy volně i komerčně dostupných dokumentů
- řízeno dobrovolníky z mnoha zemí
- metadata - ReDIF (Research Documentation Information Format)
@SIC
- Archive Ouverte en Science de l´Information et de la Communication
- zahrnuje plné texty dokumentů
- obory: věda o informacích a komunikaci
Další příklady archivů, seřazených podle oborovosti
Medicína:
Clinical Medicine and Health Research Netprints (clinmed)
PubMedCentra
Ekonomika
Research Papers in Economics (RePEc)
Computer Science Teaching Center (CSTC)
Víceoborové
Social Science Research Network
Reference
- ↑ Dublin Core https://dublincore.org
- ↑ arXiv https://arxiv.org
- ↑ E-LIS http://eprints.rclis.org
Doporučená literatura
- PLANKOVÁ J. (2008) Otevřené archivy elektronických tisků a digitální knihovny pro obor informační věda a knihovnictví: Ikaros, 12(5)
- Open Archive Initiative: Protocol for Metadata Harvesting [webpage] Retrieved from https://www.openarchives.org/pmh/
- BRATKOVÁ E. (2008). Otevřený přístup a digitální knihovny v oblasti vědy a výzkumu: vybrané systémy. Praha: Univerzita Karlova
Související články
Využití formátu XML v knihovnických aplikacích
OAIS Referenční model Otevřeného archivního informačního systému
Klíčová slova
Elektronický archiv, propojování, metadata, vědecká komunikace, elektronický dokument, přístup, protokol, OAI- PMH, agregace, harvestování dat