Trvalé identifikátory digitálních informačních entit: Porovnání verzí

Řádek 46: Řádek 46:
 
* Systém identifikátoru DOI vznikl na základě rozvíjených standardů pro směrování jmen (zejména [[HDL|Systému Handle]]) a také standardů projektu '''<nowiki><indecs></nowiki>''' (interoperability of data in e-commerce systems), který specifikoval [[popisná metadata]]. <ref name="bratkovaident"/>  
 
* Systém identifikátoru DOI vznikl na základě rozvíjených standardů pro směrování jmen (zejména [[HDL|Systému Handle]]) a také standardů projektu '''<nowiki><indecs></nowiki>''' (interoperability of data in e-commerce systems), který specifikoval [[popisná metadata]]. <ref name="bratkovaident"/>  
 
* DOI je hojně využíván v '''komerční nakladatelské sféře''' pro popis digitálních objektů s '''libovolným obsahem''' (textové, zvukové, obrazové aj. informace a jejich kombinace).  
 
* DOI je hojně využíván v '''komerční nakladatelské sféře''' pro popis digitálních objektů s '''libovolným obsahem''' (textové, zvukové, obrazové aj. informace a jejich kombinace).  
* Systém DOI má význam pro oblast elektronického obchodu a pro '''správu autorských práv'''.  
+
* Systém DOI má význam pro oblast elektronického obchodu a pro '''správu [[Autorské právo|autorských práv]]'''.  
 
* DOI také dokáže '''sjednocovat identické digitální objekty''' s různými URL adresami, které se vyskytují na různých místech Internetu, v repozitářích nebo databázích s lokálními identifikátory.
 
* DOI také dokáže '''sjednocovat identické digitální objekty''' s různými URL adresami, které se vyskytují na různých místech Internetu, v repozitářích nebo databázích s lokálními identifikátory.
 
* '''Syntax identifikátoru DOI''' vychází z identifikátoru [[HDL]] (Handle). Identifikátor může zahrnovat znaky kódování '''Unicode 2.0''' (UCS-2, Unicode, verze 2.0). Identifikátor se skládá ze 2 základních částí oddělených lomítkem:
 
* '''Syntax identifikátoru DOI''' vychází z identifikátoru [[HDL]] (Handle). Identifikátor může zahrnovat znaky kódování '''Unicode 2.0''' (UCS-2, Unicode, verze 2.0). Identifikátor se skládá ze 2 základních částí oddělených lomítkem:

Verze z 17. 6. 2016, 20:31

Trvalé identifikátory určené zejména pro potřeby jednoznačné identifikace digitálních objektů zpřístupňovaných v prostředí počítačových sítí.

Zástupci jednotlivých systémů

Obecný rámec trvalých identifikátorů URI

  • Jednotný identifikátor zdroje URI (Uniform Resource Identifier) je kódem identifikujícím dokument nebo jiný zdroj na internetu. Jedná se o obecný soubor pojmenování a adres internetového zdroje skládající se z řetězce znaků. [1] URI funguje jako obecný rámec identifikátorů informačních zdrojů (mohou být abstraktní nebo fyzické). Může popisovat zdroj z hlediska jeho identity a neurčovat jeho umístění. Může zdroj popisovat z hlediska jeho umístění, ale nepopisovat jeho identitu. Může popisovat obojí současně. S URI souvisí funkce URL (Uniform Resource Locator) a URN (Uniform Resource Name).
  • URI je obecný koncept a jeho základní formát je velmi volný. Jedná o název tzv. schématu, následovaný dvojtečkou a dále prakticky libovolným řetězcem odvozeném od použitého schématu.
    • Jméno schématu:Specifické schéma
    • Některá schémata jsou specifickými protokoly (http, telnet, ftp), jiná schémata s určitým protokolem souvisejí (z39.50s, mailto)
      • Příklady:
        • http:http://www.ifla.org/VII/s13/garr/garr.pdf - frekventované schéma http hraje důležitou roli při lokalizaci zdrojů na webu
        • telnet:dec59.ruk.cuni.cz
        • ftp:ftp.rfc-editor.org/in-notes/rfc4452.txt
        • mailto:**Eliska.Novakova@ff.cuni.cz
        • info:lccn/n78089035 - info je novým schématem jednoznačné identifikace některých tradičních lokálně platných identifikátorů (např. známého identifikátoru záznamu katalogu Kongresové knihovny (LCCN) pro jejich zapojení do automatického propojování informačních zdrojů v síťovém prostředí (pomocí standardu OpenURL a technologie SFX).[2]
        • info:doi/10.1000.10/123456
        • z39.50s:melvyl.ucop.edu/cat
        • urn:nbn:de:gbv:089-3321552 - URN - Jednotné jméno zdroje (Uniform Resource Name), které souvisí s definovaným a schválených jmenným prostorem.

Jednotné jméno zdroje URN

  • URN (Uniform Resource Name) / Jednotné jméno zdroje - je trvalý identifikátor informačního zdroje, který je nezávislý na jeho lokaci nebo metodě přístupu.
  • Struktura URN vychází ze syntaxe jednotného identifikátoru zdroje URI, jehož je definovaným a schváleným schématem. Syntax URN může podle uvedeného standardu zahrnovat několika hierarchicky uspořádaných jmenných prostorů (Namespaces): [2]
    • urn:NID:NSS
      • Schéma „urn:“ (včetně dvojtečky za ním) je povinnou částí celého identifikátoru a může být zapisováno malými nebo velkými písmeny.
      • Zkratka NID označuje globálně definovaný a schválený identifikátor jmenného prostoru (Namespace Identifier). NID se může skládat z písmen, číslic a pomlček.
      • Zkratka NSS označuje specifický řetězec jmenného prostoru (Namespace Specific String).
        • Dvojtečková syntax je podle standardu RFC 2141 povinná. NSS může mít svoji vlastní definici, která je dána jmenným prostorem (NID). NSS může zahrnovat další syntaktické dvojtečky (popř. také pomlčku), jež oddělují identifikátory dílčích jmenných prostorů (ve zkratce SNID, SubNamespace Identifier). Identifikátor NSS může zahrnovat libovolné znaky.
  • Směrování identifikátoru URN je jeho mapování k jedné nebo více adresám URL, na které se informační zdroj nalézá. K dosažení té nejjednodušší implementace směrovací služby URN se využívá jednoduchého mechanismu směrování z URN k URL, z URN ke zdroji samotnému, případně z URL K odpovídajícímu URN, existuje-li - tzv. triviální směrovací protokol HTTP (Trivial HTTP protocol) využívající protokol HTTP jako základnu pro síťový přístup ke směrovací službě. [2]
  • URN:NBN - NBN je schváleným jmenným prostorem URN. Identifikátory typu URN:NBN jsou určeny pro systémy národních bibliografií a jsou upraveny dokumentem RFC 3188. Globální registraci jmenných prostorů v rámci této domény zajišťuje Kongresová knihovna. URN:NBN souvisí se směrovacími službami národních knihoven.

Systém Handle

  • HDL (Handle) - Systém Handle je identifikační mechanismus pro přiřazování , správu a řešení trvalých identifikátorů pro digitální objekty a jiné internetové zdroje, který je americkou variantou identifikátoru URN. HDL (Handle) je identifikátorem, který je tímto systémem vytvářen.
  • Systém je využíván řadou institucí a korporací a je součástí různých projektů a systémů. Stal se součástí také systému DOI a je začleněn také ve volně dostupném softwaru mnoha institucionálních repozitářů DSpace. [2]
  • Struktura identifikátoru je tvořena dvěma částmi, které jsou oddělena lomítkem /: [2]
    • Prefix - Handle Naming Authority (NA) - číselný prefix identifikující instituci přidělující identifikátory je přidělován Globální službou Handle a je v současnosti tvořen pomocí desetinné číselné notace, kde je znak (.) k vyjádření cesty v hierarchii jmen NA (čte se zleva doprava).
    • Sufix - Handle Local Name - sufix identifikující jméno konkrétního digitálního objektu přiděluje daná instituce (NA) a musí být vyjádřeno znaky kódování Unicode 2.0 (UCS-2, Unicode, verze 2.0). Jiné limity pro tvorbu struktury lokálního jména nejsou.
      • Příklad:
        • cnri-1/1995.02:12:16:4221;9 (dříve přidělovaný identifikátor - NA tvořený písmeny a číslicemi)
        • 1012.Theses/1998-Charland.Nathalie(1970)-[HTML] (dříve přidělovaný identifikátor - NA tvořený písmeny a číslicemi)
        • 1721.1/14399 (novodobá podoba identifikátoru - desetinná číselná notace)
  • Směrování identifikátorů HDL je nezávislé na Systému doménových jmen (DNS) a systém ho zajišťuje vlastním Globálním serverem systému Handle spravovaným CNRI. [2]

Systém DOI

  • DOI (Digital Object Identifier) je trvalým identifikátorem digitálního objektu, který je využíván zejména ve sféře komerčních nakladatelů. DOI je od roku 2012 kodifikován mezinárodním standardem ISO 26324. DOI byl vytvořen pro potřeby identifikace a komunikace digitálních objektů včetně jejich metadat a to zejména v prostředí sítě Internet.
  • Systém identifikátoru DOI vznikl na základě rozvíjených standardů pro směrování jmen (zejména Systému Handle) a také standardů projektu <indecs> (interoperability of data in e-commerce systems), který specifikoval popisná metadata. [2]
  • DOI je hojně využíván v komerční nakladatelské sféře pro popis digitálních objektů s libovolným obsahem (textové, zvukové, obrazové aj. informace a jejich kombinace).
  • Systém DOI má význam pro oblast elektronického obchodu a pro správu autorských práv.
  • DOI také dokáže sjednocovat identické digitální objekty s různými URL adresami, které se vyskytují na různých místech Internetu, v repozitářích nebo databázích s lokálními identifikátory.
  • Syntax identifikátoru DOI vychází z identifikátoru HDL (Handle). Identifikátor může zahrnovat znaky kódování Unicode 2.0 (UCS-2, Unicode, verze 2.0). Identifikátor se skládá ze 2 základních částí oddělených lomítkem:
    • Prefix složený ze 2 částí oddělených tečkou:
      • Indikátor Adresáře (Directory Indicator) aktuálně obsahuje číslo 10.
      • Registrující instituce (Registrant code)
    • Sufix je jedinečným pořadovým číslem identifikujícím bibliografickou entitu, které přiděluje organizace registrovaná v rámci systému DOI. Syntax a sémantiku si pro sufix určuje sama organizace (10.000X/ISBN-900512-44-0 - v sufixu příklad aplikace identifikátoru ISBN).
        • příklad:
          • 10.1000/182 (Manuál mezinárodní nadace DOI)
          • 10.1145/336597.336660 (stať z konf. sborníku publikovaná spol. ACM)
          • 10.1016/j.acalib.2006.04.004 (článek z časopisu Journal of Academic librarianship)
  • Celý systém DOI je řízen a spravován Mezinárodní nadací DOI (IDF), která má na starosti správu nad dílčími registračními agenturami DOI. Registrační agentury přidělující prefixy jednotlivým institucím. Patrně nejvýznamnější oficiální registrační agenturou je komerčně přístupný systém CrossRef propojující vědecké publikace. Systém za účelem propojování záznamů umožňuje zúčastněným vydavatelům sdílet metadata dokumentů. Identifikátor DOI je v tomto systému důležitým nástrojem. DOI je vydavateli přidělován všem článkům, kapitolám knih i celým dokumentům registrovaným systémem CrossRef. Systémem CrossRef je spojuje se základními metadaty (včetně abstraktu, citací) a s URL identifikovaného objektu, které vydavatelé ukládají v definovaném formátu XML do databáze MDDB systému CrossRef. V rámci vyhledávacích procesů je využívána směrovací služba Mezinárodní nadace DOI. Systém integroval také identifikátory OpenURL. [2]

Trvalý identifikátor URL - PURL

  • PURL - je trvalý identifikátor URL (Persistent Uniform Resource Locator, Persistent URL, PURL) je trvalý identifikátor vyvinutý OCLC. Oproti běžnému URL nesměřuje přímo na konkrétní webovou stránku identifikovanou URL, ale nejprve na směrovací službu, která shromažďuje a aktualizuje seznam souvisejících URL k informačnímu zdroji.
  • Trvalý identifikátor informačních zdrojů PURL může identifikovat tištěné i elektronické dokumenty. Jedná se také o lokátory, které odkazují na bezprostřední směrovací službu (PURL je vlastně identifikátorem URL vedoucí ke směrovací službě). Záznamy v databázi serveru směrovací služby (PURL server) obsahují identifikátor PURL a jeden nebo více odpovídajících URL, na kterých se daný informační zdroj nachází. Pro směrování se využívá i v tomto případě standardního protokolu HTTP. Informační zdroj lze pak získat prostřednictvím klientského prohlížeče, který automaticky zajistí získání jeho digitální kopie. [2]
  • Struktura identifikátoru PURL
    • označení protokolu (http)
    • služba doménového jména (DNS) zajišťující přístup ke směrovací službě přes příslušnou IP adresu
    • jméno informačního zdroje
      • http://purl.oclc.org/keith/home
      • http://purl.oclc.org/OCLC/PURL/FAQ

Klíč archivního zdroje ARK

  • ARK - Klíč archivního zdroje (Archival Resource Key) je trvalým identifikátorem digitálních zdrojů. Jedná se o specifické URL umožňující trvalý a dlouhodobý přístup k informačnímu objektu (zdroji). Vedle digitálních zdrojů mohou identifikovat fyzické objekty (knihy, sochy, archeologické nálezy aj.) nebo nehmatatelné objekty (chemické látky, nemoci, termíny, umělecké výkony aj.). [2]
  • Struktura identifikátoru - identifikátor ARK má dvě základní části: [2]
    • NMA (Name Mapping Authority) / nověji NMAH (Name Mapping Autority Hostport) - přechází hlavní části - akční / klikatelná, nepovinná a flexibilní část (může být předmětem změny) - obsahuje protokol a jméno serveru zajišťujícím služby, mapující jméno zdroje).
    • hlavní část - stabilní a neměnné jméno informačního zdroje (s návěštím "ark:") - schválené a registrované jméno instituce přidělujícící zbytek kódu ARK (Name Assigning Authority, NAA, zkratka NAAN je číslem této instituce).

Odkazy

Reference

  1. CELBOVÁ, Ludmila. URI. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2016-06-02]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000000567&local_base=KTD.
  2. 2,00 2,01 2,02 2,03 2,04 2,05 2,06 2,07 2,08 2,09 2,10 BRATKOVÁ, Eva. Síť trvalých identifikátorů informačních entit [online]. Verze 1.0. Praha: Ústav informačních studií a knihovnictví FF UK v Praze, prosinec 2007 [cit. 2016-05-15]. 53 s. Formát PDF. Elektronické studijní texty ÚISK. Dostupný z: http://texty.jinonice.cuni.cz/.

Doporučená literatura

  • BRATKOVÁ, Eva. Síť trvalých identifikátorů informačních entit [online]. Verze 1.0. Praha: Ústav informačních studií a knihovnictví FF UK v Praze, prosinec 2007 [cit. 2016-05-15]. 53 s. Formát PDF. Elektronické studijní texty ÚISK. Dostupný z: http://texty.jinonice.cuni.cz/.
  • BRATKOVÁ, Eva. Tvůrčí díla, systémy informací o nich a nová mezinárodní čísla a kódy. Národní knihovna. 2000, roč. 11, č. 4, s. 147-155. Přístup také z: http://full.nkp.cz/nkkr/Nkkr0004/0004147.html. ISSN 0862-7487.
  • CUBR, Ladislav a Zdeněk VAŠEK. Identifikátory digitálních dokumentů se zaměřením na systém URN: NBN v ČR. Čtenář: měsíčník pro knihovny, 2013, 65(6), s. 214-217. ISSN 0011-2321.

Externí odkazy

Související články

Klíčová slova

trvalé identifikátory, informační zdroje, informační objekty, směrovací služby, mezinárodní standardy, mezinárodní normy