OAI-PMH
Na této stránce se právě pracuje. Prosím needitujte tuto stránku, dokud na ní zůstává tato šablona. Předejdete tak editačnímu konfliktu. Jestliže uběhla od poslední editace doba alespoň dvou dnů, neváhejte tuto šablonu odstranit. |
OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) je rámec pro podporu komunikace mezi informačními systémy na principu sklízení dokumentových metadat. OAI-PMH je vhodným nástrojem pro repozitáře k aktualizaci a doplnění záznamů o dokumentech. Protokol je vázán licencí Creative Commons (CC), je tedy možné ho šířit i upravovat dle vlastních požadavků. [1] [2]
Obsah
Koncept protokolu
Komunikace mezi informačními systémy probíhá na principu klient-server, kdy služba sklízení (Harvester) je klientem a server je představován repozitářem. Celého procesu se účastní Data provider a Service providers.[3]
Repozitář (Data providers)
Repozitář je administrovaný uspořádaný systém, který podporuje protokol OAI-PMH jako sběrače metadat. Repozitář obsahuje jednoznačně identifikované objekty. Tyto objekty jsou identifikovány pomocí identifikátorů a dalších metadat především v podobě Dublin Core.[3] Zpřístupnění pro službu sklízení je zajišťováno třemi hlavními metadatovými entitami.
- zdroj (resource)
Tato položka předává informaci o umístění dokumentu (tj. zda je uložen přímo v repozitáři nebo repozitářem pouze zpřístupněn) a o jeho formátu (digitální/fyzický)
- jednotka (item)
Jednotkou je myšlena složka, kde jsou uskladněna popisná metadata. Metadata mohou být uložena přímo v repozitáři nebo dynamicky vytvořena z vnějšího zdroje. Každá jednotka je určena pomocí [Unikátního identifikátoru]
- záznam (record)
Záznam se skládá z metadat uložených ve specifickém metadatovém formátu ve formě XML souboru.
Unikátní identifikátor
Unikátní identifikátor je přiřazován jednotlivým jednotkám (item) uvnitř repozitáře. Používá se při provádění OAI-PMH požadavku na stažení metadat. Formát unikátního identifikátoru musí korespondovat s normou pro URI (Uniform Resource Identifier). Identifikátor plní v protokolu roli odpovědi (ListIdentifiers, ListRecords) i požadavku (GetRecord)
Záznam
Sběr dat (Service providers)
Poskytovatel služeb, který od data providerů sklízí metadata, obvykle je shlukuje a dále popisuje. Na základě sklizených dat poskytuje svým uživatelům přidané služby (např. vyhledávací).[3]
Druhy sběru
Použití protokolu
Sběr dat probíhá pomocí příkazů (request), které se v protokolu označují jako verb. Příkazy jsou zadávány v podobě HTTP Request Format, který podporuje php metody GET, či POST. Syntax příkazu se skládá z adresy HTTP, která představuje repozitář, klíčové slovo (verb) a jeho hodnotu, která předtavuje samotný OAI-PMH požadavek doplněný o proměnné.
Obecný syntax: HTTP/oai? verb=OAI-PMH požadavek&proměnné
Typy OAI-PMH požadavku
- Get Record
Tento typ požadavku se používá pro sběr dat právě o jedné jednotce repozitáře. Povinými atributy jsou tedy unikátní identifikátor jednotky (unique identifier) a metadataPrefix (určení formátu záznamu).
- Identify
Požadavek, který získává informace o repozitáři. Nemá žádné poviné atributy.
- ListIdentifiers
Požadavek pro výpis identifikátorů jednotek uložených v repozitáři. Nemá poviné atributy, ale efektivního využití nabývá především ve spojení s atributy from nebo until, které definují čas uložení jednotky do repozitáře.
- ListMetadataFormats
Požadavek pro výpis podporovaných metadatových formátů.
- ListRecords
Požadavek pro sběr záznamů z repozitáře. Podobně jako u ListIdentifiers se používá ve spojení s atributy from nebo until.
Příklady
- Identify (popisné informace o službě/repozitáři): http://www.manuscriptorium.com/oai?verb=Identify
- ListMetadataFormats (seznam dostupných formátů): http://www.manuscriptorium.com/oai?verb=ListMetada**taFormats
- ListSets (seznam setů /struktura repozitáře): http://www.manuscriptorium.com/oai?verb=ListSets
- ListIdentifiers (výpis identifikátorů objektů uložených v repozitáři): http://www.manuscriptorium.com/oai?verb=ListIdentifiers&metadataPrefix=qdc
- ListRecords (seznam všech záznamů podle zadaných parametrů - sklizeň):http://www.manuscriptorium.com/oai?verb=ListRecords&metadataPrefix=qdc&set=digitized-xr
- GetRecord (získání záznamu): http://www.manuscriptorium.com/oai?verb=GetRecord&metadataPrefix=qdc&identifier=AIPDIG-BUW___41_E_51A____0YO48RB-cs
Odkazy
Reference
- ↑ Protocol for Metadata Harvesting. Wikipedia: the free encyclopedia [online]. San Francisco (CA): Wikimedia Foundation, 2001-. Dostupné také z: https://en.wikipedia.org/wiki/Protocol_for_Metadata_Harvesting
- ↑ Open Archives Initiative. In: Wikipedia: the free encyclopedia [online]. San Francisco (CA): Wikimedia Foundation, 2001- [cit. 2017-11-01]. Dostupné z: http://wiki.knihovna.cz/index.php/OAI-PMH
- ↑ 3,0 3,1 3,2 The Open Archives Initiative Protocol for Metadata Harvesting. Openarchives.org [online]. openarchives, 2015 [cit. 2017-11-01]. Dostupné z: https://www.openarchives.org/OAI/openarchivesprotocol.html