Skip to content

Metadatenschema

Metadatenschema v.1.1

Die von den Pilotverlagen gelieferte Testdaten wurden analysiert und in Abstimmung mit allen Projektteilnehmern (Verlage, Bibliotheken) und der DINI-AG Elektronisches Publizieren ein Metadatenschema entwickelt. Hierbei wird eine möglichst breite Nachnutzbarkeit und Konformität zu vorhandenen Standards, Schnittstellen und Ablieferverfahren bei allen Beteiligten angestrebt. Sofern dies durch ein Metadatenschema nicht erreicht werden kann, werden zusätzliche Maßnahmen zur Datenkonvertierung, -normierung und -anreicherung diskutiert.

Dabei gilt es, verschiedene Perspektiven zu betrachten und pragmatisch miteinander zu verbinden:

1. Verlagsperspektive. Laut Auskunft der DNB (Bereich Erwerbung Netzpublikationen) liefern die meisten Verlage ihre Publikationen im ONIX-Metadatenformat. Daneben unterstützt die Nationalbibliothek als Ablieferungsformate MARCXML und XMetaDissPlus.14 In der Mehrzahl unterstützen Verlage an Dublin Core (DC) angelehnte Formate.

2. Bibliotheksperspektive. Die Metadaten sollen im Idealfall auch in Bibliothekskataloge bzw. in Discovery-Systeme integriert werden können. Ein wichtiges Anliegen ist hier die hinreichende Tiefe der Metadaten, d. h. sie sollen die Komplexität und die Beziehungen eines Werkes abbilden (z.B. Beziehungen zwischen Artikel, AutorInnen der Artikel, Titel der Zeitschrift, dem
jeweiligen Zeitschriftenheft etc.). In Hinblick auf die zukünftige Rolle der Bibliothek als Datenabnehmer muss auch die Zuordnung bedacht werden. Dafür muss zusätzlich die Affiliation (zugehörige Hochschule, wissenschaftliche Einrichtung, Institution o.ä.) der AutorInnen in den Metadaten verzeichnet werden, damit entsprechend selektiert werden kann.

3. Perspektive der Repositoriensoftware. Gleichzeitig müssen die Systeme betrachtet werden. Laut dem 2014 ‘Census of Open Access Repositories’ wird in Deutschland, Österreich und der
Schweiz primär die Software OPUS verwendet (53,3 %), dann folgen EPrints (15,1 %) und DSpace (7,2 %). Weltweit ist DSpace die am weitesten verbreitete Repositoriensoftware (1.161) gegenüber EPrints (380) und OPUS (70).(Quelle) Als Schnittstelle kann OAI-PMH vorausgesetzt werden, auch SWORD wird häufig (EPrints, DSpace; nicht jedoch OPUS) unterstützt.
Als Datenformat wird in der Regel Dublin Core (DC) verwandt (oder DC angelehnte Formate). Auch die bekannten Repositorien Europe PMC und PubMed Central (PMC) kodieren nach DC. Im Rahmen von DRIVER und OpenAIRE wurde zudem ein kontrolliertes Vokabular für europäische Repositorien namens info:eu-repo entwickelt, dem ebenfalls Beachtung geschenkt werden muss. Die Antragsteller stehen dazu mit der zuständigen Interest Group „Controlled Vocabularies for Repository Assets” der Confederation of Open Access Repositories (COAR) in Kontakt.

Zur Vernetzung des Projektes DeepGreen hat im April 2016 ein zweitägiger Workshop stattgefunden, in dessen Rahmen mit geladenen Experten aus Wissenschaft, Informationsinfrastruktur und Verlagen die Anforderungen an das Metadatenschema und den Workflow diskutiert wurden. Der Workshop diente auch als Plattform, um Szenarien für die Weiterentwicklung der DeepGreen-Infrastruktur zu diskutieren. Ziel war es, die Lücken bestehender Protokolle (Workflows) und Standards (Metadaten) zu benennen und Szenarien zu konzipieren. Auch Themen wie AutorInnen und Institutionenidentifikation waren Gegenstand der Diskussion.