Skip to content

Konsolidierung und Weiterentwicklung

Ziele der 2. Förderphase

Ziel des Arbeitspaketes ist die praktische Konsolidierung des technischen Gesamtworkflows, d.h. der Zusammenarbeit zwischen a) Verlagspartner und Datendrehscheibe und b) Datendrehscheibe und Repositorienpartner, sowie die Weiterentwicklung des Gesamtworkflows für die bestehenden und neuen Projektpartner. Unterschieden werden dazu zwei Teilarbeitspakete.

Teilprojekt 1: Datendrehscheibe

Workflows zwischen Verlagspartnern und Datendrehscheibe. Zum Zeitpunkt der Antragstellung läuft eine Umfrage über die Praxistauglichkeit der Datendrehscheibe bei den Verlagen, die ihr Interesse am DeepGreen-Prototypen während der ersten Projektphase signalisiert haben (SAGE, Karger, De Gruyter, Royal Society of Chemistry, BMJ und Oxford University Press). Als Zwischenergebnis kann festgehalten werden, dass insbesondere erweiterte Statistik- und Reporting-Funktionalitäten, die zur Überprüfung der (lizenz-)rechtlichen Konformität genutzt werden, für die Verlage von großer Bedeutung sind. Weitere Entwicklungswünsche der Verlage betreffen die Optimierung der Workflows, um die verlagsseitigen Arbeitsabläufe zu vereinfachen (z. B. einfachere Bulk-Übertragung der Publikationen).

Um Verlage technisch zu unterstützen, soll ein alternativer Workflow auf Machbarkeit geprüft werden: Zum Einbinden open-access-fähiger Publikationen werden frei verfügbare Metadaten-Datenbanken (z. B. Crossref, DataCite) abgefragt. Verlage müssten dann nur noch im Bedarfsfall Volltexte liefern. Im Unterschied zum bisherigen Push-Workflow erfordert dieses Vorgehen die Einrichtung eines Pull-Workflows.

Die Praxistauglichkeit der Workflows wird im neuen Projektzeitraum ausgetestet und die entsprechende Befragung auf weitere Verlage ausgeweitet. Mit dieser Ausweitung steht in der zweiten Projektphase auch an, die Datendrehscheibe über die Allianz-Lizenzen hinaus um weitere Lizenzmodelle (z. B. im Rahmen der FID-Lizenzen) zu erweitern und technisch abzubilden.

Workflows zwischen Datendrehscheibe und datenabnehmenden Repositorien. Die neu hinzukommenden Fachrepositorien und Forschungsinformationssysteme erfordern eine Erweiterung, Modellierung und Umsetzung des Workflows der Datendrehscheibe (z. B. eine fachbezogene Zuordnung).

Überlegenswert ist auch, zukünftig Embargodaten an die Repositorien weiterzureichen. Dazu sind die lizenzrechtlich relevanten Informationen für ein Übertragungsverfahren durch die Datendrehscheibe in die Repositorien zu definieren und wie unten dargestellt an die Repositorien zu übergeben. Geplant ist, dass die Datendrehscheibe die Embargodaten aus der EZB über eine vereinheitlichte REST-Schnittstelle abruft. Eine für diesen Zweck benötigte enge Zusammenarbeit wird mit dem Letter of Intent der Universitätsbibliothek Regensburg gestützt.

Rückmeldungen seitens der Verlage und Repositorien über die Praxistauglichkeit (z. B. Oberfläche und technische Workflows, Reporting) werden systematisch dokumentiert und gehen priorisiert in die laufende Entwicklung bzw. weitere Entwicklungsplanung ein. Mit höchster Priorität werden die geforderten Erweiterungen seitens der Verlage implementiert.

Teilprojekt 2: Repositorienpartner

In der ersten Projektphase wurden Publikationen von Verlagen über die Datendrehscheibe erfolgreich in institutionelle Repositorien übertragen. Der hierfür erprobte Workflow soll so erweitert werden, dass die Zuordnung und Freischaltung der Publikationen im Repositorium selbst möglichst weitgehend automatisiert erfolgen kann. Komponenten dieses Workflows sind unter anderem die Unterstützung der Erkennung von Dubletten und anderer Versionen einer einzuspielenden Publikation sowie die automatisierte Umwandlung von Lizenztexten (z. B. von Creative Commons-Lizenzen) in maschinenlesbare Lizenz-URLs. Ein Desiderat stellt auch die Autorenidentifikation dar, da von den Verlagen oftmals nur Vor- und Nachname geliefert werden. Angestrebt wird, durch eine Abfrage von ORCID die notwendigen Informationen zu erhalten, um die Autoreninformationen im Repositorium anzureichern und die gelieferten Publikationen korrekt zuzuordnen.

Zur Übertragung der Embargoinformationen aus der Datendrehscheibe in die Repositorien muss ein neuer Workflow definiert werden. Dazu soll geprüft werden, ob das von der Datendrehscheibe genutzte Protokoll SWORD erweitert werden kann oder alternativ die Übertragung von Embargodaten als Metadaten erfolgen soll.

Eine Erweiterung des repositorienseitigen Workflows ist auch hinsichtlich der in dieser Projektphase neu hinzukommenden Fachrepositorien und Forschungsinformationssysteme notwendig. Zur Ablieferung von Publikationen aus der Datendrehscheibe werden hier konkrete Anwendungsfälle (Use Cases) in Rücksprache mit den beteiligten Testrepositorien modelliert.

Erwünschte Ergebnisse nach der 2. Förderphase

Das Ergebnis dieses Arbeitspaketes ist ein festgelegter, dokumentierter Workflow für die gesamte Kommunikation zwischen Verlagen und Repositorien über die Datendrehscheibe als Schaltstelle. Ausgehend von weiteren Anforderungen der Verlage und der Repositorienbetreiber soll auf Seiten der DeepGreen-Datendrehscheibe der Workflow entsprechend optimiert und (prototypisch mit Einbindung eines Gold-Open-Access-Verlages) erweitert werden. Für die Seite der Repositorien soll der in der ersten Projektphase entwickelte Workflow erweitert und neue Lösungen für Fachrepositorien und Forschungsinformationssysteme geschaffen werden. Dieser Workflow soll als Online-Dokumentation für EntwicklerInnen von Repositoriensoftware dokumentiert und veröffentlicht werden.

Schließlich soll mit Abschluss des Arbeitspaketes die DeepGreen-Datendrehscheibe von einer bis hierhin prototypischen Software in einen geregelten Betrieb überführt werden.