PRESERVATION POLICY: RICHTLINIEN ZUR DIGITALEN LANGZEITARCHIVIERUNG DER ZBW

Version 1.2 vom 06.02.2017, Autorinnen: Monika Zarnitz / Yvonne Tunnat

1. Einleitung

Die Preservation Policy der ZBW – Leibniz-Informationszentrum Wirtschaft hält die institutionellen Richtlinien für die digitale Langzeitarchivierung fest.

Die ZBW betreibt gemeinsam mit den anderen beiden Deutschen Zentralen Fachbibliotheken – der TIB (Technische Informationsbibliothek, Hannover) und ZB MED (ZB MED - Informationszentrum Lebenswissenschaften, Köln/Bonn) ein gemeinsames digitales Langzeitarchivierungssystem.

Die Preservation Policy der drei Zentralen Fachbibliotheken [1] hält für alle drei Bibliotheken die gültigen Richtlinien für die digitale Langzeitarchivierung und den Umgang mit dem gemeinsamen Langzeitarchivierungssystem fest. Die ZBW Preservation Policy enthält die institutionellen Richtlinien zur Langzeitarchivierung bezogen auf die Inhalte der ZBW und die Interessen der Nutzerinnen und Nutzer der ZBW. Die Policy dient dazu, diese sowohl für die Nutzerinnen und Nutzer der ZBW als auch für die Datenproduzentinnen und Produzenten zugänglich zu machen.

Die Policy wird mindestens jährlich auf Aktualisierungsbedarf geprüft, zum Beispiel was die Aktualität des Sammelprofils oder die Langzeitarchivierungspraxis betrifft.

2. Mission

Die ZBW beschafft in- und ausländische Literatur ihres Sammelgebiets (siehe Kap 2.2), erschließt ihren Bestand formal und inhaltlich, stellt ihn überregional zur Verfügung und sichert die langfristige Verfügbarkeit der Inhalte.

2.1 Mandat, Aufgabe, Zielgruppen

Als Deutsche Zentrale Fachbibliothek ist es Aufgabe der ZBW, Literatur und Fachinformationen aus dem Bereich Wirtschaftswissenschaften zu beschaffen, zu erschließen und ihren Zielgruppen dauerhaft verfügbar zu halten.

Ein stetig wachsender Teil der Bestände, z. B. Dissertationen und Arbeitspapiere besteht aus digitalen Dateien. Die ZBW in ihrer Funktion als Deutsche Zentrale Fachbibliothek ist dafür verantwortlich, dass die digitalen Inhalte, die sie sammelt, lizensiert oder mittels Retrodigitalisierung des eigenen Bestands selbst erstellt und auf eigenen Servern vorhält, langfristig und nachhaltig verfügbar bleiben.

Zu den Nutzergruppen der ZBW auch für die digitale Langzeitarchivierung gehören die wirtschaftswissenschaftliche Forschungsgemeinschaft im In- und Ausland. Die freie Wirtschaft und Unternehmen sowie die interessierte Öffentlichkeit können die Dienste und Bestände der ZBW auch nutzen. Die Interessen dieser externen Gruppen sind bei der digitalen Langzeitarchivierung zu beachten, wenn auch das digitale Langzeitarchiv der ZBW ein sogenanntes „dark archive“ ist, welches keinen direkten Zugang für Externe vorsieht. Weiterhin gehören neben diesen externen Gruppen die Kolleginnen und Kollegen aus der ZBW zu den Zielgruppen der digitalen Langzeitarchivierung, die elektronische Dienste betreuen, die nachhaltig angeboten werden sollen (z. B. die Kolleginnen und Kollegen, die den Open-Access-Server EconStor betreuen).

2.2 Sammlungsprofil und Selektion

Mit ihren Sammelschwerpunkten ist die ZBW Teil des Systems der überregionalen Literaturversorgung der Deutschen Forschungsgemeinschaft (DFG).

Die ZBW beschafft theoretische und empirische Literatur aus den Fachgebieten Volkswirtschaftslehre und Betriebswirtschaftslehre. Daneben erwirbt sie alle Publikationen der engen Nachbarwissenschaften und Hilfswissenschaften mit einem ökonomischen Schwerpunkt.

Die ZBW erwirbt wirtschaftswissenschaftliche Literatur aus aller Welt, gemäß einem regional abgestuften Länderranking. Entscheidendes Kriterium für die Auswahl der Literatur ist die wissenschaftliche Bedeutung der Veröffentlichung. Grundsätzlich bevorzugt die ZBW deutsch- und englischsprachige Literatur. Es werden auch Veröffentlichungen in den jeweiligen Landessprachen erworben. In Deutschland erscheinende wirtschaftswissenschaftliche bzw. -theoretische Literatur wird vollständig gesammelt. Dazu gehören auch empirische und regionenbezogene Publikationen und Branchenliteratur. Publikationen aus den Vereinigten Staaten und Großbritannien werden weitgehend vollständig beschafft, sofern sie wirtschaftswissenschaftlich sind. Aus den anderen Ländern werden Veröffentlichungen in engerer Auswahl erworben. Praxisnahe Literatur wird ausschließlich in Auswahl erworben.

Einen besonderen Sammelschwerpunkt der ZBW bilden die Publikationen der internationalen Wirtschaftsorganisationen. Die ZBW sammelt alle relevanten Publikationen der Europäischen Union (EU) und ihrer Organe. Dies gilt auch für die Vereinten Nationen (UN) und ihre Organisationen, die OECD, die World Trade Organisation WTO, den Internationalem Währungsfonds (IMF) und die Weltbank.

Einen weiteren Sammelschwerpunkt der ZBW bilden alle Publikationen der weltweit führenden Business Schools und Wirtschaftsforschungsinstitute.

Die ZBW beschafft alle Publikationen ihres Sammelgebietes unabhängig vom Format sowohl in gedruckter Form, als elektronische Ressource oder in Mikroform. Der Erwerbung nicht-konventioneller, sogenannter „grauer Literatur“ kommt eine besondere Bedeutung zu [3].

Die Auswahl der Inhalte für die Langzeitarchivierung orientiert sich an den Bedürfnissen der Nutzergruppen der ZBW.

3. Prinzipien der digitalen Langzeitarchivierung

Die ZBW ist bestrebt, die Lesbarkeit der digitalen Objekte ihres Bestands langfristig zu sichern. Da Dateiformate und Interpretationssoftware rasch veralten können und die Informationen der digitalen Daten dann ggf. nur noch mit hohem Aufwand wieder lesbar gemacht werden können, sorgt die ZBW im Rahmen der digitalen Langzeitarchivierung dafür, die Risiken der Veralterung digitaler Daten zu minimieren.

Die Übernahme der bereits an der ZBW auf eigenen Servern gehosteten Materialien in das digitale Langzeitarchiv erfolgt in der Regel dann, wenn keine Änderungen mehr an dem Objekt und den dazugehörigen inhaltlichen Metadaten zu erwarten sind. Sollte nach der Überführung in das digitale Archiv noch eine Änderung erfolgen, erfolgt eine Aktualisierung im digitalen Archiv; die originalen Daten werden ebenfalls weiterhin gespeichert und nicht entfernt.

Die Gruppe Digitale Langzeitarchivierung ist fester Bestandteil der ZBW. Die ZBW setzt vorranging und hauptsächlich auf automatisierte Prozesse und Workflows, um die personellen Ressourcen zu schonen und um die stetig wachsende Zahl der digitalen Objekte optimal bewältigen zu können. Daher sind die Workflows auf ein Vielfaches des jetzigen digitalen Bestandes skalierbar.

Die ZBW ist außerdem bestrebt, die auf dem Gebiet der Langzeitarchivierung üblichen Best Practices einzuhalten und sich ihre Sorgfalt, Vertrauenswürdigkeit und Transparenz bezüglich der Archivierung der digitalen Inhalte zertifizieren und bestätigen zu lassen, beispielsweise durch das Data Seal of Approval [5].

3.1 Preservation Watch, Kooperationen und Netzwerke

Es ist Aufgabe und Anliegen der Kolleginnen und Kollegen der Gruppe der Digitalen Langzeitarchivierung, sich stets mit technischen Neuerungen auseinanderzusetzen, diese zu beobachten und über neueste Entwicklungen und Best Practices anderer in der Langzeitarchivierung tätiger Institutionen informiert zu sein und die LZA-Strategie daran anzupassen. Aufgrund der vielen Neuerungen in diesem Bereich werden, wenn möglich und sinnvoll, auch nationale und internationale Konferenzen besucht. Die ZBW ist außerdem aktiv im deutschsprachigen Kompetenznetzwerk nestor [4] und bei der international tätigen Open Preservation Foundation [6].

3.2 Metadaten

Alle bereits erfassten deskriptiven Metadaten werden gemeinsam mit dem digitalen Objekt an das digitale Archiv übergeben. Sofern ein Eintrag im Verbundkatalog GVK [7] besteht, werden die digitalen Objekte zusätzlich mit Metadaten aus dem Verbundkatalog angereichert. Darüber hinaus werden für die Sicherstellung der langfristigen Lesbarkeit nützliche technischen Metadaten beim Überführen in das Archiv automatisiert erhoben (siehe Metadaten im digitalen Langzeitarchiv [10]).

3.3 Rechtliches

In der Regel wird die Erlaubnis zur digitalen Langzeitarchivierung vom Produzenten eingeholt. Wurden der ZBW diese Rechte nicht erteilt, erfolgt die Langzeitarchivierung auf Basis der gesetzlichen Schrankenregelungen.

3.4. Preservation Level

Bei der reinen Bitstream Preservation handelt es sich nur um die Erhaltung des Bitstreams. Die Bitstream Preservation sieht keinerlei Bearbeitung der Inhalte vor.

In der Regel ist die ZBW bestrebt, für alle von ihr akquirierten und erstellten digitalen Inhalte nicht nur die reine Bitstream Preservation, sondern die Erhaltung der Lesbarkeit und Nutzbarkeit zu gewährleisten. Dies kann auch die Überführung der Inhalte in andere Formate bedeuten, die für die Langzeitverfügbarkeit besser geeignet sind (siehe 3.7).

Für einige Inhalte ist dies jedoch nicht möglich, so beispielsweise für vom Datenproduzenten mit einem Passwort geschützte Inhalte, die eine Bearbeitung verhindern. Rechtlich ist es nicht möglich, diesen Schutz zu umgehen. Sofern es nicht möglich ist oder verwehrt wird, eine Version der Inhalte ohne Passwortschutz zu erlangen, wird bei solcherlei Inhalten lediglich der originäre Bitstream erhalten.

3.5. Erhalt der Datenintegrität

Die Integrität der archivierten Inhalte wird nach jedem lesenden Zugriff mittels Checksummen geprüft. Durch die redundante Speicherung der Objekte können jene Inhalte, die nicht mehr integer sind und beispielsweise Bitfehler enthalten, stets umgehend durch eine intakte Version ersetzt werden.

3.6 Erhalt der Authentizität

Die ursprünglich in das digitale Archiv überführten Inhalte werden grundsätzlich erhalten. Die darüber hinaus erstellten Präsentationen (Derivate) zum Erhalt der dauerhaften Lesbarkeit werden lediglich zusätzlich gespeichert und ersetzen nicht das Original (siehe Risiko Management und Preservation Planning im digitalen Langzeitarchiv der ZBW [8]).

3.7 Erhalt der Vollständigkeit

Die Inhalte im Archiv werden vollständig erhalten, dies bedeutet, dass alle zu einer Einheit gehörigen Dateien und Metadaten stets in ihrer Gesamtheit erhalten werden.

3.8 Erhalt der Lesbarkeit

Sofern die für die digitale Langzeitarchivierung verantwortlichen Personen der ZBW einen Einfluss darauf haben, in welchem Dateiformat die digitalen Objekte von den Datenproduzenten übernommen werden, beziehungsweise – im Falle der Retrodigitalisierung – in welchen Formaten die zu archivierenden Inhalte gespeichert werden, gelten folgende Richtlinien für Dateiformate (Details hierzu in der Dateiformat Policy [9]):

  • normiert und standardisiert (z. B. durch eine ISO-Norm)
  • nicht von einer einzigen/ einigen wenigen Programmen abhängig
  • (vorzugsweise weltweit) verbreitet mit hohem Nutzungsgrad
  • offenes oder offen gelegtes Format

Im Rahmen des Risikomanagements und des Preservation Planning werden sofern möglich bereits archivierte Inhalte in bevorzugte Dateiformate übertragen. Das Preservation Planning beinhaltet beispielsweise die  Prüfung der Aktualität der im Archiv vorhandenen Dateiformate und die Prüfung der Qualität der archivierten Einheiten bezüglich der Einhaltung der Dateispezifikationen. Detaillierte Informationen zum Risikomanagement und Preservation Planning finden sich in der hierfür erstellten Workflowdokumentation [8].

3.9 Erhalt der Auffindbarkeit

Alle in das digitale Archiv überführten Inhalte haben in ihren Metadaten mindestens einen persistent Identifier, der auch in den Metadaten auf der Repräsentationsplattform hinterlegt ist. Außerdem erhalten die Inhalte noch einen Identifier innerhalb des digitalen Archivs.

Alle deskriptiven und technischen Metadaten sind aktiv durchsuchbar, daher sind alle Inhalte auf vielerlei Weise im Archiv auffindbar. Sofern sinnvoll, sind die Inhalte außerdem zu logischen Sammlungen zusammengestellt.

3.10 Wahrung der Vertraulichkeit

Das digitale Archiv bietet ein umfangreiches Management zu Zugangsrechten mit vielfältigen Konfigurationsmöglichkeiten. So wird stets sichergestellt, dass keine unbefugten Personen Zugriff auf die Inhalte erhalten können und auch Sperrfristen eingehalten werden. Obwohl das digitale Archiv zurzeit als „dark archive“ betrieben wird, sind nicht urheberrechtsfreie Inhalte stets so gekennzeichnet für den Fall, dass das Archiv vor Ablauf der Schutzfrist in ein „light archive“ mit Zugriff von außen umgewandelt wird.

3.11 Dokumentation der Prozesse

Alle im digitalen Archiv vorgenommen Konfigurationen und Workflows sind dokumentiert und werden regelmäßig aktualisiert und allen Mitarbeiterinnen und Mitarbeitern der digitalen Langzeitarchivierung aller drei Bibliotheken zur Verfügung gestellt.

Darüber hinaus werden Tutorials erstellt, die die Durchführung der Workflows vermitteln und auch für neue Mitarbeiterinnen und Mitarbeiter eine Erleichterung darstellen und das Fehlerrisiko verringern. Die Workflows sind auch für jene Kolleginnen und Kollegen sichtbar, die die Verantwortung für die Inhalte auf den jeweiligen Access-Plattformen innehaben.

Alle Workflows werden stets optimiert und weiterentwickelt und die Dokumentation entsprechend aktualisiert.

3.12 Zugriff und Nutzung

Das Digitale Langzeitarchiv sieht für die Inhalte der ZBW keinen Zugriff von außen vor und wird als reines Dark Archive betrieben. Zugriff auf die Inhalte haben ausschließlich die Kollegen und Kolleginnen der Gruppe digitale Langzeitarchivierung. Der Zugriff auf die digitalen Daten erfolgt über ihre jeweiligen Repräsentationsplattformen, notwendige Einschränkungen des Zugriffs werden daher ebenfalls über diese Plattformen geregelt.

4. Technische Infrastruktur

Das digitale Archiv wird gemeinsam von den drei Zentralen Fachbibliotheken genutzt. Das digitale Langzeitarchiv beinhaltet alle Komponenten, die im OAIS-Modell beschrieben sind:

  • Ingest
  • Data Management
  • Archival Storage: Die Aufbewahrung der Daten erfolgt im Rechenzentrum der TIB in Hannover (Preservation Policy der drei Zentralen Fachbibliotheken [1]).
  • Preservation Planning
  • Administration: z. B. Nutzerverwaltung
  • Access: Der Zugriff auf die Daten erfolgt ausschließlich durch Personal.

5. Verantwortlichkeiten

Die Langzeitarchivierung ist fester Bestandteil der Aufgaben der ZBW und wird langfristig und nachhaltig wahrgenommen und gesichert. Die Sicherung der digitalen Daten ist Teil der Bestandserhaltung. Verantwortlich für die Erstellung und die regelmäßige Aktualisierung dieser Preservation Policy ist die Gruppe Digitale Langzeitarchivierung der ZBW.