Forschungsdaten-Lebenszyklus
Als Forschungsdatenmanagement werden alle mit digitalen Forschungsdaten durchgeführten Aktivitäten bezeichnet (von der eigentlichen Nutzung abgesehen), insbesondere bezüglich der Sicherung und langfristigen Verfügbarkeit. Die einzelnen Schritte von der Erzeugung über die Nutzung und Analyse der Forschungsdaten, Aufbereitung, Archivierung, Veröffentlichung, Wiederverwendung und eventuell bis hin zur terminierten Löschung bilden den sogenannten Lebenszyklus der Forschungsdaten. Dieser Begriff verdeutlicht, dass die Forschungsdaten und deren Pflege während aller Phasen eines Forschungsprojektes und darüber hinaus eine Rolle spielen.
Zu Beginn wird festgelegt, welche Daten für die Beantwortung einer wissenschaftlichen Fragestellung bereits vorhanden sind und welche neu erzeugt werden sollen. Darüber hinaus werden die Maßnahmen geplant, die den Umgang mit den Daten bestimmen.
In dieser Phase werden neue Daten erhoben (zum Beispiel durch Experimente, Interviews, Bildaufnahmen, Beobachtungen) sowie die bereits vorhandenen gesammelt.
Anhand der festgelegten Kriterien wird bestimmt, welche der erhobenen Rohdaten archiviert und welche bewusst gelöscht werden sollen. Alle relevanten Daten werden dabei in eine für die geplante Forschungsarbeit geeignete Form bzw. Datenformat umgewandelt. Diese Daten bilden in der Regel die Grundlage der wissenschaftlichen Arbeit.
Im nächsten Schritt werden die Informationen über den Entstehungskontext der Daten dokumentiert, zum Beispiel Ort und Datum der Entstehung oder Informationen zum Gerät beziehungsweise Werkzeug, mit dem die Daten erzeugt wurden.
Die für eine langfristige Archivierung vorgesehenen Daten werden nun gemäß den Formaten und Standards (zum Beispiel für Metadaten, Zitierung, Annotationen) bereitgestellt und zu einem Archiv hinzugefügt. Denn damit die Daten zukünftig aufgefunden und nachgenutzt werden können, zum Beispiel im Kontext neuer wissenschaftlichen Fragestellungen oder als Nachweis der wissenschaftlichen Praxis, ist es wichtig, sie in einer geeigneten Form zu erfassen.
Ausgewählte Daten werden frei verfügbar gestellt oder auf Anfrage geteilt, um eigene Forschungsergebnisse für andere nutzbar zu machen. Wichtig sind dabei persistente Identifikatoren und Nachweise in geeigneten Datenbanken.
In dieser Phase wird festgelegt, welche der gewonnenen Daten nur kurzfristig aufbewahrt werden sollen (zum Beispiel nur für die Dauer des Forschungsprojektes), und bei welchen ist es sinnvoll, eine langfristige Archivierung zu sichern, sodass die Daten auch nach Abschluss des Forschungsprojektes auffindbar sind. In diesem Zusammenhang wird bestimmt, welche Medienformate bzw. Datenarchive oder Repositorien für die festgelegte Art der Archivierung geeignet sind. Neben den technischen Rahmenbedingungen werden hierfür anfallende Kosten geklärt sowie Regelungen zu Urheberrecht und Haftung vereinbart.
Es wird festgelegt, unter welchen Rahmenbedingungen die archivierten Daten von Dritten nachgenutzt werden sollen.
Einige Förderorganisationen fordern bereits, Forschungsdaten für bestimmte Zeiten aufzubewahren, zu veröffentlichen und nachnutzbar zu machen. Deshalb hat sich bei der Planung von Forschungsvorhaben die Erstellung von Datenmanagementplänen etabliert. In einem Datenmanagementplan dokumentieren Sie schriftlich und nachvollziehbar, wie mit den Daten umgegangen wird, um diese Anforderungen zu erfüllen und die Qualität der Forschungsdaten sicherzustellen. Dabei werden etablierte Standards, die „Leitlinien zur Sicherung guter wissenschaftlicher Praxis“, „Regeln zur Sicherung der guten wissenschaftlichen Praxis“ und die FAIR-Prinzipien beachtet.
FAIR-Prinzipien
Der Umgang mit Forschungsdaten sollte nach den FAIR-Prinzipien erfolgen. Der Begriff FAIR wurde von der FORCE11-Community entwickelt. Die Prinzipien beziehen sich auf drei Entitätstypen: Daten, Metadaten und Infrastruktur. Das Ziel ist, dass Daten und Metadaten für Menschen und Maschinen lesbar aufbereitet sind, um ihre Wiederverwendbarkeit zu ermöglichen.
Weiterführende Informationen zu FAIRen Daten finden Sie auf forschungsdaten.info oder erhalten Sie bei den FDM-Verantwortlichen an den Einrichtungen.
Auch für Forschungssoftware gibt es FAIR-Prinzipien: FAIR4RS. Die FAIR for Research Software Working Group hat die FAIR-Prinzipien angepasst und weiterentwickelt, um auf spezifische Charakteristika wie Ausführbarkeit, kontinuierliche Entwicklung und Versionierung von Software einzugehen.
CARE-Prinzipien
Komplementär zu den FAIR-Prinzipien hat die Global Indigenous Data Alliance (GIDA) die CARE-Prinzipien als notwendige Erweiterung erarbeitet. Während die FAIR-Prinzipien sich auf die Eigenschaften von Daten und Datenaustausch beziehen, richten die CARE-Prinzipien den Blick auf ethische Fragestellungen, Machtdynamiken und historische Kontexte in Bezug auf Daten indigener Völker. Durch die CARE-Prinzipien sollen die Gefahren und Potenziale für Individuen und Gruppen in den Blick genommen werden. Auch sollen die Beforschten die Möglichkeit zur Mitbestimmung über die Erhebung, das Eigentum und die Verwendung von Daten bekommen.
Weiterführende Informationen zu den CARE-Prinzipien finden Sie bei der GIDA oder erhalten Sie bei den FDM-Verantwortlichen an den Einrichtungen.
Weiterführende Informationen
Folgend eine Auswahl:
- Die Informationsplattform forschungsdaten.info mit einführenden, praxisnahen Artikeln.
- Wikibasierte Sammlung an Information zum Forschungsdatenmanagement auf forschungsdaten.org.
- Putnings, Markus, Neuroth, Heike & Neumann, Jana (2021). Praxishandbuch Forschungsdatenmanagement. Berlin, Boston: De Gruyter Saur. DOI 10.1515/9783110657807.
- FDM-Trainings- und Schulungsmaterialien (initiert von der DINI UAG Schulungen/Fortbildungen).
- Handreichungen zu DFG- und Horizon Europe-Anträgen: Krömer, Cora & Rohrwild, Jürgen (2022). FDM-Handreichungen (Version 1.0). eHumanities – interdisziplinär. https://gitlab.rrze.fau.de/cdi/labs/literacy/proposal-self-service. Die Handreichungen sind mit Spezifika der Friedrich-Alexander-Universität Erlangen-Nürnberg versehen, können aber leicht angepasst werden. Viele Informationen sind allgemeingültig.
- Website des NFDI-Vereins mit Informationen zur Nationalen Forschungsdateninfrastruktur.