Forschungsdatenmanagement

Bei Fragen zum Forschungsdatenmanagement und Datenmanagementplänen stehen wir gerne zur Verfügung.

Forschungsdaten sind "Daten, die während wissenschaftlicher Tätigkeit (z. B. durch Messungen, Befragungen, Quellenarbeit) entstehen, auf Grundlage derer wissenschaftlich gearbeitet werden kann (z. B. Digitalisate) oder das Ergebnis wissenschaftlicher Arbeit dokumentieren [...]." forschungsdaten.info 

Forschungsdaten sind beispielsweise

  • Quellen: Texte, Bilder, Audio-Aufnahmen, Filme/Videos
  • Beobachtungen: Echtzeit-Daten, Untersuchungsdaten
  • Experimente: Laborwerte, Spektrogramme
  • Simulationen: Simulationsmessungen, Modellmessungen
  • Referenzen: Sammlung von bereits veröffentlichten Datensätzen
  • Methodische Testverfahren, wie Fragebögen, Software oder Simulationen

Ein Datenmanagementplan (DMP) ist die Grundlage von gutem Forschungsdatenmanagement. Der DMP beschreibt den Lebenszyklus von Forschungsdaten und ist langfristig angelegt. Er erklärt, wie die Daten während dem Projekt produziert, erhoben, dokumentiert, veröffentlicht und archiviert werden sollen.

Integraler Bestandteil eines DMPs ist die Beschreibung der Forschungsdaten nach den FAIR-Prinzipien und sollte, unter anderem, Informationen zu folgenden Punkten enthalten:

  • Datenerhebung und –dokumentation
  • Ethische, rechtliche und Sicherheitsfragen
  • Datenspeicherung und Datenerhalt
  • Datenaustausch und Weiterverwendung von Daten

Der DMP wird bei Projektantrag (SNF) oder kurz nach Projektbeginn (H2020) eingereicht, soll aber in regelmässigen Abständen aktualisiert und erweitert werden. Er bezieht sich auf fachspezifische Praktiken und Standards und kann sich deshalb in seinem Inhalt von Projekt zu Projekt unterscheiden

Weitere Informationen zu den Anforderungen finden Sie bei Förderauflagen.

Mehr und mehr Forschungsförderer und -institutionen verlangen Zugang zu Publikationen und Forschungsdaten in Open Access.

Einreichung eines Datenmanagementplans ist als integraler Teil des Forschungsgesuches obligatorisch.

Forschungsdaten müssen in öffentlich zugänglichen Datenbanken archiviert werden, sofern dem keine rechtlichen, ethischen, urheberrechtlichen oder andere Klauseln entgegenstehen.

Der Datenmangementplan muss bis spätestens sechs Monate nach Projektbeginn eingereicht werden.

Forschungsdaten müssen in öffentlich zugänglichen Datenbanken archivier werden, sofern dem keine rechtlichen, ethischen, urheberrechtlichen oder andere Klauseln entgegenstehen. Es besteht die Möglichkeit zum begründeten Opt-Out.

Die Forschungsförderer sind sich darüber im Klaren, dass die Datenpublikation mit Mehraufwand verbunden sein kann. Kosten sind deshalb teilweise anrechenbar.

Die Kosten für die Zugänglichmachung von Forschungsdaten können, bei Erfüllung der gestellten Voraussetzungen (AR 2.13), mit bis zu 10‘000 Fr. angerechnet werden. Dies ist bereits bei der Antragsstellung zu berücksichtigen.

Kosten für die Zugänglichmachung von Forschungsdaten, die mit Beiträgen von Horizon2020 erhoben, beobachtet oder generiert wurden, können während der Laufdauer des Projekts rückerstattet werden.

Um spätere Fehler, Verwechslungen und langes Suchen zu vermeiden, ist es sinnvoll, bereits zu Beginn des Projektes Zeit in eine systematische Organisation der Dateien und Ordner zu investieren. Dies ist insbesondere dann wichtig, wenn mit anderen Forschungsgruppen zusammengearbeitet wird. Dabei sollten sich alle, an einem Projekt beteiligten Personen, mit einem Schema einverstanden erklären und dieses auch einhalten. Es empfiehlt sich, das Organisations- und Benennungssystem in einem Dokument festzuhalten, um es als Begleitdokument später bei der Datenpublikation mit abzulegen.

  • Gruppieren Sie verwandte Dateien in Ordnern (z.B. nach Messungen, Methoden oder Projektphasen)
  • Benutzen Sie klare und eindeutige Ordnernamen
  • Benutzen Sie eine hierarchische Ordnerstruktur (Achtung: Eine zu verschachtelte Ordnerstruktur führt zu langen und komplizierten Dateipfaden)
  • Trennen Sie aktive und fertiggestellte Arbeiten in separaten Ordnern und löschen Sie nicht mehr gebrauchte temporäre Dateien.

Bei der Benennung von Dateien sollte darauf geachtet werden, dass die Namen eindeutig und auch für am Projekt unbeteiligte Personen leicht verständlich sind. Allgemeine Elemente die Teil eines Namens sein können, sind:

  • Datum der Erstellung (JJJJ-MM-TT )
  • Projektreferenz/Projektname
  • Beschreibung des Inhaltes
  • Name des Erstellers (Initialen oder ganzer Name)
  • Name des Forschungsteams/Departement
  • Versionsnummer


Um Limitationen des Betriebssystems zu vermeiden, wenden Sie die folgenden Namens- und Zeichenregeln an:

  • möglichst kurze Namen
  • Keine Sonderzeichen (: & * % $ £ ] { ! @)
  • Unterstriche _ anstelle von Leerzeichen oder Punkten
  • Dateiendung wo immer möglich (.txt, .xls, etc.)
  • Verlassen Sie sich nicht auf Gross-Kleinschreibung

Durch eine gezielte Wahl des Formats kann die Nachnutzbarkeit von Forschungsdaten erheblich verbessert werden, so dass Dateien auch nach Jahren noch verarbeitet werden können. Bei der Wahl eines geeigneten Formates sollten verschiedene Faktoren berücksichtigt werden:

  • Zukunftsfähigkeit: wie viele Softwareprodukte können das Datenformat lesen?
  • freie Zugänglichkeit zur Dokumentation
  • keine rechtlichen Beschränkungen (Patente)
  • keine technischen Beschränkungen (Verschlüsselung, DRM)
  • etabliert in Community


Je nach Fachgebiet können sich Forschungsdaten und deren Dateiformate stark unterscheiden. Folgende Dateiformate sind grundsätzlich empfehlenswert:

  • Bilder: TIFF, TIF
  • Dokumente: TXT, ASC, PDF/A
  • Tabellen: CSV
  • Audiodateien: WAF
  • Datenbanken: SQL, XML
  • strukturierte Daten: XML, JSON, YAML


Weitere Informationen über empfohlene Dateiformate und deren Haltbarkeit finden Sie unter hier.

Eine funktionierende Versionskontrolle ist insbesondere bei Datensätzen die sich im Laufe des Projekts ändern, unabdingbar. Die einzelnen Datensätze sollten sequentiell benannt werden und neben der Versionsnummer auch das Speicherdatum enthalten (JJJJ-MM-TT). Die finale Version sollte als solche gekennzeichnet sein. Dabei kann das Führen einer Versionstabelle in der sämtliche Änderungen und neue Benennungen festgehalten werden, bei der späteren Nachvollziehung helfen.

Insbesondere bei der Zusammenarbeit mit verschiedenen Personen, kann es Sinn machen, regelmässig eine Meilenstein-Version der Datei, die nicht mehr geändert oder gelöscht werden darf, zu speichern.

Zusammenfassend empfiehlt forschungsdaten.info

  • Sequentielle Nummerierung verwenden
  • Datum und Versionsnummer in die Benennung einbeziehen
  • Nutzung einer Versionskontrolltabelle
  • Verantwortlichkeit für die Fertigstellung von Dateien festlegen
  • Bei großen Datenmengen ggfs. Versionsverwaltungs-Software verwenden
  • Meilenstein-Versionen speichern


Weiterführende Information - Best practices

Wir empfehlen, Ihre Daten über die Uni-IT zu sichern. Sie trägt anfallende Daten uniweit zusammen und speichert diese auf zwei Tape Libraries der aktuellsten Generation redundant ab.

Weitere Informationen finden Sie hier: Campus Backup / Archive

Grunsätzlich sollten Sie immer die 3-2-1-Sicherungsregel befolgen:

  • 3 Kopien der Daten (1 Original, 2 Sicherungen)
  • Speicherung auf 2 unterschiedlichen Medien (externe Festplatten, USB-Laufwerke, SD-Karten, CDs, DVDs, Cloud)
  • 1 Kopie an einem externen Speicherort


Die Sicherung sollte in regelmässigen Abständen automatisiert erfolgen. Überprüfen Sie, ob die Sicherung fehlerfrei erfolgte und die Daten im Bedarfsfall auch wieder zurückgespielt werden können.

Eine umfangreiche Dokumentation ist für das richtige Verständnis und eine mögliche Nachnutzung Ihrer Daten unerlässlich. Die Dokumentation sollte unter anderem Angaben zu Ort und Zeit der Datenerhebung, zu den verwendeten Methoden, Instrumenten, Software und Statistikmodellen aber auch Informationen zu den gewählten Parametern, zu fehlenden Werten, der Nomenklatur und Abkürzungen enthalten.

Weitere Informationen finden Sie hier.

Metadaten sind Informationen über Daten, die in strukturierter und maschinenlesbarer Form angelegt werden. Sie helfen, Daten für Aussenstehende auffindbar und somit nutzbar zu machen. Je nach Disziplin gibt es verbreitete Metadatenstandards und Tools mit deren Hilfe ein Datensatz fachspezifisch beschrieben werden kann.  

Das Repositorium der Universität Bern (BORIS) verwendet das Metadatenschema Dublin Core. Diese Metadaten werden beim Ablegen eines Datensatzes auf dem Repositorium durch das Ausfüllen des Formulars automatisch generiert.

Die Entscheidung darüber, welche Daten eines Projekts für wie lange archiviert werden sollen, hängt vom wissenschaftlichen Wert der Daten sowie rechtlichen, regulatorischen und finanziellen Rahmenbedingungen ab.

Im Minimum müssen aber alle der Publikation zugrundeliegenen Daten aufbewahrt die entsprechenden Metadaten online publiziert werden.

Das Digital Curation Centre (DCC) und forschungsdaten.info führen Sie in fünf Schritten zur richtigen Datenauswahl.

Anleitung (englisch)

Anleitung (deutsch)

Wann immer möglich sollten Daten in fachspezifischen Repositorien hinterlegt werden. Diese sind auf die Bedürfnisse des Fachgebietes eingestellt, kennen sich mit spezifischen Datenformaten aus und bieten oft auch fachspezifische Metadaten an.

Der SNF stellt auf seiner Webseite eine Checkliste (Pkt. 5.1) zur Verfügung, mit der Sie überprüfen können, ob Ihr ausgewähltes Repositorium den FAIR Prinzipien entspricht.

Der beste Ausgangspunkt für Ihre Suche nach einem geeigneten Repositorium ist das Registry of Research Data Repositories (re3data.org). Eine umfassende Liste an Datenrepositorien bietet auch das Open Access Directory sowie PLoS.

Die folgenden Repositorien erfüllen die FAIR-Prinzipien und sind vom SNF anerkannt. Sie sind offen für Forschende aus allen Disziplinen. Die Liste ist nicht abschliessend.

BORIS erfüllt die vom SNF gestellten Ansprüche an ein Repositorium. Für publikationsbegleitende Daten für die noch kein fachspezifisches Repositorium existiert, besteht zurzeit also die Möglichkeit der Ablage in BORIS. Für grosse Rohdatensätze ist BORIS jedoch nicht geeignet und wir empfehlen die Ablage in einem allgemeinen Repositorium.

Pläne für ein institutionelles Datenrepositorium (BORIS Research Data) befinden sich derzeit in Ausarbeitung.

Daten müssen vor der Veröffentlichung mit einer Lizenz versehen werden. Wir empfehlen, nach Möglichkeit, eine offene Lizenz wie etwa CC0 oder CC BY zu wählen. Nähere Informationen zu den Creative Commons Lizenzen finden Sie hier.

Als Bestandteil der FAIR Prinzipien wird von Forschungsfördern die Ausstattung Ihrer veröffentlichten Daten mit einem eindeutigen Identifikator verlangt. Bei der Hinterlegung Ihrer Daten auf BORIS wird jedem Datensatz ein Digital Object Identifer (DOI) zugewiesen. Weitere Informationen finden Sie hier.

Forschungsdaten, die während eines Projekts generiert und gesammelt wurden, können auch über ihren ursprünglichen Erhebungszweck eine Verwendung finden. Es lohnt sich deshalb, die gewonnenen Daten der Öffentlichkeit zugänglich zu machen. Wichtig ist dabei, darauf zu achten, dass Ihre Daten mit persistenten Identifikatoren versehen werden, gute Metadaten generiert werden und eine ausreichende Dokumentation für eine Nachnutzung der Daten vorliegt.
Zurzeit gibt es drei mögliche Wege Forschungsdaten zu veröffentlichen.

Forschungsdaten können in einem disziplinären oder einem allgemeinen Repositorium veröffentlicht werden. Dabei ist die Publikation der Daten in einem fachspezifischen Repositorium gegenüber der Publikation in einem generischen Repositorium vorzuziehen. Weitere Informationen zur Wahl eines geeigneten Repositoriums finden Sie unter Repositorium finden.

Die in Data-Journals veröffentlichen Data Papers sind Dokumente die der erleichterten Verbreitung und Nachnutzung publizierter Daten dienen. Diese Publikationen enthalten alle Informationen zur Datenerhebung, Methoden, Lizenzen und Zugangsrechte sowie Informationen zu potenziellen Nachnutzungsmöglichkeiten. Die Daten selbst sind meist in einem Repositorium abgelegt.

Eine Liste mit Data-Journals findet sich auf der Webseite der Humboldt-Universität zu Berlin.

Daten können auch als Zusatzinformation zu Zeitschriftenartikel veröffentlicht werden. Es handelt sich dabei meist um die Daten, welche einer Publikation zugrunde liegen und das Nachvollziehen der Resultate ermöglichen. Die Daten können dafür entweder auf der Zeitschriftenplattform direkt oder in einem externen Datenrepositorium abgelegt sein.     

Für die Zitation von Daten sollten die im Forschungsgebiet vorhanden Standards oder der Vorschlag des Repositoriums, in dem ein Datensatz abgelegt wurde, verwendet werden. Sollte keine Standards/Empfehlungen existieren, empfiehlt Datacite folgende Minimalangaben:

  • Autor
  • Publikationsjahr (des Datensatzes)
  • Titel
  • Edition oder Version (optional)
  • Verleger (für Daten ist dies meist das Archive, in welchem die Daten gespeichert sind)
  • Resource Typ (optional)
  • Persisierender Identifikator (als persistenter, verlinkbarer URL)

Sind Ihre Daten bereit für die Datenablage? Sehen Sie sich die Pre-Deposit-Checkliste an.

Bei Fragen kontaktieren Sie uns über unsere allgemeine Email-Adresse researchdata@ub.unibe.ch.

Diese Email-Adresse wird vom gesamten Forschungsdatenmanagement-Team betreut und erlaubt deshalb eine effiziente Bearbeitung Ihrer Anfrage.

Bisherige Veranstaltungen

Workshop: Research data management and Data management plan training course with Sarah Jones (University of Glasgow, Digital Curation Center)
Dieser halbtägige Workshop richtet sich an Forschende aller Disziplinen. Gegenstände des Workshops sind die EU Förderrichtlinien zu Forschungsdaten und Datenmanagementpläne, «best practices», erste Erfahrungen und Empfehlungen an Forscher.
Referentin: Sarah Jones
Die Veranstaltung findet auf Englisch statt. Die Teilnehmerzahl ist beschränkt, eine Anmeldung ist zwingend erforderlich.
Zeit/Ort: Freitag, 17. November, 9:15-12:15 Uhr, Universität Bern, Hallerstrasse 6, Raum 205
 
 
SNSF Information event: Open Research data at SNSF
Kurze Informationsveranstaltung. Dauer ca. 45 - 60 Minuten.
Mitarbeitende des SNF präsentieren die neuen Richtlinien des SNF zum Forschungsdatenmanagement und beantworten Fragen dazu.
Referenten: Dr. Sarah Gerster, Dr. Michael von Arx
Die Veranstaltung findet auf Englisch statt.
Zeit/Ort: Donnerstag, 2. November 2017, 12:30 Uhr, UniS, Schanzeneckstrasse 1, Raum A003

Workshop Research data management and Data mangement plan training course