Weiterführende Informationen

DARIAH-DE hat im Kontext der Projektarbeit die folgende Definition des Begriffes Forschungsdaten erarbeitet:

Unter digitalen geistes- und kulturwissenschaftlichen Forschungsdaten werden innerhalb von DARIAH-DE all jene Quellen/Materialien und Ergebnisse verstanden, die im Kontext einer geistes- und kulturwissenschaftlichen Forschungsfrage gesammelt, erzeugt, beschrieben und/oder ausgewertet werden und in maschinenlesbarer Form zum Zwecke der Archivierung, Zitierbarkeit und zur weiteren Verarbeitung aufbewahrt werden können.

Mit dieser Definition sollen die speziellen Charakteristika geisteswissenschaftlicher Forschung und die daraus resultierende Heterogenität der zugrunde liegenden Daten berücksichtigt werden. Die einzelnen Arbeitsprozesse spiegeln dabei in gewisser Weise die Abläufe innherhalb eines Research Data Lifecycles, wie sie üblicherweise vorgenommen werden sollten.

Mindestanforderungen an digitale Forschungsdaten im Kontext von DARIAH-DE

Um für Ihre eigenen Forschungsdaten die DARIAH-DE Dienste sinnvoll nutzen zu können, sollten Ihre Daten bestimmte Grundvoraussetzungen erfüllen. Diese setzen sich idealerweise zusammen aus:

  • Validität
  • Reliabilität / Dokumentation des Entstehungs- und Erhebungskontextes
  • Maschinenlesbarkeit (und somit Prozessierbarkeit)
  • Referenzierbarkeit mit Angaben des Urhebers und zu rechtlichen Informationen hinsichtlich ihrer weiteren Verwendung (durch Dritte)
Wo kann ich mich näher zum Thema Forschungsdaten informieren?

DARIAH-DE möchte das Informationsangebot stetig weiterentwickeln und multimedial vermitteln.

In unserem Youtube-Channel finden Sie verschiedene Clips rund um das Thema Forschungsdaten.
Der DHd-Blog informiert über aktuelle Themen und Entwicklungen.
In der Bibliographie Digital Humanities finden Sie sowohl Einführungswerke als auch weiterführende Titel und Themenfelder.

Folgende externe Seiten enthalten umfassende weiterführende Informationen zum Thema Forschungsdaten:

Zusammen mit der Definition geisteswissenschaftlicher Forschungsdaten bildet der Research Data Lifecycle (Forschungsdatenzyklus) das intellektuelle Konzept hinter der zentralen Infrastruktur für DARIAH-DE. Im Rahmen der aktuellen Förderphase von DARIAH-DE wird die im Aufbau befindliche Repository-Infrastruktur so ausgebaut, dass ein vollständiger Research Data Lifecycle für die digitalen Geisteswissenschaften abgedeckt und ggf. erweitert werden kann.

Grundlegende Prozesse im Lebenszyklus von Forschungsdaten:

  • Planung und Erstellung
  • Auswahl
  • Ingest/Übernahme
  • Speicherung/Infrastruktur
  • Erhaltungsmaßnahmen
  • Zugriff/Nutzung

Die DARIAH-DE Data Federation Architecture

Die DARIAH-DE Data Federation Architecture (DFA) ist die Bezeichnung für Basisdienste die von DARIAH-DE bereitgestellt werden, um die grundlegenden Prozesse des Research Data Lifecycle abzudecken. Momentan umfasst die DFA die Indizierung und Anzeige von Forschungsdaten, die Bereitstellung von Beschreibungsschemata für Sammlungsbeschreibungen und deren langfristige Speicherung, sowie eine umfassende Suchfunktionalität für heterogene strukturierte Datensammlungen und Archive. Zudem sind spezifische Metadatenstandards hinterlegt und Crosswalks zwischen Metadaten-Schemata abgespeichert um Hilfestellung beim Mapping von Forschungsdaten unterschiedlicher Herkunft und Beschaffenheit zu ermöglichen.

Was sind Metadaten und wozu sind sie gut?

Metadaten sind Daten oder Informationen über Daten: Sie beschreiben die eigentlichen Daten (digitale Dateien oder physische Objekte), enthalten etwa Informationen zu Inhalt, Form oder Urheber. Um diese Metadaten strukturiert anzulegen und weiterzuverarbeiten, existieren verschiedene Metadatenformate.

Fachspezifische Empfehlungen für Daten und Metadaten

Im Rahmen von DARIAH-DE wurden fachspezifische Empfehlungen für Daten und Metadaten erstellt. Dies geschah zunächst aus dem Blickwinkel geisteswissenschaftlicher Fächer, die an DARIAH-DE beteiligt sind. Wir möchten FachwissenschaftlerInnen aller geistes- und kulturwissenschaftlichen Fachdisziplinen, aber auch WissenschaftlerInnen aus den Informationswissenschaften und der Informatik einladen, sich aktiv an der Erweiterung und dem Ausbau dieser Empfehlungen zu beteiligen. Die Empfehlungen für geistes- und kulturwissenschaftliche Fachdisziplinen finden Sie im Wiki.

Empfehlungen für Forschungsdaten, Tools und Metadaten in der DARIAH-DE Infrastruktur

Eine Übersicht zu verschiedenen Metadatenstandards finden Sie in den Empfehlungen für den Umgang mit Daten und Metadaten.

DCDDM

Das DCDDM (DARIAH Collection Description Data Model) ist ein Datenmodell zur Sammlungsbeschreibung. Institutionen und WissenschaftlerInnen können damit Beschreibungen von Sammlungen anlegen, die sowohl menschen- als auch maschinenlesbar sind. Ziel des DCDDMs ist es, einfach umsetzbare Richtlinien vorzugeben, um das Erstellen, Veröffentlichen und Verwalten von Sammlungen zu unterstützen. Sammlungen können dabei sowohl aus physischen Objekten (Bücher, Bilder, Münzen) als auch digitalen Objekten (digitalisierte Texte, Datenbankeinträge) bestehen. Die Dokumentation finden Sie im Wiki.

Das Datenmodell wird in der Collection Registry für die dortigen Sammlungsbeschreibungen verwendet.

Wozu sollte ich meine Daten lizenzieren?

Die Deutsche Forschungsgemeinschaft (DFG) rät in ihren "Empfehlungen zur Sicherung guter wissenschaftlicher Praxis", Primärdaten auf "haltbaren und gesicherten Medien" in der sie erzeugenden Institution für zehn Jahre aufzubewahren. Doch allein mit der Archivierung von Daten ist die Nachvollziehbarkeit wissenschaftlicher Ergebnisse nicht gegeben. Die Bereitstellung von Daten ist eine mindestens genauso wichtige wie berechtigte Forderung. Ein möglichst freier, überregionaler und langfristiger Zugriff auf Daten wirft eine Reihe von rechtlichen Fragen auf, die mit Hilfe von Lizenzen geregelt werden können. Sie geben unter anderem Antworten darauf, was WissenschaftlerInnen mit Forschungsdaten anderer tun (oder nicht tun) dürfen.

Forschungslizenzen.de

Das Portal „Forschungslizenzen.de“, das im Rahmen des DARIAH-DE-Projekts aufgebaut wurde, bietet einen Überblick zu Forschungslizenzen und stellt diese praxisnah anhand von Projekten aus den Geisteswissenschaften vor. Ziel ist es, einen Überblick zu vermitteln, AnsprechpartnerInnen zu vernetzen und den Einstieg in das Thema zu erleichtern.

Das Portal reagiert auf zwei Bedarfe, die bei der Arbeit in DARIAH-DE deutlich wurden: einerseits der Wunsch nach Wissensaustausch zur Lizenzierung von Forschungsdaten, anderseits der Bedarf an Aufklärungs- und Beratungsarbeit in Bezug auf die entsprechenden Entscheidungsprozesse.

Die Auswahl der vorgestellten Beispiele konzentriert sich auf das Feld der Digital Humanities. Die Texte sind aktuellen Veröffentlichungen zum Thema entnommen, die Inhalte werden bei neuen Entwicklungen ergänzt. In Beiträgen zu einzelnen Projekten werden die Kontaktinformationen von AnsprechpartnerInnen der beteiligten Institutionen vorgestellt. Auf diese Weise werden ForscherInnen ermutigt, sich bei Lizenzfragen mit vorhandenen Projekten auszutauschen und Erfahrungen zu teilen.

DARIAH-DE-Publikationen zum Thema

Eine detaillierte Diskussion zum Urheberrecht und Empfehlungen für Standardlizenzen für Forschungsdaten finden Sie in den DARIAH-DE Working Papers:

DARIAH-DE engagiert sich für eine transparente Verbreitung digitaler Forschungsmethoden und der dafür verwendeten Tools, wie sie beispielsweise von DIRT verzeichnet werden. DARIAH-DE möchte damit einen Beitrag zur Sichtbarkeit – und auch zum Selbstverständnis – der digitalen Geisteswissenschaften leisten. Das Erstellen einer SKOS-basierten Taxonomie von DH-Verfahren ist ein wichtiger Schritt zur Vernetzung der Forschungs-Community und auch zur Zuordnung und Dokumentation der erzielten Ergebnisse.

DH Verfahrem

Abb. 1: Eine beispielhafte Darstellung der Beziehung von Tools, Verfahren und Methoden

So wird in einer Kooperation mit NeDiMAH an einer umfangreichen Ontologie gearbeitet, die es ermöglichen wird, ein komplexes Modell für die Beziehung von Forschungsfeldern, Methoden, Institutionen sowie Forschungsdaten und -ergebnissen zu konstruieren.

Das geschilderte Unterfangen strebt eine stärkere Formalisierung unseres Verständnis der Digitalen Geisteswissenschaften an und kann so zum Ausbau einer Forschungsinfrastruktur beitragen.

 

TaDirah Taxonomy

Abb. 2: Eine Visualisierung der TaDiRAH Taxonomie zur Formalisierung von Verfahren der Digital Humanities. Hier geht's zu TaDiRAH auf GitHub