Breadcrumbnavigation

Weiterführende Informationen

Weiterführende Informationen

DARIAH-DE hat im Kontext der Projektarbeit die folgende Definition des Begriffes Forschungsdaten erarbeitet:

Unter digitalen geistes- und kulturwissenschaftlichen Forschungsdaten werden innerhalb von DARIAH-DE all jene Quellen/Materialien und Ergebnisse verstanden, die im Kontext einer geistes- und kulturwissenschaftlichen Forschungsfrage gesammelt, erzeugt, beschrieben und/oder ausgewertet werden und in maschinenlesbarer Form zum Zwecke der Archivierung, Zitierbarkeit und zur weiteren Verarbeitung aufbewahrt werden können.

Mit dieser Definition sollen die speziellen Charakteristika geisteswissenschaftlicher Forschung und die daraus resultierende Heterogenität der zugrunde liegenden Daten berücksichtigt werden. Die einzelnen Arbeitsprozesse spiegeln dabei in gewisser Weise die Abläufe innerhalb eines Research Data Lifecycles wider, wie sie üblicherweise vorgenommen werden sollten.

Mindestanforderungen an digitale Forschungsdaten im Kontext von DARIAH-DE

Um die DARIAH-DE Dienste sinnvoll für Ihre eigenen Forschungsdaten nutzen zu können, sollten Ihre Daten vier Grundvoraussetzungen erfüllen:

  • Validität
  • Reliabilität / Dokumentation des Entstehungs- und Erhebungskontextes
  • Maschinenlesbarkeit (und somit Prozessierbarkeit)
  • Referenzierbarkeit samt Angaben zur Urheberschaft und zu rechtlichen Informationen hinsichtlich ihrer weiteren Verwendung (durch Dritte)

Wo kann ich mich näher zum Thema Forschungsdaten informieren?

DARIAH-DE entwickelt das Informationsangebot stetig weiter und vermittelt multimedial.

In unserem YouTube-Kanal finden Sie verschiedene Clips rund um das Thema Forschungsdaten.

Der DHd-Blog informiert über aktuelle Themen und Entwicklungen.

In der Bibliographie Digital Humanities finden Sie sowohl Einführungswerke als auch weiterführende Titel und Themenfelder.

Folgende externe Seiten enthalten umfassende weiterführende Informationen zum Thema Forschungsdaten:

Zusammen mit der Definition geisteswissenschaftlicher Forschungsdaten bildet der Research Data Lifecycle (Forschungsdatenzyklus) das intellektuelle Konzept hinter der zentralen Infrastruktur für DARIAH-DE. Die Repository-Infrastruktur wird so ausgebaut, dass der gesamte Research Data Lifecycle für die digitalen Geisteswissenschaften abgedeckt und ggf. erweitert werden kann.

Grundlegende Prozesse im Lebenszyklus von Forschungsdaten:

  • Planung und Erstellung
  • Auswahl
  • Ingest / Übernahme
  • Speicherung / Infrastruktur
  • Erhaltungsmaßnahmen
  • Zugriff / Nutzung

Die DARIAH-DE Data Federation Architecture

Die DARIAH-DE Data Federation Architecture (DFA) ist die Bezeichnung für Basisdienste, die von DARIAH-DE bereitgestellt werden, um die grundlegenden Prozesse des Research Data Lifecycle abzudecken. Momentan umfasst die DFA die Indizierung und Anzeige von Forschungsdaten, die Bereitstellung von Beschreibungsschemata für Sammlungsbeschreibungen und deren langfristige Speicherung sowie eine umfassende Suchfunktionalität für heterogene strukturierte Datensammlungen und Archive. Zudem sind spezifische Metadatenstandards hinterlegt und Crosswalks zwischen Metadaten-Schemata abgespeichert, um Hilfestellung beim Mapping von Forschungsdaten unterschiedlicher Herkunft und Beschaffenheit zu ermöglichen.

Was sind Metadaten und wozu sind sie gut?

Metadaten sind Daten oder Informationen über Daten: Sie beschreiben die eigentlichen Daten (digitale Dateien oder physische Objekte), enthalten etwa Informationen zum Inhalt, zur Form oder Urheberschaft. Um diese Metadaten strukturiert anzulegen und weiterzuverarbeiten, existieren verschiedene Metadatenformate.

Fachspezifische Empfehlungen für Daten und Metadaten

Im Rahmen von DARIAH-DE wurden fachspezifische Empfehlungen für Daten und Metadaten erstellt. Dies geschah zunächst aus dem Blickwinkel geisteswissenschaftlicher Fächer, die an DARIAH-DE beteiligt sind. Wir möchten FachwissenschaftlerInnen aller geistes- und kulturwissenschaftlichen Fachdisziplinen, aber auch WissenschaftlerInnen aus den Informationswissenschaften und der Informatik einladen, sich aktiv an der Erweiterung und dem Ausbau dieser Empfehlungen zu beteiligen.

Empfehlungen für Forschungsdaten, Tools und Metadaten in der DARIAH-DE Infrastruktur

Eine Übersicht zu verschiedenen Metadatenstandards finden Sie in den Empfehlungen für den Umgang mit Daten und Metadaten.

DCDDM

Das DCDDM (DARIAH Collection Description Data Model) ist ein Datenmodell zur Sammlungsbeschreibung. Institutionen und WissenschaftlerInnen können damit Beschreibungen von Sammlungen anlegen, die sowohl menschen- als auch maschinenlesbar sind. Ziel des DCDDMs ist es, einfach umsetzbare Richtlinien vorzugeben, um das Erstellen, Veröffentlichen und Verwalten von Sammlungen zu unterstützen. Sammlungen können dabei sowohl aus physischen Objekten (Bücher, Bilder, Münzen) als auch digitalen Objekten (digitalisierte Texte, Datenbankeinträge) bestehen. Die Dokumentation finden Sie im Wiki. Das DCDDM XML-Schema und eine ausführliche Dokumentation ist bei Github verfügbar.

Das Datenmodell wird in der Collection Registry für die dortigen Sammlungsbeschreibungen verwendet.

Wozu sollte ich meine Daten lizenzieren?

Die Deutsche Forschungsgemeinschaft (DFG) rät in ihren „Empfehlungen zur Sicherung guter wissenschaftlicher Praxis“, Primärdaten auf „haltbaren und gesicherten Medien“ in der sie erzeugenden Institution für zehn Jahre aufzubewahren. Doch allein mit der Archivierung von Daten ist die Nachvollziehbarkeit wissenschaftlicher Ergebnisse nicht gegeben. Die Bereitstellung von Daten ist eine mindestens genauso wichtige wie berechtigte Forderung. Ein möglichst freier, überregionaler und langfristiger Zugriff auf Daten wirft eine Reihe von rechtlichen Fragen auf, die mit Hilfe von Lizenzen geregelt werden können. Sie geben unter anderem Antworten darauf, was WissenschaftlerInnen mit Forschungsdaten anderer tun (oder nicht tun) dürfen.

Forschungslizenzen.de

Das Portal Forschungslizenzen.de, das im Rahmen des DARIAH-DE-Projekts aufgebaut wurde, bietet einen Überblick zu Forschungslizenzen und stellt diese praxisnah anhand von Projekten aus den Geisteswissenschaften vor. Ziel ist es, einen Überblick zu vermitteln, AnsprechpartnerInnen zu vernetzen und den Einstieg in das Thema zu erleichtern.

Das Portal reagiert auf zwei Bedarfe, die bei der Arbeit in DARIAH-DE deutlich wurden: einerseits der Wunsch nach Wissensaustausch zur Lizenzierung von Forschungsdaten, anderseits der Bedarf an Aufklärungs- und Beratungsarbeit in Bezug auf die entsprechenden Entscheidungsprozesse.

Die Auswahl der vorgestellten Beispiele konzentriert sich auf das Feld der Digital Humanities. Die Texte sind aktuellen Veröffentlichungen zum Thema entnommen, die Inhalte werden bei neuen Entwicklungen ergänzt. In Beiträgen zu einzelnen Projekten werden die Kontaktinformationen von AnsprechpartnerInnen der beteiligten Institutionen vorgestellt. Auf diese Weise werden ForscherInnen ermutigt, sich bei Lizenzfragen mit vorhandenen Projekten auszutauschen und Erfahrungen zu teilen.

DARIAH-DE-Publikationen zum Thema

Eine detaillierte Diskussion zum Urheberrecht und Empfehlungen für Standardlizenzen für Forschungsdaten finden Sie in den DARIAH-DE Working Papers:

Die DARIAH-DE „Forschungsdaten-Föderationsarchitektur" (DFA) ist die Bezeichnung für Dienste und Werkzeuge, mit deren Hilfe Forschungsdaten und Sammlungsbeschreibungen aus unterschiedlichen Quellen, wie beispielsweise von Kulturinstitutionen, Bibliotheken, Archiven, Forschungseinrichtungen und Rechenzentren, gefunden und für Analysen verwendet werden können.

Suchanfragen in einem wissenschaftlichen Kontext erfordern eine hohe Genauigkeit in der Bestimmung der jeweiligen Parameter. Idealerweise sollte es ForscherInnen möglich sein, ihre wissenschaftliche Recherche im digitalen Umfeld auf bestimmte Quellen zu beschränken. Auf diese Weise können XML-Strukturen von Datensätzen unterschiedlicher Provenienz abgefragt und so die Interoperabilität von verschiedenen Daten- und Metadatenschemata gewährleistet und zudem heterogene Daten- und Metadatenquellen durch eine gemeinsame Referenz für Orte, Namen, Daten oder andere logische Einheiten korreliert werden.

Abbildung 1: Schematischer Aufbau der DARIAH-DE Data Federation Architecture

Der in der obigen Grafik visualisierte Aufbau der DARIAH-DE „Forschungsdaten-Förderationsarchitektur" umfasst die Indizierung und Anzeige von Forschungsdaten, die Bereitstellung eines nachhaltigen und anhaltenden Zugangs für die Verwendung von  technischen Tools, um Beschreibungen und Inhalte digitaler Sammlungen zu vergleichen, sowie eine umfassende Suchfunktionalität für heterogen strukturierte Datensammlungen und Archive zu ermöglichen.

Die  DARIAH-DE Forschungsdaten-Föderationsarchitektur ist modular aufgebaut, kann jederzeit durch weitere Komponenten erweitert werden und beinhaltet zum jetzigen Zeitpunkt folgende Tools und Dienste:

In der Collection Registry können sowohl Informationen von Forschungsdaten- Sammlungen in DARIAH-DE nachgewiesen, als auch neue Sammlungsinformationen registriert werden.

Das DARIAH-DE Repository erlaubt es, Forschungsdaten zu speichern, diese mit Metadaten zu versehen, durch die Nutzung von Persistent Identifiers eine permanente, maschinenlesbare Referenzierung zu gewährleisten und durch die Generische Suche aufzufinden. Ebenfalls ist es mithilfe des Repositorys möglich, Datensammlungen nachhaltig und sicher zu archivieren.

Mit Hilfe des DARIAH-DE Publikator können Forschungsdaten komfortabel per graphischer Oberfläche in das DARIAH-DE Repository eingespielt und mit Metadaten ausgezeichnet werden. Diese können dann als Kollektion in die Collection Registry eingetragen werden und sind dann in der Generischen Suche nachgewiesen.

Das Data Modeling Environment (DME) ist der Ort, an dem Daten modelliert und Mappings zwischen Datenmodellen abgespeichert, langfristig verwaltet und bei Bedarf kombiniert werden können. Damit bietet sie eine konzeptionelle Hilfestellung für ForscherInnen in den Kunst-, Geistes- und Sozialwissenschaften, um heterogene Daten miteinander zu verbinden und so Interoperabilität herzustellen.

Mappings ermöglichen eine automatisierte Übersetzung von Daten aus einem Modell in ein anderes. Aus diesem Grund bildet die DME die Grundlage, um beispielsweise in der generischen Suche verschiedene Sammlungen durchsuchen zu können. Die Funktionalität des DME in Bezug auf das Mapping zwischen Datenmodellen wird im folgenden Screenshot der Benutzeroberfläche anschaulich gemacht:

Abbildung 2: Mapping im Data Modeling Enviroment

Die Generische Suche bietet ein Front-End für die in der Collection Registry und dem DARAH-DE Repository hinterlegten Daten. Anhand der Generischen Suche können die verteilten Datensätze durchsucht werden. Zudem ist es mit Hilfe der Generischen Suche möglich, die verzeichneten Metadaten zu suchen, diese Suche personalisiert zu speichern und zu einem späteren Zeitpunkt anzupassen oder zu verfeinern.

Der Epic-PID Service sorgt als Basisdienst für eine dauerhafte Referenzierbarkeit der Forschungsdaten über so genannte 'Persistente Identifikatoren'. Letztere sind Dienste, die eine nachhaltige Referenz auf Daten gewährleisten. So bleiben Verweise, beispielsweise in wissenschaftlichen Publikationen, selbst dann stabil, wenn sich der Speicherort der referenzierten Daten ändert. DARIAH-DE verwendet PIDs des European Persistent Identifier Consortium (EPIC).

Dieses Set an digitalen Werkzeugen bildet eine modulare Softwarearchitektur, von denen jeder Dienst den Zugriff auf heterogene Datenquellen verschiedener Provenienz ermöglicht. Neue Methoden der Analyse von verteilten Datensammlungen sind dadurch gegeben.

Cookies und Trackinghelfen uns, Ihnen auf unserer Website ein besseres Erlebnis zu ermöglichen.