Breadcrumbnavigation

Normdatendienste

Normdatendienste

Im Folgenden erhalten Sie weitere Informationen über die Normdatendienste von DARIAH-DE: TGN-Service (Getty), PND-Service und GND-Service.

TGN-Service (Getty)

DARIAH-DE bietet mit dem Getty Thesaurus of Geographical Names REST Service ein Werkzeug an, mit dem sich TGN-IDs schnell ermitteln lassen.

Beschreibung

Getty Thesaurus of Geographic Names Online (TGN) ist ein Thesaurus des J. Paul Getty Trust, der sowohl aktuelle als auch historische Bezeichnungen in verschiedenen Sprachen hierarchisch abbildet und für die Anwendung in der Museumsdokumentation entwickelt wurde. Er enthält ca. 1.106.000 Datensätze, die 91.200 Orte beschreiben. Des Weiteren beinhaltet der Thesaurus zusätzliche Informationen zu den erfassten Orten wie Geokoordination oder eine Kategorisierung nach Ortstyp, und er unterscheidet außerdem zwischen geophysischen und geopolitischen Datensätzen. Seit Juli 2014 steht der TGN als open metadata zur Verfügung.

Im Getty Thesaurus of Geographic Names werden nur ungefähre Angaben für die Referenzierung mit Koordinaten vorgenommen. Die meisten Thesauri gehen nicht bis auf die Ebene von Gebäuden, Straßen oder gar Punkten.

Der Datasheet Editor des Geo-Browsers reichert seine Daten durch Einbindung des Getty Thesaurus of Geographical Names (TGN) an. Dabei wird sowohl eine TGN-ID wie auch Geokoordinaten zugewiesen.

DARIAH-DE stellt momentan eine eXist-Instanz des TGN zur Verfügung, die auf einem Dump der Getty-Daten basiert.

Beispiel

Die Nutzung des Services ist im öffentlichen DARIAH-DE-Wiki dokumentiert (Thesaurus of Geographical Names).

PND-Service (Personennamendatei)

Deutsche Nationalbibliothek (DNB)

DARIAH-DE bietet mit dem DNB Personennamendatei REST Service ein Werkzeug an, mit dem sich PND-IDs schnell ermitteln lassen.

Die Personennamendatei der Deutschen Nationalbibliothek (PND) – seit April 2012 Bestandteil der umfassenderen Gemeinsamen Normdatei GND – wurde seit Mitte der 1990er Jahre entwickelt und diente zunächst vor allem zur Vereinheitlichung der Ansetzungsformen von Autorennamen aus dem Kontext der Ermittlung von Titeldaten und deren VerfasserInnen in Bibliotheken. Dabei stand die Erstellung individualisierter Datensätze, die z. B. Personen des gleichen Namens eindeutig identifizierten, im Mittelpunkt. Jedem Datensatz wurde eine neunstellige Zahlenkombination als Identifier zugeordnet, die sogenannte PND-Nummer. Im Zuge der Integration der PND in die GND wurde auf nunmehr 10-stellige IDs umgestellt.

Gründe für einen Personennormdatei-Service

Neben Orts- und geographischen Informationen, stellen biographische und personenbezogene Informationen Daten dar, die in allen geisteswissenschaftlichen Disziplinen erhoben und verarbeitet werden, da sie per se einen interdisziplinären Charakter aufweisen und auf vielfältige Weise in unterschiedlichen Forschungskontexten verwendet werden können. Zugleich sind Personeninformationen eindeutig referenzierbar. Das grundsätzliche Problem besteht allerdings darin, dass oftmals Personennamen unterschiedlich geschrieben wurden und werden – abhängig vom historischen, sprachlichen, geographischen und zeitlichen Kontext – und dadurch z. T. höchst unterschiedliche synonyme Namensschreibungen vorzufinden sind. Als Beispiel soll hierfür Johann Wolfgang von Goethe dienen, für den z. B. in der PND derzeit 67 synonyme Schreibweisen angegeben sind. Hier ist generell die Empfehlung auszusprechen, dass Personeninformationen prinzipiell auf Normdatensätze bezogen werden sollten. Nur dadurch ist gewährleistet, dass sie eindeutig referenzierbar werden und die beschriebenen Forschungsdaten interoperabel nachgenutzt werden können. Zudem wird die Datenqualität der Normdaten durch eine redaktionelle Betreuung sichergestellt. Die DNB legt beim Einrichten eines individualisierten Normdatensatzes auch die Ansetzungsformen von Namen fest; übliche unterschiedliche Schreibweisen (oder Pseudonyme) werden jedoch mit festgehalten.

Forschung

Alle Forschungsprojekte, die nicht nur auf Personen aus dem deutschsprachigen Raum referieren wollen, können einheitlich auf die VIAF-ID verweisen, da hier internationale Personeninformationen zu finden sind, andererseits sind die nationalen Nummerierungssysteme aber ohnehin in der VIAF mit abgelegt (diese ist also eine virtuelle Normdatei, die aus dem Abgleich von zurzeit 25 Normsystemen von 20 Partnern entsteht), so dass es auch völlig legitim ist, weiterhin die PND (bzw. GND) als ID zu benutzen.

Während viele Forschungs- bzw. Editionsprojekte aufgrund von Lücken der PND interne Namensdateien führen, ist mit dem Personendaten-Repositorium der Berlin-Brandenburgischen Akademie der Wissenschaften ein erster Schritt zur Zusammenführung solcher Informationen auch im geisteswissenschaftlichen Kontext gestartet worden.

Die Daten des von DARIAH-DE zur Verfügung gestellten Dienstes basieren zur Zeit auf einer eXist-Datenbank, die mit einem Abzug der PND-Daten gefüttert wurde. Die Instanz des PND-Services wird auch zum Zweck der Autovervollständigung von Personennamen genutzt (z. B. im TextGrid Metadaten-Editor). Die Nutzung des Services ist im öffentlichen DARIAH-DE-Wiki dokumentiert (Personennamendatei).

GND-Service (Gemeinsame Normdatei)

Deutsche Nationalbibliothek

Beschreibung

Normdaten erleichtern die Katalogisierung, bieten eindeutige Sucheinstiege und die Möglichkeit der Vernetzung unterschiedlicher Informationsressourcen. In den Normdatensätzen der Gemeinsamen Normadatei GND sind nicht nur die Vorzugsbenennungen normiert, sondern neben abweichenden Benennungen auch Relationen zu anderen Normdatensätzen enthalten. Auf diese Weise ist ein Netz von miteinander in Beziehung stehenden Datensätzen entstanden, das sich besonders für die Nutzung im Web eignet, die Navigation innerhalb der Normdatei erlaubt und somit die Recherchemöglichkeiten für NutzerInnen verbessert. 

Eine Strategie des Annotierens kann die eindeutige Identifizierung und Auszeichnung von Entitäten in Textdaten sein, Personen, Körperschaften, ortsbezogene Informationen, Sachschlagworte, Kongresse, Geografika und Werktitel. Die Gemeinsame Normdatei (GND) mit ihren annähernd zehn Millionen Datensätzen ist ein geeigneter Datenpool für solche Annotationen: Sie vereint die Personennamendatei (PND), die Schlagwortnormdatei (SWD) die Gemeinsame Körperschaftsdatei (GKD) und die Einheitssachtiteldatei (EST) des Deutschen Musikarchivs. Die GND basiert auf einer eigenen Ontologie, wird regelmäßig aktualisiert und steht, angeboten von der Deutschen Nationalbibliothek und unter der Lizenz „Creative Commons Zero", zum Download zur Verfügung. Die auf Interoperabilität zu weiteren Ressourcen achtende Erschließung der Normdatei bedarf allerdings allein aufgrund ihres Formats und des Umfangs infrastruktureller Unterstützung.

Für die Integration der oftmals sehr heterogenen Daten spielen Normdaten und Authority Files wie GND, und VIAF (Virtual International Authority File) eine zentrale Rolle. So können beispielsweise in unterschiedlichen Kontexten erhobene Forschungsdaten, wenn sie mit Normdaten angereicherten werden, anschließend eindeutig und erkenntnisgewinnend zusammengeführt werden.

Um die Nutzung von Normdaten zu erleichtern bedarf es einer Schnittstelle, die gezielte Abfragen erlaubt. Im Falle der von der DNB erzeugten GND ist dies durch eine SRU Schnittstelle gewährleistet. SRU (Search / Retrieve via URL) ist ein standardisiertes Webservice-Protokoll. Die Ergebnisse der Suche werden in einem definierten XML-Format zur Verfügung gestellt. Das SRU-Protokoll ermöglicht die gezielte Suche mittels Suchindizes und Suchbegriffen und die Übernahme der entsprechenden Treffer in die eigene Umgebung.

DARIAH-DE stellt eine eXist-Instanz zur Abfrage der GND bereit, die direkt per SRU die GND abfragt (im beta-Stadium). Die Nutzung des Services ist im öffentlichen DARIAH-DE-Wiki dokumentiert (Gemeinsame Normdatei).

Footer Standarddienste

 

Sind noch Fragen offen geblieben oder möchten Sie weitere Informationen? Sie erreichen uns unter info@de.dariah.eu.