Datenmodellierung

Ein Ziel von DIKUSA und gleichzeitig eine der zentralen Herausforderungen in den Digital Humanities ist es, Wissen strukturiert und standardisiert zugänglich zu machen, um eine umfassende Nutzung und Wiederverwendung zu ermöglichen. Der Prozess der Datenmodellierung - der formalen Abbildung der im Forschungskontext relevanten Objekte mittels ihrer Attribute und Beziehungen - ist ein wesentlicher Bestandteil dieser Aufgabe.

Die sechs Teilprojekte von DIKUSA bearbeiten jeweils eine eigene Forschungsfrage. Die spezifischen zu erfassenden Daten bedürfen stets eines individuellen Datenmodells, um Feinheiten der Fragestellung korrekt beschreiben zu können. Dabei wurde den beteiligten Institutionen möglichst große Freiheit in Bezug auf einzusetzende Technologien gewährt, um die aufzubauenden Datenerfassungssysteme beispielsweise in bestehende Infrastrukturen integrieren zu können.

Um dennoch Daten der Teilprojekte auf einheitliche, strukturierte und standardisierte Weise bereitzustellen zu können, wurde ein gemeinsames Kerndatenmodell entwickelt, in das die Partner ihre Daten konvertieren. Dieses schafft somit gleichzeitig eine Basis für Datenaustausch und Datenintegration, sowohl im Rahmen von DIKUSA als auch für zukünftige Projekte der Partnerinstitutionen. Da in den Einzelprojekten in der Regel identische Entitätenarten wie Orte, Personen und Ereignisse beschrieben werden, bot sich dieses Vorgehen an. Die entstandene Ontologie umfasst im Kern sechs Kategorien mit ihren typischen Eigenschaften und Relationen untereinander. Als Basis wurde das RDF-Modell gewählt, ein W3C-Standard und Standard-Modell für Datenaustausch von Graphdaten. Das Datenmodell ist als RDF-Schema hinterlegt, um dessen Struktur formal festzulegen. Ergänzend werden umfangreiche SHACL-Constraints bereitgestellt. Diese ermöglichen es den Partnern, ihre exportierten Ontologien auf formale Korrektheit zu überprüfen.

Spätestens zu Projektende werden die Ontologien, die die Partner aufbauen, dem RDF-Modell der Kernontologie folgend frei zur Verfügung gestellt. Ergänzend ist eine Bereitstellung kompatibler Teile der Ontologien entsprechend des CIDOC Conceptual Reference Model geplant.