Da existierende Ontologien sich nur bedingt für die Abbildung der Ausgangsdaten eigneten, wird hier eine Eigenentwicklung vorgenommen. Dabei orientiert sich diese an bestehenden Lösungen wie der Swiss Art Research Infrastructure (SARI) Ontology. Gleichzeitig beruht die Umsetzung auf den in den Projekten erstellten Forschungsdaten und den darin zentralen Kategorien sowie deren typischen Eigenschaften und Beziehungen. Ziel ist keine vollständige Abbildung aller feingranularen Informationen in den sehr forschungsfragenspezifischen Datenmodellen der sechs Forschungsprojekte, sondern die Abbildung zentraler Entitäten und Aussagen.

Als Hauptkategorien haben sich herauskristallisiert:

  • Personen
  • Orte
  • Objekte/Artefakte
  • Werke
  • Gruppen
  • Ereignisse
  • welche durch typische Relationen und Eigenschaften ergänzt und verknüpft werden können.

    RDF

    Zur Definition der gemeinsamen Ontologie bedarf es einer passenden Beschreibungssprache. Das Resource Decription Framework (RDF), das Standardformat des Linked (Open) Data-Universums, bietet sich dafür an. Die DCO ist in RDFS, der Schemabeschreibungssprache von RDF modelliert. Ergebnis ist ein dokumentiertes Vokabular mit Regeln zu dessen Verwendung.

    Provenienz: RDF 1.2

    Bei der Modellierung der Core Ontology wurde das Thema Provenienz von Beginn an mitgedacht und modelliert. Die Integration von Daten aus verschiedenen Quellen macht es nötig deren Ursprung, insbesondere auch den Kontext des datengenerierenden Forschungsprojektes, festzuhalten. Durch der Nutzung aktueller Features von RDF 1.2, der sogenannten reifizierten Tripel, ist es technisch nun auch in RDF möglich, die Quelle jeder Einzelaussage systematisch festzuhalten.

    Validierung mit SHACL

    Die zu integrierenden Daten entstehen in verschiedenen Projekten und werden teilweise eigenständig, teilweise durch das KompetenzwerkD erstellt. Hier werden Entitäten und zentrale Aussagen und Relationen der projektinternen Wissensbasen in die Kernontologie überführt, es findet ein Mapping auf der Core Ontology folgendes RDF statt. Um Syntaxfehler in den Daten abzufangen, ist eine Validierung der zu importierenden Datensätze nötig. Zu diesem Zweck wurde das Schama durch Konstrukte der Shapes Constraint Language (SHACL) ergänzt. SHACL ermöglicht die Überprüfung der korrekten Verwendung des Vokabulars der DCO und somit die Validierung zu integrierender Daten.

    Dokumentation Visualisierung
    Gemeinsamer Wissensgraph

    Die Core Ontology stellt mit ihrem Schema die Basis eines gemeinsamen Wissensgraphen dar, in den Entitäten (wie Personen, Objekte und Orte) sowie dazugehörige Aussagen und Relationen aus den DIKUSA-Projekten eingefügt und miteinander verknüpft wurden. Hierzu wurden zu Projektende Datenexporte aller Partner auf die DCO gemappt und als RDF bereitgestellt. Der Wissensgraph ist per offener SPARQL-Schnittstelle abfragbar und stellt somit eine standardkonforme Nachnutzbarkeit der Daten sicher. Der Wissensgraph wiederum dient als Basis für ein im Ausbau befindliches Forschungsdatenregister, welches als Webfrontend für die darin befindlichen Objekte dient und somit auch einen niedrigschwelligen Zugriff auf die Wissensbasis bietet.

    Nachnutzung

    Das Schema der Core Ontology wird im RDFS-Format bereitgestellt. Dabei sind Varianten mit oder ohne shacl-Constraints verfügbar. Ergänzt wird das Schema durch Anwendungsbeispiele sowie durch eine Sammlung von weiteren im Rahmen von DIKUSA erstellten oder verwendeten Vokabularen. Eine Dokumentation und eine Visualisierung erleichtern die Arbeit mit der Ontologie.

    github Repositorium Veröffentlichung im RADAR4Culture