Modelle Öffentlicher Forschungsdaten

3 min read

„Mit dem im Koalitionsvertrag vorgesehenen Forschungsdatengesetz will das Bundesministerium für Bildung und Forschung (BMBF) den Zugang zu Daten für die Wissenschaft verbessern und Rahmenbedingungen für die Weitergabe, Aufbewahrung und Sicherung gestalten.“ 2023 Zitat des BMBF zum Forschungsdatengesetz.

Es bleibt spannend, wie im Einzelnen die Rahmenbedingungen für den Datenzugang, die Datenweitergabe oder auch die Datenaufbereitung bzw. Datensicherung neu gestaltet werden können. Datengetriebene Forschung liefert Antworten auf wissenschaftliche Fragen. Sie liefert aber auch neue Fragestellungen aus neuen Erkenntnissen. Aktuell existieren Linked Open Data Modelle zu Gewinnung und Verarbeitung von Forschungsdaten durch z.B. Patente. Hier liefert das DFG geförderte Patents4Science Projekt, zusammengefasst auf dem Wiki  forschungsdaten.org des Helmholtz-Zentrum Potsdam Deutsches GeoForschungsZentrum GFZ erste Ergebnisse der Anzeige spezifischer Wissensquellen in einem patentzentrierten Wissensgraphen (Patent Knowledge Graph).

Ein Beispiel vernetzter Domain übergreifender Datenmodelle im Sinne des „Linked Open Data“ Prinzipes ist auf lod-cloud.net zu bewundern.

Heimat des LOD-Wolkendiagramms

Dieses Bild zeigt Datensätze, die im Linked-Data-Format veröffentlicht wurden.

(-) Leider wird hinter den SocialLink Datensätzen kein Fediverse verwendet.

(-) Face Links funktionieren zum Zeitpunkt der Tests noch nicht. (Wofür auch immer ?)

(-) Leider befinden sich auch Dead Links unter den Datensätzen (z.B. SPARQL Endpunkte)

(+) Hinter den „Data Facts“ Links finden wir „Linked Open Vocabularies“ Der LOV-Datensatz enthält die Beschreibung von RDFS-Vokabularen
oder OWL-Ontologien, die für Datensätze in der Linked Data Cloud definiert sind und von diesen verwendet werden.

(+) Contact Details der Ansprechpartner und Projektressourcen

(+) Download Links zu aktuellen Ontologien

Resumé

Verlinkte Daten im World Wide Web sind nützlich, wenn die verlinkten Ziele auch redaktionell gepflegt werden. Wie ein Datenmodell durch LOD Wolken ermöglicht wird, erscheint als technisch relativ leicht umsetzbar. Was geschieht mit hochwertigen Patentdaten und Wirtschaftsinformationen, die nicht via Suchmaschinen oder inzwischen durch KIs gefunden werden ? Was 2 weitere wichtige Fragen aufwirft.

Welche Arten von Algorithmen werden für uns Domain übergreifende Forschungsdaten auswerten, bewerten oder sogar verwandte Anbieter empfehlen ?

Haben wir dann immernoch Einfluss darauf, welchen Teil der LOD Wolke für uns durch Algorithmen zugänglich ist ?

… und was hat das alles mit West Afrika zutun ? Mehr dazu in Teil II dieser Artikelserie.

Relevante Artikel

Andere Artikel