Linked Open Data – Vernetzte Verwaltung für vernetzte Daten

Blogbeitrag zum Workshop: „Linked Open Data – Vernetzte Verwaltung für vernetzte Daten”

Angesichts steigender Erwartungen an eine moderne, digitale und transparente Verwaltung steht die öffentliche Hand vor der Herausforderung, ihre Daten auf ein neues Qualitätsniveau zu heben. In Berlin gibt es bereits verschiedene Pioniere, die Linked Open Data (LOD) als höchsten Reifegrad in der Praxis erproben und so die Grundlage für eine vernetzte, datengetriebene Verwaltung schaffen. 

Strukturierte Daten als Schlüssel zu Innovationen  

Mit der fortschreitenden Digitalisierung steigen die Anforderungen an das Datenmanagement in der öffentlichen Verwaltung erheblich. Gleichzeitig bieten sich enorme Potenziale, um etwa dem zunehmenden Personalmangel entgegenzuwirken. Digitale Innovationen sind unverzichtbar: Viele öffentliche Organisationen erproben bereits, wie Automatisierung und neue Technologien dabei helfen können, Ressourcen effizienter zu nutzen, Abläufe zu vereinfachen und Verwaltungshandeln strategischer und evidenzbasierter zu gestalten. 

Sprachbasierte KI-Anwendungen wie LLMs können heute bereits viele Aufgaben übernehmen. Doch Halluzinationen und mangelndes Faktenverständnis sind ernstzunehmende Probleme – besonders für Verwaltungen, die auf verlässliche und Informationen angewiesen sind. Um das Potenzial voll auszuschöpfen, steht die öffentliche Verwaltung daher vor einer zentralen Aufgabe: der Nutzbarmachung ihrer eigenen Daten und Informationsgrundlagen. Jede KI und jeder Chatbot funktioniert letztlich nur so verlässlich, wie es die zugrunde liegenden Daten zulassen. Es müssen daher Lösungen etabliert werden, um (wachsende) Datenmengen sinnvoll aufzuwerten, zu verknüpfen und effektiv für neue Anwendungen zu nutzen. 

Linked Data als Innovations-Booster in der datengetriebenen Verwaltung 

Das Datenqualitätsmodell von Tim Berners-Lee, das von der einfachen Online-Verfügbarkeit (ein Stern) bis hin zur Einbindung in das Semantic Web (fünf Sterne) reicht, bietet eine klare Richtschnur zur Bewertung und Verbesserung der Zugänglichkeit sowie der technischen Nutzbarkeit von Datensätzen. Um den höchsten Qualitätsgrad zu erreichen, müssen die Daten nicht nur maschinenlesbar sein, sondern auch den grundlegenden Prinzipien von Linked Open Data (LOD) entsprechen: 

  • Verwendung von Triples: Informationen werden immer als Subjekt, Prädikat und Objekt in einem maschinenlesbaren Dateiformat gespeichert. Ein Beispiel zeigt Abbildung 1: “Kai Wegner”, “hat die Rolle”, “regierender Bürgermeister”. 
  • Verwendung von URIs: Alle Entitäten in den Daten werden durch eindeutige Identifier, die sogenannten URIs beschrieben. Kommen identische Objekte, Personen etc. In verschiedenen Datensätzen vor, bekommen sie überall ein und dieselbe URI. 
  • Ontologien: Durch standardisierte Klassen und Beschreibungen wird festgelegt, welche Beziehungen zwischen den Subjekten und Objekten möglich sind. 
  • Verknüpfungen: Durch die Anwendung dieser Prinzipien lassen sich Verbindungen zwischen Daten herstellen. Dafür müssen diese in speziellen Datenbanken, den Triple Stores gespeichert werden. 

Abbildung 1: Ein Triple besteht immer aus Subjekt, Prädikat und Objekt.  

Zusammengefasst besteht das Prinzip von Linked Data also darin, dass Inhalte eines Datensatzes eindeutig bezeichnet sind, was eine unmissverständliche und automatisierte Verknüpfung ermöglicht. So entsteht ein Netz an Informationen, auch als Wissensgraph („Knowledge Graph“) bezeichnet, welches ein enormes Potenzial birgt: Es ermöglicht die organisations- und fachübergreifende Vernetzung von Daten, erhöht die Transparenz in Entscheidungsprozessen und fördert die Bürgerbeteiligung auf vielfältige Weise. Gleichzeitig können auch Maschinen und Algorithmen die Beziehungen zwischen Datenpunkten auslesen. 

Abbildung 2: Skizze eines beispielhaften Knowledge Graphs für ein Berliner Datenökosystem 

Schritt für Schritt in Richtung Linked Open Data: Beispiele aus der Berliner Verwaltung 

Wie Linked Open Data konkret umgesetzt werden kann, wird in Berlin anhand erster Anwendungsfälle erprobt: 

1. Organigramm-Tool der ODIS: Die Open Data Informationsstelle Berlin (ODIS) hat ein browserbasiertes Open-Source-Tool entwickelt, mit dem Mitarbeitende die Organigramme ihrer Organisationen erstellen können. Im Hintergrund generiert das Tool eine offene, maschinenlesbare (JSON-)Datei, die das Organigramm abbildet. Aufgrund ihrer Fülle an Informationen über Aufbau und Struktur der Berliner Verwaltung sind maschinenlesbare Organigramme ein idealer Anwendungsfall für Linked Open Data. Deshalb hat die ODIS das Organigramm-Tool 2023 so weiterentwickelt, dass die Informationen des Organigramms nun auch als Linked Open Data veröffentlicht werden können. 

2. Berliner Haushaltsdaten: Im Rahmen des 4. Nationalen Aktionsplans des Bundes arbeitet die Berliner Finanzverwaltung in einem Pilotprojekt eng mit der Staatskanzlei Schleswig-Holstein zusammen, um die offenen Berliner Haushaltsdaten als Linked Open Data bereitzustellen. Mit tausenden von Ausgabe- und Einnahmetiteln, also Informationen zur Höhe und zum Zweck von Einnahmen und Ausgaben, enthält der Haushalt wichtige Informationen mit örtlichem und politischem Bezug. 

3. Lebensweltlich orientierte Räume (LOR): Diese geografischen Untereinheiten dienen als Grundlage für die Planung, Prognose und Beobachtung demografischer und sozialer Entwicklungen in Berlin. Über GitHub können Nutzer:innen verschiedene Unterteilungen anzeigen lassen, von Bezirksübersichten bis hin zur kleinsten Untereinheit. 

Sparring-Partner und Use Cases gesucht: Ausblick und Einladung zur Zusammenarbeit 

Unsere Ansätze gehen weit über die bloße Veröffentlichung von Daten hinaus. Wir wollen den Grundstein für zukünftige verwaltungsübergreifende Verknüpfungen legen und uns dazu mit Expert:innen aus Verwaltung, Wissenschaft und Zivilgesellschaft austauschen und folgende Leitfragen diskutieren: 

  • Welche Use Cases und Datenthemen bieten sich für die Verknüpfung von Datensätzen an?  
  • Welche Akteure über Berlin hinaus arbeiten bereits mit Linked Data?   
  • Wie kann ein Prozess für Linked Open Data in der Verwaltung aussehen, welche Infrastrukturen und Entscheidungen werden benötigt? 

Wir laden Sie herzlich ein, bei unserem Workshop auf der PIAZZA über diese Themen zu sprechen und gemeinsam mit uns weitere Schritte zu planen. Die Zukunft der Verwaltung liegt in der Vernetzung – und Linked Open Data ist der Schlüssel dazu. 


Beitragsbild von Markus Spiske auf Unsplash