Menü

Datenmanagement für das Semantic Web

The Semantic Web is not a separate Web but an extension of the current one, in which information is given well-defined meaning, better enabling computers and people to work in cooperation.” – Tim Berners-Lee (Begründer des WorldWideWeb)


Die Ergänzung zur Tourist-Information – so kann es aussehen!

Gäste informieren sich zunehmend direkt am Urlaubsort über Ausflugsziele und andere Aktivitäten – vornehmlich tun sie das digital. Der klassische Gang zur Tourist-Info ist zwar weiterhin beliebt, doch ein zusätzlicher Service, der auch gut angenommen werden kann, ist es, wenn Gäste sich unabhängig von Öffnungszeiten digital informieren können. Der Vorteil im digitalen Raum ist dabei: Es können verwaltungspolitische Grenzen überwunden werden. Wie das funktionieren kann, zeigt ein Verbundprojekt der Grafschaft Bentheim, des Emslandes und des Osnabrücker Landes.

Überregional verfügbare digitale Gästeinformationen

In dem Verbund werden an 33 verschiedenen und touristisch relevanten Orten digitale Anlaufstationen in Form von Infoterminals mit Touchscreens angebracht. So können direkt vor Ort digital Informationen abgerufen werden. Tag und Nacht können so Tipps zu Restaurants, Öffnungszeiten von Freizeiteinrichtungen oder Wander- und Radrouten eingesehen werden. Die eigentliche Innovation sind dabei aber nicht die Touchscreens selbst, sondern der überregionale Ansatz sowie das dahinterliegende Datenmanagement. Denn die umfassenden Daten zu Gastronomie- und Übernachtungsbetrieben, zu Sehenswürdigkeiten, Freizeiteinrichtungen sowie zu Wander- und Radrouten können aus einer gemeinsamen Datenbank der drei Landkreise sowie der Stadt Osnabrück an Dritte weitergegeben werden. Der Verbund ist damit Vorreiter eines regionsübergreifenden Systems, das zukunftsweisend auf vielfältige Einsatzmöglichkeiten der Daten vorbereitet ist, wie z. B. auch für Sprachassistenten.

Über den Niedersachsen Hub in die Welt

Diese Organisation der Datenpflege bringt viele Vorteile. Es werden Daten nun nicht mehr doppelt gepflegt, sondern immer nur einmal über das System. Sie liegen einheitlich vor, da die Struktur über die Datenbank festgelegt wird. Die Daten können dann aber über diverse andere Kanäle wieder ausgegeben werden. Eine Option ist hierbei auch die Überführung in den Niedersachsen Hub, wodurch im Anschluss dann u. a. eine Anbindung an den geplanten Knowledge Graphen des Tourismusstandortes Deutschland erfolgen kann. Somit wären die Daten der Teilnehmer des Verbundprojektes auf einen Schlag national und ggf. sogar international sichtbar. Wichtig ist hier natürlich, dass die Daten dann auch offen und zur Weiternutzung für alle lizensiert sind. Was es hierbei zu beachten gibt, können Sie umfassend im Artikel Überblick Open Data: Lizenzen, Nutzbarkeit und Unterstützung nachlesen.

Das Semantic Web im Blick

Neben den organisatorischen Vorteilen ist eine strukturierte Aufarbeitung der touristischen Datenbestände in Niedersachsen aber auch deshalb so wichtig, weil sich das Web selbst verändert. Bisher versucht Google Websites zu durchsuchen und auf Basis von Texten und weiteren Angaben dort den Sinn des jeweiligen Textes zu erkennen und so Ergebnisse zu liefern. Das Problem dabei ist, dass viele Details nur durch Menschen verstanden werden können. Die Daten liegen unstrukturiert vor und sind daher für Maschinen nur bedingt interpretierbar. Ein Beispiel: Wenn von einer “Bar” die Rede ist, dann kann es sich dabei um die Druckmesseinheit oder auch um eine Gaststätte handeln. Wenn diese Angabe in Verbindung mit Informationen zu Radtouren gegeben wird, kann dies missverständlich sein. Hinzu kommt, dass die Begriffe Kneipe, Lokal, Gaststätte, Schankstube oder Wirtschaft synonym verwendet werden könnten – aber eben nicht eindeutig sind. Zudem könnte sich der Begriff Wirtschaft auch auf den Handel beziehen. Kurz: Wenn Daten darauf vorbereitet werden sollen, dass sie von Maschinen wie zum Beispiel dem GoogleBot verstanden werden, dann müssen sie maschinenlesbar aufbereitet werden. Diese Entwicklung wird auch als Semantic Web bezeichnet. Semantik wird in diesem Zusammenhang als die Bedeutungslehre von Daten verstanden. Ein de facto Datenstandard, der Daten eine eindeutige Bedeutung zuschreibt, ist schema.org. Diese „Sprache für Daten“ wird im Tourismus und auch von Google präferiert. Es kann so eine Klassifikation und hierarchische Einordnung der Daten erfolgen, wodurch so ausgezeichnete Daten nicht nur für Menschen, sondern auch für Maschinen verständlich werden. Genau dies ist durch das Verbundprojekt erfolgt und ist damit eine Vorbereitung auf das Web der Zukunft.

Daten werden in Abhängigkeit der Urlaubssituation benötigt

Durch die Schulung der Mitarbeiter:innen konnte es im Projekt auch gelingen, die Daten einheitlich zu pflegen, was wiederum dazu führt, dass sie – neben der Maschinenlesbarkeit – auch unabhängig vom Ausgabemedium eingesetzt werden können. Denn Gäste haben je nach individueller Urlaubssituation ganz unterschiedliche Informationsbedarfe, die auch auf verschiedenen Endgeräten abgerufen werden (siehe Abbildung):

Aus einem solchen Datenpool kann also eine Vielzahl an Informationen gezogen und auf diversen Endgeräten angezeigt werden. Sei es abends vom Hotelbett aus auf dem iPad oder Laptop, wenn der kommende Tag geplant wird, oder morgens beim Frühstück, wenn noch schnell die Route, Reisedauer und Restaurants auf der Strecke recherchiert werden.

Effiziente Datenpflege

Es wird deutlich, dass es sehr viel effizienter ist, wenn Daten lediglich einmalig gepflegt werden müssen und dies auch nicht für jedes Endgerät einzeln erfolgen muss. Somit gehen die Regionen Grafschaft Bentheim, Emsland und Osnabrücker Land einen innovativen Weg im Datenmanagement, der im Übrigen auch einer allgemeinen Entwicklung im Web gerecht wird. Nämlich, dass wir uns von einem Web aus Dokumenten, die auf Websites gelagert werden, wegbewegen und uns auf ein semantisches Web, welches versucht, Sinnzusammenhänge herzustellen und diese kontextuell auszugeben, zubewegen. Daten müssen daher in einer Form aufgearbeitet werden, die es auch Maschinen erlaubt, sie zu verstehen. Dies setzt voraus, dass sie einheitlich nach einer vorab definierten Ontologie (hier: schema.org) so genau und so hochwertig wie möglich beschrieben werden – weil ja vorab nicht immer antizipiert werden kann, wer die Daten wo und wie abruft und sie dann sehr unterschiedlich ausgegeben werden können. Die Partner im Projekt sind hier den beschriebenen Weg gegangen, um den jetzigen und künftigen Anforderungen des Datenmanagements gerecht zu werden. Mit Erfolg!

Weitere Informationen zum Projekt in der GEO Region können Sie sich hier anschauen: Digitale Gästeinformation ohne Grenzen in der GEO Region

Teilen über: