Von Daten zu Wissen – moderne Datenarchitektur macht es möglich!

Aktuelle Informationen zum Corona-Virus / COVID-19 finden Sie hier.

„Die Herausforderung im Tourismus liegt vor allem darin, lokales, aktuelles Wissen mit bereits verfügbaren Daten zu verknüpfen und dies über relevante Kanäle bereitzustellen.“ (Alexander Wahler[1])


„Hallo lieber Urlaubsassistent, ich möchte gerne eine Tageswanderung mit Kindern und Hund von Hannover aus machen. Ich wohne in einem Hotel im Stadtteil Linden. Es wäre gut, wenn wir mittags in einem Restaurant Essengehen könnten. Was kannst Du mir vorschlagen?“

So, oder ähnlich klingen die Anfragen, wenn Beispiele von sogenannten Smarten Assistenten angeführt werden, die Gästen automatisiert Antworten auf Fragen geben sollen. Das System hinter einem solchen Assistenten muss dafür eine Menge kombinieren und Daten für die jeweilige Anfrage neu zusammenstellen: Er muss prüfen, welche Wanderrouten es gibt, die für Kinder geeignet sind, wo Hunde gestattet sind. Vielleicht schließt der Assistent auch gleich jene Touren aus, in denen gerade Brutzeit ist. Dabei muss dann aber auch sichergestellt sein, dass es ein Restaurant auf der Strecke gibt, das geöffnet hat. Zudem ist relevant, wie lange die Anfahrt mit dem Pkw ist. Kurz: Es müssen sehr viele Einzeldaten für diese sehr spezifische Anfrage vorliegen, die dann auf diese hin ausgewertet und bereitgestellt werden können.

Im Tourismus ist es tatsächlich so, dass viele dieser Daten bereits vorhanden sind. Das Problem nur: Es kann auf diese nicht zugegriffen werden. Sie liegen in regionalen Datenbanken und werden nur für die App oder Webseite der jeweiligen Region gepflegt. Auf diese „Datensilos“ kann dann oftmals nicht zugegriffen werden. Neben der Tatsache, dass die Daten meist nicht für die Allgemeinheit zur Verfügung gestellt werden ist es darüber hinaus auch typisch, dass die Logik in der Aufarbeitung von Ort zu Ort unterschiedlich ist. Jede Organisation hat andere Angaben, die sie bei einer Wanderroute für bedeutsam hält und pflegt diese dann so, dass sie für die eigene Ausgabe auf der eigenen Website stimmig ist – aber wohlmöglich nicht darüber hinaus.

Dabei gibt es gute Gründe, Daten zu öffnen und einheitlich darzustellen. Insbesondere Angaben zu Ausflugszielen, wie z. B. die Öffnungszeiten eines Schwimmbades oder eine in der betreffenden Region verfügbare Fahrrad- oder Wandertour sind in öffentlichem Interesse und müssen dann nicht nur für eine touristische Anwendung gepflegt werden – sie können allen zur Verfügung stehen. Grundsätzlich sind touristische Informationen oftmals auch deckungsgleich mit denen für Bürger. Das Ziel sollte es also sein, dass Daten eine größtmögliche Verbreitung finden. Die Digitalisierung wichtiger Angaben, die zu einer Art „Digitaler Spiegelwelt“ führen, sollte nicht so erfolgen, dass die Daten archiviert werden, sondern sie sollten so zur Verfügung stehen, dass Gäste sowie Bürger und andere Interessenten in vielen Situationen auf diese Daten zurückgreifen können. Gäste können so im entscheidenden Moment mit dem benötigten und dann auch auffindbaren und verfügbargemachten Wissen ihren Urlaub gestalten.

„Die Herausforderung im Tourismus liegt vor allem darin, lokales, aktuelles Wissen mit bereits verfügbaren Daten zu verknüpfen und dies über relevante Kanäle bereitzustellen.“ (Alexander Wahler[1])

Aus der Perspektive der Gäste, aber auch aus der von touristischen Akteuren macht es also Sinn, Daten so aufzuarbeiten, dass sie unabhängig vom Ausgabeformat und auf möglichst vielen Kanälen angezeigt werden. Nun ist dabei aber nicht immer direkt klar, wie die jeweilige App oder Website aussieht, wo der Wanderweg, das Restaurant oder die Beschreibung des Strandabschnitts angezeigt werden soll. Zielführend ist es, seine Daten einheitlich nach einem etablierten Datenstandard zu beschreiben und die Angaben dort so detailliert wie möglich zu hinterlegen. Allein bei einem Wanderweg könnten dies Angaben zum Schwierigkeitsgrad, zur Strecke, der Dauer, den Höhenmetern, der Anreise, der benötigten Ausrüstung, Einkehrmöglichkeiten usw. usw. sein. Wenn die Daten konsequent so gepflegt werden, dann können sie in unterschiedlichsten Zusammenhängen eingesetzt werden. Und je besser das gemacht wird, desto länger profitiert der einzelne Betrieb oder Ort davon. Es ist eine Investition in die Zukunft.

Die entscheidende Frage ist nun jedoch, wie so etwas realisiert werden kann? Im Deutschlandtourismus kann diese Frage glücklicherweise sehr klar beantwortet werden: Als Datenstandard hat sich schema.org durchgesetzt. Dies ist eine Art und Weise, wie Daten ausgezeichnet werden müssen, die auch von Google und anderen Suchmaschinen unterstützt wird. Die Angaben gleichen hier einer technischen Dokumentation. Das heißt, es werden Vorgaben gemacht, welche Angaben konkret und in welcher Form hinterlegt werden müssen. Beim Schema „Hotel“ wären dies Dinge wie Zeiten zu Check-In und Check-Out, Anzahl der Zimmer, ob Haustiere erlaubt sind usw.

Alle diese Daten, die in dieser Form ausgezeichnet sind, können später dann zum einen in die bundeslandweite Datenbank Niedersachsen Hub übertragen werden und zum anderen dann von dort aus an den Knowledge Graphen des Tourismusstandortes Deutschland angeschlossen werden. Der große Vorteil ist hier, dass die Angaben zum Hotel dann gebündelt und mit vielen anderen Informationen verknüpft dort liegen, frei verfügbar sind und so in diverse andere Anwendungen übertragen werden können.

Ein Knowledge Graph, das ist eine moderne Form, um Daten in einer Datenbank (also einer Graphdatenbank) zusammenzuführen. Ohne zu technisch zu werden, ist der große Vorteil hier, dass die Daten im Knowledge Graph immer wieder und je nach Anforderung neu zusammengesetzt werden können, sodass kontextsensitives Wissen entsteht, das auch für Anwendungen aus dem Bereich der Künstlichen Intelligenz oder für Sprachassistenten, die ja immer wieder Antworten auf Fragen geben müssen, sehr vorteilhaft ist.

Der „Trick“ bei einem Knowledge Graph ist, dass dieser die Daten in einem Netzwerk miteinander verbindet. Es entstehen also (Knoten-)Punkte, in denen die Daten selbst beschrieben sind und diese stehen dann über klar definierte Zusammenhänge miteinander in Verbindung. So entsteht ein Netzwerk aus Daten, die dann von Maschinen je nach Bedarf angefragt werden können und aus denen je nach Fragestellung unterschiedliche Antworten generiert werden können.

In der folgenden Abbildung werden mögliche Verbindungen anhand eines touristischen Beispiels verdeutlicht:

Wer in diesem Wissensnetzwerk bzw. Knowledge Graphen schon früh auffindbar sein möchte tut gut daran, seine Daten schon heute wie beschrieben aufzuarbeiten und im Niedersachsen Hub zur Verfügung zu stellen.

Weitere Informationen zu Knowledge Graphen und zum Open Data-Projekt gibt es hier: https://open-data-germany.org/knowledge-graphen/ und hier https://open-data-germany.org/open-data-germany/

[1] Wahler, A. (2020): Mehr Wissen für Chatbots und Sprachassistenten. Knowledge Graphen als Grundlage von gehaltvollen Konversationen zwischen Mensch und Maschine. Online verfügbar unter: www.onlim.com/ressourcen/whitepaper-mehr-wissen-fuer-chatbots-und-sprachassistenten

 

Teilen über: