Welche Entwicklungen des Datenmanagements gibt es in Deutschland? Welche Bedeutung haben Datenmodelle im Deutschlandtourismus? Und welche Rolle spielen dabei die Open Data Tourism Alliance, schema.org und der Knowledge Graph?
Diese und weitere Fragen werden im folgenden Beitrag beantwortet und die Zusammenhänge aufgezeigt.
Was ist ein Datenmodell und wie sieht dieses aus?
Ein Datenmodell ist ein konzeptionelles Rahmenwerk, um die Struktur, die Beziehungen und die Bedeutung von Daten zu beschreiben. Es ermöglicht, Daten auf eine verständliche Weise zu organisieren. Datenmodelle sind dann entscheidend, wenn eine klare Vorstellung darüber vermittelt werden soll, wie Daten in einem bestimmten Kontext organisiert sind und wie sie miteinander in Beziehung stehen. Wenn zum Beispiel eine Suchanfrage zu „Essen in Baden-Baden“ gestellt wird, dann kann in Verbindung mit Künstlicher Intelligenz über ein standardisiertes Datenmodell schnell antizipiert werden, welche Restaurants in der Stadt Baden-Baden zu empfehlen sind – und, dass es sich eben nicht um die Stadt „Essen“ oder die Tätigkeit „baden“ bei der Anfrage handelt. Insofern helfen Datenmodelle der Künstlichen Intelligenz, schnell und präzise zu einem eindeutigen und korrekten Ergebnis zu gelangen.
Welchen Beitrag Datenmodelle für intelligente Sprachanwendungen leisten und welche Voraussetzungen dafür notwendig sind, zeigt das folgende Video der DZT:
Bei Datenmodellen werden zunächst die wichtigsten Entitäten (das sind im Tourismus bestimmte wichtige Objekt-Typen wie Sehenswürdigkeiten, Hotels, Restaurants usw.) identifiziert und ihre Attribute (also die Eigenschaften, die sie haben, wie z. B. die Anzahl der Betten und Zimmer in einem Hotel) sowie die Beziehungen zwischen ihnen definiert. So können alle, die ein Hotel, eine Sehenswürdigkeit usw. haben, diese auf dieselbe Art und Weise beschreiben und die einzelnen Objekte werden miteinander vergleichbar.
Wer kümmert sich im Tourismus um die Erstellung solcher Datenmodelle?

Diese Arbeit übernimmt im Tourismus für den DACH-Raum die Open Data Tourism Alliance (ODTA). Die ODTA wurde im September 2021 gegründet und ging aus der DACH-KG hervor, einer Initiative, die sich bereits früh für Open Data und standardisierte Datenmodelle im Tourismus einsetzte. Die ODTA ist eine grenzüberschreitende Organisation, welche die Arbeit der DACH-KG fortführt. Dadurch trägt sie maßgeblich dazu bei, dass Reisende und die Tourismusindustrie von einheitlich strukturierten und auch offenen Daten profitieren. Die Mitglieder der ODTA sind die nationalen Tourismusorganisationen von Deutschland, Österreich und der Schweiz sowie rund 20 Partner auf Landes- und Kantonebene (also auch die TMN!). Die ODTA pflegt zudem enge Kooperationen mit relevanten Unternehmen, darunter Anbieter touristischer Datenbanken, um über die bereitgestellten Schemata aufzuklären. Die organisatorische Führung der ODTA liegt bei der Deutschen Zentrale für Tourismus e.V.. Neben der TMN! ist auch Björn Reckewell, Fachbereich Kultur und Tourismus Wolfenbüttel, als Vertreter für Niedersachsen in der Arbeitsgruppe dabei.
Wo steht die Open Data Tourism Alliance (ODTA)?
Während des 7. ODTA-Treffens in Linz (24. und 25. Mai 2023) wurden für die vier wichtigsten Datentypen im Tourismus spezifische Datenmodelle beschlossen (sogenannte Domain Specifications (DS)). Diese touristischen Spezifizierungen basieren auf dem weltweit verbreiteten Vokabular von schema.org. Im übertragenen Sinne ist es eine “Sprache” für Daten. Mit den Domain Specifications wird einfach gesprochen ein Orientierungsrahmen geschaffen, der einem Regelwerk gleicht, welches festlegt, wie Daten im Tourismus beschrieben werden sollten. Also zum Beispiel, in welcher Form Öffnungszeiten hinterlegt werden, oder in welcher Form Angaben zu einer Ferienunterkunft angegeben werden sollten.
Auf folgenden Seiten sind die erarbeiteten Domain Specifications der ODTA zu finden:
|
Welche Vorteile bieten die Datenmodelle der ODTA?
Wenn ein Datensatz vollständig umschrieben wurde, dann ist dieser im Fachjargon „semantisch annotiert“. Das bedeutet, dass ein Objekt mit touristischem Bezug, welches es in der Realität gibt, einheitlich und umfassend digital beschrieben wurde. Konkret versteht man unter einer semantischen Annotierung also, dass ein touristisches Objekt (ein POI, eine Unterkunft, eine Veranstaltung, eine Wanderroute usw.) mit zusätzlichen Informationen oder Erklärungen versehen wird, um den Inhalt besser zu verstehen und zu organisieren. Es ist vergleichbar mit dem Hinzufügen eines Etiketts, auf dem Produktangaben zu einem Kleidungsstück vermerkt sind. So lässt sich ein digitales Abbild der touristischen Lebenswelt erschaffen. Die Basis dafür sind die von der ODTA erarbeiteten Domain Specifications durch die Informationen in einer einheitlichen Struktur hinterlegt werden können und definiert werden kann, wie die einzelnen Daten miteinander in Beziehung stehen. Dies hilft sowohl Menschen als auch Maschinen, den Kontext und die Bedeutung von Daten (und damit auch der Realität) besser zu erfassen und zu interpretieren.
Ein typisches Anwendungsbeispiel findet sich bereits bei Google, das über strukturierte Daten schon jetzt Veranstaltungen einheitlich auf seiner Suchergebnisseite darstellt. Dazu müssen Nutzende die wissen wollen, was es in einer Stadt zu erleben gibt, nicht mehr auf jede einzelne Website gehen, sondern können diese Informationen direkt und einheitlich dargestellt auf der Ergebnisseite von Google recherchieren. Die Künstliche Intelligenz von Google durchsucht dazu diejenigen Websites, auf denen Veranstaltungsinformationen in einem spezifischen Datenmodell (hier: die von Google genutzten strukturierten Daten, die dem Datenmodell der ODTA sehr ähnlich sind) hinterlegt sind und stellt diese dann in einer bestimmten Art und Weise dar (siehe Abbildung).
©Quelle: TourismusMarketing Niedersachsen (TMN!). Horster (2023). | CC BY-SA 4.0
Eine weitere Möglichkeit, einheitliche Datenmodelle zu nutzen, liegt in der Zusammenführung dezentral gespeicherter Informationen durch deren Integration (Mappings), um sie so zentral verfügbar zu machen. Die ODTA strebt danach, perspektivisch auch Hilfsmittel bereitzustellen, um solche Mappings auf Basis der entwickelten Datenmodelle zu erleichtern. Der Vorteil eines solchen Datenmodells zeigt sich insbesondere dann, wenn von vielen unterschiedlichen Datenbanken die Daten zusammengeführt werden sollen – wie es im Tourismus häufig der Fall ist. Über einzelne Konnektoren (siehe linken Teil der Abbildung) wird ein solches Verfahren schnell komplex und noch dazu unflexibel, da bei einer Veränderung der einzelnen Systeme Auswirkungen und potenzieller Datenverlust zu befürchten sind. Im Gegensatz dazu wird es bei einem einheitlichen Datenmodell möglich, die einzelnen Systeme zentral auf dieses zu mappen und das (oder auch diejenigen) Systeme, auf das/die die Daten überführt werden sollen, ebenfalls zentral dort anzugliedern (siehe rechten Teil der Abbildung).
©Quelle: TourismusMarketing Niedersachsen (TMN!). Horster (2023). | CC BY-SA 4.0
Welche Bedeutung hat der touristische Knowledge Graph in diesem Zusammenhang?
Die Deutsche Zentrale für Tourismus (DZT) hat im Juli 2023 den Knowledge Graphen für den Deutschlandtourismus veröffentlicht. Die Arbeit der ODTA ist eng an dieses komplementäre Projekt geknüpft. Denn in diesem Knowledge Graphen werden die Daten ebenfalls nach den in der ODTA beschlossenen Datenmodellen abgebildet. Alle Daten, die so aufgearbeitet wurden, wie es die ODTA vorschlägt, können also später sowohl in den landesweiten Datenbanken (z. B. den Niedersachsen Hub) eingesetzt werden als auch mit dem Knowledge Graphen für den deutschen Tourismus verknüpft werden. Dies bietet den Vorteil, dass möglichst alle touristischen Informationen an einem zentralen Ort gesammelt und mit vielen anderen Daten verknüpft werden können. Diese Daten sind dann zudem frei zugänglich und einheitlich strukturiert und können so in verschiedene Anwendungen integriert werden.
Ein solches Wissensnetzwerk (der Knowledge Graph) stellt eine moderne Art dar, um Daten in einer Datenbank zu vereinen. Ohne in technische Details abzutauchen, besteht der wesentliche Vorteil darin, dass die Daten im Wissensnetzwerk immer wieder auf neue Art und Weise zusammengestellt werden können – abhängig von den Anforderungen der jeweiligen Anwendung. Dadurch entsteht kontextbezogenes Wissen, das insbesondere für Anwendungen im Bereich der Künstlichen Intelligenz (z. B. Sprachassistenten) von Vorteil ist, denn diese müssen meist kontinuierlich Antworten auf Fragen der Nutzenden liefern. Wie sich so ein Wissensnetzerk (Knowledge Graph) zusammensetzt, zeigt die nachfolgende Grafik exemplarisch:

Mit den Inhalten, die über den Niedersachsen Hub in den Knowledge Graph überführt werden, wird die Grundlage für Services gelegt, die auf Künstlicher Intelligenz basieren. ChatGPT und andere Sprachmodelle können nur dann umfängliche und korrekte Antworten liefern, wenn sie die Möglichkeit erhalten, auf eine valide Datenbasis zurückzugreifen, mit der sie trainiert werden können. Der Aufgabe der touristischen Partner aus Niedersachsen, ihre Inhalte der Leistungsträger, Orte und Regionen als Open Data im Niedersachsen Hub einzustellen, kommt demzufolge eine besonders hohe Bedeutung zu.
Weitere Informationen zum Einsatz von Künstlicher Intelligenz rund um Open AI und ChatGPT im Datenbankkontext finden Sie in diesem Beitrag: https://nds.tourismusnetzwerk.info/2023/09/13/kuenstliche-intelligenz-und-automatisierungen-als-hilfestellungen-im-niedersachsen-hub/
Wie ist der Stand des Knowledge Graphen aktuell?

“Das bisher größte Dateninfrastrukturprojekt des Deutschlandtourismus” ist seit dem 28.06.2023 live! Derzeit stehen im Knowledge Graphen allen Akteuren – globalen Vertriebsplattformen, aber auch touristischen Dienstleistern oder Startup-Unternehmen – mehr als 200.000 aktuelle Datensätze in hoher Qualität für den öffentlichen Datenabruf zur Verfügung. Darunter sind laut Angabe der DZT 100.000 touristische Objekte (POIs, Touren, Events, Gastronomie, Hotels u.ä.) sowie weitere 100.000 Infrastrukturdaten. Davon entfallen 12.000 offene Daten (Stand Ende Juni) auf das Reiseland Niedersachsen, das sämtliche Open Data-Inhalte über den Niedersachsen Hub zur Verfügung stellt.
Als zentrale Datenbasis für den Deutschlandtourismus nutzt der Knowledge Graph touristische Daten aus allen 16 Bundesländern. Weitere Partner im Projekt sind z.B. die Magic Cities, Amadeus, das German Convention Bureau sowie Vertreter der Wissenschaft.
Zwischen unterschiedlichen Systemen kann es insbesondere in den Anfangsphasen neuer Projekte immer zu Diskrepanzen zwischen den Datenbeständen kommen. Ab sofort finden Nutzer des Knowledge Graph daher auf den nachfolgend erwähnten Seiten, die den aktuellen Datenbestand zeigen, ein Dropdown-Menü, über das sie gegebenenfalls im Knowledge Graph fehlende Daten melden und auf Fehlersuche gehen können.
Link zur Deutschlandkarte des Datenbestands im Knowledge Graph: https://open-data-germany.org/datenbestand/
Link zum Such-Widget, um nach konkreten Datensätzen im Knowledge Graph zu suchen: https://open-data-germany.org/datenbestand-such-widget/

Sie finden dort Hilfestellungen zu möglichen Gründen und die direkte Kontaktmöglichkeit zur TMN: https://open-data-germany.org/kontakt-tourismusmarketing-niedersachsen-gmbh/
Wenn Sie das Kontaktformular nutzen, füllen Sie die abgefragten Felder bitte bestmöglich aus, damit die Spurensuche in der Schnittstelle zwischen den Systemen erfolreich und zügig erfolgen kann. |
Eine erste Anwendung, die bereits auf die niedersächsischen Open Data-Inhalte über den Knowledge Graph zugreift, ist SmartGuide.

SmartGuide verwandelt touristischen Content in digitale und audiovisuelle Reiseführer für Gäste. Im Backoffice der Anwendung zur Erstellung eines Audioguides können die touristischen Inhalte aus dem Knowledge Graph direkt abgerufen werden, um so Reisenden ein einzigartiges multimediales Erlebnis bieten zu können, das auf ihre individuellen Vorlieben und Interessen zugeschnitten ist.
Wer erfahren möchte, wie SmartGuide Knowledge Graph-Daten für die innovative Erstellung von Audioguides in Deutschland nutzt, findet weitere Informationen in diesem Beitrag: https://blog.smart-guide.org/en/how-smartguide-leverages-knowledge-graph-data-for-innovative-audio-guide-creation-in-germany.
Auch am 28.09.23 in unserem 9. Termin des Datenmanagement-Netzwerks haben Sie die Möglichkeit, mehr über SmartGuide zu erfahren und wie der Abruf niedersächsischer Inhalte aus dem Knowledge Graph für die Anwendung schon funktioniert. Anmelden können Sie sich für die Veranstaltung unter: https://nds.tourismusnetzwerk.info/inhalte/digitales/niedersachsen-hub/datenmanagement-netzwerk-niedersachsen/
Wie geht es mit der Arbeit der ODTA weiter?
Die ODTA legt ihren Fokus neben der Entwicklung von Datenstandards für weitere touristisch relevante Daten nun darauf, die bestehenden, offenen und strukturierten Daten in Wert zu setzen. Dazu möchte die ODTA sich inhaltlich über mögliche digitale Services austauschen und daraus Use Cases ableiten. Es können so Anwendungen auf Basis der Datenstandards geschaffen werden, die exemplarisch für mögliche weitere Nutzungen stehen können. Neben diesen Anwendungsszenarien sollen Startups mit interessanten Use Cases unterstützt werden.
Durch diese Entwicklungen des Datenmanagements im Deutschlandtourismus wird eine Vielfalt an Ausgabekanälen gefördert. Dies regt Innovation an und fördert kleine Dienstleistende, die sich eine entsprechend umfangreiche Datenbasis sonst nicht leisten könnten, oder auf Schnittstellen sowie den Einkauf von Fremdanbietenden angewiesen wären. Da abzusehen ist, dass die Daten im Knowledge Graph zunehmend mehr eingesetzt werden, bleibt auch die Frage zur Verbesserung der Datenqualität ein wichtiges Thema.