Menü

Open Data und Datenqualität

Aktuelle Informationen zum Corona-Virus / COVID-19 finden Sie hier.

“Die Datenqualität wird auf zwei Ebenen beurteilt:
quantitative Anforderungen und qualitative Anforderungen.”

Im Niedersachsen Hub werden sämtliche Informationen zu Reisezielen digital gebündelt. Dies ist ein wichtiger Schritt hin zu einer umfassenden touristischen Dateninfrastruktur auf Landesebene. Damit Gäste dieses Informationsangebot wahrnehmen ist es wichtig, dass die Daten zum einen regelmäßig und vollumfassend gepflegt werden und zum anderen die Daten auf unterschiedlichen Anwendungen ausgespielt werden, damit Gäste diese genau dann finden können, wenn sie diese benötigen. Es ergeben sich in diesem Prozess zwei zentrale Engpässe, die es zu überwinden gilt:

  1. Eingabe der Daten: Die Pflege aller Daten, die auf Landesebene touristisch relevant sind, ist auf diverse Redakteure verteilt, die jeweils über einen unterschiedlichen Kenntnisstand verfügen. Hier ein einheitliches Datenmodell durchzusetzen, das konsistent gepflegt wird, ist eine immense Koordinationsaufgabe.
  2. Ausgabe der Daten: Jeder Gast hat seine ganz eigenen Nutzungsgewohnheiten. Es ist entsprechend herausfordernd, Gästen Informationen digital immer genau dort anbieten zu können, wo sie diese gerade abrufen möchten. Dieser Engpass bezieht sich sowohl auf die Situation, in der die Daten benötigt werden als auch auf die unterschiedlichen Endgeräte, die genutzt werden – vom Infoterminal in der Tourist-Information bis hin zum eigenen Smartphone.

Die Dateneingabe
Bei der Eingabe der Daten kann zwischen einer automatisierten Datenerfassung (Import aus Drittsystemen) und der manuellen Eingabe von Basisdaten unterschieden werden. Letztere ist entscheidend, damit die realen touristischen Attraktionen auch digital gespiegelt werden können. Angaben zu Ausflugszielen, Sehenswürdigkeiten oder Wander- und Radrouten stellen damit die Basis für die Entwicklung jeglicher digitaler Anwendungen dar. Da die Daten oft sehr unterschiedlich gepflegt werden, liegt meist auch keine einheitliche Datenqualität vor. Die Pflege der Daten sollte daher regelgeleitet erfolgen, damit ein umfassender Datenbestand aufgebaut werden kann.

Die Datenqualität wird hierbei auf zwei Ebenen beurteilt: Zum einen in quantitativen Anforderungen. Hierbei geht es um die Anzahl ausgefüllter Pflichtfelder, damit einzelne Datensätze nach einem Ampelsystem auf ihre Vollständigkeit hin evaluiert werden können (rot = minimal ausgefüllte Pflichtfelder, gelb = gut ausgefüllte Pflichtfelder und grün = viele bis alle Pflichtfelder ausgefüllt). Zum anderen müssen die Daten qualitative Anforderungen erfüllen. Hierbei geht es um gute Formulierungen, eine adäquate Gästeansprache sowie die Bildqualität. Die Begutachtung der qualitativen Maßstäbe ist nur manuell möglich. Daher ist es wichtig, dass Redakteure von Anfang an geschult werden, um eine Orientierung bei der Formulierung von Texten zu haben, sodass diese im Anschluss korrekt, aktuell und verständlich für den Gast sind.

TourismusMarketing Niedersachsen (TMN) fokussiert ihre Bemühungen zur Sicherstellung der Datenqualität dabei auf die Unterstützung der Redakteure:

  1. Entwicklung von Weiterbildungsformaten wie bspw. Screencasts und perspektivisch auch Schulungen vor Ort zu Fragestellungen wie:
    • Was muss ich bei der Datenpflege berücksichtigen?
    • Wie pflege ich meine Daten so, dass sie den Standards des Niedersachsen Hubs entsprechen?
  2. Mittels eines Content Guides können Redakteure nachschlagen, wie spezifische Datentypen (Vorgaben zu Formaten und deren Qualitätsanforderungen) gepflegt werden müssen, um die Anforderungen an die Datenqualität bestmöglich zu erfüllen.
  3. Bei der Eingabe der Daten in den Niedersachsen Hub wird eine direkte Rückmeldung zum aktuellen Qualitätsniveau des Datensatzes in Form eines Ampelsystems zurückgegeben.

Ziel ist es, dass die Daten einheitlich gepflegt werden, deren Lizensierung klar geregelt ist (Stichwort: Creative Commons Lizenzen) und die Daten so untereinander vergleichbar und verknüpfbar sind. Neben der konsequenten Berücksichtigung der Qualitätsvorgaben ist es auch möglich, unterschiedliche Datenmodelle mit dem des Niedersachsen Hubs zu harmonisieren. Dieser technische Prozess (Mapping) bietet den Vorteil, dass bestehende Datenbanken weitergepflegt und dennoch in den Niedersachsen Hub integriert werden können.

Die Datenausgabe
Damit die Daten an alle erdenklichen Anwendungen ausgespielt werden können, müssen sie zudem technische Mindestanforderungen erfüllen. Hierzu zählt in erster Linie ihre Strukturierung nach schema.org. Durch diese (einer technischen Dokumentation ähnelnden) eindeutigen Beschreibung der Daten wird es möglich, dass diese maschinenlesbar sind und so von unterschiedlichen Anwendungen verstanden und selektiv integriert werden können. Allerdings sind dafür bestimmte Datenfelder zwingend erforderlich, wie beispielsweise ein Titel oder Geo-Informationen eines Ortes. Sofern diese Felder nicht ausgefüllt sind, kann der Datensatz technisch nicht verarbeitet werden (siehe Abbildung unten) und somit auch nicht in den Niedersachsen Hub eingespielt werden.

Digital vorgehaltene Informationen werden zunehmend mehr von Gästen genutzt. Auch Destinationen modernisieren ihre Informationsangebote durch Infoscreens in Tourist-Informationen und dergleichen. Die Datenpflege sollte daher genauso behandelt werden wie das Redigieren von Texten und Bildern in Broschüren, Flyern und auf Karten, die in der Tourist Information ausliegen. Dies gilt spätestens seit der Corona-Pandemie, bei der das Abrufen aktueller Daten ein zwingendes Erfordernis ist, da sich die Situation im Urlaubsort selbst oft täglich ändert, was durch eine vorgedruckte Imagebroschüre längst nicht mehr abgebildet werden kann.

Für den Niedersachsen Hub bedeuten diese Entwicklungen konkret, dass vier Ebenen der Datenqualität unterschieden werden können:

1. Technische Mindestanforderungen
2. Minimale Anforderungen
3. Anforderungen für gute Qualität
4. Anforderungen für sehr gute Qualität

Welche Daten dafür genau gepflegt werden müssen, wird nachfolgend exemplarisch am Beispiel eines POIs erläutert:

Teilen über: