Data-Enrichment: GEFAHREN & CHANCEN … was steckt dahinter?

ESRI hat den Usern in der jüngeren Vergangenheit viele Werkzeuge in die Hand gegeben um individuelle Polygone hinsichtlich vielfältiger Attribute auswerten zu können. Eine Möglichkeit, dies mit dem ESRI Business Analyst zu tun, haben wir auf der diesjährigen Plenary Veranstaltung der SynerGIS 2018 zeigen können.

Mit den Data-Enrichment Funktionen lassen sich Informationen aus unterschiedlichen Bereichen auch auf kleinräumige Flächen herunter brechen: Population, Einkommen, Altersstruktur, Haushalte, Bildung, Ausgabeverhalten, Arbeitslosigkeit, Beziehungsstatus.

Dahinter stehen Daten von MBR (Michael Bauer Research), die wiederum (in Österreich) auf Daten der Statistik Austria basieren. Ein Blick in die Release Notes von ESRI zeigt, dass in Österreich Daten bis auf die Ebene der Statistical Areas (Zählsprengel) verwendet werden.

Wie also kann beispielsweise die Business Analyst Web App diese Informationen noch weiter herunter brechen bzw. auf beliebige Flächen umlegen?
Dahinter stehen berechnete Schätzwerte die aus den Statistikdaten letztendlich auf Punktebene (Blocks) verteilt werden. Diese Funktionalitäten stehen ESRI Usern weltweit zu Verfügung, und werden über Credits (ArcGIS Online) abgerechnet.

Quelle: ESRI

Die Methodik an sich wenden wir bei GeoMagis seit Jahren an. GeoDaten von einer Ebene auf eine andere Ebene zu „vererben“ gehört seit je her zu den GIS Grundfunktionalitäten. Wie so oft ist nur die Frage nach dem „Wie“ entscheidend.

Es empfiehlt sich zunächst einmal eine möglichst kleine administrative Einheit zu wählen, für die GeoInformation verfügbar ist – der regionalstatistische Raster der Statistik Austria zum Beispiel. Um hier „Blocks“ zu erzeugen kann am einfachsten der Rastermittelpunkt herangezogen werden, der repräsentativ für die Rasterzelle deren Attribute übernimmt.

Dass dies auch nicht immer der Weisheit letzter Schluss ist, hat Mag. Maria-Luzia Enengel beim Vortrag des NOEGUS im Business-GIS Slot eindrucksvoll gezeigt. Rastermittelpunkte können im Zweifelsfall nur zur Gänze auf die eine, oder eben der anderen Flächeneinheit vererbt werden. Auf die südliche Wiener Stadtgrenze umgelegt heißt das, dass beispielsweise über 15.000 Hauptwohnsitze einer 2000m Rasterzelle entweder nach Wien oder nach Niederösterreich zu vererben sind. Die Problematik wird gemildert wenn man eine kleinere Rastergröße nimmt.

Die Verfeinerung der Methodik besteht jedoch auch darin, die Rastermittelpunkte auf repräsentative Schwerpunkte zu legen. Diese lassen sich gut durch die Verteilung der Adressen in der  Rasterzelle ableiten.

Quelle: GeoMagis

Ist selbst diese Methode zu ungenau, so bietet die Statistik Austria Projektgebietsauswertungen an. Es ist möglich, für ein individuelles Polygon Daten aus den Paketen der Statistik Austria „gebäudekoordinatenscharf“ abzufragen, sofern die Datenschutzgrenzen eingehalten werden können. Die zugrundeliegenden Daten sind mit den Stichtagen 1.1. bzw. 31.10 verfügbar.

Die ESRI Tools ermöglichen mit geringem Aufwand weltweit feine Analysen durchzuführen. Der Fall Österreich zeigt aber einmal mehr, dass man (natürlich je nach Projektanforderung) nicht auf Prüfung von Alternativen verzichten sollte!

Im Rahmen des ersten GeoMagis GeoDaten Workshops (26. – 27.9.2018) haben wir uns an Hand eines Beispiels eingehender mit diesen verschiedenen Möglichkeiten befasst und Ergebnisse verglichen. In einer durchschnittlichen NÖ Gemeinde wurden 3 individuell darüber gelegte Polygone ausgewertet. Das Data-Enrichment Ergebnis (ArcGIS Online) zeigte in Summe fast das gleiche Ergebnis wie eine Projektgebietsauswertung der Statistik Austria!

Ein anderer Fall in OÖ zeigt aber auch die Gefahren des Data-Enrichment Services auf: Eine individuelle Fläche im Bereich des Linzer Industriegebietes (nördlich VOEST) wird hinsichtlich Einwohnerpotential um das 62fache überbewertet (Verglichen mit dem Statistik Austria Ergebnis wäre es das 75fache).

Interessanterweise wird dieselbe Fläche (aber als Einzeldatensatz!) mit der aggregationMethod BlockApportionmentAT.StatisticalAreas ausgewertet und das Ergebnis dadurch wieder sehr realistisch.

Für ESRI stellen nämlich administrative Raumeinheiten wie etwa Postal Code oder Municipalities sogenannte „Block Groups“ dar, also Raumeinheiten die weiter auf Basis der Bevölkerungsverteilung in „Blocks“ unterteilt werden. Von welcher BlockGroup jedoch abgeleitet wird, steht im Attributfeld aggregationMethod.

Das umgebende Rechteck (die Bounding Box) ist schlussendlich ausschlaggebend dafür, ob das Service die zu aggregierenden Daten aus Statistical Areas, Postal Codes, Municipalities etc. ableitet!

Näheres wird HIER ausgeführt!

Unser Beispiel hat leider gezeigt, zu welchen Fehleinschätzungen man kommen kann, wenn dieses Hintergrundwissen fehlt!

Data.Enrichment by ESRI ist in vielen Fällen ein guter und rascher Weg Analyseergebnisse zu bekommen. In gewisser Weise bleibt es aber eine Blackbox, denn die zugrundeliegenden Daten sind zum Teil aus wesentlich größeren Raumeinheiten abgeleitet.

Für den User geschieht hier ohne jeden Hinweis versteckt sehr viel: Valide Daten auf Basis administrativer Einheiten werden gemäß ESRI-Technologie auf wesentlich kleinere Einheiten „aufgeteilt“. Wäre das in der Realität tatsächlich immer so einfach, man würde sich wohl oft teure Einzelerhebungen sparen!

Leider muss man zusammenfassend aber feststellen, dass durch diese Services schon das Gefühl für Originär-Daten und deren Granularität ein Stück weit mehr verloren geht.

 

Bei näherem Interesse zu diesem Thema kontaktieren Sie Dipl.-Ing. Walter Heginger von GeoMagis.