Räumliches Clustering

Das Werkzeug Räumliches Clustering erstellt geclusterte Zonen durch Gruppierung nahegelegener Features in eine angegebene Anzahl räumlicher Cluster.

1. Erklärung

Das Werkzeug Räumliches Clustering gruppiert eine Menge räumlicher Features in eine angegebene Anzahl räumlicher Zonen. Es bietet zwei Clustering-Methoden:

K-Means — Eine schnelle, geometriebasierte Methode, die Features nach Nähe zu Clusterzentren gruppiert. Diese Methode zielt nicht darauf ab, gleich große Zonen bereitzustellen.
Ausgeglichene Zonen — Ein genetischer Algorithmus, der Zonen mit annähernd gleicher Größe erstellt, entweder nach Anzahl der Features oder nach einem numerischen Feldwert. Diese Methode unterstützt auch Kompaktheitseinschränkungen, um die räumliche Ausdehnung jeder Zone zu begrenzen.

info

Das Werkzeug für räumliches Clustering ist derzeit auf Punkt-Features beschränkt. Es unterstützt maximal 2.000 Punkte. Für größere Datensätze sollten Sie Ihre Daten vor der Ausführung des Werkzeugs filtern oder eine Stichprobe nehmen.

info

Die Methode Ausgeglichene Zonen verwendet einen genetischen Algorithmus, der nicht deterministisch ist. Verschiedene Läufe können leicht unterschiedliche Zonenkonfigurationen erzeugen.
Die Ausführungszeit für Ausgeglichene Zonen kann je nach Anzahl der Punkte und gewünschten Cluster erheblich variieren. Sie ist im Allgemeinen langsamer als K-Means und kann je nach Datensatzkomplexität zwischen 1 Minute und 3 Minuten dauern.

2. Anwendungsfälle

Aufteilung von Verkaufsgebieten in ausgeglichene Zonen basierend auf Kundenstandorten und Umsatz.
Gruppierung von Bevölkerungsstandorten in Gebiete mit gleicher Bevölkerungsgröße.
Gruppierung potenzieller Carsharing-Stationen in Servicebereiche.

3. Vorgehensweise

Klicken Sie auf Werkzeuge Optionen

Klicken Sie im Menü Geoanalyse auf Räumliches Clustering.

Eingabe

Wählen Sie Ihren Eingabe-Layer aus dem Dropdown-Menü. Dies muss ein Punkt-Layer sein, der die zu clusternden Features enthält.

Legen Sie die Anzahl der Cluster fest – die Anzahl der zu erstellenden Zonen (Standard: 10).

Konfiguration

Wählen Sie den Cluster-Typ.

K-Means
Ausgeglichene Zonen

K-Means gruppiert Features nach Nähe zu Clusterzentren. Es ist schnell und eignet sich, wenn Sie eine schnelle räumliche Gruppierung ohne strenge Größenbalance benötigen.

Für K-Means ist keine zusätzliche Konfiguration erforderlich.

Wenn Sie Ausgeglichene Zonen verwenden, wählen Sie die Größenmethode: Anzahl für gleiche Feature-Anzahlen pro Zone oder Feldwert, um nach einem numerischen Attribut auszugleichen.

Wenn Sie Feldwert verwenden, wählen Sie das Größenfeld – ein numerisches Feld aus Ihrem Eingabe-Layer, das als Ausgleichsgewichtung verwendet wird.

Aktivieren Sie optional Zonengebiet begrenzen, um eine Kompaktheitseinschränkung hinzuzufügen. Wenn aktiviert, konfigurieren Sie die Max. Distanz, um die maximale Entfernung zwischen zwei Features im selben Cluster zu begrenzen.

Klicken Sie auf Ausführen, um die Berechnung zu starten.

Ergebnisse

Sobald die Berechnung abgeschlossen ist, werden zwei Ergebnis-Layer zur Karte hinzugefügt:

Features-Layer — Die ursprünglichen Eingabe-Features, denen jeweils eine cluster_id zugewiesen wurde.
Zusammenfassungs-Layer — Ein Multigeometrie-Feature pro Zone mit Zonenstatistiken (Größe, maximale Distanz zwischen Features).

Tipp

Möchten Sie visuell ansprechende Karten erstellen, die eine klare Geschichte erzählen? Erfahren Sie, wie Sie Farben, Legenden und Stile in unserem Abschnitt Styling anpassen können.

4. Technische Details

K-Means Clustering

Der K-Means-Algorithmus arbeitet iterativ:

Initialisierung — k anfängliche Zentroide werden unter Verwendung einer Furthest-Point-Strategie für eine bessere Verteilung ausgewählt.
Zuordnung — Jedes Feature wird basierend auf der euklidischen Distanz (in projizierten Koordinaten) dem nächstgelegenen Zentroid zugeordnet.
Aktualisierung — Zentroide werden als mittlere Position aller zugeordneten Features neu berechnet.
Wiederholung bis die Zentroide konvergieren oder die maximale Anzahl an Iterationen erreicht ist.

Ausgeglichene Zonen

Die Methode Ausgeglichene Zonen verwendet einen genetischen Algorithmus, um optimale räumliche Gruppierungen zu finden:

Eine anfängliche Population von Lösungen wird erstellt, wobei K-Means als Startpunkt verwendet wird, plus zufällige Variationen.
Für jede Lösung wird ein Startpunkt (Seed) für jeden Cluster extrahiert und Zonen wachsen gelassen durch räumliche Nachbarn, um alle Features den Clustern zuzuweisen. Durch das Wachstum nicht zugewiesene Features werden dem kleinsten umliegenden Cluster zugewiesen. Die Rand-Features großer Cluster können dann kleineren Zonen neu zugewiesen werden.
Jede Lösung wird anhand eines Fitness-Scores bewertet.
Die besten Lösungen werden über mehrere Generationen hinweg kombiniert und mutiert, um das Ergebnis schrittweise zu verbessern.
Der Algorithmus stoppt, wenn keine weitere Verbesserung gefunden wird oder die maximale Anzahl an Generationen erreicht ist.

Der Algorithmus verwendet räumliche Nachbarschaftsgraphen, um zusammenhängendes Zonenwachstum sicherzustellen — Features werden Zonen durch ihre räumlichen Nachbarn zugewiesen, was kompakte und verbundene Cluster fördert.

Fitness-Funktion:

Jede Lösungskandidat wird bewertet basierend auf:

Größenvarianz — Wie gleichmäßig die Zonen dimensioniert sind (primäres Ziel).
Kompaktheitsstrafe (optional) — Bestraft Zonen, bei denen der maximale Distanzschwellenwert überschritten wird.

Alle Einschränkungen (gleiche Größe, Kompaktheit) sind weiche Einschränkungen — der Algorithmus optimiert darauf hin, erzwingt sie jedoch nicht als harte Grenzen.

Algorithmus-Parameter:

Parameter	Wert	Beschreibung
Populationsgröße	40–50	Anzahl der Lösungskandidaten pro Generation
Generationen	40–50	Maximale Anzahl an Evolutionszyklen
Mutationsrate	0,1	Wahrscheinlichkeit der Änderung des Cluster-Startpunkts
Crossover-Rate	0,7	Wahrscheinlichkeit der Kombination von Elternlösungen
Elitismus	Top 10%	Die besten Lösungen bleiben über Generationen erhalten

Adaptive Parameter: Für größere Datensätze (>500 Features) werden die Populationsgröße und die Anzahl der Generationen automatisch reduziert, um angemessene Rechenzeiten beizubehalten.

Räumliches Clustering

1. Erklärung​

2. Anwendungsfälle​

3. Vorgehensweise​

Eingabe​

Konfiguration​

Ergebnisse​

4. Technische Details​

K-Means Clustering​

Ausgeglichene Zonen​

Fitness-Funktion:​

Algorithmus-Parameter:​