Z-Kurve

lineare Ordnung in einem mehrdimensionalen Raum

Die Z-Kurve (Lebesgue-Kurve, englisch Z-order curve) ist eine Abbildung, die Punkte aus dem mehrdimensionalen Raum in eine lineare Ordnung, die Z-Ordnung oder Morton-Ordnung,[1] bringt, eine Ordnung mit nachbarschaftserhaltenden Eigenschaften: Wenn zwei Raumpunkte im Mehrdimensionalen nah beisammen liegen, liegen mit hoher Wahrscheinlichkeit auch ihre Z-Werte nah beisammen. Der Z-Wert eines Raumpunktes wird durch bitweises Verschränken der binären Koordinatenwerte berechnet.[Anm 1]

Iterationen 1, 2, 3 und 4 der Z-Kurve

Mit Hilfe der Z-Ordnung lassen sich (effiziente) Verfahren, die auf einer linearen Ordnung beruhen, ins Mehrdimensionale übertragen. Dazu gehört Binäres Suchen, Binärer Suchbaum, Skip-Liste, B-Baum, oder ein B -Baum.

Für eine effiziente mehrdimensionale Bereichssuche ist ein Algorithmus erforderlich, um, ausgehend von einem in der Datenstruktur außerhalb des Suchbereichs angetroffenen Punkt, den nächstmöglichen Z-Wert im Suchbereich zu bestimmen (BIGMIN/LITMAX)[2]

Die Z-Ordnung ist beliebt aufgrund ihrer guten Nachbarschaftserhaltung und der einfachen Berechenbarkeit der Z-Werte. Bei der Hilbert-Kurve ist die Nachbarschaftserhaltung besser, doch sind die Rechnungen komplizierter.

Anwendungen finden sich bei der Nachbarschaftssuche in Datenbanken, bei diversen technischen Anwendungen, sowie – zur besseren Nutzung der Speicherhierarchie – in der linearen Algebra.

Zahlentheorie

Bearbeiten

 
Z-Kurve (grau) der dritten Iteration
x-Bits blau, y-Bits rot

Die nebenstehende Abbildung zeigt die Z-Werte im zweidimensionalen Fall für ganzzahlige Koordinaten  . Das bitweise Verschränken der  - und  -Werte (auch bitweises Verzahnen oder Binärbruchpressung genannt) ergibt die binären  -Werte. Verbindet man diese in ihrer aufsteigenden numerischen Reihenfolge, dann entsteht eine Kurve (Polygonzug), die Z-Kurve genannt wird.[Anm 2] Die zugrunde liegende Abbildung sei in ihrer  -ten Iteration durch

 

spezifiziert. Sie lässt sich leicht auf höhere Dimensionen erweitern und ist umkehrbar eindeutig (bijektiv).[Anm 3]

In den binären Darstellungen der Z-Werte   für   gibt es 1-Bits höchstens an Binärstellen mit geradem Index. Im System zur Basis 4 bestehen diese Zahlen also nur aus Ziffern 0 und 1.[Anm 4] Diese Zahlen heißen Z-Werte im engeren Sinn oder Moser-de Bruijn-Zahlen. Sie machen die Folge A000695 in OEIS aus.

Fürs Folgende sei diese Folge angegeben als

  ,

wobei der ersten Komponente der Index 0 gegeben wird. Summen und Differenzen zweier  -Komponenten lassen sich bilden durch die bitweisen Operationen

  und
  falls   ,

mit   und mit den Operatoren   für bitweises logisches UND und   für bitweises logisches ODER, jeweils angewendet auf die in Bitketten aufgelösten Operanden.

Eine Formel zum Erzeugen des Folgeelements   aus dem Vorgänger   ist

 .[3]

Anwendungen in der Informatik

Bearbeiten

Nachbarschaftssuche

Bearbeiten

 
Rechteckiger Suchbereich

Durch Bitverschränken werden die Datenbankeinträge in eine (möglicherweise sehr lange) Folge von Bits umgewandelt. Die Bitfolgen werden als Binärzahlen interpretiert, und die Datenbankeinträge werden nach den Binärwerten sortiert oder indiziert, wobei eine beliebige eindimensionale Datenstruktur verwendet wird, wie in der Einleitung erwähnt. Jedoch ist bei der Abfrage eines mehrdimensionalen Suchbereichs in diesen Daten eine binäre Suche nicht wirklich effizient. Trotz der guten Nachbarschaftserhaltung ist für die mehrdimensionale Bereichssuche ein Algorithmus erforderlich, um, ausgehend von einem in der Datenstruktur außerhalb des Suchbereichs angetroffenen Punkt, den nächstmöglichen Z-Wert zu bestimmen, dessen Koordinaten im Suchbereich liegen.

Im Beispiel der nebenstehenden Abbildung ist der Suchbereich (x=2..3, y=2..6), ein 2D-Intervall, als gestricheltes Rechteck angezeigt. Der höchste Z-Wert darin ist MAX=45. Angenommen, im Laufe der Suche wird der Wert F=19 angetroffen, bei Suche nach steigenden Werten. Das 1D-Intervall zwischen F und MAX (schraffiertes Gebiet) ist Obermenge des noch zu durchsuchenden Teils des Rechtecks. Um die Suche zu beschleunigen, wird der nächstmögliche Z-Wert im Suchbereich berechnet, im Folgenden BIGMIN genannt (36 im Beispiel). Dann muss nur das Intervall zwischen BIGMIN und MAX durchsucht werden (fett gezeichnete Werte), dadurch wird der Großteil des schraffierten Gebiets übersprungen. Die Suche nach fallenden Werten ist analog dazu, mit LITMAX, dem größten Z-Wert im Suchbereich, der kleiner ist als F. Das Problem und seine Lösung wurde zuerst im Jahr 1981 von Tropf und Herzog beschrieben[2]. Zur Entwicklungsgeschichte nach der Veröffentlichung siehe [4]

Die Methode wurde später auch in UB-Bäumen verwendet.

Indem man die Methode hierarchisch (entsprechend der verwendeten Datenstruktur) einsetzt, ggf. nach sowohl steigenden als auch fallenden Z-Werten, erhält man eine hocheffiziente mehrdimensionale Bereichssuche; dies ist nützlich sowohl in kommerziellen als auch technischen Anwendungen, z. B. als Grundfunktion für (Nächste-)Nachbarschaftssuchen.

Eine ausführliche Erläuterung des LITMAX/BIGMIN-Berechnungsalgorithmus, zusammen mit Pascal-Quellcode (3D, leicht an nD anzupassen) und Hinweisen zum Umgang mit Fließkommadaten und möglicherweise negativen Daten, wird bereitgestellt 2021 von Tropf.[5] Hier wird die Bitverschränkung nicht explizit durchgeführt; die Datenstruktur hat nur Zeiger auf die ursprünglichen (unsortierten) Datensätze. Mit einer allgemeinen Datensatz-Vergleichsfunktion (größer-kleiner-gleich, im Sinne des Z-Wertes) werden Komplikationen mit Bitfolgen vermieden, deren Länge die Computerwortlänge übersteigt, und der Code kann leicht an eine beliebige Anzahl von Dimensionen und jede Datensatz-Schlüsselwortlänge angepasst werden.

Die Methode wird verwendet in diversen technischen Anwendungen unterschiedlicher Bereiche[6] und in Datenbanksystemen[7] und ist eine der wenigen mehrdimensionalen Zugriffsmethoden, die Eingang in kommerzielle Datenbanken gefunden haben.[8]

Der Ansatz hängt nicht von der gewählten eindimensionalen Datenstruktur ab. Die freie Wahl der Struktur macht es einfacher, die Methode in bestehende Datenbanken zu integrieren. Dies steht im Gegensatz beispielsweise zu R-Bäumen, bei denen besondere Vorkehrungen erforderlich sind. So können z. B. für dynamische Daten fallbewährte, balancierte Strukturen verwendet werden, bei denen die Beibehaltung des Baumgleichgewichts beim Einfügen oder Löschen O(log n) Zeit benötigt.

Nutzung der Speicherhierarchie

Bearbeiten

Moderne Mikroprozessoren bieten eine umfangreiche Speicherhierarchie. Auf hoher Ebene sind die Speicher schnell und ausschließlich einem einzelnen Kern zugewiesen, aber klein. Wenn der Datenzugriff eine hohe Lokalität aufweist, können übermäßige Datenübertragungen zwischen den verschiedenen Ebenen der Speicherhierarchie vermieden werden.[9]

So können Matrizen in der linearen Algebra auch anhand von einer raumfüllenden Kurve durchwandert werden. Herkömmliche Schleifen durchwandern eine Matrix zeilenweise. Das Durchwandern mit der Z-Kurve ermöglicht einen effizienten Zugriff auf den Speicher[10].

Analysis

Bearbeiten

Binärbruchverschränkung

Bearbeiten
Bemerkung zur Notation
Um Undeutlichkeiten oder Verwechslungen mit dem Komma der Notationen für Intervalle oder Koordinatenpaare zu vermeiden, wird im Folgenden als Trennzeichen zu den Stellen mit negativen Exponenten der Punkt verwendet. Wir folgen diesbezüglich M. Bader wie auch in der Platzierung der Basis als Präfix bei diesem Punkt.
Ferner verwenden wir zur Kennzeichnung offener reeller Intervalle die umgekehrten eckigen Klammern   da die runden zur Kennzeichnung der  -Paare benötigt werden.

Die durch unendliche Iteration der obigen Vorschrift   „definierte“ und auf das Einheitsintervall normalisierte Abbildung

 

mit Ziffern   ist zunächst nicht wohldefiniert, weil es zu einem gekürzten Bruch mit Zweierpotenz im Nenner, also zu einem Element

 

mit abbrechender Binärdarstellung, zwei Möglichkeiten der Darstellung gibt.

Beispielsweise hat der Bruch   die Darstellung mit einem 02-Ende

 

und die mit einem 12-Ende

  .

Diese Wahlmöglichkeit (Gleichheit) ist bei endlichem   nicht gegeben, im Limes   aber sehr wohl, wo sie die für die Funktion   erforderliche Rechtseindeutigkeit verletzt, da sie sich auf das Ergebnis der Verschränkung auswirkt. Die Rechtseindeutigkeit lässt sich aber, beispielsweise durch eine der folgenden Vorschriften, herstellen:

Vorschrift ↓:  Die Binärdarstellung eines Bruchs   hat immer ein 02-Ende. Das entspricht der üblichen abbrechenden Darstellung und einer Annäherung an   von oben her.
Diese Variante von   sei mit   bezeichnet.
Vorschrift ↑:  Die Binärdarstellung von 0 ist immer 02. Der Binärdarstellung eines (abbrechenden) Bruchs   wird immer mit einem 12-Ende ausgestattet. (Ist bspw.   die Zahl der Binärstellen rechts vom Binärpunkt, dann ist die zum Index   gehörige Binärziffer   und die Binärdarstellung   zu nehmen.) Das entspricht einer Annäherung an   von unten her, also einer linksseitigen Grenzwertbildung bei jeder Funktion, bei der es auf die Binärdarstellung ankommt, beispielsweise einem Limes  .[Anm 5]
Diese Variante von   sei mit   bezeichnet.

Durch jede der beiden Vorschriften wird   wohldefiniert und ist auch injektiv.

  ist aber nicht surjektiv. Denn bei beiden Vorschriften gibt es bspw. zu Brüchen wie   kein Urbild, da hierfür die  -Koordinate zwingend ein 02-Ende und die  -Koordinate zwingend ein 12-Ende haben müsste (resp. umgekehrt bei  .) Das Bild des Einheitsquadrates ist jeweils

  bei Vorschrift ↓ resp.
  bei Vorschrift ↑.

Ihm fehlt in beiden Fällen zum Einheitsintervall eine abzählbare dichte Teilmenge. Somit ist es nicht kompakt. (Gleichwohl ist die abgeschlossene Hülle beider Bilder das abgeschlossene Intervall  .)

Weder   noch   ist stetig, da an den Punkten   eine infinitesimale Änderung des Arguments eine endliche Änderung des Funktionswerts bewirkt. Das kann man schon in der obigen Abbildung „dritte Iteration“ erkennen, beispielsweise am Einserschritt der  -Koordinate von   zu   oder am Einserschritt der  -Koordinate von Punkt   zu Punkt  , wo die Positionsnummer in der Z-Kurve um mehr als ein Drittel (32−10=22 > 64/3) resp. um mehr als ein Sechstel (16−5=11 > 64/6) ihrer Gesamtlänge (64) zunimmt.

Genaue Überlegung

Enthält die Binärdarstellung einer Zahl   keine 1, dann handelt es sich um die 0, und es gibt keine Wahlmöglichkeit, diese mit einem 12-Ende so darzustellen, dass derselbe Zahlenwert 0 herauskommt.

Für die Untersuchung der Stetigkeit an einem Punkt   kann man die koordinatenweisen Differenzen der einseitigen Grenzwerte heranziehen. Denn genau dann, wenn beide Differenzen 0 sind, ist die Funktion am Punkt   stetig. Ist weder   noch   ein abbrechender Binärbruch, dann stimmen die einseitigen Grenzwerte von   überein[Anm 5] und   ist stetig bei  . Ist aber beispielsweise   ein abbrechender Binärbruch  , dann entspricht der linksseitige Grenzwert einem 12-Ende von  , während der rechtsseitige Grenzwert einem 02-Ende von   entspricht.[Anm 6]

Zunächst werde eine Binärbruchverschränkung   für   untersucht mit nicht abbrechendem   und abbrechendem   mit   und  .

  mit 02-Ende                
  mit 12-Ende                
Überträge                                
Differenz                

Die erste Zeile enthält die verschränkten Binärziffern von  , wenn   mit 02-Ende dargestellt wird, die zweite für dasselbe   dargestellt mit 12-Ende, die dritte enthält die Überträge der binären Subtraktion und die vierte Zeile enthält die Sprunghöhe, d. i. die Differenz »abbrechendes  « der ersten beiden Zeilen im Limes, also

 

Für   mit abbrechendem   bei   und   und mit nicht abbrechendem   ist analog

  mit 02-Ende            
  mit 12-Ende            
Überträge                        
Differenz            

Die Differenz »abbrechendes  « ist im Limes

 

Ist  , dann addieren sich die Sprunghöhen.

Raumfüllend

Bearbeiten
 
Zur Berechnung der (x,y)-Koordinaten der Z-Kurve aus den verschränkten Bits eines z-Werts, im Beispiel 2479

Die „Umkehrfunktion“

 

mit   ist – wie das obige   aus demselben Grund der fehlenden Rechtseindeutigkeit infolge mehrdeutiger binärer Darstellbarkeit – zunächst nicht wohldefiniert. Wie dort lässt sich die Rechtseindeutigkeit durch die Vorschrift herstellen, dass ein Bruch   entweder immer nur mit 02-Ende (Vorschrift ↓) oder immer nur mit 12-Ende (Vorschrift ↑) zu expandieren ist. Je nachdem sei die Variante von   mit   oder mit   bezeichnet. Durch jede der beiden Vorschriften wird   wohldefiniert. Sie bildet das Einheitsintervall   surjektiv („raumfüllend“) auf das Einheitsquadrat   ab.

  ist aber nicht injektiv, denn die Punkte aus   haben mehrere Urbilder. Beispielsweise hat der Punkt   sowohl

  wegen   als auch
  wegen  

zum  -Urbild. Die Umkehrung davon entspricht mit   genau den zwei einseitigen Grenzwerten

  und
  .

Etwas anders liegt der Fall bei den im vorigen Abschnitt Binärbruchverschränkung erwähnten Punkten   und  , die weder Bildpunkte von   noch von   sind. Unter   ist

  und
  ,

wogegen die einseitigen Grenzwerte von   am Punkt  

  und
 

sind.

  ist nicht stetig[11] an einem Punkt  , weil linksseitiger Grenzwert (  am 12-Ende) und rechtsseitiger (  am 02-Ende) sich im Ergebnis unterscheiden[Anm 6] (siehe Tabelle mit Beispielen).

Die Summe aller „Sprungweiten“ der Unstetigkeitsstellen (siehe Tabelle) wächst exponentiell mit der Zahl der Iterationen, da pro Iteration (siehe Abbildung „Vier Iterationen“) die Weite der Sprünge zwar mit dem Faktor 2 abnimmt, die Anzahl der Sprünge jedoch mit dem Faktor 4 zunimmt.

Tabelle mit Beispielen

Erläuterung zu den Spalten der Tabelle

  1. Der Exponent   in der ersten Spalte korreliert mit der Iterationsnummer   in der Abbildung „Vier Iterationen“, nämlich   mit Iteration 1 und   mit Iteration 2.
  2. Zu einem (binär abbrechenden) z-Wert   gibt es eine Unstetigkeitsstelle der  - oder  -Koordinate. Die Spalte enthält den kleinsten zu   gehörigen z-Wert; andere z-Werte, die ungerade Vielfache davon sind, sind ebenfalls Unstetigkeitsstellen; sie werden in der Spalte Anzahl gezählt. Für die Zwecke der nächsten Spalte   sind die x-Bits blau und die y-Bits rot eingefärbt.
  3.   ist gleichzeitig der rechtsseitige Grenzwert  .
  4. Die nächste Spalte zeigt denselben z-Wert, aber mit dem 12-Ende. Auch hier sind die x-Bits blau und die y-Bits rot eingefärbt.
  5. Entsprechend dieser Einfärbung sind die Bits in der Spalte  -Ende  in  - und  -Koordinate aufgeteilt.
  6.   bringt den linksseitigen Grenzwert (eine seiner Koordinaten ist  , die andere größer).
  7. Richtung gibt an, welche Koordinate sich ändert. Beispielsweise bedeutet ↑, dass sich die  -Koordinate an dieser Stelle bei infinitesimal wachsendem   ändert, und zwar fallend und in den Abbildungen „Vier Iterationen“ und „dritte Iteration“ nach oben.
  8. Weite enthält die euklidische Distanz der beiden Grenzwerte.
  9. Anzahl enthält die Anzahl von Unstetigkeitsstellen (im Einheitsquadrat) mit dieser Richtung und Weite.
  10. Der Beitrag zur Gesamtsumme der Sprungweiten ist das Produkt von Weite mal Anzahl.
 
 
 
(02-Ende)
    mit
12-Ende
 -Ende    Rich-
tung
Wei-
te
An-
zahl
Bei-
trag
           
1                   1   1
2                   2 1
3                   4 2
                       
4                   8 2
                       
Tab. 1: Die Sprungweiten von   in Abhängigkeit vom Exponenten  

Weitere Werte:

 

Weitere Limites gegenübergestellt für  

 

 
Z-Kurve der dritten Iteration.
Bei drei beispielhaften Sprüngen   sind stetig machende Verbindungsstrecken als Pfeile hinzugefügt, die im Limes achsenparallel die entsprechende waagrechte  -Ordinate (bei ungeradem  ) oder die senkrechte  -Abszisse (bei geradem  ) überqueren.

Wegen der Unstetigkeit von   ist die Bildmenge von   keine Kurve. Da sie aber in der Ebene liegt, also zweidimensional ist, und   bei wachsendem Argument   an einer Unstetigkeitsstelle immer nur in der  - oder der  -Koordinate springt, lassen sich die beiden Ränder (linksseitiger und rechtsseitiger Grenzwert) der Unstetigkeitsstelle durch eine Parallele zur Achse der springenden Koordinate verbinden, wie es die Abbildung „Vier Iterationen“ nahelegt (und wie es in der Abbildung „dritte Iteration (Beispiel)“ andeutungsweise ausgeführt ist). Dadurch entsteht eine stetige Abbildung  , deren Bild Z-Kurve genannt wird. Die Stetigkeit impliziert, dass linksseitige und rechtsseitige Grenzwerte gleich sind; mit der Folge, dass Rechtseindeutigkeit auch ohne Entscheidung für Vorschrift ↓ oder Vorschrift ↑ besteht.   ist stetig und surjektiv, aber nicht injektiv.[Anm 7] Da die endlichen Iterationen gleichwohl injektiv und damit selbst-ausweichend sind, gehört die Z-Kurve zu den FASS-Kurven, die ihrerseits eine echte Teilmenge der raumfüllenden Kurven sind.[Anm 8]

Siehe auch

Bearbeiten
Bearbeiten

Anmerkungen

Bearbeiten
  1. Streng genommen ist nicht diese Abbildung, sondern allenfalls ihre Umkehrung eine raumfüllende Kurve.
  2. In der Literatur ist es Konvention, ganz rechts beim Index 0 mit einer  -Stelle (Bit) zu beginnen und nach links alternierend mit einer  -Stelle fortzusetzen. Dadurch entsteht die charakteristische Z-Form, wenn (wie in den Abbildungen) die  -Abszisse nach rechts und die  -Ordinate nach unten wächst.
  3. Die Injektivität geht bei   (genauer: im  ) verloren. Die ebenfalls auftretenden Probleme mit der Rechtseindeutigkeit haben dieselbe Ursache (s. u.).
  4. Die Punkte der Cantor-Menge enthalten in ihrer klassischen Darstellung zur Basis 3 nur Ziffern 0 und 2.
  5. a b Für   ist
     
    sowie
      .
  6. a b Diese Begründung für Unstetigkeit gilt völlig unabhängig von der Entscheidung ob Vorschrift ↓ oder Vorschrift ↑.
  7. Stetig und bijektiv ist nur möglich bei gleicher Dimension (Satz von der Invarianz der Dimension).
  8. Es gibt raumfüllende Kurven, die auch im Limes von vornherein stetig sind, wie die Hilbert-Kurve und die Peano-Kurve. Insofern deutet die hier nachgebesserte Stetigkeit der Z-Kurve ein verbesserungsfähiges Nachbarschaftsverhalten an.

Einzelnachweise

Bearbeiten
  1. G. M. Morton: A computer Oriented Geodetic Data Base; and a New Technique in File Sequencing. In: Technical Report. IBM, Ottawa, Canada 1966 (englisch).
  2. a b H. Tropf, H. Herzog: Multidimensional Range Search in Dynamically Balanced Trees. (PDF; 1,4 MB) In: Angewandte Informatik, 2/1981, S. 71–77.
  3. Jeyarajan Thiyagalingam, Olav Beckmann, Paul H. J. Kelly: Is Morton layout competitive for large two-dimensional arrays yet? In: Concurrency and Computation: Practice and Experience. 18. Jahrgang, Nr. 11, September 2006, S. 1509–1539, doi:10.1002/cpe.v18:11 (englisch, doc.ic.ac.uk (Memento des Originals vom 29. März 2017 im Internet Archive) [abgerufen am 13. November 2017]).
  4. https://hermanntropf.de/media/DB-Artikel_Geschichte_und_Anwendungen.pdf
  5. LITMAX/BIGMIN computation - Pascal source code
  6. Annotierte Liste von Artikeln über technische Anwendungen der Z-Kurve zur mehrdim. Bereichssuche
  7. Annotierte Liste von Artikeln über Datenbanken mit der Z-Kurve zur mehrdim. Bereichssuche
  8. Volker Gaede, Oliver Guenther: Multidimensional access methods. In: ACM Computing Surveys. 30. Jahrgang, Nr. 2, 1998, S. 170–231, doi:10.1145/280277.280279 (englisch, static.cc.gatech.edu (Memento des Originals vom 26. Februar 2007 im Internet Archive) [abgerufen am 14. November 2017]).
  9. Martin Perdacher: Space-filling curves for improved cache-locality in shared memory environments. Dissertation, Universität Wien 2020
  10. Martin Perdacher, Claudia Plant, Christian Böhm: Improved Data Locality Using Morton-order Curve on the Example of LU Decomposition. IEEE BigData 2020: 351-360
  11. Michael Bader: Space-Filling Curves. An Introduction with Applications in Scientific Computing (= Timothy J. Barth, Michael Griebel, David E. Keyes, Risto M. Nieminen, Dirk Roose, Tamar Schlick [Hrsg.]: Texts in Computational Science and Engineering. Band 9). 1. Auflage. Springer-Verlag, 2013, ISBN 978-3-642-31045-4, ISSN 1611-0994, doi:10.1007/978-3-642-31046-1 (englisch, 278 S.). S. 96.