reading

Inhaltsverzeichnis

Cover

Über die Autoren

John Muellers Widmung
Luca Massarons Widmung
John Muellers Danksagung
Luca Massarons Danksagung

Einführung

Über dieses Buch
Konventionen in diesem Buch
Törichte Annahmen über den Leser
Symbole, die in diesem Buch verwendet werden
Wie es weitergeht

Teil I: Erste Schritte

Kapitel 1: Grundlegendes über Algorithmen
1. Algorithmen beschreiben
  1. Definitionen zur Anwendung von Algorithmen
  2. Algorithmen sind überall
2. Mit Computern Aufgaben lösen
  1. Moderne CPUs und GPUs wirksam einsetzen
  2. Arbeiten mit Spezialchips
  3. Netzwerke wirksam einsetzen
  4. Daten effektiv nutzen
3. Zwischen Aufgaben und Lösungen unterscheiden
  1. Richtigkeit und Effizienz
  2. Die Erkenntnis, dass nichts umsonst ist
  3. Die Strategie an die Aufgabe anpassen
  4. Algorithmen in einer Lingua franca beschreiben
  5. Schwierige Aufgaben angehen
4. Daten für Lösungen strukturieren
  1. Die Sichtweise eines Computers
  2. Datenordnung muss sein
Kapitel 2: Algorithmendesign
1. Der Anfang der Problemlösung
  1. Praxisaufgaben modellieren
  2. Lösungen und Gegenbeispiele finden
  3. Auf den Schultern von Riesen stehen
2. Teile und herrsche
  1. Brute-Force-Lösungen vermeiden
  2. Erster Schritt: Vereinfachen
  3. Reduktion ist meist vorteilhaft
3. Erkennen, dass Gier gut sein kann
  1. Gierig denken
  2. Eine gute Lösung
4. Kostenberechnungen und Heuristiken
  1. Das Problem in einem Raum darstellen
  2. Zufällig und von Glück gesegnet
  3. Heuristiken und Kostenfunktionen verwenden
5. Algorithmen auswerten
  1. Simulationen mittels abstrakter Maschinen
  2. Weitere Abstrahierungen
  3. Mit Funktionen arbeiten
Kapitel 3: Mit Python Algorithmen verwenden
1. Die Vorteile von Python
  1. Wie Python in diesem Buch verwendet wird
  2. Mit MATLAB arbeiten
  3. Andere Testumgebungen für Algorithmen
2. Python-Distributionen
  1. Analytics Anaconda installieren
  2. Enthought Canopy Express
  3. Python(x,y)
  4. WinPython
3. Python auf Linux installieren
4. Python auf MacOS installieren
5. Python auf Windows installieren
6. Datensätze und Beispielcode herunterladen
  1. Jupyter Notebook benutzen
  2. Das Coderepository definieren
  3. Ein neues Notebook erstellen
  4. Ein Notebook exportieren
  5. Ein Notebook entfernen
  6. Ein Notebook importieren
  7. Die Datensätze in diesem Buch verstehen
Kapitel 4: Algorithmen mit Python programmieren: Grundlagen
1. Mit Zahlen und Logik arbeiten
  1. Variablenzuordnungen vornehmen
  2. Berechnungen durchführen
  3. Datenvergleich durch boolesche Ausdrücke
2. Strings erstellen und verwenden
3. Mit Datumsangaben arbeiten
4. Funktionen erstellen und verwenden
  1. Mehrfach aufrufbare Funktionen erstellen
  2. Funktionen aufrufen
5. Bedingte Anweisungen und Schleifen verwenden
  1. Entscheidungen mittels if-Befehl treffen
  2. Mittels verschachtelter Entscheidungen zwischen mehreren Möglichkeiten auswählen
  3. Iterative Aufgaben mittels for-Schleife ausführen
  4. Der while-Befehl
6. Daten in Mengen, Katalogen und Tupeln speichern
  1. Datasets erstellen
  2. Listen erstellen
  3. Tupel erstellen und verwenden
7. Nützliche Iteratoren definieren
8. Daten mittels Dictionaries indizieren
Kapitel 5: Grundlagen der Datenbearbeitung mit Python
1. Berechnungen mit Vektoren und Matrizen
  1. Variablen- und Vektoroperationen verstehen
  2. Vektoren multiplizieren
  3. Der erste Schritt: Matrizen erstellen
  4. Matrizen multiplizieren
  5. Erweiterte Matrizenoperationen definieren
2. Der richtige Weg: Kombinationen erzeugen
  1. Permutationen unterscheiden
  2. Kombinationen erzeugen
  3. Wiederholungen behandeln
3. Ergebnisse mit Rekursion erzielen
  1. Die Funktionsweise der Rekursion
  2. Endrekursionen entfernen
4. Prozesse schneller ausführen
  1. Der »teile und herrsche«-Ansatz
  2. Zwischen möglichen Lösungen unterscheiden

Teil II: Die Notwendigkeit des Suchens und Sortierens

Kapitel 6: Daten strukturieren
1. Die Notwendigkeit einer Struktur
  1. Inhalt vereinfacht darstellen
  2. Daten aus verschiedenen Quellen anpassen
  3. Die Wichtigkeit der Datenbereinigung
2. Daten gestapelt und kumuliert anordnen
  1. Stapelweise Anordnungen
  2. Warteschlangen verwenden
  3. Daten mittels assoziativen Datenfeldern finden
3. Mit Bäumen arbeiten
  1. Grundlegendes über Bäume
  2. Bäume erstellen
4. Relationen in Graphen darstellen
  1. Über Bäume hinauswachsen
  2. Graphen erstellen
Kapitel 7: Daten ordnen und durchsuchen
1. Daten mit Mergesort und Quicksort sortieren
  1. Die Notwendigkeit des Sortierens
  2. Daten naiv anordnen
  3. Bessere Sortiertechniken einsetzen
2. Suchbäume und Heaps verwenden
  1. Die Notwendigkeit einer effizienten Suche
  2. Binäre Suchbäume erstellen
  3. Spezialisierte Suchen mit einem binären Heap
3. Hashing verwenden
  1. Alles in Buckets füllen
  2. Kollisionen vermeiden
  3. Hashfunktionen selbst erstellen

Teil III: Die Welt der Graphen

Kapitel 8: Die Grundlagen von Graphen
1. Die Wichtigkeit von Netzwerken
  1. Grundlegendes über Graphen
  2. Graphen sind überall
  3. Die soziale Seite eines Graphen
  4. Teilgraphen verstehen
2. Definitionen für das Zeichnen von Graphen
  1. Die wichtigsten Eigenschaften von Graphen
  2. Graphen zeichnen
3. Die Funktionalität eines Graphen
  1. Kanten und Knoten zählen
  2. Zentralität berechnen
4. Graphen in ein numerisches Format bringen
  1. Graphen zu einer Matrix hinzufügen
  2. Dünn besetzte Matrizen verwenden
  3. Graphen durch Listen ausdrücken
Kapitel 9: Punkte verbinden
1. Graphen effizient durchsuchen
  1. Einen Graphen erstellen
  2. Breitensuche anwenden
  3. Tiefensuche anwenden
  4. Die Entscheidung für eine Methode
2. Die Elemente eines Graphen sortieren
  1. Mit gerichteten azyklischen Graphen arbeiten
  2. Topologische Sortierungen verwenden
3. Die Reduktion auf einen minimalen Spannbaum
  1. Geeignete Algorithmen verwenden
  2. Vorrangwarteschlangen kennenlernen
  3. Den Algorithmus von Prim einsetzen
  4. Den Algorithmus von Kruskal testen
  5. Entscheiden, welcher Algorithmus am besten passt
4. Den kürzesten Weg finden
  1. Definieren, was der kürzeste Weg ist
  2. Der Dijkstra-Algorithmus: eine Erklärung
Kapitel 10: Die Geheimnisse der Graphen
1. Soziale Netzwerke als Graphen betrachten
  1. Netzwerke in Gruppen clustern
  2. Communitys entdecken
2. Einen Graphen durchlaufen
  1. Grade der Trennung abzählen
  2. Graphen zufällig durchlaufen
Kapitel 11: Die richtige Webseite finden
1. Die Welt in einer Suchmaschine
  1. Datensuche im Internet
  2. Die richtigen Daten finden
2. Die Funktionsweise des PageRank-Algorithmus
  1. Die Logik hinter dem PageRank-Algorithmus
  2. Das A und O von PageRank
3. PageRank implementieren
  1. Pythonskripte implementieren
  2. Der Kampf mit naiven Implementierungen
  3. Langeweile und Teleportation
  4. Das Leben einer Suchmaschine
  5. Andere Verwendungsmöglichkeiten von PageRank
4. Über das PageRank-Paradigma hinaus
  1. Semantisches Suchen
  2. Ranking von Suchergebnissen mit künstlicher Intelligenz

Teil IV: Der Kampf mit Big Data

Kapitel 12: Big Data verwalten
1. Die Umwandlung von Strom in Daten
  1. Die Auswirkungen von Moore
  2. Daten sind überall
  3. Algorithmen ins Geschäft bringen
2. Datenflüsse streamen
  1. Streams korrekt analysieren
  2. Die richtigen Daten auswählen
3. Lösungen aus Stream-Daten skizzieren
  1. Datenstromelemente filtern
  2. Bloomfilter darstellen
  3. Die Anzahl der Elemente bestimmen
  4. Elemente eines Streams abzählen
Kapitel 13: Abläufe parallelisieren
1. Die Handhabung großer Datenmengen
  1. Die parallele Methode
  2. Dateien und Vorgänge verteilen
  3. Lösungen mit MapReduce
  4. Operationen verteilen
2. Algorithmen für MapReduce erstellen
  1. MapReduce-Simulationen erstellen
  2. Anfragen durch Mapping
Kapitel 14: Daten komprimieren
1. Daten reduzieren
  1. Codierungen verstehen
  2. Die Folgen der Kompression
  3. Die Entscheidung für eine Kompressionsart
  4. Die Wahl einer vernünftigen Codierung
  5. Codieren mit der Huffman-Kompression
  6. Folgen merken mit dem LZW-Algorithmus

Teil V: Komplexe Aufgaben angehen

Kapitel 15: Mit gierigen Algorithmen arbeiten
1. Die Entscheidung, wann Gier Sinn macht
  1. Die Vorteile der Gier
  2. Gierige Algorithmen im Zaum halten
  3. NP-vollständige Probleme
2. Herausfinden, wieso Gier nützlich ist
  1. Daten im Cache anordnen
  2. Der Kampf um Ressourcen
  3. Noch mal zu Huffman-Codierungen
Kapitel 16: Dynamische Programmierung
1. Dynamische Programmierung – was ist das?
  1. Die historische Grundlage
  2. Probleme dynamisieren
  3. Rekursion dynamisch auslegen
  4. Memoisation verwenden
2. Die besten dynamischen Techniken
  1. Den Rucksack packen
  2. Städte bereisen
  3. Näherungsweise nach Strings suchen
Kapitel 17: Randomisierte Algorithmen
1. Die Funktionsweise der Randomisierung
  1. Die Notwendigkeit der Randomisierung
  2. Das Wahrscheinlichkeitsprinzip verstehen
  3. Verteilungen verstehen
  4. Die Monte-Carlo-Simulation
2. Den Zufall in die Logik einbauen
  1. Den Median durch Quickselect bestimmen
  2. Monte-Carlo-Simulationen ausführen
  3. Schneller sortieren mit Quicksort
Kapitel 18: Lokale Suchen durchführen
1. Lokale Suchen verstehen
  1. Die Nachbarschaft kennen
2. Tricks bei der lokalen Suche
  1. Bergsteigen und das Damenproblem
  2. Die Funktionsweise des Simulated Annealing
  3. Wiederholungen durch die Tabu-Suche vermeiden
3. Die Erfüllbarkeit boolescher Schaltkreise
  1. 2-SAT mittels Randomisierungen lösen
  2. Die Code-Implementierung in Python
  3. Die Wichtigkeit des Anfangspunkts
Kapitel 19: Lineare Optimierung
1. Lineare Funktionen – ein Werkzeug
  1. Die mathematischen Grundlagen
  2. Während des Planens vereinfachen
  3. Das Simplex-Verfahren geometrisch bearbeiten
  4. Die Grenzen der linearen Optimierung
2. Lineare Optimierung in der Praxis
  1. PuLP auf dem eigenen Computer installieren
  2. Produktionsvorgänge und Einnahmen optimieren
Kapitel 20: Heuristiken untersuchen
1. Unterschiedliche Heuristiken kennenlernen
  1. Die Ziele heuristischer Verfahren
  2. Von genetisch zu künstlich
2. Heuristische Routensuche bei Robotern
  1. Unbekannte Gebiete erkunden
  2. Entfernungsmessungen als Heuristiken verwenden
3. Pathfinding-Algorithmen verstehen
  1. Einen Irrgarten erstellen
  2. Die Suche nach dem besten Weg
  3. Heuristische Bewegungen mit A*

Teil VI: Der Top-Ten-Teil

Kapitel 21: Zehn algorithmische Verfahren, die die Welt verändern
1. Sortierverfahren einsetzen
2. Suchen durchführen
3. Mit Zufallszahlen eine neue Ordnung herstellen
4. Datenkompressionen vornehmen
5. Die Geheimhaltung von Daten
6. Datenbereiche ändern
7. Zusammenhänge erkennen
8. Muster in Daten erkennen
9. Mit Automatisierung und automatischen Antworten arbeiten
10. Eindeutige Identifizierungen erstellen
Kapitel 22: Zehn bislang ungelöste Probleme
1. Textsuchen bearbeiten
2. Wörter unterscheiden
3. Herausfinden, wann eine Anwendung anhält
4. Einwegfunktionen erstellen und verwenden
5. Die Multiplikation großer Zahlen
6. Die Gleichverteilung von Ressourcen
7. Die Berechnungszeit der Editierdistanz reduzieren
8. Aufgaben schnell lösen
9. Das Paritätsspiel spielen
10. Räumliche Aufgabenstellungen verstehen

Stichwortverzeichnis

Wiley End User License Agreement

Abbildungsverzeichnis

Kapitel 2

Abbildung 2.1: Komplexität eines Algorithmus im Falle von bestem, durchschnittlichem und ungünstigstem Input

Kapitel 3

Abbildung 3.2: Geben Sie im Installationsassistenten an, wie Anaconda auf Ihrem System installiert werden soll.
Abbildung 3.1: Der Installationsprozess (auf Englisch) informiert Sie zu Anfang darüber, ob Sie die 64-Bit-Version haben.
Abbildung 3.4: Konfiguration der erweiterten Installationsoptionen
Abbildung 3.3: Wählen Sie einen Installationsort.
Abbildung 3.5: Mit Jupyter Notebook lassen sich Beispiele zum maschinellen Lernen sehr einfach erstellen.
Abbildung 3.6: Neue Ordner tragen die Bezeichnung .
Abbildung 3.7: Benennen Sie den Ordner um, damit Sie sich dessen Inhalt leichter merken können.
Abbildung 3.8: Ein Notebook besteht aus Zellen, die Code enthalten können.
Abbildung 3.9: Wählen Sie einen neuen Namen für Ihr Notebook.
Abbildung 3.10: Notebook speichert Ihren Code in Zellen ab.
Abbildung 3.11: Alle von Ihnen erstellten Notebooks erscheinen in der Repository-Liste.
Abbildung 3.12: Notebook warnt Sie, ehe es Dateien aus dem Repository löscht.
Abbildung 3.13: Die Dateien, die Sie zum Repository hinzufügen wollen, werden in einer Uploadliste angezeigt, die eine oder mehrere Dateien enthält.
Abbildung 3.14: Das Boston-Objekt enthält den importierten Datensatz.

Kapitel 5

Abbildung 5.1: Beim rekursiven Prozess ruft eine Funktion sich selbst so lange wiederholt auf, bis eine bestimmte Bedingung erfüllt ist.

Kapitel 6

Abbildung 6.1: Bäume in Python ähneln Bäumen in der Natur.
Abbildung 6.2: Knoten in Graphen können ganz unterschiedlich miteinander verbunden werden.

Kapitel 7

Abbildung 7.1: Die Anordnung der Schlüssel in einem BST
Abbildung 7.2: Die Anordnung der Schlüssel in einem binären Heap

Kapitel 8

Abbildung 8.1: Beispiel eines einfachen, ungerichteten Graphen
Abbildung 8.2: Die gerichtete Version des ersten Graphen
Abbildung 8.3: Gewichtete Graphen sind realistischer.
Abbildung 8.4: Durch die bildliche Darstellung wird der Inhalt des Graphen deutlich.
Abbildung 8.5: Durch das Plotten des Graphen wird die Gradzentralität deutlich.

Kapitel 9

Abbildung 9.1: Eine Darstellung des Beispielgraphen durch NetworkX
Abbildung 9.2: Der Beispielgraph ist nun gewichtet.
Abbildung 9.3: Der Beispielgraph ist gewichtet und gerichtet.

Kapitel 10

Abbildung 1.1: Netzwerkcluster der Beziehungen unter Freunden
Abbildung 1.2: Communitys enthalten häufig Cliquen, die sehr nützlich für die soziale Netzwerkanalyse sind.
Abbildung 1.3: Ein Beispielgraph für Suchzwecke

Kapitel 11

Abbildung 11.1: Ein stark zusammenhängendes Netz
Abbildung 11.2: Eine Sackgasse
Abbildung 11.3: Eine Spider Trap

Kapitel 12

Abbildung 12.1: Immer mehr Transistoren finden Platz in einem Prozessor.
Abbildung 12.2: Stichproben aus einer Urne
Abbildung 12.3: Windowing eines DNA-Datenstroms
Abbildung 12.4: Ein einzelnes Element wird zu einem Bit-Array hinzugefügt.
Abbildung 12.5: Durch Hinzufügen eines zweiten Elements entsteht eine Kollision.
Abbildung 12.6: Um herauszufinden, ob ein Element existiert, wird das Bit-Array nach 0-Einträgen durchsucht.
Abbildung 12.7: Mit einem Bloomfilter überprüfen, ob eine Webseite bereits besucht wurde
Abbildung 12.8: Anfangs-Nullen abzählen
Abbildung 12.9: So werden Werte in einem Count-Min-Sketch aktualisiert.

Kapitel 13

Abbildung 13.1: Durch assoziative und kommutative Eigenschaften parallel rechnen
Abbildung 13.2: Ein Schema, das einen Computercluster darstellt
Abbildung 13.3: Eine Liste von Zahlen quadrieren
Abbildung 13.4: Eine Zahlenliste auf ihre Summe reduzieren
Abbildung 13.5: Ein Überblick über den gesamten MapReduce-Vorgang

Kapitel 14

Abbildung 14.1: Ein Huffman-Baum und die entsprechende Zeichensatztabelle zur Umwandlung

Kapitel 15

Abbildung 15.1: Von einem balancierten (links) zu einem unbalancierten (rechts) Baum

Kapitel 16

Abbildung 16.1: Die Knoten des gewichteten Graphen stehen für Städte.
Abbildung 16.2: »Sunday« in »Saturday« umformen
Abbildung 16.3: Die ausgeführten Transformationen

Kapitel 17

Abbildung 17.1: Ein Histogramm einer Normalverteilung
Abbildung 17.2: Ein Histogramm einer Gleichverteilung
Abbildung 17.3: Die Ergebnisse einer Monte-Carlo-Simulation
Abbildung 17.4: Das Ergebnis einer Monte-Carlo-Simulation von Quickselect
Abbildung 17.5: Monte-Carlo-Simulationen bei zunehmender Inputgröße

Kapitel 18

Abbildung 18.1: Durch Änderungen der Endstrecken lassen sich in einem TSP-Problem bessere Ergebnisse erzielen.
Abbildung 18.2: Eine lokale Suche untersucht die Landschaft durch Bergsteigen.
Abbildung 18.3: Eine Lösung des Damenproblems
Abbildung 18.4: Symbole und Wahrheitstabellen der logischen Operatoren , und
Abbildung 18.5: Die Anzahl der unerfüllbaren Klauseln nimmt nach zufälligen Änderungen ab.
Abbildung 18.6: Die Laufzeit ist bei einem besseren Anfangspunkt kürzer.

Kapitel 19

Abbildung 19.1: Überprüfen, wo die Zielfunktion die zulässige Region berührt
Abbildung 19.2: Herausfinden, welche Ecke die richtige ist

Kapitel 20

Abbildung 2.1: A und B sind Koordinaten auf der Karte.
Abbildung 2.2: Ein Irrgarten, der eine topologische Karte mit Hindernissen darstellt
Abbildung 2.3: Ein komplexer Irrgarten, der durch eine Heuristik gelöst wird

1-6

Algorithmen für Dummies

Schummelseite

Den richtigen Algorithmus finden

In der folgenden Tabelle finden Sie verschiedene Algorithmen, die für die Datenanalyse nützlich sein können.

Algorithmus	Beschreibung
A*-Suche	Der Algorithmus berechnet während der Untersuchung der Knoten fortlaufend die damit verbundenen Kosten. Dies geschieht anhand der Gleichung f(n) = g(n) + h(n), wobei: n für den Knoten steht, g(n) die entstandenen Kosten bis zum Erreichen des Knotens sind, h(n) die geschätzten Kosten vom Knoten bis zum Ziel sind und f(n) die geschätzten Kosten des Wegs von n bis zum Ziel sind. Die Idee hierbei ist, zuerst die aussichtsreichsten Wege zu durchsuchen und kostenintensive Wege zu vermeiden.
Balancierter Baum	Eine besondere Art von Baum, der durch Umordnen eine balancierte Struktur bewahrt. Hierdurch lassen sich Aufrufzeiten reduzieren. Die Anzahl der Elemente auf der linken Seite unterscheidet sich von der Anzahl der Elemente auf der rechten Seite höchstens um 1.
Bidirektionale Suche	Bei dieser Technik wird gleichzeitig vom Wurzelknoten und vom Zielknoten aus gesucht, bis sich die Wege beider Suchen in der Mitte treffen. Ein Vorteil dieses Ansatzes ist, dass er nicht sehr zeitaufwändig ist, weil er die Lösung schneller als viele andere Brute-Force-Ansätze findet. Zudem ist er im Vergleich zu anderen Ansätzen sparsamer hinsichtlich des Speicherplatzverbrauchs und findet garantiert eine Lösung. Der größte Nachteil ist die Komplexität der Implementierung.
Binärer Baum	Bei dieser Art von Baum ist ein Knoten jeweils mit keinen (im Fall eines Blattknotens), einem oder zwei (bei inneren Knoten) anderen Knoten verbunden. Durch jeden Knoten werden drei wichtige Aspekte definiert: Datenspeicher, linke und rechte Verbindung.
Breitensuche	Diese Technik setzt am Wurzelknoten an und untersucht zunächst jeden der Kinderknoten. Anschließend geht sie zur nächsten Ebene über. So durchläuft sie Ebene für Ebene, bis eine Lösung gefunden wurde. Der Nachteil dieses Algorithmus ist, dass jeder Knoten abgespeichert werden muss, was bei großen Knotenmengen entsprechend viel Speicherplatz beansprucht. Die Breitensuche kann doppelt vorkommende Knoten finden, was Zeit spart. Eine Lösung ist immer garantiert.
Brute-Force-Methode	Bei diesem Ansatz wird jede mögliche Lösung ausprobiert, um darunter die beste Lösung zu finden. Brute-Force-Techniken finden immer die beste Lösung, sind jedoch dermaßen zeitaufwändig in der Implementierung, dass sie meistens nicht verwendet werden.
Dijkstra	Dieser Algorithmus findet den kürzesten Weg in einem gerichteten, positiv gewichteten Graphen.
Gierige Bestensuche	Dieser Algorithmus wählt stets diejenige Strecke aus, die sich am nächsten zum Zielpunkt befindet. Dies geschieht anhand der Gleichung f(n) = h(n). Der Algorithmus findet in der Regel sehr schnell eine Lösung, kann jedoch auch in Schleifen hängen bleiben. Aus diesem Grund stellt er oftmals keinen optimalen Lösungsansatz dar.
Gieriger Algorithmus	Bei dieser Technik wird für die Gesamtlösung das beste Ergebnis aus jedem einzelnen Schritt des Lösungsprozesses genommen. Gierige Algorithmen gehen von zwei Annahmen aus: Es ist möglich, in jedem Schritt die eine optimale Wahl zu treffen. Trifft man in jedem Schritt die optimale Wahl, lässt sich hierdurch eine optimale Lösung des Gesamtproblems finden.
Graph	Ein Graph ist eine Art Erweiterung eines Baums. Wie auch bei Bäumen können zwischen den Knoten eines Graphen Verbindungen bestehen. Anders als bei binären Bäumen können bei Graphen jedoch mehr als eine oder zwei Verbindungen von einem Knoten ausgehen. Graphknoten haben oftmals sogar sehr viele Verbindungen. Sie werden beispielsweise in GPS-Karten und in vielen anderen Anwendungen eingesetzt, wo der Top-Down-Ansatz für Bäume nicht funktioniert.
Hashing	Bei dieser Methode wird vorhergesagt, wo sich ein bestimmtes Datenobjekt in einer beliebigen Datenstruktur befindet, bevor man mit der eigentlichen Suche beginnt. Hierzu werden Schlüssel eingesetzt, die in einem Index abgelegt sind: Der Schlüssel wird zunächst durch eine Hashfunktion in einen numerischen Wert umgewandelt, den der Algorithmus in einer Hashtabelle ablegt. Anhand der Hashtabelle lässt sich ein Index erstellen, der auf die Elemente in der Datenstruktur verweist, sodass der Algorithmus die Position der Daten leicht vorhersagen kann.
Heap	Hierbei handelt es sich um eine raffinierte Baumstruktur, in die sich Daten einfügen lassen. Durch dieses Einfügen lässt sich der Sortiervorgang beschleunigen. Die Bäume können weiter in sogenannte Max-Heaps und Min-Heaps unterteilt werden, je nachdem, ob der Heap sofort den maximalen oder den minimalen Wert im Baum ausgibt.
Heuristik	Diese Problemlösetechnik beruht auf Erfahrungen und gibt Ergebnisse aus, die zwar nicht optimal, jedoch gut genug sind, sodass eine bessere Lösung nicht mehr nötig ist. Hierbei lässt man sich durch den Algorithmus potentiell nützliche Lösungswege aufzeigen. Anschließend ist man jedoch trotzdem auf menschliche Intuition und Vernunft angewiesen, um zu wissen, ob es sich bei dem Ergebnis tatsächlich um die richtige Lösung handelt.
MapReduce	Mithilfe dieser Grundstruktur können Algorithmen auf mehreren vernetzten Computern parallele Berechnungen ausführen, wodurch Ergebnisse schneller erzielt werden.
Mergesort	Mergesort ist eine universelle, vergleichsbasierte Methode des Datensortierens. Zur Ausführung macht man von einem Teile-und-herrsche-Ansatz Gebrauch.
Nash-Gleichgewicht	Dies ist ein Begriff aus der Spieltheorie. Er beschreibt eine Situation, in der jedem Spieler die Strategie der anderen Spieler bekannt ist, sodass kein Spieler durch die Änderung seiner Strategie einen Vorteil hat. Diese Theorie wird auf Konfliktsituationen angewandt, bei denen ein Spieler die Entscheidungen aller beteiligten Spieler berücksichtigen muss, wenn er das Spiel gewinnen will.
PageRank	Der PageRank-Algorithmus misst die Wichtigkeit eines Knotens in einem Graphen. Dieser Algorithmus bildet die wesentliche Grundlage für die Kernalgorithmen von Google, die die relevantesten Ergebnisse einer Suchanfrage ausgeben.
Quicksort	Dies ist ein allgemeines Sortierverfahren, bei dem ein Datenarray durch einen Teile-und-herrsche-Ansatz in kleinere Datenarrays zerlegt wird.
Rein heuristische Suche	Dieser Algorithmus durchläuft die Knoten in der Reihenfolge ihrer Kosten und legt dabei zwei Listen an. Eine geschlossene Liste enthält bereits besuchte Knoten, während eine offene Liste diejenigen Knoten enthält, die noch besucht werden müssen. Bei jeder Iteration wählt der Algorithmus den Knoten mit den niedrigsten Kosten aus. Alle Kinderknoten dieses Knotens werden in der geschlossenen Liste abgelegt und die jeweiligen Kosten berechnet. Der Algorithmus legt sodann alle Kinderknoten mit niedrigen Kosten wieder in der offenen Liste ab und löscht die Kinderknoten mit hohen Kosten. So führt er eine intelligente, kostenbasierte Suche nach der Lösung aus.
Teile und herrsche	Bei diesem Lösungsansatz wird die Aufgabe in kleinstmögliche Teile zerlegt und mithilfe des einfachsten Ansatzes gelöst. Dies spart im Vergleich zu anderen Ansätzen wie etwa dem Brute-Force-Ansatz viel Zeit und Ressourcen. Jedoch ist eine optimale Lösung nicht immer garantiert.
Tiefensuche	Diese Technik setzt am Wurzelknoten an und untersucht dann eine Menge von verbundenen Kinderknoten, bis sie einen Blattknoten erreicht. Sie durchläuft Zweig um Zweig, bis sie eine Lösung findet. Der Nachteil dieses Algorithmus ist, dass er nicht nach doppelt vorkommenden Knoten suchen kann; das bedeutet, dass er die gleichen Knotenwege mehr als einmal durchlaufen könnte. Es kann sogar sein, dass dieser Algorithmus gar keine Lösung findet, sodass Sie eine obere Grenze definieren müssen, damit der Algorithmus nicht ewig weitersucht. Ein Vorteil dieses Ansatzes ist, dass er speicherplatzfreundlich ist.
Unbalancierter Baum	Bei diesem Baum werden je nach Bedarf neue Datenelemente eingefügt, ohne dass dabei die Balance des Baums berücksichtigt wird. Durch diese Methode des Hinzufügens wird der Baum schneller aufgebaut, bei Such- oder Sortiervorgängen jedoch langsamer abrufbar.

Algorithmen und andere mathematische Begriffe

Wie die meisten Menschen kommen wahrscheinlich auch Sie ins Grübeln, wenn Sie einen mathematischen Fachbegriff hören. Niemand scheint zu wissen, wie man diese Begriffe richtig verwendet. Es ist, als wollten manche Menschen die Dinge schwieriger machen, als sie eigentlich sind! Was ist nun eigentlich eine Gleichung, und wodurch unterscheidet sie sich von einem Algorithmus? Die folgende Tabelle hilft Ihnen weiter.

Begriff	Beschreibung
Gleichung	Eine Gleichung enthält stets ein Gleichheitszeichen. Dieses bedeutet, dass die Zahlen und Symbole auf beiden Seiten den gleichen Wert ergeben. 5 + 2 = 7 ist eine sehr einfache Form einer Gleichung. 7 = 3 + 4 wäre auch eine Gleichung. In der Regel aber enthalten Gleichungen Variablen, die mit Symbolen dargestellt sind! Ob die Gleichung wahr oder falsch ist, hängt dann von den Werten der Variablen ab. Werte, die die Gleichung erfüllen, heißen Lösungen der Gleichung. Wenn a + 2 = 7, ist a = 5 eine Lösung der Gleichung.
Formel	Formeln sind eine Kombination aus Zahlen und Symbolen und definieren normalerweise ein mathematisches oder logisches Konzept wie zum Beispiel der berühmte Satz des Pythagoras über die Seitenlängen in einem rechtwinkligen Dreieck: a² + b² = c². Allgemein zeigen Formeln eine Beziehung zwischen zwei oder mehreren Variablen auf. Für die meisten Menschen ist eine Formel eine besondere Sorte von Gleichung.
Algorithmus	Eine Abfolge von Schritten zur Lösung eines Problems. Algorithmen sind nicht immer mathematischer oder logischer Natur, obgleich die Beispiele in diesem Buch oftmals in diese Kategorie fallen, weil Algorithmen in der Regel auf diese Weise verwendet werden. Bei einigen Spezialformeln handelt es sich auch um Algorithmen, wie etwa bei der Mitternachtsformel zur Lösung quadratischer Gleichungen. Um als Algorithmus gelten zu können, muss ein Verfahren die folgenden Eigenschaften erfüllen: Endlichkeit: Früher oder später muss der Algorithmus die Aufgabe lösen können. Wohldefiniertheit: Die Abfolge der Schritte muss klar und verständlich sein. Insbesondere müssen die Schritte für Computer nachvollziehbar sein, damit der Algorithmus mithilfe einer Programmiersprache implementiert werden kann. Effektivität: Ein Algorithmus muss für jeden Fall, den die Aufgabenstellung vorsieht, Ergebnisse berechnen können. Er sollte stets die Aufgabe lösen, für die er entwickelt wurde. Obwohl dabei Fehler auftreten können, sind diese eher eine Seltenheit und tauchen nur in Situationen auf, die im Rahmen des beabsichtigten Einsatzes akzeptabel sind.

Spannende Anwendungsgebiete für Algorithmen

In der folgenden Tabelle finden Sie einige großartige Einsatzgebiete für Algorithmen.

Aufgabe	Besonderheit
Ablaufplanung	Die gerechte Verteilung von Ressourcen unter mehreren beteiligten Parteien stellt ein großes Anwendungsgebiet für Algorithmen dar. Moderne Ampelschaltungen berücksichtigen beispielsweise unter anderem die Tageszeit, die Wetterbedingungen und den Verkehrsfluss. Denken Sie auch an Ihren Computer, der mehrere Aufgaben gleichzeitig ausführen kann. Ohne einen Algorithmus zur Ablaufplanung würde das Betriebssystem alle verfügbaren Ressourcen in Anspruch nehmen und andere Anwendungen von der Arbeit abhalten.
Analyse von Graphen	In vielen unterschiedlichen Bereichen benötigt man die kürzeste Strecke zwischen zwei Punkten. Beispielsweise würde Ihr GPS ohne diesen besonderen Algorithmus nicht funktionieren, da es in einer Stadt niemals des kürzesten Weg zwischen Punkt A und B finden würde.
Erzeugung pseudozufälliger Zahlen	Stellen Sie sich ein Spiel vor, das immer gleich ist: Sie würden jedes Mal am gleichen Anfangspunkt beginnen und immer nach dem gleichen Schema die gleichen Schritte ausführen. Das wäre doch langweilig! Ohne die Möglichkeit, scheinbar zufällige Zahlen zu erzeugen, wären viele Computeraufgaben sinnlos oder schier unmöglich.
Kryptographie	Angesichts von Hackerangriffen ist die Sicherung von Daten heutzutage ein wichtiges Thema. Mit Algorithmen lassen sich Daten analysieren, in eine andere Form umwandeln (verschlüsseln) und am Ende wieder in ihre ursprüngliche Form bringen.
Sortieren	Angesichts der heutigen Datenmengen ist es wichtig, Informationen in einer bestimmten Reihenfolge anordnen zu können. Nur so lassen sich die Informationsfluten in eine reduzierte, übersichtlichere Form bringen. Stellen Sie sich vor, Sie suchen bei Amazon nach Kaffeetassen und finden dort Tausende Tassen im Angebot, die Sie jedoch nicht nach dem Preis oder nach positiven Bewertungen sortieren können. Viele komplexe Algorithmen benötigen Daten in einer bestimmten Reihenfolge, um überhaupt zuverlässig funktionieren zu können, sodass das Sortieren eine wichtige Voraussetzung für das Lösen von immer mehr Problemen darstellt.
Suchen	Die Suche nach Informationen und die Überprüfung, dass es sich bei den angezeigten Informationen tatsächlich um die gewünschten Informationen handelt, sind wesentliche Aufgaben in verschiedenen Bereichen. Ohne diese Algorithmen wäre eine Internetsuche nicht durchführbar.
Umformungen	Für den sinnvollen Gebrauch von Daten ist es mitunter unabdingbar, dass man Daten einer bestimmten Form in eine andere Form umwandeln kann. So könnte es etwa sein, dass Sie an das metrische Maßsystem gewöhnt sind, Ihre Daten jedoch im angloamerikanischen Maßsystem vorliegen. Durch eine Umrechnung der Daten werden die Daten verständlicher. Genauso lassen sich mithilfe der schnellen Fourier-Transformation Zeitsignale in Frequenzsignale umwandeln, was sich Ihr WLAN-Router zunutze macht.

Die Komplexität von Algorithmen

Für die Arbeit mit Algorithmen ist es hilfreich zu wissen, wie komplex ein Algorithmus ist – je komplexer er ist, umso mehr Zeit benötigt er.

Komplexitätsklasse	Beschreibung
Konstante Komplexität O(1)	Hier ist die Laufzeit immer gleich und hängt nicht von der Menge des Inputs ab. Jeder einzelne Input besitzt eine festgelegte Ausführzeit.
Logarithmische Komplexität O(log n)	Die Anzahl der Operationen wächst langsamer an als der Input, wodurch der Algorithmus bei kleineren Inputs nicht so effizient, bei größeren Inputs jedoch umso effizienter ist. Ein Beispiel ist die binäre Suche.
Lineare Komplexität O(n)	Die Menge der benötigten Operationen wächst im Verhältnis 1:1 mit der Inputmenge. Ein typisches Beispiel ist die Iteration, bei der der Input einmal überprüft und auf jedem seiner Elemente eine Operation ausgeübt wird.
Super-lineare Komplexität O(n·log n)	Diese Komplexität ist eine Mischung aus logarithmischer und linearer Komplexität. Sie findet sich typischerweise bei Sortierverfahren wie Mergesort, Heapsort und Quicksort.
Quadratische Komplexität O(n²)	Die Anzahl der Operationen nimmt mit dem Quadrat der Inputmenge zu. Wenn es eine Iteration innerhalb einer anderen gibt, so liegt quadratische Komplexität vor. Einige der weniger effizienten Sortieralgorithmen wie Bubblesort, Selectionsort und Insertionsort gehören zu dieser Komplexitätsklasse. Es könnte sein, dass ihr Algorithmus stunden- oder tagelang rechnen muss, bis er eine Lösung findet.
Kubische Komplexität O(n³)	Hier nehmen die Operationen noch stärker zu als bei quadratischer Komplexität, weil es mehrfach verschachtelte Iterationen gibt. Algorithmen von dieser Komplexität können für die Verarbeitung einer recht kleinen Datenmenge von 100.000 Elementen Jahre brauchen. Ist die Anzahl der nötigen Operationen eine Potenz des Inputs, spricht man von einer polynomiellen Laufzeit.
Exponentielle Komplexität O(2ⁿ)	Dieser Algorithmus benötigt für jedes neue Element die doppelte Anzahl der vorigen Operationen. Bei Algorithmen dieser Komplexität können sogar kleine Aufgaben unendlich lange Laufzeiten haben. Viele Algorithmen, die umfangreiche Suchen ausführen, sind von exponentieller Laufzeit. Ein klassisches Beispiel für dieses Komplexitätsniveau ist die Berechnung der Fibonacci-Zahlen.
Faktorielle Komplexität O(n!)	Algorithmen von dieser Komplexität sind aufgrund der vielen möglichen Kombinationen der Elemente untereinander ein wahres Grauen. Angenommen, Ihr Input besteht aus 100 Objekten und eine Operation auf Ihrem Computer dauert 10^-6 Sekunden, was eine normale Geschwindigkeit für heutige Computer ist. Dann dauert die Ausführung der Aufgabe etwa 10¹⁴⁰ Jahre – ein Ding der Unmöglichkeit: Das Alter unseres Universums wird gerade mal auf 10¹⁴ Jahre geschätzt. Ein berühmtes Problem mit faktorieller Komplexität ist das Problem des Handlungsreisenden, bei dem ein Handlungsreisender die kürzeste Verbindungsstrecke zwischen mehreren Städten finden muss.

WILEY END USER LICENSE AGREEMENT