Vorwort

Bücher zur Implementierung numerischer Verfahren der Optimierung sind seit vielen Jahren gefragt. Die Behandlung mathematisch-naturwissenschaftlicher, technischer und ökonomischer Fragestellungen erfordert in wachsendem Umfang die Lösung linearer oder nichtlinearer Optimierungsaufgaben. Gegenüber den ersten Bemühungen in den 40er- und 50er-Jahren haben sich hierfür die Voraussetzungen auf dem Gebiet der Informatik wesentlich verbessert. Nicht nur Rechenzeit und Speicherplatz haben eine andere Bewertung erfahren, auch Programmierparadigmen und die Nutzung von Dialogmöglichkeiten haben sich geändert. Dieser Entwicklung folgend, werden im vorliegenden Buch Probleme und Lösungsverfahren als Klassen der objektorientierten Programmierung aufgefasst. Die Formulierung der zu lösenden Optimierungsaufgabe und die Auswahl der Lösungsmethode erfolgt im Dialog, die Ergebnisse der Berechnung werden automatisch gespeichert. Im Unterschied zu komplexen Systemen, wie Matlab sind die einzelnen Routinen modifizierbar und separat nutzbar. Seit den Arbeiten von Kantorovich [1] und Dantzig [2] zum Simplexverfahren hat auch die Entwicklung effektiver numerischer Verfahren der Optimierung eine stürmische Entwicklung genommen. Ihre theoretische Begründung und sachgerechte Implementierung stellt inzwischen einen eigenständigen Problemkreis dar, welcher als Numerik der Optimierung (in englischer Sprache als „Computational Mathematical Programming“, in russischer Sprache als „Vycislitelnye metody programmirovanija“) bezeichnet wird. Die Aneignung der auf diesem Gebiet vorhandenen Erkenntnisse, noch mehr aber das Erleben des Zusammenhangs von beschriebenem Algorithmus, umgesetztem Programm und bereitgestellter Nutzeroberfläche werden zum Bedürfnis des an der Optimierung interessierten Praktikers. Gegenstand des Buches sind deshalb nicht in erster Linie theoretische Grundlagen, sondern Fragen der praktischen Realisierung der Verfahren mit modernen Mitteln der Informatik. Es soll einen Einstieg in die Behandlung von Optimierungsaufgaben auf Computern ermöglichen.

Für praktische Hilfeleistungen beim Zustandekommen des Buches bin ich Klaus Schönefeld zu Dank verpflichtet. In gleicher Weise danke ich Thomas Cassebaum für die Möglichkeit, die von ihm bereitgestellte Entwicklungsumgebung „SmallCpp“ nutzen zu können und in C++-Fragen in ihm jederzeit einen guten Gesprächspartner gefunden zu haben. Ermutigende Worte und gute Ratschläge vieler Kollegen, insbesondere von Diethard Pallaschke, Oleg Burdakov, Manfred Grauer und Gerd Langensiepen, haben den Entstehungsprozess befördert. Dem Wiley-Verlag danke ich für die Möglichkeit, die Ergebnisse meiner Überlegungen zu publizieren. Schließlich möchte ich meiner Frau Hannelore für das Verständnis danken, mit dem sie die Belastung mitgetragen hat, welche dem Autor aus dem Schreiben eines Buches erwächst. Die Publikation von Algorithmen und Programmen schließt zu erwartende Kritiken und Hinweise von vornherein ein. Sie werden von mir sorgfältig berücksichtigt und in die Aufbereitung weiterer Programmversionen eingearbeitet.

Claus Richter

1
Einleitung

1.1 Das lineare und das nichtlineare Optimierungsproblem

Im vorliegenden Buch werden Optimierungsaufgaben betrachtet, die dadurch charakterisiert sind, dass eine lineare oder nichtlineare Zielfunktion f unter linearen oder nichtlinearen Ungleichungsnebenbedingungen minimiert wird, d. h.

(1.1)

wobei I

die Indexmenge der Ungeichungsrestriktionen bezeichnet. Gleichungsrestriktionen werden der Übersichtlichkeit halber zunächst weggelassen. An geeigneten Stellen werden sie zusätzlich berücksichtigt.

1.2 Definitionen und Bezeichnungen

Für die weiteren Überlegungen benötigen wir folgende Bezeichnungen:

n-dimensionaler Euklidischer Raum: Rⁿ,
Menge der reellen Zahlen: R,
nichtnegativer Orthant des n-dimensionalen Euklidischen Raumes: ,
Euklidische Norm:
Betragssummennorm:
(m, n)-Matrix A: rechteckiges Zahlenschema A = (a_i,j) von m ∗ n Zahlen, angeordnet in m Zeilen und n Spalten,
quadratische Matrix: (m, n)-Matrix A mit m = n,
Diagonalmatrix A: quadratische Matrix A mit a_{i j} = 0 für i ≠ j und a_ii ≠ 0,
Einheitsmatrix I: Diagonalmatrix A mit a_ii = 1,
obere Dreiecksmatrix A: quadratische Matrix A mit a_{i j} = 0, i > j,
untere Dreiecksmatrix A: quadratische Matrix A mit a_{i j} = 0, i < j,
positiv definite Matrix A: quadratische Matrix A mit x^TAx > 0 für alle x ≠ 0,
symmetrische Matrix A: quadratische Matrix A mit a_{i j} = a_ji,
transponierte Matrix A^T zu A: Matrix A^T mit A^T = (a_ji),
inverse Matrix A⁻¹ zur Matrix A: Matrix mit der Eigenschaft A ∗ A⁻¹ = I,
nichtsinguläre Matrix A: die inverse Matrix A⁻¹ zu A existiert,
orthogonale Matrix A: Matrix mit der Eigenschaft A^T = A⁻¹,
transponierter Vektor: x^T = (x₁, …, x_n),
Gradient einer Funktion f : Rⁿ → R
Hesse-Matrix einer Funktion f : Rⁿ → R
Lagrange-Funktion für die Aufgabe (1.1)
Ableitung der Lagrange-Funktion nach den Komponenten des 1. Arguments
zweite Ableitung der Lagrange-Funktion nach den Komponenten des 1. Arguments
Indexmenge I(x) der in x aktiven Restriktionen
Vektor, dessen Komponenten alle gleich 1 sind: e = (1, …, 1)^T,
i-ter Einheitsvektor: e_i = (0, …, 0, 1, 0, …, 0)^T,
die Menge G⁰ := {x : g_i(x) < 0, i = 1, …, m}.

1.3 Spezialfälle linearer und nichtlinearer Optimierungsaufgaben

Besitzen Zielfunktion f und der zulässige Bereich G bzw. Nebenbedingungen g_i und g_j eine spezielle Gestalt, so können zur Lösung von (1.1) spezielle Verfahren herangezogen werden. Für die Zielfunktion f sind folgende Strukturen interessant:

Allgemeine nichtlineare Zielfunktion f (x).
Lineare Zielfunktion f (x) = c^Tx.
Quadratische Zielfunktion
Quadratsumme (Regression)
Maximum von Funktionen f (x) = max f_j(x) (j = 1, …, l).

In Bezug auf die Nebenbedingungen N sind folgende Situationen typisch:

Allgemeine nichtlineare Nebenbedingungen.
Lineare Nebenbedingungen .
Keine Nebenbedingungen G = Rⁿ.

In den folgenden Kapiteln werden spezielle Kombinationen von Zielfunktion und Nebenbedingungen eine besondere Rolle spielen:

lineare Optimierung (L): f 2 + N2,
quadratische Optimierung (Q): f 3 + N2,
allgemeine nichtlineare Optimierungsaufgabe (C): f 1 + N1,
unbeschränkte Minimierung (U): f 1 + N3,
Regressionsprobleme (P): f 4 + N3, f 4 + N1.

Die Spezifikationen L, Q, C, U und P werden in der Charakterisierung der implementierten Beispiele im Programmsystem „Optisoft“ verwendet. Über die dargestellten Kombinationen von Zielfunktion und Nebenbedingungen hinaus spielen Aufgaben der nichtglatten Optimierung eine besondere Rolle. Diese finden im vorliegenden Buch keine Beachtung. Gleiches gilt auch für Optimierungsaufgaben mit sehr vielen Variablen: n > 100, sofern sie nicht als Teilprobleme zur Lösung von (1.1) auftreten.

Obwohl die spezifische Gestalt von Zielfunktion und Nebenbedingungen interessant ist, wie etwa in der geometrischen Optimierung

wird diese nicht explizit berücksichtigt.

In der Betrachtung von Optimierungsverfahren gehen wir von dem Grundmodell (1.1) aus. Für Least-Square-Probleme in Differenzialgleichungsmodellen und bei Strukturoptimierungsproblemen liegen spezielle Aufgaben zugrunde. Diese werden in den folgenden Kapiteln näher erläutert.

1.4 Anwendungen

Nichtlineare Optimierungsprobleme spielen in vielen Anwendungsbereichen eine wichtige Rolle, z. B. in der

Luft- und Raumfahrt (Steuerung, Konstruktion),
Mechanik (Optimierung mechanischer Strukturen, z. B. von Tragwerken),
Elektrotechnik (Transformatorkonstruktion),
Chemie (Gleichgewichtsprobleme),
Medizin, Soziologie (Statistische Probleme),
Betriebswirtschaft (Planungsmodelle),
Physik (Kernforschung),
Energiewesen (Energieverteilung).

Typische Anwendungsbeispiele finden sich in den Büchern von Bracken und McCormick [3] oder Beightler und Phillips [4]. Einige mathematische Fragestellungen, welche bei der Lösung praktischer Probleme auf Optimierungsverfahren zurückgreifen, werden im Buch näher betrachtet:

1.4.1 Strukturoptimierung

Die Strukturoptimierung wird schon seit einigen Jahren in der computergestützten Konstruktion eingesetzt. In der zugrundeliegenden Aufgabenstellung wird dabei zwischen Querschnitts-, Form-, und Topologieoptimierung (der eigentlichen Strukturoptimierung) unterschieden. Grundlegende Fragestellung ist dabei, die Struktur und die Abmessungen von Konstruktionen derart zu wählen, dass zum einen die mechanischen Randbedingungen erfüllt und zum anderen der Materialeinsatz und damit die Kosten möglichst gering sind.

Obwohl die Berücksichtigung der Nebenbedingungen oft die Koppelung mit komplizierten Berechnungsvorschriften – z. B. FEM-Solvern – erfordert, soll das Grundprinzip an folgendem Beispiel erläutert werden:

1.4.2 Das Least-Squares-Problem

Spezielle nichtlineare Optimierungsaufgaben treten bei der Parameterbestimmung von Modellen auf, die einen in Natur- oder Technikwissenschaften vorliegenden Zusammenhang qualitativ beschreiben. Sind über diesen Zusammenhang Resultate von Experimenten bekannt, kann man die Methode der kleinsten Quadrate anwenden, um die Koeffizienten näherungsweise zu bestimmen. Das zugehörige Optimierungsproblem lautet:

bei

(1.2)

Hierbei sind

y(x, t) – die gewählte Modellfunktion,

x – der Parametervektor, dessen Komponentenwerte zu bestimmen sind

t_i – der

i-te Wert der (u. U. vektorwertigen) unabhängigen Veränderlichen,

y_i – die i-te Beobachtung der (u. U. vektorwertigen) unabhängigen Veränderlichen,

a, b – Schrankenvektoren für den Vektor x.

Entsprechend der Wahl der Norm haben wir es mit einer linearen oder quadratischen Zielfunktion zu tun. Die vorliegende Formulierung gestattet die Berücksichtigung zusätzlicher Nebenbedingungen. Beim Vorliegen von Differenzialgleichungen wird die Aufgabe wie folgt modifiziert:

bei

(1.3)

Eventuell treten zusätzlich Anfangsbedingungen der Form

(1.4)

auf.

Diese können gegebenenfalls in die Least-Square-Formulierung einbezogen werden.

1.4.3 Optimale Steuerung

Das Problem der optimalen Steuerung besteht darin, eine Funktion unter Differenzialgleichungsnebenbedingungen sowie Anfangs- und Endbedingungen zu minimieren: bei

bei

(1.5)

Durch Spline-Approximation der Steuerungsfunktion und Anwendung von Lösungsmethoden für Differenzialgleichungssysteme ist es möglich, das Problem der optimalen Steuerung in eine nichtlineare Optimierungsaufgabe zu transformieren. Hierzu wird die Kopplung einer Mehrfachschießmethode mit einer SQP-Methode betrachtet.

Diese Kopplung ist sehr effektiv und eine Alternative zur Verwendung von Straf-Barriere-Verfahren, welche von Kraft publiziert wurde [5].

Optimierung in C++

Grundlagen und Algorithmen

Autor