Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

21
Lineare Optimierung Prüfungsvorbereitung 30. Juli 2012 1 Einführung 1.1 Definitionen Definition 1 (Optimierungsproblem). min / max{f (x)| x M } Definition 2 (Lineares Optimierungsproblem). f (x) ist linear M lässt sich durch lineare Funktionen beschreiben Definition 3 (Konvexe Kombination). Für x 1 ,...,x k R n heißt x konvexe Kombination, falls λ 1 ...λ k 0 mit X i λ i =1 und X i λ i x i = x Definition 4 (Konvexe Hülle). Für M = {x 1 ,...,x k } heißt die konvexe Hülle von M conv M = {x|∃λ 1 ...λ k 0: X i λ i =1 X i λ i x i = x} Die konvexe Hülle zwischen zwei Punkten x 1 ,x 2 heißt Verbindungsstrecke. Definition 5 (Konvexe Menge). Die Menge M heißt konvex, wenn x 1 x 2 M : conv{x 1 ,x 2 }∈ M d. h. zwischen zwei beliebigen Punkten der Menge liegt auch die Verbindungsstrecke in der Menge. 1

Transcript of Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

Page 1: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

Lineare OptimierungPrüfungsvorbereitung

30. Juli 2012

1 Einführung

1.1 Definitionen

Definition 1 (Optimierungsproblem).

min /max{f(x)| x ∈M}

Definition 2 (Lineares Optimierungsproblem).

f(x) ist linear

M lässt sich durch lineare Funktionen beschreiben

Definition 3 (Konvexe Kombination). Für x1, . . . , xk ∈ Rn heißt x konvexe Kombination,falls

∃λ1 . . . λk ≥ 0

mit∑i

λi = 1

und∑i

λixi = x

Definition 4 (Konvexe Hülle). Für M = {x1, . . . , xk} heißt die konvexe Hülle von M

convM = {x| ∃λ1 . . . λk ≥ 0 :∑i

λi = 1 ∧∑i

λixi = x}

Die konvexe Hülle zwischen zwei Punkten x1, x2 heißt Verbindungsstrecke.

Definition 5 (Konvexe Menge). Die Menge M heißt konvex, wenn

∀x1x2 ∈M : conv{x1, x2} ∈M

d. h. zwischen zwei beliebigen Punkten der Menge liegt auch die Verbindungsstrecke inder Menge.

1

Page 2: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

Definition 6 (Extremalpunkt). Ein Punkt x ∈M ist extremal, falls gilt:

@ε > 0, u 6= 0n : x+ ε · u ∈M ∧ x− ε · u ∈M

Definition 7 (Halbraum). Mengen der Form

M1 = {x ∈ Rn| 〈c, x〉 ≤ c0}M2 = {x ∈ Rn| 〈c, x〉 ≥ c0}

}abgeschlossen

M3 = {x ∈ Rn| 〈c, x〉 < c0}M4 = {x ∈ Rn| 〈c, x〉 > c0}

}offen

heißen abgeschlossene, bzw. offene Halbräume.

Definition 8 (Konvexes Polyeder). P ⊆ Rn heißt konvexes Polyeder, falls

P =⋂i

Hi

mit Hi = {x ∈ Rn| 〈c, x〉 ≤ c0i , c 6= 0n}

d. h. ein konvexes Polyeder ist der Schnitt endlich vieler Halbräume.

Definition 9 (Hyperebene). Eine Menge heißt Hyperebene, wenn sie folgende Darstel-lung hat

S = {x ∈ Rn| 〈c, x〉 = c0}

Definition 10 (Indexmenge). Die Indexmenge I einer Menge M = {x ∈ Rn| 〈Ai, x〉 ≤bi} ist definiert als

I(x) := {i| 〈Ai, x〉 = bi}und heißt Menge der aktiven Restriktionen von x ∈M .

Definition 11 (Basismatrix). Eine Teilmatrix AB ∈ Rm×m der Matrix A ∈ Rm×n heißtBasismatrix, falls ihr Rang m ist, bzw. sie regulär ist. B ist dabei die Indexmenge derausgewählten Spalten aus A.

Definition 12 (Basisvariablen). Die Menge B := {j1, . . . , jm} ⊆ {1, . . . , n} heißt Index-menge der Basisvariablen, falls AB eine Basismatrix von A ist.

Definition 13 (Nichtbasisvariablen). Die Menge N := {1, . . . , n} \B heißt Indexmengeder Nichtbasisvariablen.

Definition 14 (Basispunkt). Der Punkt x ∈ Rn heißt Basispunkt zur Basismatrix AB,falls

xj = 0 ∀j ∈ N,Ax = b

bzw. ABxB = b für xB := (xj)j∈B

Definition 15 (Zulässigkeit). Der Basispunkt x heißt zulässig, falls xi ≥ 0, d. h. er ist dieLösung eines Gleichungssystemes ABxB = b und besitzt keine negativen Komponenten.

2

Page 3: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

1.2 Beweise

Lemma 1. Jeder Halbraum ist konvex.

Beweis. Betrachte zwei beliebige Punkte aus einem Halbraum und ihre Verbindungsstre-cke. Zeige, dass ein beliebiger Punkt dazwischen ebenfalls im Halbraum liegt.

Lemma 2. Endliche Schnitte konvexer Mengen sind konvex.

Beweis. Betrachte zwei beliebige Punkte aus dem Schnitt. Zeige, dass beliebige Punkteaus der Verbindungsstrecke in allen konvexen Mengen einzeln enthalten sind.

Lemma 3. Ein Punkt x ist genau dann extremal, wenn es keinen anderen Punkt y gibt,dessen Indexmenge I(y) die von x enthält, d. h.

x extremal⇔ I(x) echt maximal

Beweis. Zerlege den Beweis in Hin- und Rückrichtung für x extremal in M .

Fall 1. Beweis durch Widerspruch zur Extremalität von x

1. Gegeben Punkt x extremal, nimm’ an, dass es ein y gibt, dessen Indexmenge dievon x enthält.

2. Betrachte die Differenz u zwischen x und y und zeige, dass x+ εu in der Menge Mist.

3. Um zu zeigen, dass auch x− εu in M liegt, zeige 〈Ai, x− εu〉 ≤ bi,∀i.

a) Betrachte den Fall i ∈ I(x).

b) Betrachte den Fall i ∈ I(y) \ I(x).

c) Für den Fall i /∈ I(y) beachte

∃ki > 0 : 〈Ai, x〉+ ki ≤ bi

Zeige nun, dass〈Ai, x− εu〉 = 〈Ai, x〉 − ε 〈Ai, u〉 ≤ bi

für die beiden Fälle 〈Ai, u〉 > 0 und 〈Ai, u〉 < 0.

Fall 2. Beweis durch Widerspruch zur Maximalität der Indexmenge I(x)

1. Angenommen die Indexmenge von x ist echt maximal, aber x ist nicht extremal.

2. Betrachte u 6= 0n für das ein ε > 0 existiert, so dass x ± εu ∈ M . Zeige, dass∀i ∈ I(x) : 〈Ai, u〉 = 0 ist.

3. Konstruiere daraus einen Punkt y 6= x, der ebenfalls alle aktiven Restriktionen vonx mit Gleichheit erfüllt.

3

Page 4: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

Lemma 4. Für ein nichtleeres konvexes Polyeder M gilt

M besitzt einen Extremalpunkt⇔M enthält keine Gerade

Beweis. Zerlege die Aussage in Hin- und Rückrichtung.

Fall 1. Beweis durch Widerspruch zur Existenz eines Extremalpunktes

1. Betrachte die in M enthaltene Gerade g = {x+t·u, t ∈ R} und zeige, dass 〈Ai, u〉 =0 ist.

2. Betrachte einen beliebigen Punkt aus M und schließe aus 〈Ai, u〉 = 0 auf dessenNichtextremalität.

Fall 2. Konstruktiver Beweis für die Existenz eines Extremalpunktes

1. Wähle einen Startpunkt x ∈M und betrachte die Menge der aktiven Restriktionen.Zeige die Aussage für den Fall, dass diese Menge maximal ist.

2. Wähle einen Punkt y ∈ M , der die gleiche Menge aktiver Restriktionen erfüllt undbetrachte für u = x− y die Gerade x+ t · u.

3. Betrachte hier zunächst den Fall, dass diese Gerade komplett in M liegt.

4. Betrachte nun den Fall, dass die k’te Restriktion für ein t1 ∈ R verletzt wird.

5. Folgere aus dem Zwischenwertsatz, dass es ein t∗k gibt, das die k’te Restriktion exakterfüllt.

6. Von allen möglichen t’s, die eine Restriktion exakt erfüllen, wähle das, von demkeine anderen Restriktionen verletzt werden.

7. Folgere, dass der neue Punkt z = x+ t∗ ·u mindestens eine Restriktion mehr erfülltals x und y.

Satz 1. Für ein konvexes Polyeder M enthält die Lösungsmenge S der linearen Optimie-rungsaufgabe min{〈c, x〉 |x ∈M} einen extremalen Punkt x ∈M .

Beweis. Die Aussage wird in zwei Teilschritten bewiesen.

1. S ist selbst ein Polyeder und besitzt einen extremalen Punkt.

a) Betrachte die Definition von S:

S = {x ∈M | 〈c, x〉 = v}

b) Benutze die Konvexität von M und Lemma 4, um auf die Existenz eines ex-tremalen Punktes x zu schließen.

2. Der extremale Punkt von S ist auch ein extremaler Punkt von M .

4

Page 5: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

a) Nimm’ an, x wäre nicht extremal in M und folgere aus der Existenz von t > 0und u 6= 0n für x± t · u ∈M , dass 〈c, u〉 = 0 ist.

b) Folgere daraus, dass x schon in S nicht extremal war.

Satz 2. Für Polyeder M in Gleichungsform ist ein Punkt x genau dann extremal, wenn erzulässig ist.

Beweis. Zerlege die Behauptung in die beiden Teilrichtungen.

Fall 1. Widerspruch zur Nichtextremalität von x

1. Gegeben ist die Zulässigkeit von x, angenommen wird die Nichtextremalität.

2. Wähle einen Punkt y 6= x mit I(y) ⊇ I(x) und untersuche ob y ein Basispunkt derBasismatrix AB ist.

Fall 2. Widerspruch zur Nichtregularität der Basismatrix von x

1. Bilde die Menge der aktiven Restriktionen

J := J(x) = {i| xi = 0}

außerdem die Menge der inaktiven Restriktionen

T := T (x) = {i| xi > 0}

2. Zeige, dass die Teilmatrix AB regulär ist, wenn x extremal in M ist.

a) Nimm’ an, dass sie es nicht ist, d.h. dass die Spalten von AB linear abhängigsind, also ∑

i∈T

AB.iλi = 0,

ABxB =∑i∈T

AB.ixi = b

b) Zeige ∀t ∈ R gilt ∑i∈T

AB.i(xi + tλi) = b

c) Analysiere, ob es ein t∗ gibt, das klein genug ist, damit xi − t∗λ > 0 ist.

d) Folgere aus der Definition von Extremalpunkten, dass x nicht extremal ist.

3. Erweitere die Matrix AT so, dass sie zu einer Basismatrix wird.

4. Folgere, dass x Basispunkt dieser Matrix AB ist.

5

Page 6: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

2 Simplexmethode

2.1 Herleitung

Um die Simplexmethode herzuleiten, müssen folgende Schritte ausgeführt werden.

1. Starte mit einem Basispunkt x für ein lineares Optimierungsproblem in Gleichungs-form.

2. Da x zulässig ist, gilt:Ax = b

3. Stelle das in folgende Form um:

xB = A−1B · b−A−1B ·AN · xN

4. Nun definiere

dk0 :=(A−1B

)k· b

dkj :=(A−1B

)k· (AN ).j

und formuliere obige Form für Komponenten k ∈ B.

5. Setze xB in die Zielfunktion ein

〈c, x〉 = 〈cB, xB〉+ 〈cN , xN 〉

6. Forme um, bis folgende Darstellung erreicht ist

∑k∈B

ckdk0 −∑j∈N

(∑k∈B

ckdkj − cj

)xj

7. Definiere

d00 :=∑k∈B

ckdk0

d0j :=∑k∈B

ckdkj − cj

und setze das ein.

8. Formuliere das lineare Optimierungsproblem um:

max{d00 −∑j∈N

d0jxj | dk0 −∑j∈N

dkjxj ≥ 0, k ∈ B,

xj ≥ 0, j ∈ N}

6

Page 7: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

2.2 Definitionen

Definition 16 (Entartung). Ein Basispunkt heißt entartet, wenn der Wert mindestenseiner Basisvariablen Null ist.

Definition 17 (Lexikographisch positiv). x ∈ Rn heißt lexikographisch positiv (x � 0),wenn die erste von Null verschiedene Komponente von x positiv ist.

x � 0 := ∃i(1 ≤ i ≤ n ∧ xi > 0 ∧ ∀j(j < i→ xj = 0))

Definition 18 (Lexikographisch negativ). x ∈ Rn heißt lexikographisch negativ (x ≺ 0),falls −x � 0.

Definition 19 (Lexikographische Ordnung). Die Relation � (lexikographisch größer)sei definiert als

�: Rn × Rn mit x � y ⇔ x− y � 0

Diese Relation ist

1. irreflexiv (x � x)

2. transitiv (x � y ∧ y � z → x � z)

3. asymmetrisch (x � y → y � x)

4. total (∀x∀y(x, y ∈ Rn → (x � y ∨ y � x)))

5. x � y ⇒ λx � λy,∀λ > 0

und damit eine irreflexive Ordnung.

Definition 20 (Hilfsaufgabe). Die Hilfsaufgabe einer linearen Optimierungsaufgabe mitder Restriktionsmenge

M = {x ∈ Rn| Ax = b, x ≥ 0n}

lautet im Allgemeinen

min{m∑i=1

yi| Ax+ Ey = b, x ≥ 0n, y ≥ 0m}

wobei E die m×m-Identitätsmatrix ist. Die Komponenten des y-Vektors werden künst-liche Variablen genannt.

7

Page 8: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

2.3 Beweise

2.3.1 Klassische Simplexmethode

Satz 3. Wenn ein l ∈ N existiert, so dass d0l < 0 ist, dann kann durch eine Basisänderungder Wert der Zielfunktion erhöht werden.

Beweis. Der Beweis wird unter Benutzung der bekannten Regeln für eine Basisänderunggeführt. Im Skript hatten wir die Regeln an dieser Stelle erst hergeleitet.

1. Sei l ∈ N mit d0l < 0.

2. Die Bedingungen für die Erhöhung von xl sind

∀i ∈ B : xi = di0 − dilxl ≥ 0

3. Leite daraus das Kriterium für Nichtlösbarkeit ab (ZF (x)→∞)

4. Zeige mittels der Kreuzregel, dass der Zielfunktionswert steigt.

2.3.2 Lexikographische Simplexmethode

Satz 4. Wenn alle Zeilen zi, i ∈ B lexikographisch positiv sind, so sind die Zeilen z̃i, i ∈ B̃nach einer Basistransformation ebenfalls lexikographisch positiv.

Beweis. Sei B̃ := (B \ {k})∪{l}, wobei k eine alte Basisvariable und l die neue Basisva-riable ist.

Fall 1. Für die Pivotzeile l gilt

z̃l =1

dklzk

Fall 2. Ansonsten gilt für i ∈ B̃, i 6= l

z̃i = zi −(dildkl

)zk

• Betrachte den Fall dil < 0.

• Falls dil > 0 gilt ∀i ∈ B, i 6= k aufgrund der lexikographischen Auswahlregel, diedie lexikographisch kleinste Zeile wählt

zidil� zkdkl

Satz 5. Die charakteristische Zeile im Simplextableau wächst lexikographisch.

Beweis. Die neue Zeile berechnet sich durch die Kreuzregel

z̃0 = z0 −d0ldkl

zk

8

Page 9: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

3 Dualität

3.1 Definitionen

Definition 21 (Duale Aufgabe). Jedes lineare Optimierungsproblem besitzt eine dualeForm. Folgende drei Definitionen sind äquivalent:

(P ) max{〈c, x〉 | Ax ≤ b, x ≥ 0}(D) min{〈b, y〉 | AT y ≥ c, y ≥ 0}

(P ) max{〈c, x〉 | Ax = b, x ≥ 0}(D) min{〈b, y〉 | AT y ≥ c}

(P ) max{〈c, x〉 | A1x = b1, A2x ≤ b2, x ≥ 0}

(D) min{⟨(

b1b2

),

(v

w

)⟩| AT

1 v +AT2 w ≥ c, w ≥ 0}

Definition 22 (Annäherungsgüte). Die Güte der Annäherung an den optimalen Werteiner linearen Optimierungsaufgabe beträgt:

〈c, x〉 ≤ v ≤ 〈b, y〉v − 〈c, x〉 ≤ 〈b, y〉 − 〈c, x〉︸ ︷︷ ︸

Güte der Annäherung

3.2 Beweise

Satz 6 (Dualitätssatz). Die primale Aufgabe ist genau dann lösbar, wenn die duale lösbarist und die Extremalwerte sind gleich.

Beweis. Wir beweisen die Aufgabe in der Richtung (P ) → (D) für die primale Formaus Definition 2 und folgern dann aus der Äquivalenz der Definitionen, dass die Aus-sage auch für die anderen beiden gilt. Der Beweis ist zu technisch, um in der Prüfungabgefragt zu werden. Die Rückrichtung (D)→ (P ) wird folgendermaßen bewiesen:

1. Betrachte dafür Definition 1 für die duale Aufgabe

min{〈b, y〉 | AT y ≥ c, y ≥ 0}

Schreibe diese Aufgabe um und wende Definition 1 darauf an.

2. Forme die duale Aufgabe der dualen Aufgabe in die primale Form um.

9

Page 10: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

4 Parametrische Optimierung

4.1 Herleitung

Für die parametrische Optimierung sind zwei unterschiedliche Fälle zu betrachten:

max{〈c(t), x〉 | Ax = b, x ≥ 0}c(t) = c(0) + c(1)t, c(0), c(1) ∈ Rn

odermax{〈c, x〉 | Ax = b(0) + b(1)t, x ≥ 0}

Der zweite Fall lässt sich unter Benutzung des dualen Problemes auf den ersten Fallzurückführen, denn

(P ) max{〈c, x〉| Ax = b(0) + b(1)t, x ≥ 0}(D) min{

⟨b(0) + b(1)t, y

⟩| AT y ≥ c}

und die Zielfunktionswerte sind nach dem Dualitätssatz identisch. Wir betrachten alsozunächst nur den Fall, in dem der Parameter in der Zielfunktion steckt. Dazu werdenfolgende Überlegungen durchgeführt:

Falls t = 0 ist, ist der optimale Lösungswert identisch mit dem ohne Parameter. Prin-zipiell ließe sich also das normale Simplexverfahren auf diesen Fall anwenden. Da derZielfunktionswert jedoch von t abhängt, muss die charakteristische Zeile diese Abhän-gigkeit im Prinzip mit berücksichtigen. Allerdings wissen wir, nach welchen Regeln dieseZeile an Basiswechsel angepasst wird: über die Kreuzregel, d. h. statt für ein Pivotele-ment bei ij zu rechnen

d̃0N = d0N −d0j · di0dij

berücksichtigen wir die Abhängigkeit zu t, indem stattdessen

d̃0N = d(0)0N + d

(1)0N · t−

(d(0)0j + d

(1)0j · t) · di0dij

gerechnet wird, wobei die Werte der jeweiligen Einträge in den von t unabhängigen(d(0)) und in den von t abhängigen (d(1)) Teil zerlegt werden. Mit diesem Ansatz lässt

10

Page 11: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

sich der Wert der charakteristischen Zeile separieren.

d̃0N = d(0)0N + d

(1)0N · t−

(d(0)0j + d

(1)0j · t) · di0dij

= d(0)0N + d

(1)0N · t−

di0 · d(0)0j + di0 · d(1)0j · tdij

= d(0)0N −

di0 · d(0)0j

dij+ d

(1)0N · t−

di0 · d(1)0j · tdij

= d(0)0N −

di0 · d(0)0j

dij+

(d(1)0N −

di0 · d(1)0j

dij

)· t

Das heißt, dass die Kreuzregel auf jede der beiden Komponenten der charakteristi-schen Zeile getrennt angewandt werden kann. Also fügen wir eine zweite Zeile für tin das Simplextableau ein und führen die Änderungen durch Basiswechsel für t separatmit.

Nachdem wir also das optimale Tableau für t = 0 gefunden haben, müssen wir unsanschauen, für welche t die Komponenten von d(0)0N noch optimal bleiben, d. h. für welchet die d(0)i + d

(1)i t ≥ 0 bleiben. Für den Grenzfall ergibt das für t

d(0)i + d

(1)i t = 0⇔ t = −

d(0)i

d(1)i

Wir suchen das betragsmäßig kleinste t, das die Optimalität der Lösung zerstört. ImFalle eines positiven d

(1)i handelt es sich dabei um den maximalen Wert (aufgrund des

negativen Vorzeichens), für d(1)i < 0 ist es das Minimum. Die Komponente d(0)i ist positiv,weil das Tableau optimal ist. Auf diese Weise können wir nun eine obere und eine un-tere Intervallgrenze für t angeben, für die die berechnete Lösung optimal bleibt. Wennwir für die rechte Intervallgrenze betrachten, welche Komponente(n) der charakteristi-schen Zeile verletzt wurden, können wir annehmen, dass t diese Grenze überschreitetund mit den verletzten Nichtbasisvariablen einen Basiswechsel durchführen. Dadurchkommen wir zum nächsten Intervall, und analog für die linke Grenze. Da nur endlichviele Basiswechsel vollzogen werden können, ist die Anzahl der Intervalle endlich unddas Verfahren terminiert.

Für den zweiten Fall, in dem der Parameter in den Restriktionen steckt, fügen wirstatt einer zweiten charakteristischen Zeile eine zweite erste Spalte ein (was im dualenFall die zweite charakteristische Zeile wäre) und gehen identisch vor, mit dem einzigenUnterschied, dass wir uns für die Intervallbestimmung anschauen welche Restriktion alserstes verletzt wird (das bedeutet im dualen Problem, wann die Optimalitätsbedingungverletzt wird, da Restriktionen zu Nichtbasisvariablen werden).

11

Page 12: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

5 Transportaufgabe

5.1 Definitionen

Definition 23 (Transportaufgabe (informal)). Gegeben sind n Produzenten Pi und mAbnehmer Aj . Ein beliebig teilbares Gut ist von den Produzenten an die Abnehmer zuminimalen Kosten zu liefern.

Definition 24 (klassische Transportaufgabe). Es seien folgende Daten gegeben:

ai – die Menge des bei Pi produzierten Gutes

bj – der Bedarf des Gutes bei Aj

cij – der Preis für den Transport einer Einheit des Gutes von Pi nach Aj

Dann modelliert folgende lineare Optimierungsaufgabe die klassische Transportaufga-be.

min{n∑

i=1

m∑j=1

cijxij |m∑j=1

xij = ai, ∀i ∈ {1, . . . , n},

n∑i=1

xij = bj , ∀j ∈ {1, . . . ,m},

n∑i=1

ai =

m∑j=1

bj ,

xij ≥ 0, ai ≥ 0, bj ≥ 0}

Die letzte Bedingung heißt Bilanzgleichung.

Definition 25 (Nachbarschaft). Zwei Elemente einer Matrix heißen benachbart, wennsie in der gleichen Zeile oder Spalte stehen.

Definition 26 (Wege). Ein Weg in einer Matrix ist eine Folge benachbarter Elemente.

Definition 27 (Zyklus). Ein Zyklus ist ein Weg mit identischem Start- und Zielpunkt.

Definition 28 (Zusammenhang). Eine Teilmenge T der Elemente einer Matrix heißtzusammenhängend, wenn es zu je zwei Elementen aus T einen Weg in T gibt, der dieseverbindet.

Definition 29 (Transportaufgabe mit Kapazitätsbeschränkung). Die Transportaufgabe

12

Page 13: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

mit Kapazitätsbeschränkungen ist folgendermaßen definiert

min{∑i,j

cijxij |m∑j=1

xij = ai,∀i ∈ {1, . . . , n},

n∑i=1

xij = bj , ,∀j ∈ {1, . . . ,m},

n∑i=1

ai =

m∑j=1

bj ,

xij ≤ kij , kij > 0

xij ≥ 0}

Das ist eine lineare Optimierungsaufgabe der Form

min{〈c, x〉 | A1x = a,

A2x = b,

− x ≥ −k,x ≥ 0}

5.2 Beweise

Lemma 5. Die Lösungen einer Transportaufgabe verändern sich nicht, wenn zu einer Zeileoder Spalte der Kostenmatrix eine Konstante addiert wird.

Beweis. Sei x eine optimale Lösung der Transportaufgabe (T )

min{∑i,j

cijxij | Ax = b, x ≥ 0mn}

und die modifizierte Transportaufgabe (T ∗)

min{∑i,j

(cij + αi + βj) · xij | Ax = b, x ≥ 0mn}

Es ist zu zeigen, dass x auch eine Lösung von T ∗ ist.

1. Betrachte ohne Beschränkung der Allgemeinheit den Fall, dass nur die erste Zeileangepasst wurde, d. h. für einen Wert k sind α1 = k, αi = 0,∀i > 1 und βj = 0, ∀j.

2. Setze in die modifizierte Zielfunktion ein und separiere k vom Rest der Summe.

3. Setze nun den optimalen Wert x ein und nutze die Ungleichung∑i,j

cijxij ≤∑i,j

cijxij , ∀x ∈M

13

Page 14: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

Satz 7 (Charakterisierungssatz). Für eine lineare Optimierungsaufgabe in Gleichungsform

min{〈c, x〉 | Ax = b, x ≥ 0n}

ist ein Punkt x ∈ Rn mit Ax = b genau dann optimal, wenn ein Punkt y ∈ Rm existiert, sodass

1. AT y ≤ c

2. xT (AT y − c) = 0

Beweis. Der Beweis wird in Hin- und Rückrichtung zerlegt.

Fall 1. ⇒

1. Betrachte die duale Aufgabe und folgere die Korrektheit der ersten Bedingung.

2. Multipliziere äquivalent mit yT und benutze die Identität

yT b = bT y

zusammen mit dem Dualitätssatz.

Fall 2. ⇐

1. Wähle einen Punkt y, der die beiden Bedingungen erfüllt, sei außerdem x ∈ Rn einPunkt mit Ax = b.

2. Die erste Bedingung sagt aus, dass y dual zulässig ist, es reicht also aus zu zeigen,dass

bT y = cTx

Korollar 1 (Optimalitätskriterium). Ein Transportplan ist genau dann optimal, wenn∃(uv

), so dass

xij 6= 0→ ui + vj = cij

xij = 0→ ui + vj ≤ cij

Beweis. Nach Satz 7 erfüllen optimale Lösungen die zwei Bedingungen für ein y =(uv

).

Diese Darstellung ergibt Sinn, da die Matrix A für das Transportproblem die spezielleEigenschaft hat, dass in jeder Spalte zwei Einsen in n + m Komponenten sind, wobeieine Eins unter den ersten n Einträgen zu finden ist und eine weitere unter den letz-ten m. Also ist u ein Vektor mit n und v einer mit m Komponenten. Eingesetzt in die

14

Page 15: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

Bedingungen ergibt sich

(1) AT

(u

v

)≤ c

⇒ ui + vj ≤ c

(2) xT (AT

(u

v

)− c) = 0

⇒∑i,j

xij(ui + vj − cij) = 0

Da diese Gleichungen für alle i und j gelten, sind zwei Fälle zu unterscheiden:

Fall 1. xij 6= 0 (xij ist Basisvariable):

⇒∑i,j

xij︸︷︷︸>0

(ui + vj − cij︸ ︷︷ ︸≤0 wegen (1)

) = 0⇔ ui + vj = cij

Fall 2. xij = 0 (xij ist Nichtbasisvariable):

⇒ ui + vj ≤ cij

Lemma 6. Wenn die Menge der Kästchenelemente zusammenhängend ist und in jeder Zeileund Spalte mindestens ein Kästchenelement existiert, dann gibt es einen Zyklus der auseinem Nichtkästchenelement und Kästchenelementen besteht.

Beweis. Betrachte die Kostenmatrix und darin ein beliebiges Nichtkästchenelement undzeige die Aussage unter Benutzung der beiden Eigenschaften.

Lemma 7. Der neue Transportplan x∗ verbessert die Zielfunktion.

Beweis. Teile die Zielfunktion z∗ von x∗ auf in Elemente, die Teil des Zyklus sind undsolche, die es nicht sind. Starte mit

z∗ =∑i,j

cijx∗ij =

∑cij KE

cij /∈ Zyklus

cijx∗ij +

∑cij KE

cij∈ Zyklus

cijx∗ij

Lemma 8. Der neue Transportplan x∗ ist (a) zusammenhängend und (b) enthält in jederZeile und Spalte ein Kästchenelement.

Beweis. Ist recht technisch, deshalb hier nur eine Beweisskizze.

15

Page 16: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

1. Betrachte alle Kästchenelemente des gewählten Zyklus’ und davon die Minusele-mente. Eines davon ist minimal, deshalb ist es nicht Kästchenelement im nächstenTransportplan.

2. Da dieses Element Teil des zweifach zusammenhängenden Zyklus’ ist, ist der neueTransportplan immer noch mindestens einfach zusammenhängend. Demnach giltAussage (a).

3. Weiterhin sind alle anderen Zeilen vom Entfernen des minimalen Minuselementesunberührt, also gilt Aussage (b) für diese weiterhin.

4. Das zu entfernende Element selbst enthält aber noch mindestens einen Nachbarnin der selben Zeile (sonst hätten wir den Zyklus nicht über dieses Element laufenlassen können), also ist auch diese Zeile durch ein Kästchenelement abgedeckt,was Aussage (b) für alle Zeilen zeigt.

5. Für die Spalten ist die Argumentation analog.

Satz 8 (Komplementaritätssatz). Ein Basispunkt x ∈ Rn·m für eine lineare Optimierungs-aufgabe der Form

min{〈c, x〉 | A1x = a,

A2x = b,

− x ≥ −k,x ≥ 0}

ist genau dann optimal, wenn ein y =

uvw

existiert, das folgende Bedingungen erfüllt:

1. AT1 u+AT

2 v − w ≤ c

2. w ≥ 0

3. xT (AT1 u+AT

2 v − w − c) = 0

4. wT (k − x) = 0

Bemerkung. Steht nicht im Skript, sollte aber relativ nahe am Beweis des Charakterisie-rungssatzes liegen. Die duale Form obiger Aufgabe lautet

max{aTu+ bT v − kTw| AT1 u+AT

2 v − w ≤ c, w ≥ 0}

16

Page 17: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

Korollar 2 (Optimalitätskriterium). x ist genau dann ein optimaler Transportplan für eineTransportaufgabe mit Kapazitätsbeschränkungen, wenn

0 < xij < kij → ui + vj = cij

xij = kij → ui + vj ≥ cijxij = 0→ ui + vj ≤ cij

Beweis. Eingesetzt in den Komplementaritätssatz bedeutet das

Fall 1. 0 < xij < kij (xij ist Basisvariable):

⇒ ui + vj − w − cij = 0 ∧ w = 0

⇒ ui + vj = cij

Fall 2. xij = kij (xij ist Basisvariable):

⇒∑i,j

xT︸︷︷︸=kij

· (ui + vj − w − cij)︸ ︷︷ ︸≤0 wegen (1)

= 0 ∧ w ≥ 0

⇒ ui + vj ≥ cij

Fall 3. xij = 0 (xij ist Nichtbasisvariable):

⇒ ui + vj − w ≤ cij ∧ w = 0

⇒ ui + vj ≤ cij

6 Spieltheorie

6.1 Definitionen

Definition 30 (Gewinnfunktion). Die Gewinnfunktion für Spieler k ist eine Funktion

fk :∏i∈I

Si → R

Sie bewertet den Nutzen einer Situation. Alle Spieler wollen diese Funktion im Allge-meinen maximieren.

Definition 31 (Spiel). Ein Spiel ist ein Tripel

Γ =[I, {Si}i∈I , {fi}i∈I

]wobei I die Menge der Spieler, {Si} die Menge der Strategiemengen jedes Spielers und{fi} die Menge der Gewinnfunktionen ist.

17

Page 18: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

Definition 32 (Situation). Eine Situation ist ein Tupel

si ∈∏i∈I

Si

Definition 33 (Annehmbarkeit). Eine Situation s = (s1, . . . , sk, . . . , sn) heißt für einenSpieler k annehmbar, wenn es keine bessere Strategie gibt, die er in der Situation spielenkönnte. Formal gilt:

∀tk ∈ Sk : fk(s1, . . . , sk, . . . , sn) ≥ fk(s1, . . . , tk, . . . , sn)

Definition 34 (Gleichgewichtssituation). Eine Situation heißt Gleichgewichtssituation,wenn sie für alle Spieler annehmbar ist.

Definition 35 (Antagonistisches Spiel). Ein Spiel mit n = 2 heißt antagonistisch, wenndie Summe der beiden Gewinnfunktionen Null ist, bzw.

f1 = −f2

Definition 36 (Optimalitätskriterium). Eine Strategie s1 ∈ S1 ist optimal für Spieler 1,falls es ein s2 ∈ S2 gibt, so dass (s1, s2) eine Gleichgewichtssituation ist.

Definition 37 (Gemischte Erweiterung). Für ein Matrixspiel Γ = [{1, 2}, {S1, S2}, f ] mitden Strategiemengen S1 = {s1, . . . , sm} und S2 = {t1, . . . , tn} und den Mengen

P = {p ∈ Rm|m∑i=1

pi = 1, p ≥ 0m}

Q = {q ∈ Rn|n∑

j=1

qj = 1, q ≥ 0n}

sowie der GewinnfunktionE(p, q) = 〈p,Aq〉

heißt das SpielΓ∗ = [{1, 2}, {P,Q}, E]

gemischte Erweiterung von Γ.Die Gewinnfunktion E(p, q) bezeichnet den erwarteten Gewinn, falls die Spieler 1

und 2 entsprechend der Strategieverteilungen von p und q spielen. Die Matrix A = (aij)entspricht der Gewinnfunktion f(si, tj).

Definition 38 (Wert eines Matrixspieles). Mit dem Wert v(A) eines Matrixspieles Γ wirdder Wert einer Gleichgewichtssituation für die gemischte Erweiterung Γ∗ bezeichnet.

18

Page 19: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

6.2 Beweise

Lemma 9. Für ein antagonistisches Spiel Γ mit mehreren Gleichgewichtssituationen sinddie jeweiligen Strategierepräsentanten austauschbar, d. h. wenn (s1, s2) und (t1, t2) Gleich-gewichtssituationen sind, so sind (s1, t2) und (t1, s2) ebenfalls Gleichgewichtssituationen.

Beweis. Betrachte die Definition einer Gleichgewichtssituation und stelle die Unglei-chungen

f(x, s2) ≤ f(s1, s2) ≤ f(s1, y) ∀x ∈ S1, y ∈ S2f(x, t2) ≤ f(t1, t2) ≤ f(t1, y) ∀x ∈ S1, y ∈ S2

auf und setze s1 und s2 für die freien Variablen ein, um die Aussage abzuleiten.

Lemma 10. Für antagonistische Spiele gilt folgende Äquivalenzaussage:

(s1, s2) ist GGS⇔ maxx∈S1

f(x, s2) ≤ miny∈S2

f(s1, y)

Beweis. Der Beweis wird in Hin- und Rückrichtung zerlegt.

Fall 1. Sei (s1, s2) eine Gleichgewichtssituation.

1. Wende die Definition von Annehmbarkeit für beide Spieler an.

2. Folgere daraus, dass die Strategien s1 und s2 jeweils nicht schlechter als die besteStrategie werden.

maxx∈S1

f(x, s2) ≤ f(s1, s2)

miny∈S2

f(s1, y) ≤ f(s1, s2)

3. Stelle damit die Ungleichung auf.

Fall 2. Sei maxx∈S1 f(x, s2) ≤ miny∈S2 f(s1, y).

1. Nutze den Zusammenhang

maxx∈S1

f(x, s2) ≥ f(a, s2) ∀a ∈ S1

miny∈S2

f(s1, y) ≤ f(s1, b) ∀b ∈ S2

um die Ungleichungmaxx∈S1

f(x, s2) ≥ miny∈S2

f(s1, y)

abzuleiten und folgere die Gleichheit der Werte.

19

Page 20: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

Satz 9 (Hauptsatz über Matrixspiele). Die gemischte Erweiterung eines Spieles Γ besitztimmer eine Gleichgewichtssituation.

Beweis. Die gemischte Erweiterung sei definiert als

Γ∗ = [{1, 2}, {P,Q}, E]

Wir definieren die zwei Funktionen g1 : P → R und g2 : Q→ R wie folgt

g1(p) := miny∈S2

E(p, y)

g2(q) := maxx∈S1

E(x, q)

Diese Funktionen bestimmen für eine Strategie den jeweils schlechtesten Wert, derauftreten kann. Spieler 1 versucht dabei seinen Gewinn zu maximieren, und Spieler 2seinen Verlust zu minimieren. Die Strategien p und q sind genau dann optimal, wenn

maxp∈P

g1(p) = g1(p) ∀p ∈ S1

minq∈Q

g2(q) = g2(q) ∀q ∈ S2

also von allen möglichen Strategien, die Spieler 1 auswählen kann, wählt er die mitdem höchsten Minimalgewinn. Analog für den zweiten Spieler. Da P und Q konvexe,abgeschlossene und beschränkte Polyeder sind, reicht es aus unter der Menge der Ex-tremalpunkte nach einer Lösung für g1 und g2 zu suchen . Aufgrund der Struktur derDefinitionen von P und Q, ist die Eckenmenge eine Menge von Einheitsvektoren im m-bzw. n-dimensionalen Raum, und wegen der Definition von E gilt

E(p, q) = 〈p,Aq〉⇒Ecke E(p, ej) = 〈p,Aej〉 = 〈p,A.j〉

Demnach muss für g1 nur das folgende Minimum über die Spalten von A bestimmtwerden

g1(p) := minj〈p,A.j〉

Um darüber das Maximum für die optimale Lösung zu bilden, formulieren wir diefolgende lineare Optimierungsaufgabe

maxp∈P

g1(p) = max{t ∈ R| 〈p,A.j〉 ≥ t, j ∈ {1, . . . , n}, p ∈ P}

Das Minimum wird dabei implizit gebildet, weil für jeden zulässigen Basispunkt alleUngleichungen erfüllt sein müssen. Analog lässt sich die optimale Strategie für Spieler2 umformen. Im nächsten Schritt zeigt man, dass die beiden Aufgaben dual zueinander

20

Page 21: Lineare Optimierung Prüfungsvorbereitung - hu-berlin.de

sind, um dann mittels des Dualitätssatzes auf die Gleichheit ihrer Zielfunktionswerte zuschließen.

max g1 = min g2

⇒ g1(p) = g2(q)

⇒ minq∈Q〈p,Aq〉 = max

p∈P〈p,Aq〉

⇒ 〈p,Aq〉 ≥ 〈p,Aq〉 ∀p, q

Da p und q beliebig gewählt werden können, ergibt sich als Spezialfall

〈p,Aq〉 ≥ 〈p,Aq〉︸ ︷︷ ︸annehmbar für Spieler 2

= 〈p,Aq〉 ≥ 〈p,Aq〉︸ ︷︷ ︸annehmbar für Spieler 1

Also ist (p, q) eine Gleichgewichtssituation.

21