Manfred Boergens - Problem 53 mit Loesung

Manfred Börgens
Mathematische Probleme # 53

Liste aller Probleme mit Lösungen
voriges Problem nächstes Problem

Wieviele Spiele ?

Die Lösung steht im unteren Teil der Seite.

Im Monatsproblem Juli/August 2001 wurde die Frage diskutiert, bei welcher Anzahl von Spielen der schwächere Spieler die besten Aussichten auf den Gesamtsieg hat. Das Resultat kann man so zusammenfassen:

Zwei Spieler bestreiten eine Serie von Einzelpartien, die kein Unentschieden zulassen. Die Spielstärke der beiden ist nicht gleich: Der schwächere Spieler gewinnt mit Wahrscheinlichkeit p < 1/2 , der stärkere mit q > 1/2 .

Falls eine ungerade Anzahl N = 2n + 1 von Spielen vereinbart wird, sinkt die Chance für den Gesamtsieg des schwächeren Spielers streng monoton mit wachsendem n . Er hätte also die besten Aussichten, wenn nur ein einziges Spiel stattfände (d.h. n = 0 ).

Für dieses Problem gibt es eine interessante Verallgemeinerung, deren Lösung nicht so leicht vorhersehbar ist wie im oben dargestellten Fall. Es soll nämlich jetzt auch eine gerade Anzahl N = 2n von Spielen erlaubt sein. Dann können natürlich auch Unentschieden bei der Gesamtwertung vorkommen.

Bei den folgenden Fragen soll der Spieler A jede Einzelpartie mit Wahrscheinlichkeit p gewinnen ( 0 < p < 1 ) und sein Gegner B mit Wahrscheinlichkeit q = 1 - p .

1.
Sei N eine beliebige natürliche Zahl. Wie groß ist die Chance von A auf Sieg, Unentschieden und Niederlage in der Gesamtwertung?

2.
Sei N eine beliebige natürliche Zahl. Für welches N sind die Aussichten von A auf den Gesamtsieg am besten?

Nun kommt die Kernfrage - mit einer nur schwer zu erratenden Lösung.
3.
Sei N gerade. Für welches N sind die Aussichten von A auf den Gesamtsieg am besten?

4.
Diskutieren Sie das Monotonie- und Grenzwertverhalten der Wahrscheinlichkeiten für Sieg, Unentschieden und Niederlage.
Tipp: Wenden Sie einen der Grenzwertsätze der Wahrscheinlichkeitsrechnung an.

5.
Eine naheliegende Variante entsteht durch die "Neutralisierung" der Unentschieden. Was ändert sich bei den Fragen 2 - 4, falls Unentschieden nicht gewertet werden?
Das kann man sich so vorstellen: Gewinnt A, erhält er einen Euro; verliert er, zahlt er einen Euro; bei Unentschieden fließt kein Geld. Wie maximiert A seinen Ertrag?

6.
Eine weitere Variante ergibt sich aus der Änderung der Spielregel: Was ändert sich bei den Fragen 2 - 4, falls auch ein Unentschieden schon zum Gesamtsieg von A ausreicht?

Lösung

Zu 1.

Die Anzahl der Siege für A ist binomialverteilt mit den Parametern N und p . Die Wahrscheinlichkeit w_N für seinen Gesamtsieg in N Spielen ist dann die Summe der Wahrscheinlichkeiten für mehr als N/2 Siege. Sowohl für gerade N = 2n als auch für ungerade N = 2n + 1 sind das mindestens n + 1 Siege. Also gewinnt A mit folgender Wahrscheinlichkeit:

W'keit fuer Sieg des Schwaecheren

Ein Unentschieden kann nur für gerade N vorkommen, und zwar mit der folgenden Wahrscheinlichkeit:

W'keit fuer Unentschieden

Daraus ergibt sich die Wahrscheinlichkeit für eine Niederlage von A:

W'keit fuer Niederlage von A

Ein Beispiel:
Gewinnt ein Spieler im Mittel 40 % aller Spiele und vereinbart mit seinem Gegner 15 Partien, so beträgt seine Chance auf den Gewinn der Serie nur 21,31 %. Werden 16 Partien vereinbart, so sinken seine Gewinnchancen auf 14,23 %; die Serie würde in 14,17 % aller Fälle unentschieden enden.

Zu 2.

Für ungerade N können wir die Ergebnisse aus dem Monatsproblem Juli/August 2001 heranziehen. Bei p = 1/2 spielt die Anzahl der Spiele keine Rolle, alle w_N = w_2n+1 sind dann identisch gleich 1/2 . Für p < 1/2 fällt die Folge der w_N  = w_2n+1 streng monoton mit wachsendem n , also liegt das Optimum bei N = 1 . Für p > 1/2 wächst w_N = w_2n+1 streng monoton mit wachsendem n , also gibt es kein Optimum; für einen solchen Spieler würde gelten: Je mehr Spiele, desto besser.

Lässt man beliebige N zu, so zeigt eine leichte Überlegung, dass die Chance auf einen Sieg in einer geraden Anzahl von Partien immer kleiner ist als bei den benachbarten ungeraden Anzahlen, d.h. es gilt w_2n+1 > w_2n+2 < w_2n+3 für alle n . Zur ersten Ungleichung: Liegt man nach 2n + 1 Partien im Rückstand, so kann man maximal ein Unentschieden erreichen; führt man aber mit genau n + 1 Siegen, kann man den Gesamtsieg mit einer Niederlage in der (2n + 2)-ten Partie verspielen. Zur zweiten Ungleichung: Nach 2n + 2 gespielten Partien behält A auf jeden Fall seine Führung oder seinen Rückstand auch in der folgenden Partie; aber ein Unentschieden lässt sich in eine Führung verwandeln. - Generell sollte man also eine ungerade Anzahl von Spielen bevorzugen, und zwar möglichst viele bei p > 1/2 und möglichst wenige bei p < 1/2 .

Das wichtigste Resultat in diesem Abschnitt ist somit: Die Chancen des schwächeren Spielers, also bei p < 1/2 , sind am größten, wenn nur ein einziges Spiel stattfindet: N = 1 .

Zu 3.

Wir betrachten eine Serie von N + 2 = 2n + 2 Spielen. Mit Wahrscheinlichkeit p₁ "dreht" sich das Gesamtergebnis in den letzten beiden Spielen zugunsten von A, nämlich wenn er genau n Siege aus den ersten N Spielen erzielt hat und dann die beiden letzten Spiele gewinnt. Mit Wahrscheinlichkeit p₂ "dreht" sich das Gesamtergebnis in den letzten beiden Spielen zuungunsten von A, nämlich wenn er genau n + 1 Siege aus den ersten N Spielen erzielt hat und dann die beiden letzten Spiele verliert. In allen anderen Fällen, also mit Wahrscheinlichkeit 1 - p₁ - p₂ , gewinnt A genau dann in N + 2 Spielen, wenn er in N Spielen gewinnt. Wir gehen vor wie im Monatsproblem Juli/August 2001 und berechnen p₁ - p₂ :

Formel fuer p1-p2

Am Ende wurde zur Abkürzung r= ¹/_1-2p gesetzt. Für das Vorzeichen von p₁ - p₂ müssen also N und r - 1 verglichen werden.

p = 1/2
Hier muss natürlich die letzte Zeile der Berechnung weggelassen werden. Aus der dritten Zeile geht hervor, dass p₁ - p₂ > 0 . Also wächst w_N streng monoton mit wachsendem (geradem) N .

p > 1/2
B und r sind dann negativ. Deshalb gilt auch hier: p₁ - p₂ > 0 , und w_N wächst streng monoton mit wachsendem (geradem) N .

p < 1/3
Dann ist r < 3 und p₁ < p₂ für alle N = 2n . Also fällt w_N streng monoton mit wachsendem (geradem) N .

p = 1/3
Dann ist r = 3 und p₁ = p₂ für N = 2 , p₁ < p₂ für N > 2 . Also ist w₂ = w₄ und ab w₄ fällt die Folge der w_N = w_2n streng monoton.

1/3 < p < 1/2
1. Fall: r ist keine ungerade natürliche Zahl. Dann ist p₁ > p₂ für N < r - 1 und p₁ < p₂ für N > r - 1 . Also wächst die Folge w_N = w_2n erst streng monoton bis zu einem Maximum und fällt dann streng monoton. Das größte N mit N < r - 1 ist gleich [r] - 1 , falls [r] ungerade, und gleich [r] - 2 , falls [r] gerade ( [.] Gaußklammer). Da der "letzte" Anstieg in der Folge von diesem N nach N + 2 erfolgt (siehe Definition p₁ - p₂ ), liegt das Maximum der w_N bei [r] + 1 (falls [r] ungerade) bzw. bei [r] (falls [r] gerade).
2. Fall: r ist natürlich und ungerade. Für N = r - 1 ist p₁ = p₂ , also w_N = w_N+2 . Für N < r - 1 und N > r - 1 gilt wieder p₁ > p₂ bzw. p₁ < p₂ wie im 1. Fall. Das Maximum der Folge der w_N liegt somit bei N = r - 1 und N = r + 1 .

Das interessante Hauptergebnis ist:
Die optimale (gerade) Anzahl N von Spielen für den schwächeren Spieler hängt von seiner Spielstärke p ab. Für p > 1/3 ist das optimale N nicht das minimale N , sondern ein N > 2 oder zwei benachbarte Werte von N .

Zusammenfassung
Für eine gerade Anzahl N von Spielen und p ≥ 1/2 gibt es kein optimales N ; hier heißt die Devise: Je mehr Partien, desto besser. Für p < 1/2 und r = ¹/_1-2p ist das gesuchte optimale N , das w_N maximiert:

N_opt  =   2                 p < 1/3        2 und 4           p = 1/3        [r]               p > 1/3, [r] gerade        [r] + 1           p > 1/3, [r] ungerade, r nicht natürlich        r - 1 und r + 1   p > 1/3, r natürlich und ungerade

Aus p = 1/3 folgt r = 3 , und aus p < 1/3 folgt r < 3 . Andererseits ist immer r > 1 . Damit lässt sich die Zusammenfassung für p < 1/2 komprimieren:

N_opt  =   [r]               [r] gerade        [r] + 1           [r] ungerade, r nicht natürlich        r - 1 und r + 1   r natürlich und ungerade

Bemerkung: Zwei optimale Werte für N kommen vor, wenn r positiv und ungerade ist. Beispiele gewinnt man aus p = ^(r-1)/2/_r , also z.B. p = 12/25 = 0.48 .

Beispiel: Hat ein Spieler die Spielstärke p = 0.42 , so beträgt für ihn die optimale Spieldauer 6 Partien; er gewinnt dann die Serie mit der (maximal möglichen) Wahrscheinlichkeit von 20,8 % .

Zu 4.

Das Monotonieverhalten von w_N ergibt sich direkt aus den Überlegungen zu 2 und 3. In der Tabelle wird der Einfachheit halber bei "wachsend" und "fallend" der Zusatz "streng monoton" weggelassen.

Monotonie von `w_N`	`p` `<` `1/2`	`p` `=` `1/2`	`p` `>` `1/2`
`N` ungerade	fallend	gleich	wachsend
`N` gerade	`p` `<` `1/3` : fallend `p` `=` `1/3` : `w₂` `=` `w₄` , dann fallend `p` `>` `1/3` : erst wachsend, dann fallend falls `r` ungerade : 2 Maxima	wachsend	wachsend
`N` beliebig	oszillierend	oszillierend	oszillierend

Einige Beispiele sollen grafisch dargestellt werden (optimale Werte für N gerade in Rot):

Waagerechte Achse: N
Senkrechte Achse: W'keit für Sieg von A

Grafik fuer p=.29
p = 0.29

Grafik fuer p=.4
p = 0.4

Grafik fuer p=.45
p = 0.45

Grafik fuer p=.5
p = 0.5

Grafik fuer p=.55
p = 0.55

Das Monotonieverhalten von u_N für gerade N = 2n hängt nicht von p ab; u_N fällt immer streng monoton. Dies zeigt sich, wenn man u_N+2/u_N ausrechnet:

Formel fuer u_N+2/u_N

Das Monotonieverhalten von v_N ergibt sich aus den Überlegungen zu w_N . Denn der Spieler A verliert genau dann, wenn der Spieler B gewinnt; dieser Fall erfordert in der Tabelle für w_N die Ersetzung von p durch q = 1 - p und entsprechend von r durch r'=¹/_1-2q . Damit ergibt sich die folgende Übersicht:

Monotonie von `v_N`	`p` `<` `1/2`	`p` `=` `1/2`	`p` `>` `1/2`
`N` ungerade	wachsend	gleich	fallend
`N` gerade	wachsend	wachsend	`p` `>` `2/3` : fallend `p` `=` `2/3` : `v₂` `=` `v₄` , dann fallend `p` `<` `2/3` : erst wachsend, dann fallend falls `r'` ungerade : 2 Maxima
`N` beliebig	oszillierend	oszillierend	oszillierend

Für das Grenzwertverhalten der berechneten Wahrscheinlichkeiten werden wir eine Lösung mit Hilfe eines einfachen Grenzwertsatzes angeben. Vorher jedoch soll die Approximation der Binomialverteilung durch die Normalverteilung herangezogen werden, um näherungsweise einen ersten Überblick zu gewinnen. Die Binomialverteilung B mit den Parametern N, p wird für große N durch die Normalverteilung N_μ,σ2 mit den Parametern μ = N·p und σ² = N·p(1-p) = N·p·q approximiert. Insbesondere gilt dann:

Approximation der Binomialverteilung durch die Normalverteilung

Daraus folgt:

w-N mit Approximation der Binomialverteilung durch die Normalverteilung

Wir betrachten nun die untere Integrationsgrenze; zur Abkürzung wird D = (2pq)^-1/2 gesetzt:

Grenzwert von w_N

Grenzwert von u_N

Der Grenzwert für v_N ist dann offensichtlich; man muss nur bei w_N "kleiner" und "größer" vertauschen.

Nun soll ein exakter Beweis für diese Grenzwerte gegeben werden. Dafür geben wir zunächst einen der Grenzwertsätze der Wahrscheinlichkeitsrechnung und die Stirling'sche Formel an:

Grenzwertsatz

X_k seien Zufallsvariable mit Erwartungswert μ und Standardabweichung σ . Die Zufallsvariable S_N sei das arithmetische Mittel ( X₁ + ... + X_N )/ N . Dann gilt für N -> ∞ :

lim p(| S_N - μ | ≥ ε ) = 0 für alle ε > 0 .

Stirling'sche Formel

n! = (2 π n)^1/2·nⁿ·e^-n·δ mit 1 ≤ δ ≤ e^1/12n

Setzt man X_k = 1 , falls Spieler A das k-te Spiel gewinnt, und X_k = 0 , falls A das k-te Spiel verliert, so ist μ = p , und S_N gibt den relativen Anteil von Siegen von A in N Spielen an.

p < 1/2
w_N = p( X₁ + ... + X_N > N/2 ) = p( S_N > 1/2 ) ≤ p(|S_N - p| > 1/2 - p ) .
Nach dem Grenzwertsatz gilt für N -> ∞   lim p(w_N) = 0 .

p > 1/2
w_N = 1 - p( X₁ + ... + X_N ≤ N/2 ) = 1 - p( S_N ≤ 1/2 ) ≥ 1 - p(|S_N - p| ≥ p - 1/2 ) .
Nach dem Grenzwertsatz gilt für N -> ∞   lim p(w_N) = 1 .

p = 1/2
Für N ungerade ist w_N = 1/2 wegen der Symmetrie der Binomialverteilung bei p = 1/2 . Für N gerade betrachten wir zuerst die Wahrscheinlichkeit für ein Unentschieden:

Formel fuer u_N bei p=.5

Daraus folgt für N -> ∞ lim p(u_N) = 0 und wegen der Symmetrie der Binomialverteilung lim p(w_N) = 1/2 .

Zusammengefasst gilt für N -> ∞ :

lim p(w_N) =  0    p < 1/2
         = 1/2   p = 1/2
         =  1    p > 1/2

lim p(u_N) =  0

lim p(v_N) =  1    p < 1/2
         = 1/2   p = 1/2
         =  0    p > 1/2

Zu 5.

Hier ist die Antwort einfach, denn der erwartete Ertrag ist in 2n + 1 Spielen der gleiche wie in 2n + 2 Spielen; die Folge der Erträge in Abhängigkeit von N ist monoton mit paarweise gleichen Werten. Begründung: Nur wenn A von den ersten 2n + 1 Spielen genau n oder n + 1 gewonnen hat, kann sich im nächsten Spiel für ihn noch etwas ändern, nämlich dass die Gesamtserie von 2n + 2 Spielen Unentschieden ausgeht. Analog zu den Überlegungen unter 3 trete der erste Fall mit Wahrscheinlichkeit p₁ (Gewinn 1 Euro) und der zweite mit p₂ (Verlust 1 Euro) auf. Dann ist (man beachte die Gleichheit der beiden Binomialkoeffizienten):

Formel fuer p1-p2

Der erwartete Ertrag ist für N = 2n + 1 und N = 2n + 2 : 1·w_2n+1 + (-1)·w_2n+1 = 2·w_2n+1 -1 . Monotonie- und Grenzwertverhalten folgen also im Wesentlichen (d.h. bis auf paarweise Gleichheit der Folgenglieder) dem Fall N ungerade in 2 - 4.

Der schwächere Spieler sollte also möglichst wenige, der stärkere möglichst viele Partien anstreben.

Für p = 0.33 wird das Ergebnis - also der erwartete Ertrag für Spieler A - grafisch dargestellt:

Grafik fuer p=.45
p = 0.33

Zu 6.

In 2 - 4 wurde das Spiel aus der Sicht des Spielers A betrachtet. Dort war nur nach seiner Siegchance in einer Serie von N Spielen gefragt. Das bedeutet aber, dass die Gegenwahrscheinlichkeit sowohl für den Sieg seines Gegners B als auch für ein Unentschieden steht. Somit müssen wir hier lediglich die Resultate von 2 - 4 heranziehen, dort 1-p statt p , r'=¹/_1-2q statt r und statt der berechneten Wahrscheinlichkeiten für den Gesamtsieg deren Gegenwahrscheinlichkeiten einsetzen. Damit kehrt sich vor allem die Monotonierichtung um; insbesondere sind dann bei der Oszillation für ungerade und gerade N die Werte für gerade N die höheren. Die Grenzwerte ergeben sich aus 4. Man kann dies in einer Tabelle zusammenfassen, aus der auch die optimalen N hervorgehen:

	`p` `<` `1/2`	`p` `=` `1/2`	`p` `>` `1/2`
`N` ungerade	fallend gegen `0`	gleich ( `1/2` )	wachsend gegen `1`
`N` gerade	fallend gegen `0`	fallend gegen `1/2`	`p` `>` `2/3` : wachsend gegen `1` `p` `=` `2/3` : `w₂` `=` `w₄` , dann wachsend gegen `1` `p` `<` `2/3` : erst fallend, dann wachsend gegen `1` falls `r'` ungerade : 2 Minima
`N` beliebig	oszillierend gerade `N` günstiger Grenzwert `0`	oszillierend gerade `N` günstiger Grenzwert `1/2`	oszillierend gerade `N` günstiger Grenzwert `1`

Ein Beispiel soll grafisch dargestellt werden:

Grafik fuer p=.56
p = 0.56

Publiziert 2005-12-30 Stand 2005-07-03

voriges Problem | Liste aller Probleme mit Lösungen | nächstes Problem

Manfred Börgens | zur Leitseite