Manfred Börgens Mathematische Probleme # 111 |
Liste aller Probleme mit Lösungen voriges Problem nächstes Problem |
zur Leitseite |
Zwei Umschläge
Die Lösung steht im unteren Teil der Seite.
Hier kommt eine Variante des Two Envelopes Paradox (auf Deutsch manchmal mit Umtauschparadoxon übersetzt). Allen Versionen dieses Problems (das in Wahrheit kein Paradoxon ist) liegt zugrunde, dass Spieler A zwei verschiedene Geldbeträge in zwei (danach verschlossene) gleiche Umschläge steckt, Spieler B einen der beiden Umschläge öffnet und dann entscheiden kann, ob er den darin enthaltenen Betrag behält oder statt dessen den Inhalt des anderen Umschlags wählt (ohne ihn gesehen zu haben).
Im Kongress-Magazin des ICM 2018 wurde eine spezielle Variante des Two Envelopes Paradox diskutiert, in der nur A ein wirklicher "Spieler" ist (also auswählen darf, welche Beträge er in die Umschläge füllt), während B eine Strategie für "Behalten oder Tauschen" durch einen Zufallsalgorithmus vorgegeben wird, der auch A bekannt ist. Da dieses Problem seinen Fokus auf das Verhalten von A legt, entspricht es nicht dem klassischen Two Envelopes Paradox, in welchem es vor allem auf die optimale Strategie des Spielers B ankommt. - Hier soll nun das Problem vom ICM "umgedreht" werden: A spielt eine passivere Rolle, B kann entscheiden.
Nun zunächst zu den Randbedingungen, wie sie im ICM-Magazin beschrieben wurden. Die beiden Umschläge enthalten die ganzzahligen Beträge i und j , o.E. i < j , mit i, j ∈ {0, 1, ..., n}, n ∈ N . n ist fest gewählt und beiden Spielern vorab bekannt. - Die Strategie für B wird - wie üblich beim Two Envelopes Paradox - durch eine Schwelle x bestimmt. Er tauscht die Umschläge genau dann, wenn er im ersten Umschlag einen Betrag ≤ x findet.
Bis hierhin folgen wir dem ICM-Problem. Dort geht es so weiter: B wählt x zufällig und mit gleicher Wahrscheinlichkeit aus den halbzahligen Werten 1/2, 3/2, ..., n - 1/2 aus. A kennt diese (Zufalls-)Strategie. B erzielt den höheren Betrag j mit Wahrscheinlichkeit p > 1/2 . Für A gibt es eine optimale Strategie zur Minimierung von p , nämlich j = i+1 . Soweit zum ICM-Problem (hier in verkürzter Form). Wir werden im Folgenden einem anderen Ansatz folgen.
Die Zufälligkeit soll jetzt mit der Wahl von (i,j) durch A ins Spiel kommen. A wählt mit gleicher Wahrscheinlichkeit ein Paar (i,j) aus den n(n+1)/2 Möglichkeiten aus. B dagegen ist frei in der Wahl von x ∈ {1/2, 3/2, ..., n - 1/2}.
Aufgabe 1
Die Wahrscheinlichkeit p , den höheren Betrag j zu erzielen, wurde bereits bei der ICM-Variante eingeführt. Berechnen Sie p in Abhängigkeit von x .
Aufgabe 2
Berechnen Sie die optimale Schwelle xopt , mit der B für p aus Aufgabe 1 den maximalen Wert pmax erzielt. - Bei der Gelegenheit können Sie auch noch pmin berechnen.
Aufgabe 3
Berechnen Sie den Erwartungswert E für die Auszahlung an B in Abhängigkeit von x .
Aufgabe 4
Berechnen Sie die optimale Schwelle x'opt , mit der B für den Ertrag E aus Aufgabe 3 den maximalen Wert Emax erzielt. - Bei der Gelegenheit können Sie auch noch Emin berechnen.
Aufgabe 5
Zeigen Sie, dass es für große n bei der Wahl der Schwelle "nicht so genau darauf ankommt": Wenn nämlich B in den Aufgaben 2 und 4 statt der optimalen Schwelle eine Schwelle xopt ± h bzw. x'opt ± h mit festem h ∈ N wählt (was natürlich nur für genügend große n einen Sinn ergibt), so ändern sich die Grenzwerte (mit wachsendem n ) in den Aufgaben 2 und 4 nicht.
Zur Vereinfachung soll im Folgenden (i,j) sowohl für das Zahlenpaar als auch für das offene reelle Intervall stehen können.
⌈x⌉ steht für ganzzahliges Aufrunden, ⌊x⌋ für ganzzahliges Abrunden.
Aufgabe 1
Berechnen Sie die Wahrscheinlichkeit p , den höheren Betrag j zu erzielen, in Abhängigkeit von x .
Es gibt n(n+1)/2 Möglichkeiten für die Paare (i,j). Für i gibt es ⌈x⌉ (= x + 1/2) und für j gibt es n+1-⌈x⌉ Möglichkeiten. Insgesamt überdecken also ⌈x⌉(n+1-⌈x⌉) Intervalle (i,j) ein vorgegebenes x .
Wir wollen mit q die Wahrscheinlichkeit bezeichnen, dass x zwischen i und j liegt. In diesem Fall erzielt B den höheren Betrag j mit Wahrscheinlichkeit 1 , in allen anderen Fällen mit Wahrscheinlichkeit 1/2 . Also gilt:
p = q +(1-q)/2 = 1/2 + q/2 mit q = 2⌈x⌉(n+1-⌈x⌉)/(n2+n)
p = 1/2 + ⌈x⌉(n-⌊x⌋)/(n2+n)
Beispiel : n = 10, x = 7,5 ⇒ p ≈ 0,7182
Aufgabe 2
Berechnen Sie die optimale Schwelle xopt , mit der B für p aus Aufgabe 1 den maximalen Wert pmax erzielt. - Bei der Gelegenheit können Sie auch noch pmin berechnen.
Für B ist es offenbar günstig, wenn x durch möglichst viele Intervalle (i,j) überdeckt wird. Man kann also vermuten, dass xopt möglichst mittig im Intervall (0,n) liegen muss, um p zu maximieren.
Es genügt, statt p die Funktion y = ⌈x⌉(n-⌊x⌋) = (x+1/2)(n+1/2-x) zu betrachten. Diese Funktion beschreibt eine konkave Parabel mit den Nullstellen -1/2 und n+1/2 . Das Maximum der Parabel liegt mittig dazwischen, also bei n/2 . Da x halbzahlig sein soll, erhalten wir:
xopt = n/2 für n ungerade
xopt1 =(n-1)/2 oder xopt2 =(n+1)/2 für n gerade
Die anfängliche Vermutung erweist sich somit als richtig.
y(xopt) = (n+1)2/4 für n ungerade
y(xopt) = n(n+2)/4 für n gerade
Daraus ergibt sich
pmax = 3/4 + 1/(4n) für n ungerade
pmax = 3/4 + 1/(4(n+1)) für n gerade
Mit wachsendem n hat pmax den Grenzwert 3/4 . B erzielt den höheren Betrag in mehr als 75 % aller Spiele.
Wegen der parabolischen Abhängigkeit erhält man pmin für x = 1/2 und x = n - 1/2 .
pmin = 1/2 + 1/(n+1)
Aufgabe 3
Berechnen Sie den Erwartungswert E für die Auszahlung an B in Abhängigkeit von x .
Wir wählen den folgenden Lösungsweg: Zunächst rechnen wir die durchschnittliche Auszahlung für den Fall der vollständigen Zufälligkeit aus; d.h. B setzt sich keine Schwelle x und entscheidet sich rein zufällig für einen der beiden Umschläge. (Es wird uns nicht überraschen, dass dieser Durchschnitt gleich n/2 ist.) Danach schauen wir uns diejenigen Fälle an, in denen B durch die Setzung der Schwelle eine höhere Auszahlung erzielt, was dann auch zu einem höheren Gesamtdurchschnitt führt.
Bei reiner Zufälligkeit für die Wahl der Umschläge hat B im Mittel (i+j)/2 für die Auszahlung zu erwarten. Betrachtet man zunächst nur die Paare (i,j) mit j-i = m , mit festem m ∈ {1,...,n}, so ist die durchschnittliche Auszahlung i+m/2 . Es gibt n-m+1 solcher Paare; damit erhält man:
Durchschnittliche Auszahlung bei Zufallsauswahl :
Σi=0..n-m(i+m/2)/(n-m+1) = ((n-m+1)(n-m)/2 +(n-m+1)m/2)/(n-m+1) = n/2
Dieser Durchschnittswert ist unabhängig von m . B hat also gewissermaßen eine mittlere Auszahlung von n/2 "sicher", wenn er alles dem Zufall überlässt.
Nun zu den zusätzlichen Erträgen, die sich durch die Setzung der Schwelle x ergeben. Hierfür sind die Paare (i,j) mit i < x < j zu betrachten. Der Ertrag ist dann j ; dies ist (j-i)/2 mehr als bei den eben verwendeten (i+j)/2 . Wir summieren alle diese zusätzlichen Erträge auf :
Σj=⌈x⌉..n Σi=0..⌊x⌋(j-i)/2 = Σj=⌈x⌉..n (j ⌈x⌉/2 - ⌈x⌉ ⌊x⌋/4) = (⌈x⌉/4)·((n+1)n - ⌈x⌉ ⌊x⌋ - n ⌊x⌋ + ⌊x⌋2) = (n+1)⌈x⌉(n - ⌊x⌋)/4
Für E muss über alle (n+1)n/2 Paare (i,j) gemittelt werden:
E = n/2 + ⌈x⌉(n - ⌊x⌋)/2n
Beispiel : n = 10, x = 7,5 ⇒ E = 6,2
Aufgabe 4
Berechnen Sie die optimale Schwelle x'opt , mit der B für den Ertrag E aus Aufgabe 3 den maximalen Wert Emax erzielt. - Bei der Gelegenheit können Sie auch noch Emin berechnen.
Wie in Aufgabe 2 genügt es, statt E die Funktion y = (x+1/2)(n+1/2-x) zu betrachten. Das Maximum liegt also bei:
x'opt = n/2 für n ungerade
x'opt1 =(n-1)/2 oder x'opt2 =(n+1)/2 für n gerade
Das ist das gleiche Ergebnis wie bei Aufgabe 2: x'opt = xopt . Daraus ergibt sich yopt wie in Aufgabe 2 und Emax = n/2 +(n+1)2/(8n) für n ungerade und Emax = n/2 + n(n+2)/(8n) für n gerade. Das lässt sich vereinfachen:
Emax = 5n/8 + 1/4 + 1/(8n) für n ungerade
Emax = 5n/8 + 1/4 für n gerade
Die von B angewendete Strategie lässt ihn also ca. 25 % mehr erhalten, als wenn er rein zufällig einen Umschlag wählt.
Wegen der parabolischen Abhängigkeit erhält man Emin für x = 1/2 und x = n - 1/2 .
Emin = (n+1)/2
Aufgabe 5
Wenn B eine Schwelle xopt ± h mit festem h ∈ N wählt (was natürlich nur für genügend große n einen Sinn ergibt), so ändern sich die Grenzwerte (mit wachsendem n ) in den Aufgaben 2 und 4 nicht.
In den Aufgaben 2 und 4 wurde die Funktion y definiert.
y(xopt ± h) = (n+1)2/4 - h2 ⇒ p = pmax - h2/(n2+n) und E = Emax - h2/(2n) für n ungerade
y(xopt1 ± h) = y(xopt2 ∓ h) = n(n+2)/4 ± h - h2 ⇒ p = pmax - (h2 ∓ h)/(n2+n) und E = Emax - (h2 ∓ h)/(2n) für n gerade
Mit wachsendem n strebt dieses p wieder gegen 3/4 , und E liegt auch hier mehr als 25 % höher als bei zufälliger Wahl des Umschlags.
Publiziert 2020-06-18 Stand 2019-01-07
voriges Problem | Liste aller Probleme mit Lösungen | nächstes Problem