Manfred Börgens
Mathematische Probleme  # 130
Liste aller Probleme mit Lösungen
voriges Problem      nächstes Problem
zur Leitseite


Wieviele Kugeln enthält die Urne ?

          Die Lösung steht im unteren Teil der Seite.

Eine Urne enthalte \(~n~\) weiße und \(~n~\) schwarze Kugeln. Es werden  –  in Unkenntnis von \(~n\)  –  zufällig \(~m~\) Kugeln gezogen, von denen sich \(~n_1~\) als weiß und \(~n_2~\) als schwarz herausstellen. Welche Rückschlüsse lassen sich daraus für \(~n~\) ziehen?

Das soll präzisiert werden: \(~m=n_1+n_2 \gt 0~\) und \(~n_i~\) mit \(~n_i \ge 0~\) werden als bekannt vorausgesetzt. Es soll die Wahrscheinlichkeit \(~p_n~\) analysiert werden, mit der bei Ziehung von \(~m~\) Kugeln aus \(~2_~n~\) Kugeln (davon gleich viele weiß und schwarz) \(~n_1~\) weiß und \(~n_2~\) schwarz sind.

Haben die \(~p_n~\) einen Grenzwert für \(~n \rightarrow \infty~\)?

Insbesondere interessiert uns die Frage, ob es ein \(~n~\) gibt, für das \(~p_n~\) maximal wird (engl. "best guess for \(~n~\)"). Falls ja, ist dieses \(~n~\) eindeutig?

Für genügend große \(~n_i~\) ist die Lage des Maximums der \(~p_n~\) einfach zu bestimmen: Sein Abstand zum minimal möglichen \(~n~\) ist dann konstant.



Lösung



Eine stark vereinfachte Version dieses Problems erschien am 17.6.2022 in  The Riddler  auf der Website  FiveThirtyEight ;  die Lösung erschien am 24.6.2022.  –  Die zentrale Frage nach dem Maximum der \(~p_n~\) ist dort formuliert als  What is your best guess for the original number of balls in the urn ?

Der Definitionsbereich für \(~n~\) ist \(~\{n \in \text{N}~|~n \ge n_0\}~~~\text{mit}~~~n_0 = max_~\{n_1,n_2\}~\).

\(p_n~\) ergibt sich nach dem  hypergeometrischen Modell  zu: \[p_n = \frac{\binom{n}{_~n_{1~}}\binom{n}{_~n_{2~}}}{\binom{2_~n}{_~n_{1~}+_~n_{2~}}}\] Im Grenzwert geht das hypergeometrische Modell über zum binomialen Modell mit der Wahrscheinlichkeit \(~1/2~\) für jede einzelne Ziehung einer weißen oder schwarzen Kugel: \[\lim_{n \to \infty}~p_n = \binom{n_1+n_2}{n_1}\left(\frac{1}{2}\right)^{n_1~+~n_2}\]
Um Monotonieverhalten und Extrema der Folge \((p_n)_{_~n_~\ge _~ n_0}~\) zu ermitteln, betrachten wir den Bruch \(~p_n/p_{n+1}~\) nach dem Kürzen: \[\frac{p_n}{p_{n+1}} = \frac{2_~(n+1-n_1)_~(n+1-n_2)_~(2_~n+1)}{(n+1)_~(2_~n+1-n_1-n_2)_~(2_~n+2-n_1-n_2)} = \frac{q_n}{q_{n+1}}~~~~\rightarrow~1~~~~\text{für}~~n\rightarrow\infty\] Mit \(~q_n~\) und \(~q_{n+1}~\) sind Zähler und Nenner des Bruchs in der Mitte gemeint.  –  Nach Sortieren erhalten wir:

\(q_n - q_{n+1} = a\cdot n+b~~~~\text{mit}~~~~a = n_1+n_2-(n_1-n_2)^2~~~~\text{und}~~~~b = n_1+n_2-n_1^2-n_2^2~\le~0\)

In der letzten Ungleichung gilt \(~~\text{"}=\text{"}~~~\text{nur für}~~n_0=1_~\).
\[p_n~~\substack{\lt \\=\\ \gt}~~p_{n+1}~~~\Leftrightarrow~~~a \cdot n+b~=~q_n - q_{n+1}~~\substack{\lt \\=\\ \gt}~~0\] Für \(~a \le 0~\) wächst also \((p_n)_{_~n_~\ge _~ n_0}~\) monoton.

Mit \(~c = |n_1-n_2|_~\) erhalten wir das folgende erste Resultat:

Für \(~a \le 0~\),  also für \(~c^2 \ge n_1+n_2~\),  ex. kein Maximum der \(~p_n~\).

Dies gilt insbesondere für \(~\text{min}~\{n_1,n_2\}=0~\).

\(p_n~\) wächst streng monoton gegen den Grenzwert \(~\binom{n_1+n_2}{n_1}\left(\frac{1}{2}\right)^{n_1~+~n_2~}\) (s.o.).

Ausnahme \(~n_1+n_2=1:~~~p_n = 1/2~\) konstant.


\(a\gt 0~~~\rightarrow~~~a\cdot x+b~\) hat die Nullstelle in \[x_0 = \frac{n_1^2+n_2^2-n_1-n_2}{n_1+n_2-(n_1-n_2)^2}~=~n_0 - 1 + \frac{c_~(c-1)}{2} + d\] \[~~~~~~\text{mit}~~~~d = \frac{c^4-c^2}{4_~n_0-2_~c_~(c+1)} \gt 0~~~~\text{und}~~~~\lim_{n_0 \to \infty} d = 0~~~~\text{(konstant}~=~0~~\text{für}~~c \le 1~\text{, sonst streng monoton fallend)}\] Der Nenner von \(~d~\) ist positiv wegen \(~a = 2_~n_0 - c - c^2~\gt~0~\).

Damit erhalten wir das folgende Hauptresultat:

Für \(~a \gt 0~\),  also für \(~c^2 \lt n_1+n_2~\),  ex. ein Maximum der \(~p_n~\) bei:

\(~~~~n = n_0~\) (eindeutig), falls \(~c = 0~\) oder \(~c = 1_~\).

\(~~~~~~~~~~p_n~\) fällt dann streng monoton.

\(~~~~~~~~~~\)\(c=0:~~~\text{Maximum}~~p_{n_0} = 1~~~\text{und Grenzwert}~~\binom{_~2_~n_0~}{n_0}\left(\frac{1}{2}\right)^{2_~n_0}\)

\(~~~~~~~~~~\)\(c=1:~~~\text{Maximum}~~p_{n_0} = 1/2~~~\text{und Grenzwert}~~\binom{_~2_~n_0~-~1~}{n_0}\left(\frac{1}{2}\right)^{2_~n_0~-~1}\)

\(~~~~n = \lceil x_0 \rceil \gt n_0~\),  falls \(~c\gt 1_~\).

\(~~~~~~~~~~\)Falls \(~x_0~\) nicht-ganzzahlig, ist dieses Maximum eindeutig.

\(~~~~~~~~~~\)Falls \(~x_0~\) ganzzahlig, gibt es genau zwei Maxima bei \(~n=x_0~\) und \(~n=x_0+1_~\).

\(~~~~~~~~~~~~~~~~~~~~\)Dieses doppelte Maximum tritt für jedes \(~c \gt 1~\) mindestens einmal auf,

\(~~~~~~~~~~~~~~~~~~~~\)nämlich bei \(~d=1~\),  d.h. \(~n_0 = c_~(c^3+c+2)/4~~~(\in~\text{N}~~!)\);  dann ist \(~x_0 = n_0 + c_~(c-1)/2~\).

\(~~~~~~~~~~p_n~\) wächst streng monoton bis zum Maximum und fällt dann streng monoton

\(~~~~~~~~~~~~~~~~~~~\)zum Grenzwert \(~\binom{_~2_~n_0~-~c~}{n_0}\left(\frac{1}{2}\right)^{2_~n_0~-~c~}\).


Es folgen drei Beispiele. Die blauen Punkte stehen für die Zahlenfolge \((p_n)_{_~n_~\ge _~ n_0}~\):

3 Folgen

Beispiele für \((p_n)_{_~n_~\ge _~ n_0}~\).  Am unteren Rand jeder Graphik sind \(~n_0~\) sowie das \(~n~\) mit maximalem \(~p_n~\) vermerkt.

Oben: \(~n_1=16,~n_2 = 13,~\text{Maximum}~~p_{20} \approx~0,1625\)

Mitte: \(~n_1=6,~n_2 = 9,~\text{doppeltes Maximum}~~p_{17}=p_{18}~\approx~0,1621\)

Unten: \(~n_1=16,~n_2 = 10,~\text{kein Maximum}\)



In der Aufgabenstellung wird angeregt, sich die Lage des Maximums der Folge \((p_n)_{_~n_~\ge _~ n_0}~\) für "große" \(~n_i~\) genauer anzuschauen. Dann ist auch \(~n_0 = max_~\{n_1,n_2\}~\) "groß". Die Umkehrung gilt ebenfalls: Sei o.E. \(~n_1 \le n_2~\),  also \(~n_0 = n_2~\) "groß"; wegen \(~n_0-n_1 = c \lt \sqrt{2n_0}~\) ist auch \(~n_1~\) "groß", nämlich \(~n_1 \gt n_0-\sqrt{2n_0}~\).

Mit ein paar Proberechnungen sieht man schnell, dass das Maximum für genügend große \(~n_0~\) immer an derselben Position liegt  –  gezählt vom Beginn der Folge \((p_n)_{_~n_~\ge _~ n_0}~\) bei \(~n_0~\).

Für \(~c \le 1~\) haben wir schon gesehen, dass das Maximum bei \(~n_0~\) liegt.

Für \(~c \gt 1~\) fällt \(~d~\) streng monoton gegen \(~0~\),  also liegt für \(~d \le 1~\) das Maximum bei \(~n_0 + c_~(c-1)/2~\).  \(~d \le 1~\) ist äquivalent zu \(~n_0 \ge c_~(c^3+c+2)/4~\).

Für genügend große \(~n_0~\) (genauer: für \(~d \le 1~\))  ist der Abstand von \(~n_0~\) zum Maximum konstant.

Dann gilt \(\lceil x_0 \rceil = n_0 + c_~(c-1)/2~\).

Das kleinste \(~n_0~\) mit dieser Eigenschaft ist \(~n_0 = c_~(c^3+c+2)/4~\);  dann ist \(~d = 1~\) und es liegt ein doppeltes Maximum bei \(~x_0~\) und \(~x_0 + 1~\) vor.



Publiziert 2025-03-03          Stand 2022-07-05


voriges Problem   |   Liste aller Probleme mit Lösungen   |    nächstes Problem


Manfred Börgens   |    zur Leitseite