Manfred Börgens Mathematische Probleme # 130 |
Liste aller Probleme mit Lösungen voriges Problem nächstes Problem |
zur Leitseite |
Wieviele Kugeln enthält die Urne ?
Die Lösung steht im unteren Teil der Seite.
Eine Urne enthalte \(~n~\) weiße und \(~n~\) schwarze Kugeln. Es werden – in Unkenntnis von \(~n\) – zufällig \(~m~\) Kugeln gezogen, von denen sich \(~n_1~\) als weiß und \(~n_2~\) als schwarz herausstellen. Welche Rückschlüsse lassen sich daraus für \(~n~\) ziehen?
Das soll präzisiert werden: \(~m=n_1+n_2 \gt 0~\) und \(~n_i~\) mit \(~n_i \ge 0~\) werden als bekannt vorausgesetzt. Es soll die Wahrscheinlichkeit \(~p_n~\) analysiert werden, mit der bei Ziehung von \(~m~\) Kugeln aus \(~2_~n~\) Kugeln (davon gleich viele weiß und schwarz) \(~n_1~\) weiß und \(~n_2~\) schwarz sind.
Haben die \(~p_n~\) einen Grenzwert für \(~n \rightarrow \infty~\)?
Insbesondere interessiert uns die Frage, ob es ein \(~n~\) gibt, für das \(~p_n~\) maximal wird (engl. "best guess for \(~n~\)"). Falls ja, ist dieses \(~n~\) eindeutig?
Für genügend große \(~n_i~\) ist die Lage des Maximums der \(~p_n~\) einfach zu bestimmen: Sein Abstand zum minimal möglichen \(~n~\) ist dann konstant.
Eine stark vereinfachte Version dieses Problems erschien am 17.6.2022 in The Riddler auf der Website FiveThirtyEight ; die Lösung erschien am 24.6.2022. – Die zentrale Frage nach dem Maximum der \(~p_n~\) ist dort formuliert als What is your best guess for the original number of balls in the urn ?
Der Definitionsbereich für \(~n~\) ist \(~\{n \in \text{N}~|~n \ge n_0\}~~~\text{mit}~~~n_0 = max_~\{n_1,n_2\}~\).
\(p_n~\) ergibt sich nach dem hypergeometrischen Modell zu:
\[p_n = \frac{\binom{n}{_~n_{1~}}\binom{n}{_~n_{2~}}}{\binom{2_~n}{_~n_{1~}+_~n_{2~}}}\]
Im Grenzwert geht das hypergeometrische Modell über zum binomialen Modell mit der Wahrscheinlichkeit \(~1/2~\) für jede einzelne Ziehung einer weißen oder schwarzen Kugel:
\[\lim_{n \to \infty}~p_n = \binom{n_1+n_2}{n_1}\left(\frac{1}{2}\right)^{n_1~+~n_2}\]
Um Monotonieverhalten und Extrema der Folge \((p_n)_{_~n_~\ge _~ n_0}~\) zu ermitteln, betrachten wir den Bruch \(~p_n/p_{n+1}~\) nach dem Kürzen:
\[\frac{p_n}{p_{n+1}} = \frac{2_~(n+1-n_1)_~(n+1-n_2)_~(2_~n+1)}{(n+1)_~(2_~n+1-n_1-n_2)_~(2_~n+2-n_1-n_2)} = \frac{q_n}{q_{n+1}}~~~~\rightarrow~1~~~~\text{für}~~n\rightarrow\infty\]
Mit \(~q_n~\) und \(~q_{n+1}~\) sind Zähler und Nenner des Bruchs in der Mitte gemeint. – Nach Sortieren erhalten wir:
\(q_n - q_{n+1} = a\cdot n+b~~~~\text{mit}~~~~a = n_1+n_2-(n_1-n_2)^2~~~~\text{und}~~~~b = n_1+n_2-n_1^2-n_2^2~\le~0\)
In der letzten Ungleichung gilt \(~~\text{"}=\text{"}~~~\text{nur für}~~n_0=1_~\).
\[p_n~~\substack{\lt \\=\\ \gt}~~p_{n+1}~~~\Leftrightarrow~~~a \cdot n+b~=~q_n - q_{n+1}~~\substack{\lt \\=\\ \gt}~~0\]
Für \(~a \le 0~\) wächst also \((p_n)_{_~n_~\ge _~ n_0}~\) monoton.
Mit \(~c = |n_1-n_2|_~\) erhalten wir das folgende erste Resultat:
Für \(~a \le 0~\), also für \(~c^2 \ge n_1+n_2~\), ex. kein Maximum der \(~p_n~\).
Dies gilt insbesondere für \(~\text{min}~\{n_1,n_2\}=0~\). \(p_n~\) wächst streng monoton gegen den Grenzwert \(~\binom{n_1+n_2}{n_1}\left(\frac{1}{2}\right)^{n_1~+~n_2~}\) (s.o.). Ausnahme \(~n_1+n_2=1:~~~p_n = 1/2~\) konstant. |
Für \(~a \gt 0~\), also für \(~c^2 \lt n_1+n_2~\), ex. ein Maximum der \(~p_n~\) bei:
\(~~~~n = n_0~\) (eindeutig), falls \(~c = 0~\) oder \(~c = 1_~\). \(~~~~~~~~~~p_n~\) fällt dann streng monoton. \(~~~~~~~~~~\)\(c=0:~~~\text{Maximum}~~p_{n_0} = 1~~~\text{und Grenzwert}~~\binom{_~2_~n_0~}{n_0}\left(\frac{1}{2}\right)^{2_~n_0}\) \(~~~~~~~~~~\)\(c=1:~~~\text{Maximum}~~p_{n_0} = 1/2~~~\text{und Grenzwert}~~\binom{_~2_~n_0~-~1~}{n_0}\left(\frac{1}{2}\right)^{2_~n_0~-~1}\) \(~~~~n = \lceil x_0 \rceil \gt n_0~\), falls \(~c\gt 1_~\). \(~~~~~~~~~~\)Falls \(~x_0~\) nicht-ganzzahlig, ist dieses Maximum eindeutig. \(~~~~~~~~~~\)Falls \(~x_0~\) ganzzahlig, gibt es genau zwei Maxima bei \(~n=x_0~\) und \(~n=x_0+1_~\). \(~~~~~~~~~~~~~~~~~~~~\)Dieses doppelte Maximum tritt für jedes \(~c \gt 1~\) mindestens einmal auf, \(~~~~~~~~~~~~~~~~~~~~\)nämlich bei \(~d=1~\), d.h. \(~n_0 = c_~(c^3+c+2)/4~~~(\in~\text{N}~~!)\); dann ist \(~x_0 = n_0 + c_~(c-1)/2~\). \(~~~~~~~~~~p_n~\) wächst streng monoton bis zum Maximum und fällt dann streng monoton \(~~~~~~~~~~~~~~~~~~~\)zum Grenzwert \(~\binom{_~2_~n_0~-~c~}{n_0}\left(\frac{1}{2}\right)^{2_~n_0~-~c~}\). |
Für genügend große \(~n_0~\) (genauer: für \(~d \le 1~\)) ist der Abstand von \(~n_0~\) zum Maximum konstant.
Dann gilt \(\lceil x_0 \rceil = n_0 + c_~(c-1)/2~\). Das kleinste \(~n_0~\) mit dieser Eigenschaft ist \(~n_0 = c_~(c^3+c+2)/4~\); dann ist \(~d = 1~\) und es liegt ein doppeltes Maximum bei \(~x_0~\) und \(~x_0 + 1~\) vor. |
Publiziert 2025-03-03 Stand 2022-07-05
voriges Problem | Liste aller Probleme mit Lösungen | nächstes Problem