Manfred Börgens
Mathematik auf Briefmarken  # 35
Liste aller Briefmarken
vorige Marke      nächste Marke
zur Leitseite

Stempel des Monats November 2003

Stempel mit Jensen'scher Ungleichung


Die Jensen'sche Ungleichung
nach Johan Ludwig Jensen (1859 - 1925)

Statt einer Briefmarke wird in diesem Monat ein Stempel gezeigt. Es ist außergewöhnlich, dass eine mathematische Formel mit Hilfe einer Frankiermaschine in großer Zahl auf die Reise in alle Welt geschickt wird. Dass es sich um einen dänischen Stempel handelt, ist nicht verwunderlich, wenn man die Formel erkennt: Es ist die Ungleichung, die der Däne Johan Ludwig Jensen 1906 für konvexe Funktionen aufgestellt hat.

J. L. Jensen studierte Mathematik und Naturwissenschaften an einem Polytechnikum in Kopenhagen und arbeitete danach bis zu seiner Pensionierung bei der Kopenhagener Telefongesellschaft, zunächst als Fernmeldeingenieur und ab 1890 als Abteilungsleiter für Fernmeldetechnik. Mathematik betrieb er in seiner Freizeit, erreichte aber ein so hohes Niveau, dass seine Forschungsergebnisse in namhaften mathematischen Zeitschriften gedruckt wurden.

Die Funktion  φ  in der Ungleichung ist eine reelle Funktion, definiert auf einem Intervall. Die Ungleichung gilt genau dann, wenn  φ  eine konvexe Funktion ist. Üblicherweise wird die Definition für Konvexität mit der Ungleichung

Definition Konvexitaet

gegeben, wobei  x1  und  x2  beliebige Punkte aus dem Definitionsintervall und  b1 ,  b2  beliebige positive Zahlen mit der Summe  1  sein können. Die Bedeutung dieser Definition kann man sich zunächst anhand eines einfachen Spezialfalls veranschaulichen. Wählt man  b1 = b2 = 1/2 , so lautet die Ungleichung

phi((x1+x2)/2) kleiner-gleich (phi(x1)+phi(x2))/2

Diese Ungleichung ist in der Jensen'schen Ungleichung auf dem Stempel enthalten; man muss dort nur eine Summe mit genau zwei Summanden nehmen und  a1 = a2 = 1 . Bild 1 zeigt die Lage aller Punkte in der Ungleichung; zur Abkürzung sind dort die φ-Funktionswerte von  x1  und  x2  mit  y1  und  y2  bezeichnet:

konvexe Funktion mit halbierter Sehne

Bild 1


Für diesen Spezialfall bedeutet also die Jensen'sche Ungleichung, dass der Mittelpunkt der Sehne zwischen zwei Kurvenpunkten oberhalb des zugehörigen Funktionswertes liegt.

("oberhalb" soll hier und im Folgenden nicht ausschließen, dass die beiden betrachteten Punkte zusammenfallen; in den Ungleichungen wird ja kein striktes "<" verlangt. - Der Graph der Funktion wird hier der Einfachheit halber immer als "Kurve" bezeichnet.)

Auch die schon genannte Definition der Konvexität

Definition Konvexitaet

lässt sich graphisch gut veranschaulichen:

konvexe Funktion mit geteilter Sehne

Bild 2


Bild 2 zeigt, dass beliebige Sehnenpunkte immer oberhalb der zugehörigen Kurvenpunkte liegen; dies ist die "graphische Definition" der Konvexität reeller Funktionen.

Die Definition mit  b1  und  b2  ist äquivalent zur Jensen'schen Ungleichung für zwei Summanden:

Jensen'sche Ungleichung fuer zwei Punkte

Gilt nämlich diese Jensen'sche Ungleichung, so folgt die Definition, wenn man  a1 = b1  und  a2 = b2  wählt; die Summen in den Nennern der Jensen'schen Ungleichung sind dann  1 . Gilt umgekehrt die Ungleichung aus der Definition, so wählt man  b1 = a1 / ( a1 + a2 )  und  b2 = a2 / ( a1 + a2 )  und erhält die Jensen'sche Ungleichung für zwei Summanden.

Durch vollständige Induktion erhält man schließlich die Jensen'sche Ungleichung für mehrere Summanden wie auf dem Stempel. Hier ist der Induktionsschritt von  n  auf  n + 1  Summanden:

linke Seite Jensen'sche Ungleichung fuer n+1 Punkte

Dieser Ausdruck wird umgeformt, indem man zur Abkürzung

a=Summe der Gewichte - x=Summe(a.i mal x.i/a) - beide Summen mit n Summanden

setzt und mit  1/a  erweitert:

1. Umformung der vorigen Formel

2. Umformung der vorigen Formel

Also ist die Jensen'sche Ungleichung auf dem Stempel eine äquivalente Beschreibung der Konvexität von  φ .


Die Jensen'sche Ungleichung kann man sich veranschaulichen als eine Aussage über den Schwerpunkt von Punkten auf der Kurve. Versieht man Punkte  ( xv , yv )  in der Ebene mit "Gewichten"  av  (in Bild 3 als grüne Säulen dargestellt), so liegt ihr gemeinsamer Schwerpunkt in

Definition Schwerpunkt

Die Jensen'sche Ungleichung sagt also für Punkte  ( xv , yv )  auf einer konvexen Kurve aus:

phi(xs) kleiner-gleich ys

Der Schwerpunkt gewichteter Punkte auf einer konvexen Kurve liegt oberhalb der Kurve.

konvexe Kurve mit Gewichten auf 4 Punkten

Bild 3


Den schönen Stempel mit der Jensen'schen Ungleichung verdanke ich Herrn Professor Dr. Jacobus van Lint von der Universität Eindhoven. Er ist so wie ich Mitglied der Mathematical Study Unit und hat mir vor einigen Monaten eine große Freude gemacht, als er mir ein dickes Paket mit vielen mathematischen Stempeln schickte. - Professor van Lint ist den Teilnehmern des Mathematischen Weltkongresses 1998 in Berlin sicherlich noch bekannt durch seinen bemerkenswerten Vortrag "The mathematics of the CD-player". - Dem freundlichen Kollegen J. van Lint sei an dieser Stelle noch einmal herzlich gedankt.

Von Prof. van Lint stammt auch ein eleganter und sehr anschaulicher Beweis für die Stetigkeit konvexer Funktionen auf offenen Intervallen. Voraussetzung dafür ist die oben angegebene Definition

Definition Konvexitaet

Dies muss deshalb ausdrücklich erwähnt werden, weil in manchen Lehrbüchern die Definition

phi((x1+x2)/2) kleiner-gleich (phi(x1)+phi(x2))/2

für die Konvexität verwendet wird, und in diesem Fall die Stetigkeit nicht folgt.

Nun zum Beweis: Die Stetigkeit im Punkt  x  soll gezeigt werden.  h > 0  wird so gewählt, dass  x + h  und  x - h  im Definitionsintervall liegen. Für die Werte  x, x + h, x - h  laufe die Kurve durch die Punkte  A, B, C . In Bild 4 kann die Kurve wegen der Konvexität nur durch die weißen, aber nicht durch die blauen Bereiche laufen:


Kurvenpunkte durch A, B mit erlaubten Bereichen

Bild 4


(Natürlich muss die Strecke  AB  nicht notwendigerweise eine positive Steigung haben bzw.  CA  eine negative.  A  muss lediglich unterhalb oder auf  CB  liegen.)

In Bild 5 werden beide Skizzen aus Bild 4 kombiniert:


Kurvenpunkte durch A, B, C mit erlaubten Bereichen

Bild 5


In einer Umgebung von  x  verläuft also der Graph in einem "Trichter", woraus sofort die Stetigkeit folgt.

Der van Lint'sche Beweis umfasst noch mehr: Aus Bild 5 folgt auch die rechts- und linksseitige Differenzierbarkeit konvexer Funktionen auf offenen Intervallen. Es genügt, den rechtsseitigen Fall zu betrachten. Die Steigung der Strecke  AB  ist:

(phi(x+h)-phi(x))/h

Für  0 < h' < h  und den zu  x + h'  gehörigen Kurvenpunkt  B'  ist wegen der Konvexität die Steigung der Strecke  AB'  kleiner oder gleich der Steigung von  AB :

(phi(x+h')-phi(x))/h' kleiner-gleich (phi(x+h)-phi(x))/h

Also ist

(phi(x+h)-phi(x))/h

monoton fallend, wenn  h > 0  gegen  0  strebt. Aus Bild 6 erkennt man außerdem, dass die Steigung von  AB'  für alle  h'  nach unten durch die Steigung der Strecke  AD  beschränkt ist:


Kurvenpunkte durch A, B, B' mit erlaubten Bereichen

Bild 6


Folglich existiert der Grenzwert (rechtsseitige Ableitung)

lim(phi(x+h)-phi(x))/h fuer h gegen 0+



Stand 2004-01-04
vorige Marke   |    Liste aller Briefmarken   |    nächste Marke   |          Mathematische Philatelie
Manfred Börgens   |    zur Leitseite