14. Taylorsche Formel und Extremwertaufgaben


 

14.1 Notwendige und hinreichende Bedingungen für lokale Extrema

 

14.1.1 Die Taylorsche Formel

 

Am Beginn unserer Untersuchungen zu Extremwertaufgaben für Funktionen in mehreren Veränderlichen steht die Taylorsche Formel.

 

Satz: Auf der offenen Menge \( \Omega\subseteq\mathbb R^m \) sei eine Funktion \( f\in C^\ell(\Omega,\mathbb R) \) mit einem \( \ell\in\mathbb N \) vorgelegt. Seien ferner \( x\in\Omega \) und \( h\in\mathbb R^m \) so gegeben, dass \[ \mbox{Conv}\,(x,x+h)=\{x+th\,:\,0\le t\le 1\} \] vollständig in \( \Omega \) liegt, also \( \mbox{Conv}\,(x,x+h)\subset\Omega. \) Dann gilt die Taylorsche Formel \[ f(x+h)=f(x)+\sum_{k=1}^{\ell-1}\frac{1}{k!}\,d^kf(x,h)+\frac{1}{\ell!}\,d^\ell f(\xi,h) \] mit einem geeignet zu wählenden \[ \xi\in\mbox{Conv}\,(x,x+h)\setminus\{x,x+h\}=\{x+th\,:\,0\lt t\lt 1\}\,. \]

 

Beweis

 

Wir gewinnen die Behauptung aus der Taylorschen Formel in einer Veränderlichen.

1. Betrachte die Hilfsfunktion

\[ g(t):=f(x+th),\quad t\in[0,1]. \]

  Mit der Kettenregel folgt

\[ g'(t)=\sum_{i=1}^mf_{x_i}(x+th)h_i=df(x+th,h). \]

  Das können wir auch so schreiben

\[ g'(t)=\sum_{i=1}^m(h_i\partial_{x_i})f(x+th). \]

  Hieraus erhalten wir durch immer wieder erneutes Differenzieren (Übung)

\[ g^{(k)}(t)=\left(\,\sum_{i=1}^mh_i\partial_{x_i}\right)^kf(x+th)=d^kf(x+th,h). \]

2. Auf \( g(t) \) wenden wir die eindimensionale Taylorformel an

\[ g(1)-g(0)=\sum_{k=1}^{\ell-1}\frac{1}{k!}\,g^{(k)}(0)+\frac{1}{\ell!}\,g^{(\ell)}(\vartheta) \]

  mit geeignetem \( \vartheta\in(0,1). \) Substituieren von \( g(t) \) durch \( f(x+th) \) sowie Setzen von \( \xi:=x+\vartheta h \) zeigt die Behauptung.

 

Damit ist der Satz bewiesen.\( \qquad\Box \)

 

 

Die Taylorsche Formel schreiben wir auch oft in der Form \[ f(x)=f(x_0)+\sum_{k=1}^\ell\frac{1}{k!}\,d^kf(x_0,x-x_0)+\frac{1}{(\ell+1)!}\,d^{(\ell+1)}f(\xi,x-x_0) \] mit \( x=x_0+h. \) Wir bezeichnen

\( \circ \) als das Taylorpolynom vom Grad \( \ell\in\mathbb N \) an der Entwicklungsstelle \( x_0\in\mathbb R^m \) den Ausdruck

\[ T_\ell(x):=f(x_0)+\sum_{k=1}^\ell\frac{1}{k!}\,d^kf(x_0,x-x_0) \]

\( \circ \) und als das Restglied der Taylorreihe vom Grad \( \ell+1\in\mathbb N \) den Term

\[ R_{\ell+1}(\xi):=\frac{1}{(\ell+1)!}\,d^{(\ell+1)}f(\xi,x-x_0). \]

 

Aufgaben zu diesem Abschnitt

 


 

 

14.1.2 Minima und Maxima

 

Nun zu wichtigen Begriffsbildungen.

 

Definition: Auf der Menge \( \Omega\subseteq\mathbb R^m \) sei die Funktion \( f\colon\Omega\to\mathbb R \) gegeben. Ein Punkt \( a\in\Omega \) heißt globales Maximum bzw. globales Minimum von \( f(x), \) falls gilt \[ \begin{array}{l} f(x)\le f(a)\quad\mbox{für alle}\ x\in\Omega \\ \mbox{bzw.}\quad f(x)\ge f(a)\quad\mbox{für alle}\ x\in\Omega. \end{array} \] Es heißt ferner \( a\in\Omega \) ein lokales Maximum bzw. lokales Minimum von \( f(x), \) falls es ein \( \varepsilon\gt 0 \) und einen offenen Ball \( B_\varepsilon(a)\subset\mathbb R^m \) gibt mit \[ \begin{array}{l} f(x)\le f(a)\quad\mbox{für alle}\ x\in\Omega\cap B_\varepsilon(a) \\ \mbox{bzw.}\quad f(x)\ge f(a)\quad\mbox{für alle}\ x\in\Omega\cap B_\varepsilon(a). \end{array} \] Im Fall \( f(x)\lt f(a) \) bzw. \( f(x)\gt f(a) \) sprechen wir von einem strikten (globalen, lokalen) Maximum bzw. strikten (globalen, lokalen) Minimum von \( f(x). \)

 

Ein (lokales, globales, strikes) Maximum oder Minimum bezeichnen wir auch als (lokales, globales, striktes) Extremum der Funktion.

 

Bemerkung: In den Anwendungen ist der Definitionsbereich der Funktion im Allgemeinen nicht offen. Daher müssen bei Extremwertaufgaben eventuell auch Randpunkte, isolierte Punkte, das Verhalten der Funktion im Unendlichen usw. untersucht werden.

 

Aufgaben zu diesem Abschnitt

 


 

 

14.1.3 Eine notwendige Bedingung erster Ordnung

 

Satz: Auf der offenen Menge \( \Omega\subseteq\mathbb R^m \)besitze \( f\in C^0(\Omega,\mathbb R) \) in einem Punkt \( a\in\Omega \) ein lokales Minimum oder lokales Maximum. Ferner existieren die partiellen Ableitungen \( f_{x_i}(x) \) in \( \Omega \) für alle \( i=1,\ldots,m. \) Dann gelten notwendig \[ f_{x_i}(a)=0\quad\mbox{für alle}\ i=1,\ldots,m. \]

 

Einen Beweis dieser Aussage belassen wir als Übungsaufgabe.

 

Definition: Ist \( f\colon\Omega\to\mathbb R \) differenzierbar in einem inneren Punkt \( a\in\Omega \) mit \[ \mbox{grad}\,f(a)=0 \] so heißt \( a\in\Omega \) ein kritischer Punkt.

 

Aufgaben zu diesem Abschnitt

 


 

 

14.1.4 Eine notwendige Bedingung zweiter Ordnung

 

Neben der obigen notwendigen Bedingung erster Ordnung \( \mbox{grad}\,f(a)=0 \) in einem lokalen Extremum \( a\in\mathring\Omega \) lernen wir nun eine notwendige Bedingung zweiter Ordnung kennen, die wir an dieser Stelle nur für den Fall eines lokalen Minimums formulieren - eine Übertragung auf den Fall lokaler Maxima belassen wir als Übung.

 

Satz: Auf der offenen Menge \( \Omega\subseteq\mathbb R^m \) besitze die Funktion \( f\in C^2(\Omega,\mathbb R) \) im Punkt \( a\in\Omega \) ein lokales Minimum. Dann gilt \[ \sum_{i,j=1}^mf_{x_ix_j}(a)\xi_i\xi_j\ge 0\quad\mbox{für alle}\ \xi=(\xi_1,\ldots,\xi_m)\in\mathbb R^m\,. \]

 

Beweis

 

Wähle ein \( \xi\in\mathbb R^m \) beliebig. Da \( a\in\Omega \) ein innerer Punkt ist, existiert ein \( \varepsilon\gt 0, \) so dass \( B_\varepsilon(a)\subset\Omega. \) Also gilt auch \( a+t\xi\in\Omega \) für \( t\gt 0 \) hinreichend klein. Wegen \( \mbox{grad}\,f(a)=0 \) folgt mit der Taylorschen Formel aus Paragraph 14.1.1 \[ f(a+t\xi)-f(a) =df(a,t\xi)+\frac{1}{2}\,d^2f(a+\tau\xi,t\xi) =\frac{1}{2}\,d^2f(a+\tau\xi,t\xi) \] mit geeignet zu wählendem \( \tau\in(0,t). \) Nach Voraussetzung ist außerdem \[ f(a+t\xi)-f(a)\ge 0\quad\mbox{für}\ t\gt 0\ \mbox{hinreichend klein.} \] Wir schließen also \[ 0\le\frac{1}{2}\,d^2f(a+\tau\xi,t\xi) =\frac{t^2}{2}\,\sum_{i,j=1}^mf_{x_ix_j}(a+\tau\xi)\xi_i\xi_j\,. \] Grenzübergang \( t\to 0 \) und \( f\in C^2(\Omega,\mathbb R) \) zeigen die Behauptung.\( \qquad\Box \)

 

 

Bemerkung: In der Behauptung des Satzes gilt nicht „\( \gt \)“ statt „\( \ge \)“. Betrachte nämlich als Gegenbeispiel die Funktion in einer reellen Veränderlichen \[ f(x)=x^4\,,\quad x\in\mathbb R, \] die in \( a=0 \) ein lokales, sogar ein globales Minimum besitzt, wo aber gilt \( f''(0)=0 \) und eben nicht \( f''(0)\gt 0. \)

 

Bemerkung: Im Satz können wir „offene Menge \( \Omega\subseteq\mathbb R^m \)“ ersetzen durch „offene Umgebung \( U\subset\Omega \)“ und die Voraussetzungen und die Behauptung für eine solche Umgebung formulieren.

 

Aufgaben zu diesem Abschnitt

 


 

 

14.1.5 Die Hessesche Form

 

Wir wollen unsere Beobachtungen aus dem vorigen Paragraphen in einen algebraischen Kontext stellen.

 

Definition: Auf der offenen Menge \( \Omega\subseteq\mathbb R^m \) sei \( f\in C^2(\Omega,\mathbb R). \) Dann heißt die symmetrische Matrix \[ {\mathbf H}_f(a) :=\left( \begin{array}{ccc} f_{x_1x_1}(a) & \cdots & f_{x_1x_m}(a) \\ \vdots & & \vdots \\ f_{x_mx_1}(a) & \cdots & f_{x_mx_m}(a) \end{array} \right)\in\mathbb R^{m\times m} \] die Hessesche Matrix von \( f(x) \) im Punkt \( a\in\Omega. \) Die zu \( {\mathbf H}_f(a) \) gehörige quadratische Form \[ Q_f(a):=\xi\circ{\mathbf H}_f(a)\circ\xi^t=\sum_{i,j=1}^mf_{x_ix_j}(a)\xi_i\xi_j\,,\quad\xi\in\mathbb R^m\,, \] heißt Hessesche Form.

 

Bemerkung: Besitzt \( f\in C^2(\Omega,\mathbb R), \) \( \Omega\subseteq\mathbb R^m \) offen, in \( a\in\Omega \) ein lokales Minimum, so gilt notwendig nach dem Satz aus dem vorigen Paragraphen \[ Q_f(a)=\xi\circ{\mathbf H}_f(a)\circ\xi^t\ge 0\quad\mbox{für alle}\ \xi\in\mathbb R^m\,, \] d.h. die Hessesche Form ist in \( a\in\Omega \) positiv semidefinit und besitzt dort keine negativen Eigenwerte.

 

Aus der Linearen Algebra sind Ihnen auch die Begriff positiv definit, negativ definit, negativ semidefinit und indefinit vertraut, die wir in diesem Zusammenhang anwenden werden.

 

Aufgaben zu diesem Abschnitt

 


 

 

14.1.6 Eine hinreichende Bedingung zweiter Ordnung

 

Wir kommen nun zu einer hinreichenden Bedingung zweiter Ordnung für die Existenz lokaler Extrema.

 

Satz: Auf der offenen Menge \( \Omega\subseteq\mathbb R^m \) besitze die Funktion \( f\in C^2(\Omega,\mathbb R) \) in \( a\in\Omega \) einen kritischen Punkt mit der Eigenschaft \( \mbox{grad}\,f(a)=0. \) Außerdem gelte \[ Q_f(a)=\xi\circ{\mathbf H}_f(a)\circ\xi^t\gt 0\quad\mbox{für alle}\ \xi\in\mathbb R^m\setminus\{0\}\,. \] Dann besitzt \( f(x) \) in \( a\in\Omega \) ein striktes lokales Minimum.

 

Beweis

 

Wir gehen in zwei Schritten vor.

1. Betrachte die quadratische Form

\[ q(\xi):=\xi\circ{\mathbf H}_f(a)\circ\xi^t\,,\quad\xi\in S:=\{\eta\in\mathbb R^m\,:\,|\eta|=1\}\,. \]

  Nach Voraussetzung ist \( q\colon S\to\mathbb R \) auf der kompakten Menge \( S\subset\mathbb R^m \) stetig und erfüllt daher nach dem Fundamentalsatz von Weierstraß

\[ q(\xi)\ge\alpha\quad\mbox{für alle}\ \xi\in S \]

  mit einem \( \alpha\gt 0. \) Wegen \( f\in C^2(\Omega,\mathbb R) \) gibt es ferner ein \( \varepsilon\gt 0 \) hinreichend klein mit

\[ \xi\circ{\mathbf H}_f(x)\circ\xi^t\ge\frac{\alpha}{2}\gt 0\quad\mbox{für alle}\ \xi\in S\ \mbox{und alle}\ x\in B_\varepsilon(a). \]

2. Sei nun \( \xi\in\mathbb R^m\setminus\{0\} \) beliebig gewählt. Dann gilt

\[ \xi\circ{\mathbf H}_f(x)\circ\xi^t =\frac{\xi}{|\xi|}\circ{\mathbf H}_f(x)\circ\frac{\xi}{|\xi|}\,|\xi|^2 \ge\frac{\alpha}{2}\,|\xi|^2 \]

  für alle \( \xi\in\mathbb R^m\setminus\{0\} \) und alle \( x\in B_\varepsilon(a), \) und damit natürlich auch

\[ \xi\circ{\mathbf H}_f(x)\circ\xi^t \ge\frac{\alpha}{2}\,|\xi|^2 \quad\mbox{für alle}\ \xi\in\mathbb R^m\ \mbox{und alle}\ x\in B_\varepsilon(a). \]

  Wir erinnern an die Taylorsche Formel

\[ f(a+h)-f(a)=df(a,h)+\frac{1}{2}\,d^2f(z,h),\quad a+h\in B_\varepsilon(a), \]

  mit geeignetem \( z\in B_\varepsilon(a) \) und \( |h|\gt 0 \) hinreichend klein, so dass \( a+h\in B_\varepsilon(a). \) Nach Voraussetzung ist aber \( df(a,h)=0, \) so dass für \( h\not=0 \) folgt

\[ f(a+h)-f(a) =\frac{1}{2}\,\sum_{i,j=1}^mf_{x_ix_j}(z)h_ih_j =\frac{1}{2}\,h\circ{\mathbf H}_f(z)\circ h^t \ge\frac{\alpha}{4}\,|h|^2 \gt 0. \]

  Also gilt

\[ f(x)\gt f(a)\quad\mbox{für alle}\ x\in B_\varepsilon(a)\setminus\{a\}\,, \]

  d.h. die Funktion besitzt in \( a\in\Omega \) ein striktes lokales Minimum.

Damit ist der Satz bewiesen.\( \qquad\Box \)

 

 

Bemerkung: Das Beispiel \( f(x)=x^3, \) \( x\in\mathbb R, \) zeigt, dass die Bedingung \( Q_f(a)\gt 0 \) nicht durch \( Q_f(a)\ge 0 \) ersetzt werden kann.

 

Bemerkung: Als Übung formuliere und beweise man eine entsprechende Aussage für den Fall strikter lokaler Maxima.

 

Eine genau Durchsicht des Beweises zeigt außerdem den

 

Satz: Auf der offenen Menge \( \Omega\subseteq\mathbb R^m \) besitze die Funktion \( f\in C^2(\Omega,\mathbb R) \) im Punkt \( a\in\Omega \) einen kritischen Punkt. Die Hessesche Form \( Q_f(a) \) sei in diesem Punkt indefinit, d.h. weder positiv noch negativ definit. Dann nimmt \( f(x) \) in \( x=a \) weder ein lokales Minimum noch ein lokales Maximum an.

 

In diesem letzten Fall spricht man von einem Sattelpunkt.

 

Aufgaben zu diesem Abschnitt

 


 

 

14.1.7 Aufgaben

 

Aufgaben - Die Taylorsche Formel

 

Aufgabe 14.1.1: (Approximation des Inhalts eines Rechtecks)

Es sei \( R\subset\mathbb R^2 \) ein zweidimensionales Rechteck mit den Seitenlängen \( x\gt 0 \) und \( y\gt 0, \) und es bezeichne \[ A(x,y):=xy \] seinen elementargeometrischen Inhalt. Wir wollen das Verhalten dieses Inhalts bei Änderung von \( x \) zu \( x+h_1 \) und \( y \) zu \( y+h_2 \) mit einem Vektor \( h=(h_1,h_2)\in\mathbb R^2 \) studieren.

(i) Ermitteln Sie zunächst einen Ausdruck für die exakte Inhaltsänderung

\[ \triangle A:=(x+h_1)(y+h_2)-xy. \]

(ii) Berechnen Sie die Differentiale

\[ d^kA(x,y;h_1,h_2)\quad\mbox{für}\ k=1,2. \]

(iii) Verifizieren Sie nun die Identität

\[ \triangle A=\sum_{k=1}^2\frac{1}{k!}\,d^kA(x,y;h_1,h_2). \] Die Inhaltsänderung \( \triangle A \) lässt sich also durch eine geeignete Linearkombination der Differentiale \( dA \) und \( d^2A \) approximieren, genauer

\( \circ \) durch \( dA \) unter alleiniger Berücksichtigung der Störung \( h \) in erster Ordnung,
\( \circ \) durch \( dA+\frac{1}{2}\,d^2A \) unter Berücksichtigung der Störung \( h \) in erster und zweiter Ordnung.
(iv) Verdeutlichen Sie vermittels einer Skizze die Inhaltsänderung des Ausgangsrechtecks \( R \) bei Berücksichtigung der Störung \( h \) in erster und zweiter Ordnung.

 

Lösung

 

(i) Wir ermitteln

\[ \triangle A =(x+h_1)(y+h_2)-xy =xy+xh_2+yh_1+h_1h_2-xy =xh_2+yh_1+h_1h_2\,. \]

(ii) Wir berechnen

\[ dA(x,y;h_1,h_2) =A_x(x,y)h_1+A_y(x,y)h_2 =yh_1+xh_2 \]

  sowie

\[ d^2A(x,y;h_1,h_2) =A_{xx}(x,y)h_1^2+A_{yy}(x,y)h_2^2+2A_{xy}(x,y)h_1h_2 =2h_1h_2\,. \]

(iii) Aus (i) folgt zusammen mit (ii)

\[ \triangle A =xh_2+yh_1+h_1h_2 =dA(x,y;h_1,h_2)+\frac{1}{2}\,d^2A(x,y;h_1,h_2). \]

(iv) Unsere Skizze:
 

 

Damit ist alles gezeigt.\( \qquad\Box \)

 

 

Aufgabe 14.1.2: (Bestimmen des Taylorpolynoms I)

Bestimmen Sie das Taylorpolynom \( T_2(x,y) \) zweiten Grades der Funktion \[ f(x,y):=\cos(xy)+xe^{y-1}\,,\quad(x,y)\in\mathbb R^2\,, \] an der Entwicklungsstelle \( (x_0,y_0)=(\pi,1). \)

 

Lösung

 

Wir ermitteln zunächst die partiellen Ableitungen erster Ordnung \[ \begin{array}{rcl} f_x(x,y)\!\!\! & = & \!\!\!\displaystyle -y\sin(xy)+e^{y-1}\,, \\[0.6ex] f_y(x,y)\!\!\! & = & \!\!\!\displaystyle -x\sin(xy)+xe^{y-1} \end{array} \] und dann die partiellen Ableitungen zweiter Ordnung \[ \begin{array}{rcl} f_{xx}(x,y)\!\!\! & = & \!\!\!\displaystyle -y^2\cos(xy), \\[0.6ex] f_{xy}(x,y)\!\!\! & = & \!\!\!\displaystyle -\sin(xy)-xy\cos(xy)+e^{y-1}\,, \\[0.6ex] f_{yy}(x,y)\!\!\! & = & \!\!\!\displaystyle -x^2\cos(xy)+xe^{y-1}\,. \end{array} \] Im Entwicklungspunkt \( (x_0,y_0)=(\pi,1) \) bedeutet das \[ \begin{array}{l} f(\pi,1)=\pi-1, \\ f_x(\pi,1)=1,\quad f_y(\pi,1)=\pi, \\ f_{xx}(\pi,1)=1,\quad f_{xy}(\pi,1)=\pi+1,\quad f_{yy}(\pi,1)=\pi^2+\pi. \end{array} \] Damit erhalten wir für das Taylorpolynom zweiter Ordnung in \( (x_0,y_0)=(\pi,1) \) \[ \begin{array}{lll} T_2(\pi,1)\negthickspace & = & \negthickspace\displaystyle f(\pi,1)+f_x(\pi,1)(x-\pi)+f_y(\pi,1)(y-1) \\ & & \negthickspace\displaystyle +\,\frac{1}{2}\,f_{xx}(\pi,1)(x-\pi)^2+f_{xy}(\pi,1)(x-\pi)(y-1)+\frac{1}{2}\,f_{yy}(\pi,1)(y-1)^2 \\ & = & \negthickspace\displaystyle \pi-1+(x-\pi)+\pi(y-1) \\ & & \negthickspace\displaystyle +\,\frac{1}{2}\,(x-\pi)^2+(\pi+1)(x-\pi)(y-1)+\frac{\pi^2+\pi}{2}\,(y-1)^2 \\ & = & \negthickspace\displaystyle \frac{1}{2}\,x^2+\frac{\pi(1+\pi)}{2}\,y^2+(1+\pi)xy-2\pi x-\pi(2\pi+1)y+2\pi^2+\frac{\pi}{2}-1. \end{array} \] Das ist das gesuchte Taylorpolynom.\( \qquad\Box \)

 

 

Aufgabe 14.1.3: (Bestimmen des Taylorpolynoms II)

Entwickeln Sie das Polynom \[ f(x,y):=x^3+xy^2+y^3\,,\quad(x,y)\in\mathbb R^2\,, \] nach dem Taylorschen Satz

(i) um den Entwicklungspunkt \( (x_0,y_0)=(0,0), \)
(ii) um den Entwicklungspunkt \( (x_0,y_0)=(1,2). \)

 

Lösung

 

Wir berechnen zunächst \[ \begin{array}{l} f_x=3x^2+y^2\,,\quad f_y=2xy+3y^2\,, \\ f_{xx}=6x,\quad f_{xy}=f_{yx}=2y,\quad f_{yy}=2x+6y, \\ f_{xxx}=6,\quad f_{xxy}=f_{xyx}=f_{yxx}=0, \\ f_{xyy}=f_{yxy}=f_{yyx}=2,\quad f_{yyy}=6. \end{array} \]

(i) Wir ermitteln

\[ \begin{array}{l} f(0,0)=0, \\ f_x(0,0)=f_y(0,0)=0, \\ f_{xx}(0,0)=f_{xy}(0,0)=f_{yx}(0,0)=f_{yy}(0,0)=0, \\ f_{xxx}(0,0)=6,\quad f_{xxy}(0,0)=f_{xyx}(0,0)=f_{yxx}(0,0)=0, \\ f_{xyy}(0,0)=f_{yxy}(0,0)=f_{yyx}(0,0)=2,\quad f_{yyy}(0,0)=6 \end{array} \]

  und erhalten damit

\[ \begin{array}{lll} f(x,y)\negthickspace & = & \negthickspace\displaystyle f(0,0)+f_x(0,0)x+f_y(0,0)y \\ & & \negthickspace\displaystyle +\,\frac{1}{2}\,f_{xx}(0,0)x^2+f_{xy}(0,0)xy+\frac{1}{2}\,f_{yy}(0,0)y^2 \\ & & \negthickspace\displaystyle +\,\frac{1}{6}\,f_{xxx}(0,0)x^3+\frac{1}{2}\,f_{xxy}(0,0)x^2y+\frac{1}{2}\,f_{xyy}(0,0)xy^2+\frac{1}{6}\,f_{yyy}(0,0)y^3 \\ & = & \negthickspace\displaystyle \frac{1}{6}\cdot 6\cdot x^3+\frac{1}{2}\cdot 2\cdot xy^2+\frac{1}{6}\cdot 6\cdot y^3 \\ & = & \negthickspace\displaystyle x^3+xy^2+y^3\,. \end{array} \]

  Das Polynom ist also bereits in seiner Taylorentwicklung um den Punkt \( (0,0) \) gegeben.
(ii) Wir ermitteln

\[ \begin{array}{l} f(1,2)=13, \\ f_x(1,2)=7,\quad f_y(1,2)=16, \\ f_{xx}(1,2)=6,\quad f_{xy}(1,2)=f_{yx}(1,2)=4,\quad f_{yy}(1,2)=14, \\ f_{xxx}(0,0)=6,\quad f_{xxy}(0,0)=f_{xyx}(0,0)=f_{yxx}(0,0)=0, \\ f_{xyy}(0,0)=f_{yxy}(0,0)=f_{yyx}(0,0)=2,\quad f_{yyy}(0,0)=6 \end{array} \]

  und erhalten damit

\[ \begin{array}{lll} f(x,y)\negthickspace & = & \negthickspace\displaystyle f(1,2)+f_x(1,2)(x-1)+f_y(1,2)(y-2) \\ & & \negthickspace\displaystyle +\,\frac{1}{2}\,f_{xx}(1,2)(x-1)^2+f_{xy}(1,2)(x-1)(y-2)+\frac{1}{2}\,f_{yy}(1,1)(y-2)^2 \\ & & \negthickspace\displaystyle +\,\frac{1}{6}\,f_{xxx}(1,2)(x-1)^3+\frac{1}{2}\,f_{xxy}(1,2)(x-1)^2(y-2) \\ & & \negthickspace\displaystyle +\,\frac{1}{2}\,f_{xyy}(1,2)(x-1)(y-2)^2+\frac{1}{6}\,f_{yyy}(1,2)(y-2)^3 \\ & = & \negthickspace\displaystyle 13+7(x-1)+16(y-2)+\frac{1}{2}\cdot 6\cdot(x-1)^2+4(x-1)(y-2) \\ & & \negthickspace\displaystyle +\,\frac{1}{2}\cdot 14(y-2)^2+\frac{1}{6}\cdot 6\cdot(x-1)^3+\frac{1}{2}\cdot 2\cdot(x-1)(y-2)^2 \\ & & \negthickspace\displaystyle +\,\frac{1}{6}\cdot 6\cdot(y-2)^3 \\ & = & \negthickspace\displaystyle 13+7(x-1)+16(y-2)+3(x-1)^2+4(x-1)(y-2)+7(y-2)^2 \\ & & \negthickspace\displaystyle +(x-1)^3+(x-1)(y-2)^2+(y-2)^3\,. \end{array} \] Damit sind alle Größen ermittelt.\( \qquad\Box \)

 

 

Aufgaben - Minima und Maxima

 

Aufgabe 14.1.4: (Quadratische Funktionen und Extrema I)

Mit \( m,n\in(0,\infty) \) betrachten wir die Funktion \[ f(x,y):=m^2x^2+n^2y^2\,,\quad(x,y)\in\mathbb R^2\,. \] Begründen Sie, dass \( f(x,y) \) in \( a=(0,0) \) ein globales Minimum besitzt.

 

Lösung

 

 

 

Aufgabe 14.1.5: (Quadratische Funktionen und Extrema II)

Wir betrachten wir die Funktion \[ f(x,y):=xy,\quad(x,y)\in[-1,1]\times[-1,1]. \]

(i) Besitzt \( f(x,y) \) in \( a=(0,0) \) ein lokales Extremum? Begründen Sie.
(ii) Ermitteln Sie die globalen Extrema der Funktion.

 

Lösung

 

 

 

Aufgaben - Eine notwendige Bedingung erster Ordnung

 

Aufgabe 14.1.6: (Bestimmen kritischer Punkte I)

Bestimmen Sie sämtliche kritische Punkte der Funktion \[ f(x,y)=(x-1)^3+3(x-y)^2+1,\quad(x,y)\in\mathbb R^2\,. \]

 

Lösung

 

Wir berechnen zunächst \[ f_x(x,y)=3(x-1)^2+6(x-y)=3x^2-6y+3,\quad f_y(x,y)=6y-6x. \] Die Bedingung \( \nabla f(x,y)=(0,0) \) führt also auf \[ x=y\quad\mbox{und damit}\quad x^2-2x+1=0. \] Die quadratische Gleichung rechts besitzt nur die eine Lösung \( x=1, \) d.h. wir erhalten \[ P=(1,1) \] als einzigen kritischen Punkt.\( \qquad\Box \)

 

 

Aufgabe 14.1.7: (Bestimmen kritischer Punkte II)

Bestimmen Sie sämtliche kritische Punkte der Funktion \[ f(x,y)=x^3-6xy+2y^3\,,\quad(x,y)\in\mathbb R^2\,. \]

 

Lösung

 

Wir ermitteln zunächst \[ f_x(x,y)=3x^2-6y,\quad f_y(x,y)=-6x+6y^2\,. \] Beide Terme setzen wir nun gleich \( 0 \) und erhalten \[ x^2=2y,\quad y^2=x, \] d.h. die Koordinaten kritischer Punkte sind nicht negativ. Wir lesen als ersten kritischen Punkt ab \( (0,0). \) Quadrieren der zweiten Identität bringt unter der Annahme \( x,y\not=0 \) \[ y^4=x^2\,,\quad\mbox{daher}\quad y^4=2y\quad\mbox{bzw.}\quad y^3=2 \] und somit als zweiten kritischen Punkt \( (\sqrt[3]{4},\sqrt[3]{2}). \) Zusammenfassend haben wir also \[ P_1=(0,0),\quad P_2=(\sqrt[3]{4},\sqrt[3]{2}) \] als kritische Punkte bestimmt.\( \qquad\Box \)

 

 

Aufgabe 14.1.8: (Bestimmen kritischer Punkte III)

Bestimmen Sie sämtliche kritische Punkte der Funktion \[ f(x,y)=\sin x\sin y,\quad(x,y)\in\mathbb R^2\,. \]

 

Lösung

 

Wir berechnen zunächst \[ f_x(x,y)=\cos x\sin y,\quad f_y(x,y)=\sin x\cos y. \] Die Bedingungen \[ 0=\cos x\sin y,\quad 0=\sin x\cos y \] führen auf folgende zwei Fälle:

\( \circ \) Ist \( \cos x=0, \) dann auch \( \cos y=0 \) und umgekehrt, also

\[ x=\frac{\pi}{2}+m\pi,\quad y=\frac{\pi}{2}+n\pi \quad\mbox{mit}\ m,n\in\mathbb Z. \]

\( \circ \) Ist \( \sin x=0, \) dann auch \( \sin y=0 \) und umgekehrt, also

\[ x=k\pi,\quad y=\ell\pi \quad\mbox{mit}\ k,\ell\in\mathbb Z. \] Wir erhalten also als Menge der kritischen Punkte \[ \begin{array}{l} \displaystyle \{(x,y)\in\mathbb R^2\,:\,x=k\pi,\ y=\ell\pi,\ k,\ell\in\mathbb Z\}\cup\ldots \\ \displaystyle\qquad \ldot\cup\left\{(x,y)\in\mathbb R^2\,:\,x=\frac{\pi}{2}+m\pi,\ \frac{\pi}{2}+n\pi,\ m,n\in\mathbb Z\right\}. \end{array} \] Das war zu zeigen.\( \qquad\Box \)

 

 

Aufgabe 14.1.9: (Beweis der notwendigen Bedingung erster Ordnung)

Beweisen Sie den Satz aus Paragraph 14.1.3.

 

Lösung

 

Da \( \Omega\subseteq\mathbb R^m \) offen ist, existiert ein offener Ball \( B_\varepsilon(a)\subset\Omega. \) Wähle \( i\in\{1,\ldots,m\}. \) Mit dem \( i \)-ten Einheitsvektor \( e_i=(0,\ldots,0,1,0,\ldots,0)\in\mathbb R^n \) betrachten wir die differenzierbare Funktion \[ \Phi(t):=f(a+te_i),\quad t\in(-\varepsilon,\varepsilon). \] Nach dem Satz aus ➝  Paragraph 7.3.2 gilt \[ \Phi'(0)=0 \quad\mbox{und damit}\quad f_{x_i}(a)=0. \] Das gilt nun für alle \( i=1,\ldots,m, \) woraus die Behauptung folgt.\( \qquad\Box \)

 

 

Aufgaben - Eine notwendige Bedingung zweiter Ordnung

 

Aufgabe 14.1.10: (Die notwendige Bedingung zweiter Ordnung am Beispiel)

Verifizieren Sie die notwendige Bedingung zweiter Ordnung aus Paragraph 14.1.4 am Beispiel der Funktion \[ f(x,y)=x^2+y^2\,,\quad(x,y)\in\mathbb R^2\,, \] die im Punkt \( a=(0,0) \) ein lokales Minimum besitzt.

 

Lösung

 

Hier gelten \[ f_x(x,y)=2x,\quad f_y(x,y)=2y \] sowie \[ f_{xx}(x,y)=2,\quad f_{xy}(x,y)=0,\quad f_{yy}(x,y)=2. \] Die notwendige Bedingung zweiter Ordnung lautet daher \[ \sum_{i,j=1}^2f_{x_ix_j}(0,0)\xi_i\xi_j =f_{xx}(0,0)\xi_1^2+f_{yy}(0,0)\xi_2^2 =2(\xi_1^2+\xi_2^2). \] Die rechte Seite hierin ist offensichtlich nichtnegativ.\( \qquad\Box \)

 

 

Aufgabe 14.1.11: (Beweis der notwendigen Bedingung zweiter Ordnung)

Formulieren und beweisen Sie den Satz aus Paragraph 14.1.4 für den Fall, dass \( f(x) \) in \( a\in\Omega \) ein lokales Maximum besitzt.

 

Lösung

 

Auf der offenen Menge \( \Omega\subseteq\mathbb R^m \) besitze die Funktion \( f\in C^2(\Omega,\mathbb R) \) im Punkt \( a\in\Omega \) ein lokales Maximum. Dann gilt \[ \sum_{i,j=1}^mf_{x_ix_j}(a)\xi_i\xi_j\le 0\quad\mbox{für alle}\ \xi=(\xi_1,\ldots,\xi_m)\in\mathbb R^m\,. \] Zum Beweis gehen wir wie in Paragraph 14.1.4 vor: Wähle also ein \( \xi\in\mathbb R^m \) beliebig. Da \( a\in\Omega \) ein innerer Punkt ist, existiert ein \( \varepsilon\gt 0, \) so dass \( B_\varepsilon(a)\subset\Omega. \) Also gilt auch \( a+t\xi\in\Omega \) für \( t\gt 0 \) hinreichend klein. Wegen \( \mbox{grad}\,f(a)=0 \) folgt mit der Taylorschen Formel aus Paragraph 14.1.1 \[ f(a+t\xi)-f(a) =df(a,t\xi)+\frac{1}{2}\,d^2f(a+\tau\xi,t\xi) =\frac{1}{2}\,d^2f(a+\tau\xi,t\xi) \] mit geeignet zu wählendem \( \tau\in(0,t). \) Nach Voraussetzung ist außerdem \[ f(a+t\xi)-f(a)\le 0\quad\mbox{für}\ t\gt 0\ \mbox{hinreichend klein.} \] Wir schließen also \[ 0\ge\frac{1}{2}\,d^2f(a+\tau\xi,t\xi) =\frac{t^2}{2}\,\sum_{i,j=1}^mf_{x_ix_j}(a+\tau\xi)\xi_i\xi_j\,. \] Grenzübergang \( t\to 0 \) und \( f\in C^2(\Omega,\mathbb R) \) zeigen die Behauptung.\( \qquad\Box \)

 

 

Aufgaben - Die Hessesche Form

 

Aufgabe 14.1.12: (Ermitteln der Hesseschen Matrix)

Ermitteln Sie die Hessesche Matrix der folgenden Funktionen \( f,g\in C^2(\mathbb R^2,\mathbb R). \)

(i) \( f(x,y)=xy-3xy^3+x^3 \)
(ii) \( g(x,y)=\sin xy-\cosh(x+y) \)

 

Lösung

 

 

 

Aufgabe 14.1.13: (Spezielle Formen der Hesseschen Matrix)

Finden Sie Funktionen \( f,g\in C^2(\mathbb R^2,\mathbb R), \) deren Hessesche Matrizen die folgende Form besitzen:

(i) \( {\mathbf H}_f(x,y)=\left(\begin{array}{cc} * & 0 \\ 0 & * \end{array}\right) \) (ii) \( {\mathbf H}_g(x,y)=\left(\begin{array}{cc} 0 & * \\ * & 0 \end{array}\right) \)

 

Lösung

 

(i) Für \( f(x,y)=x^2+y^2 \) ermitteln wir

\[ {\mathbf H}_f(x,y)=\left(\begin{array}{cc} 2 & 0 \\ 0 & 2 \end{array}\right). \]

(ii) Für \( g(x,y)=xy \) ermitteln wir

\[ {\mathbf H}_g(x,y)=\left(\begin{array}{cc} 0 & 1 \\ 1 & 0 \end{array}\right). \] Damit sind zwei solche Funktionen gefunden.\( \qquad\Box \)

 

 

Aufgaben - Eine hinreichende Bedingungen zweiter Ordnung

 

Aufgabe 14.1.14: (Lokale und globale Extrema)

Untersuchen Sie die Funktion \[ f(x,y):=(x^2+y^2)e^{-x^2-y^2}\,,\quad(x,y)\in\Omega:=\left\{(x,y)\in\mathbb R^2\,:\,x^2+y^2\le\frac{1}{4}\right\}, \] auf lokale und globale Minima und Maxima.

 

Lösung

 

 

 

Aufgabe 14.1.15: (Lokale Extrema I)

Untersuchen Sie die Funktion \[ f(x,y):=x(x-y),\quad(x,y)\in\mathbb R^2\,, \] auf lokale Minima und Maxima.

 

Lösung

 

 

 

Aufgabe 14.1.16: (Lokale Extrema II)

Untersuchen Sie die Funktion \[ f(x,y):=-x^2+xy-y^2\,,\quad(x,y)\in\mathbb R^2\,, \] auf lokale Minima und Maxima.

 

Lösung

 

 

 

Aufgabe 14.1.17: (Schwerpunkt eines Dreiecks)

Die Koordinaten des Schwerpunktes \( P=(x_s,y_s) \) eines Dreiecks \[ \triangle(ABC):=\{(x,y)\in\mathbb R^2\,:\,\lambda A+\mu B+\nu C\in\mathbb R^2\,:\,\lambda,\mu,\nu\in[0,1],\ \lambda+\mu+\nu=1\} \] mit paarweise verschiedenen Eckpunkten \( A=(x_1,y_1), \) \( B=(x_2,y_2), \) \( C=(x_3,y_3) \) berechnen sich zu \[ x_s=\frac{x_1+x_2+x_3}{3}\,,\quad y_s=\frac{y_1+y_2+y_3}{3}\,. \] Beweisen Sie: Der Schwerpunkt ist unter allen inneren Punkten des Dreiecks derjenige Punkt, für welchen die Summe der Abstandsquadrate zu den Ecken des Dreiecks minimal ist.

 

Lösung

 

Es ist die quadratische Funktion (wir quadrieren) \[ f(x,y):=\big[(x-x_1)^2+(y-y_1)^2\big]+\big[(x-x_2)^2+(y-y_2)^2\big]+\big[(x-x_3)^2+(y-y_3)^2\big] \] zu minimieren. Beachte dabei \( f\in C^2(\mathbb R^2,\mathbb R). \) Wir berechnen also \[ \begin{array}{lll} f_x(x,y)\negthickspace & = & \negthickspace\displaystyle 2\,\big[(x-x_1)+(x-x_2)+(x-x_3)\big], \\ f_y(x,y)\negthickspace & = & \negthickspace\displaystyle 2\,\big[(y-y_1)+(y-y_2)+(y-y_3)\big]\,. \end{array} \] Als einzigen kritischen Punkt der Funktion in ganz \( \mathbb R^2 \) erhalten wir also den Schwerpunkt \[ P=(x_s,y_s) \] mit den in der Aufgabe angegebenen Koordinaten \( x_s \) und \( y_s. \) Für die zweiten partiellen Ableitungen erhalten wir \[ f_{xx}(x,y)=6,\quad f_{xy}(x,y)=f_{yx}(x,y)=0,\quad f_{yy}(x,y)=6, \] d.h. die Hessesche Form ist positiv definit, so dass in \( (x_s,y_s) \) ein striktes Minimum der Funktion \( f(x,y) \) vorliegt. Da aber \( (x_s,y_s)\in\triangle(ABC), \) so ist \( (x_s,y_s) \) auch ein striktes Minimum der Funktion im Inneren des Dreiecks \( \triangle(ABC) \) - Randdaten werden nach Aufgabenstellung nicht betrachtet. Das war zu zeigen.\( \qquad\Box \)

 

 


 

 

14.1.8 Wiederholungsfragen

 

1. Wie lautet die Taylorsche Formel?
2. Was versteht man unter dem Taylorpolynom \( \ell \)-ter Ordnung
3. Wie haben wir das Restglied der Taylorreihe vom Grad \( \ell+1 \) eingeführt?
4. Was versteht man unter einem globalen Maximum bzw. globalen Minimum?
5. Was versteht man unter einem lokalen Maximum bzw. lokalen Minimum?
6. Wann spricht man von einem Extremum?
7. Wie lautet die notwendige Bedingung erster Ordnung für die Existenz eines lokalen Maximums bzw. lokalen Minimums?
8. Was versteht man dagegen unter einem kritischen Punkt?
9. Welche notwendige Bedingung zweiter Ordnung zur Existenz eines lokalen Extremums kennen Sie?
10. Wie lautet die Hessesche Matrix einer Funktion \( f\in C^2(\Omega,\mathbb R)? \)
11. Was versteht man unter der Hesseschen Form einer Funktion \( f\in C^2(\Omega,\mathbb R)? \)
12. Wie drückt sich die notwendige Bedingung zweiter Ordnung aus Punkt 9 in Termen der Hesseschen Form bzw. der Hesseschen Matrix aus?

 


 

14.2 Der Fundamentalsatz über inverse Abbildungen

 

14.2.1 Der Fundamentalsatz über inverse Abbildungen

 

Wir wollen in diesem Abschnitt den folgenden zentralen Satz über die Umkehrbarkeit mehrwertiger Abbildungen beweisen.

 

Satz: Es seien \( \Omega\subseteq\mathbb R^m \) eine offene Menge und \( f\in C^p(\Omega,\mathbb R^m) \) mit \( p\in\mathbb N \) eine Funktion. In einem Punkt \( a\in\Omega \) gelte \[ \mbox{det}\,\partial f(a)\not=0 \] für die Determinante der Funktionalmatrix \( \partial f(x) \) im Punkt \( x=a. \) Dann existieren offene Mengen \[ A\subset\Omega\ \mbox{mit}\ a\in A \quad\mbox{und}\quad B\subset f(\Omega)\ \mbox{mit}\ b:=f(a)\in B, \] so dass gelten

(i) \( f\colon A\to B \) bildet \( A\subset\mathbb R^m \) topologisch auf \( B\subset\mathbb R^m \) ab, d.h. es existiert eine stetige Inverse \( g\colon B\to A \) mit

\[ \begin{array}{ll} g(f(x))=x & \mbox{für alle}\ x\in A, \\ f(g(y))=y & \mbox{für alle}\ y\in B. \end{array} \]

(ii) Es gilt \( g\in C^p(B,\mathbb R^m). \)

 

Den Beweis dieses Satzes tragen wir nach F. Sauvignys Lehrbuch Analysis vor. Wir unterteilen ihn in fünf Hilfssätze, die wir nun detailliert diskutieren.

 

Aufgaben zu diesem Abschnitt

 


 

 

14.2.2 Lokale Umkehrbarkeit I

 

Wir beginnen also mit dem

 

Hilfssatz: Auf der offenen Menge \( \Omega\subseteq\mathbb R^m \) sei die Funktion \( f\in C^1(\Omega,\mathbb R^m) \) gegeben. In einem Punkt \( a\in\Omega \) gelte \[ \mbox{det}\,\partial f(a)\not=0. \] Dann existieren ein \( \varrho\gt 0 \) und eine abgeschlossene Kugel \[ K_\varrho(a):=\{x\in\mathbb R^m\,:\,|x-a|\le\varrho\}\subset\Omega, \] so dass die Einschränkung von \( f(x) \) auf \( K_\varrho(a) \) injektiv ist. Insbesondere gilt die Verzerrungsabschätzung \[ |f(x')-f(x'')|\ge M\cdot|x'-x''|\quad\mbox{für alle}\ x',x''\in K_\varrho(a) \] mit einer geeignet zu wählenden Konstante \( M\gt 0. \) Ferner gilt \[ \mbox{det}\,\partial f(x)\not=0\quad\mbox{für alle}\ x\in K_\varrho(a). \]

 

Beweis

 

Wir gehen in mehreren Schritten vor.

1. Es ist nach Voraussetzung \( f_i\in C^1(\Omega,\mathbb R) \) für alle \( i=1,\ldots,m, \) d.h. die partiellen Ableitungen \( \partial_{x_j}f_i \) der Komponenten \( f_i \) sind in \( \Omega \) sämtlich stetig.
2. Nach Voraussetzung ist \( \mbox{det}\,\partial f(a)\not=0, \) d.h. die Funktionalmatrix \( \partial f(x) \) ist im Punkt \( x=a \) invertierbar. Mit einem geeigneten \( \varrho\gt 0 \) ist dann auch wegen der Stetigkeit der Ableitungen \( f_{i,x_j}(x) \)

\[ \partial^*f[\eta] :=\left( \begin{array}{ccc} f_{1,x_1}(z^{(1)}) & \cdots & f_{1,x_m}(z^{(1)}) \\ \vdots & & \vdots \\ f_{m,x_1}(z^{(m)}) & \cdots & f_{m,x_m}(z^{(m)}) \end{array} \right) \]

  für alle \( \eta=(z^{(1)},\ldots,z^{(m)})\in K_\varrho(a)\times\ldots\times K_\varrho(a) \) invertierbar, und hieraus folgt das im Hilfssatz behauptete Nichtverschwinden der Funktionaldeterminante.
3. Wir betrachten die Funktion

\[ \Phi(\eta,\xi):=|\partial^*f[\eta]\circ\xi^t|,\quad(\eta,\xi)\in\mathbb R^m\,. \]

  Auf der kompakten Menge

\[ D:=K_\varrho(a)\times\ldots\times K_\varrho(a)\times S\subset\mathbb R^{m\cdot m+m}\,,\quad S=\{\xi\in\mathbb R^m\,:\,|\xi|=1\}\,, \]

  ist zunächst (Übungsaufgabe)

\[ \Phi(\eta,\xi)\gt 0\quad\mbox{für alle}\ (\eta,\xi)\in D, \]

  und nach dem Fundamentalsatz von Weierstraß nimmt die Funktion \( \Phi(\eta,\xi) \) auf \( D\subset\mathbb R^{m^2+m} \) ihr Minimum an, d.h. mit geeignetem \( M\gt 0 \) gilt

\[ 0\lt M\le\Phi(\eta,\xi)\quad\mbox{für alle}\ (\eta,\xi)\in D. \]

  Hieraus schließen wir wiederum (setze in \( \Phi(\eta,\cdot) \) das Argument \( \frac{\xi}{|\xi|}\in S \) ein für \( \xi\in\mathbb R^m\setminus\{0\} \) und multipliziere mit \( |\xi|\gt 0 \), im Fall \( \xi=0 \) ist nichts zu zeigen)

\[ M|\xi|\le\Phi(\eta,\xi)\quad\mbox{für alle}\ (\eta,\xi)\in K_\varrho(a)\times\ldots\times K_\varrho(a)\times\mathbb R^m\,. \]

4. Wähle nun \( x',x''\in K_\varrho(a) \) beliebig, und wende auf jede Komponentenfunktion \( f_i\colon K_\varrho(a)\to\mathbb R \) den Mittelwertsatz an

\[ f_i(x'')-f_i(x')=\sum_{j=1}^m\frac{\partial f_i(z^{(i)})}{\partial x_j}\cdot(x_j''-x_j'),\quad i=1,\ldots,m, \]

  mit \( z^{(i)}\in\mbox{Conv}\,(x',x'') \) geeignet. Vektoriell schreiben wir kompakter

\[ f(x'')-f(x')=\partial f^*[\eta]\circ(x''-x')^t \]

  mit \( \eta=(z^{(1)},\ldots,z^{(m)})\in K_\varrho(a)\times\ldots\times K_\varrho(a). \)
5. Hieraus erhalten wir mit \( \xi:=x''-x' \) und dem dritten Beweispunkt für alle \( x',x''\in K_\varrho(a) \)

\[ |f(x'')-f(x')|=|\partial^*f[\eta]\circ\xi^t|=\Phi(\eta,\xi)|\le M|x''-x'|. \]

  Das ist die im Hilfssatz behauptete Ungleichung. Wegen \( M\gt 0 \) folgt aus dieser Ungleichung sofort die Injektivität der Funktion \( f(x). \)

 

Damit ist der Hilfssatz bewiesen.\( \qquad\Box \)

 

 

Keine Aufgaben

 


 

 

14.2.3 Lokale Umkehrbarkeit II

 

Wir beginnen also mit dem

 

Hilfssatz: Auf der offenen Menge \( \Omega\subseteq\mathbb R^m \) sei die Funktion \( f\in C^1(\Omega,\mathbb R^m) \) gegeben. In einem Punkt \( a\in\Omega \) gelte \[ \mbox{det}\,\partial f(a)\not=0. \] Neben dem Radius \( \varrho\gt 0 \) aus dem vorigen Hilfssatz existieren dann ein weiterer Radius \( \sigma\gt 0 \) sowie eine abgeschlossene Kugel \[ K_\sigma(b):=\{y\in\mathbb R^m\,:\,|y-b|\le\sigma\}\subset f(\Omega),\quad b:=f(a), \] so dass zu jedem \( y'\in K_\sigma(b) \) ein \( x'\in K_\varrho(a) \) gehört mit \[ f(x')=y'\,. \]

 

Beweis

 

Wir gehen in mehreren Schritten vor.

1. Nach vorigem Hilfssatz ist zunächst

\[ \begin{array}{l} |f(x)-b|\ge M\cdot|x-a|=M\varrho=:\tau \\ \mbox{für alle}\ x\in\partial K_\varrho(a)=\{z\in\mathbb R^m\,:\,|z-a|=\varrho\}\,. \end{array} \]

  Sei jetzt \( y'\in K_\sigma(b) \) in \( K_\sigma(b) \) beliebig gewählt, wobei wir

\[ \sigma\in\left(0,\frac{\tau}{2}\right) \]

  als Radius wählen. Zu zeigen ist die Existenz eine Urbildes \( x'\in K_\varrho(a) \) mit \( y'=f(x'). \)
2. Dazu beginnen wir mit der Abschätzung

\[ \begin{array}{l} \displaystyle |f(x)-y'|=|f(x)-b+b-y'|\ge|f(x)-b|-|b-y'|\ge\tau-\sigma\gt\frac{\tau}{2} \\ \displaystyle \mbox{für alle}\ x\in\partial K_\varrho(a), \end{array} \]

  wobei wir \( |f(x)-b|\ge\tau \) nach dem ersten Beweispunkt und \( b,y'\in K_\sigma(b) \) beachten. Desweiteren ist wegen \( y'\in K_\sigma(b) \)

\[ |f(a)-y'|=|b-y'|\le\sigma\lt\frac{\tau}{2}\,. \]

3. Wir betrachten nun die stetige Funktion

\[ \begin{array}{l} \displaystyle h\colon K_\varrho(a)\longrightarrow\mathbb R\quad\mbox{vermöge} \\ \displaystyle h(x):=|f(x)-y'|^2=\sum_{i=1}^m\big\{f_i(x)-y_i'\big\}^2\,. \end{array} \]

  Nach dem zweiten Beweispunkt erfüllt diese Funktion

\[ h(a)=|f(a)-y'|^2\lt\frac{\tau^2}{4} \]

  (zweite Abschätzung dort) sowie

\[ h(x)=|f(x)-y'|^2\gt\frac{\tau^2}{4}\quad\mbox{für alle}\ x\in\partial K_\varrho(a) \]

  (erste Abschätzung dort). Auf der kompakten Menge \( K_\varrho(a) \) nimmt \( h(x) \) ihr Minimum an, und nach eben diesen Abschätzungen genauer in einem inneren Punkt, etwa

\[ x'\in\mathring K_\varrho(a)=\{z\in\mathbb R^m\,:\,|z-a|\lt\varrho\}\,. \]

4. Da aber \( h(x) \) auch stetig differenzierbar ist, folgt in diesem inneren Punkt

\[ 0=\frac{\partial h(x')}{\partial x_k}=2\sum_{i=1}^m\frac{\partial f_i(x')}{\partial x_k}\,\big\{f_i(x')-y_i'\big\} \]

  für alle \( k=1,\ldots,m \) bzw. in Matrixschreibweise

\[ 0=\partial f(x')\circ\big\{f(x')-y'\big\}^t\,. \tag{\(*\)} \]

  Nach Voraussetzung ist aber

\[ \mbox{det}\,\partial f(a)\not=0, \]

  und mit der Wahl des Radius \( \varrho\gt 0 \) aus dem vorigen Hilfssatz folgt aus Stetigkeitsgründen

\[ \mbox{det}\,\partial f(x')\not=0,\quad\mbox{da}\ x'\in\mathring K_\varrho(a). \]

  Das Gleichungssystem \( (*) \) besitzt also nur die triviale Lösung, d.h. es gelten

\[ f(x')-y'=0\quad\mbox{bzw.}\quad f(x')=y'\,. \] Damit ist der Hilfssatz bewiesen.\( \qquad\Box \)

 

 

Keine Aufgaben

 


 

 

14.2.4 Zusammenfassung

 

Wir fassen unsere bisherigen Ergebnisse zusammen.

 

\( \circ \) Für alle \( y\in K_\sigma(b) \) existiert nach dem zweiten Hilfssatz ein \( x\in K_\varrho(a) \) mit

\[ f(x)=y. \]

\( \circ \) Dieses Urbild zu \( x\in K_\varrho(a) \) ist auf \( K_\varrho(a) \) eindeutig, denn gäbe es

\[ x',x''\in K_\varrho(a)\quad\mbox{mit}\quad f(x')=f(x'')=y, \]

  so folgt nach dem ersten Hilfssatz wegen \( M\gt 0 \)

\[ M|x'-x''|\le|f(x')-f(x'')|=|y-y|=0 \quad\mbox{bzw.}\quad x'=x''\,. \] Wir können also auf \( K_\sigma(b) \) die zu \( f(x) \) inverse Abbildung definieren \[ \begin{array}{l} g\colon K_\sigma(b)\longrightarrow K_\varrho(a)\quad\mbox{vermöge} \\ y\mapsto x:=g(y),\ \mbox{falls}\ x\in K_\varrho(a)\ \mbox{und}\ f(x)=y. \end{array} \]

In den folgenden beiden Paragraphen wollen wir die Stetigkeit und die Differenzierbarkeit dieser Umkehrabbildung studieren.

 

Keine Aufgaben

 


 

 

14.2.5 Stetigkeit der Umkehrabbildung

 

Hilfssatz: Die Abbildung \( g\colon K_\sigma(b)\to K_\varrho(a) \) ist stetig auf \( K_\sigma(b). \)

 

Beweisidee

 

Wir wollen nur eine grobe Idee eines möglichen Beweises geben.

1. Die Abbildung \( f\colon K_\varrho(a)\to K_\sigma(b) \) ist nach Voraussetzung stetig, und daher ist die folgende Menge kompakt

\[ D:=\{x\in K_\varrho(a)\,:\,f(x)\in K_\sigma(b)\}\subseteq K_\varrho(a). \]

2. Schränke \( f(x) \) auf \( D \) ein und betrachte nur die invertierbare Einschränkung \( f|_D\colon D\to K_\sigma(b). \) Diese ist stetig.
3. Die zu \( f|_D \) gehörige Inverse \( g\colon K_\sigma(b)\to D \) ist stetig.

 

Damit schließen wir unsere Beweisidee ab.\( \qquad\Box \)

 

 

Keine Aufgaben

 


 

 

14.2.6 Differenzierbarkeit der Umkehrabbildung

 

Hilfssatz: Die Abbildung \( g\colon K_\sigma(b)\to K_\varrho(a) \) aus vorigem Paragraphen gehört zur Regularitätsklasse \( C^1(\mathring K_\sigma(b),\mathbb R^m), \) und es gilt \[ \partial g(y) =\big\{\partial f(x)\big\}^{-1} =\frac{(\mbox{det}\,{\mathbf F}_{ij}(g(y)))_{i,j=1,\ldots,m}}{\mbox{det}\,\partial f(g(y))}\,. \] Hierbei bedeutet \[ {\mathbf F}_{ij}(x)\in\mathbb R^{m\times n} \] die Matrix, die aus der Funktionalmatrix \( \partial f(x) \) nach Ersetzen der \( i \)-ten Spalte von \( \partial f(x) \) durch den \( j \)-ten Einheitsvektor entsteht.

 

Beweis

 

Wir gehen in mehreren Schritten vor.

1. Nach dem ersten Hilfssatz gilt zunächst

\[ \mbox{det}\,\partial f(x)\not=0\quad\mbox{für alle}\ x\in K_\varrho(a). \]

  Wir können daher \( \partial f(x) \) in \( K_\varrho(a) \) invertieren und erhalten die inverse Matrix

\[ \big\{\partial f(x)\big\}^{-1}=:(a_{ij}(x))_{i,j=1,\ldots,m}\,,\quad x\in K_\varrho(a). \]

  Wir wollen die Koeffizienten \( a_{ij}\in\mathbb R \) näher bestimmen.
2. Wegen

\[ \partial f(x)\circ\big\{\partial f(x)\big\}^{-1} =\big\{\partial f(x)\big\}^{-1}\circ\partial f(x) =\mathbb E^m \]

  mit der \( m \)-dimensionalen Einheitsmatrix

\[ \mathbb E^m=(\delta_{ij})_{i,j=1,\ldots,m}\in\mathbb R^{m\times m} \quad\mbox{mit}\quad \delta_{ij}:=\left\{\begin{array}{cl} 1, & \mbox{falls}\ i=j \\ 0, & \mbox{sonst} \end{array}\right. \]

  lösen die unbekannten \( a_{ij}\in\mathbb R \) das lineare Gleichungssystem

\[ \partial f(x)\circ\left(\begin{array}{c} a_{1j} \\ \vdots \\ a_{mj} \end{array}\right) =\left(\begin{array}{c} \delta_{1j} \\ \vdots \\ \delta_{mj} \end{array}\right) \quad\mbox{für alle}\ j=1,\ldots,m. \]

  Dieses System kann mit der Gramschen Regel aufgelöst werden gemäß

\[ a_{ij}(x)=\frac{\mbox{det}\,{\mathbf F}_{ij}(x)}{\mbox{det}\,\partial f(x)} \]

  mit \( {\mathbf F}_{ij}(x)\in\mathbb R^{m\times m} \) aus der Behauptung des Hilfssatzes. Damit sind aber alle \( a_{ij}(x) \) als stetige Funktionen ausgedrückt:

\[ a_{ij}\in C^0(K_\varrho(a),\mathbb R)\quad\mbox{für alle}\ i,j=1,\ldots,m. \]

3. Da \( f\in C^1(K_\varrho(a),\mathbb R^m) \) nach Voraussetzung des Fundamentalssatzes über inverse Abbildungen richtig ist, gilt nach dem zweiten Satz aus ➝ Paragraph 13.2.2

\[ f(x')=f(x)+\partial f(x)\circ(x'-x)^t+{\mathbf F}(x',x)\circ(x'-x)^t \]

  worin der Restterm \( {\mathbf F}\in\mathbb R^{m\times m} \) erfüllt

\[ \lim_{x'\to x,\ x'\not=x}{\mathbf F}(x',x)={\mathbf 0}. \]

  Wir multiplizieren diese Entwicklung mit \( \{\partial f(x)\}^{-1} \) und erhalten

\[ \begin{array}{l} \displaystyle \big\{\partial f(x)\big\}^{-1}\circ\{f(x')-f(x)\}^t \\ \displaystyle\qquad =\,\big\{\partial f(x)\big\}^{-1}\circ\partial f(x)\circ(x'-x)^t +\big\{\partial f(x)\big\}^{-1}\circ{\mathbf F}(x',x)\circ(x'-x)^t \\ \displaystyle\qquad =\,(x'-x)^t+\big\{\partial f(x)\big\}^{-1}\circ{\mathbf F}(x',x)\circ(x'-x)^t\,. \end{array} \]

4. In dieser letzten Identität substituieren wir

\[ y=f(x),\quad y'=f(x'),\quad x=g(y),\quad x'=g(y') \]

  mit der Umkehrabbildung \( g(y). \) Damit gelangen wir zu

\[ \begin{array}{l} \big\{\partial f(g(y))\big\}^{-1}\circ(y'-y)^t \\ \displaystyle\qquad =\,\{g(y')-g(y)\}^t+\big\{\partial f(g(y))\big\}^{-1}\circ{\mathbf F}(g(y'),g(y))\circ\{g(y')-g(y)\}^t \end{array} \]

  bzw. nach Umstellen

\[ \begin{array}{l} g(y')-g(y) \\ \displaystyle\qquad =\,\big\{\partial f(g(y))\big\}^{-1}\circ(y'-y)^t -\big\{\partial f(g(y))\big\}^{-1}\circ{\mathbf F}(g(y'),g(y))\circ\{g(y')-g(y)\}^t \\ \displaystyle\qquad =\,\big\{\partial f(g(y))\big\}^{-1}\circ(y'-y)^t+G(y',y) \end{array} \]

  mit der Resttermabbildung

\[ G(y',y):=-\big\{\partial f(g(y))\big\}^{-1}\circ{\mathbf F}(g(y'),g(y))\circ\{g(y')-g(y)\}^t\,. \]

5. Diese Resttermabbildung erfüllt nun

\[ \lim_{y'\to y,\ y'\not=y}\frac{G(y',y)}{|y'-y|}=0, \]

  wobei wir zum Nachweis beachten:
 
\( \circ \) der erste Faktor \( \{\partial f(g(y))\}^{-1} \) von \( G(y',y) \) ist nach Voraussetzung stetig in allen Komponenten;
\( \circ \) nach dem dritten Hilfssatz ist \( g(y) \) stetig;
\( \circ \) es gilt

\[ \lim_{x'\to x,\ x'\not=x}{\mathbf F}(x',x)={\mathbf 0}. \]

  Aber wie verhält sich nun der Quotient

\[ \frac{|g(y')-g(y)|}{|y'-y|}\quad\mbox{im Grenzfall}\ y'\underset{\not=}{\longrightarrow}y\,? \]

  Nach dem ersten Hilfssatz existiert ein reelles \( M\gt 0 \) mit

\[ |y'-y|=|f(g(y'))-f(g(y))|\ge M\cdot|g(y')-g(y)| \quad\mbox{für alle}\ y,y'\in K_\sigma(b), \]

  da ja \( g(y),g(y')\in K_\varrho(a). \) Umstellen liefert

\[ \frac{|g(y')-g(y)|}{|y'-y|}\le\frac{1}{M}\quad\mbox{für alle}\ y,y'\in K_\sigma(b)\ \mbox{mit}\ y\not=y'\,. \]

  Dies zeigt die Beschränktheit des Quotienten, und obige Zwischenbehauptung folgt.
6. Wir kommen zu Identität

\[ g(y')-g(y) =\big\{\partial f(g(y))\big\}^{-1}\circ(y'-y)^t+G(y',y) \]

  zurück und wollen den \( j \)-ten Differenzenquotienten auswerten. Mit einem \( h\in\mathbb R\setminus\{0\} \) ersetzen wir dazu \( y'\in\mathbb R^m \) durch

\[ \widetilde y:=(y_1,\ldots,y_{j-1},y_j+h,y_{j+1},\ldots,y_m) \]

  und multiplizieren die Gleichung von links mit \( \frac{1}{h}\,e_i: \)

\[ \frac{g_i(\widetilde y)-g_i(y)}{h} =\frac{1}{h}\,e_i\circ\big\{\partial f(g(y))\big\}^{-1}\circ\left(\begin{array}{c} 0 \\ \vdots \\ 0 \\ h \\ 0 \\ \vdots \\ 0 \end{array}\right) +\frac{\langle e_i,G(\widetilde y,y)\rangle}{h}\,. \]

  Jetzt sind zu beachten
 
\( \circ \) der erste Summand rechts lässt sich mit den \( a_{ij} \) aus dem ersten Beweispunkt ausdrücken;
\( \circ \) er zweite Summand rechts verschwindet im Grenzfall \( h\to 0 \) nach dem fünften Beweispunkt.
  Es existieren also die partiellen Ableitungen

\[ \frac{\partial g_i(y)}{\partial y_j} =\frac{\mbox{det}\,{\mathbf F}_{ij}(g(y))}{\mbox{det}\,\partial f(g(y))}\,, \]

  und es gelten

\[ \partial_{y_j}g_i\in C^1(\mathring K_\sigma(b),\mathbb R)\quad\mbox{für alle}\ i,j=1,\ldots,m, \]

  also \( g\in C^1(\mathring K_\sigma(b),\mathbb R^m). \)
  Damit ist der Hilfssatz bewiesen.\( \qquad\Box \)

 

 

Die hiermit bewiesene Aussage \[ f\in C^1(\Omega,\mathbb R^m),\quad\mbox{dann}\quad g\in C^1(\mathring K_\sigma(b),\mathbb R^m) \] kann wie folgt verschärft werden, was endlich der fünfte Hilfssatz ist.

 

Hilfssatz: Auf der offenen Menge \( \Omega\subseteq\mathbb R^m \) sei \( f\in C^p(\Omega,\mathbb R^m) \) mit \( p\in\mathbb N. \) Sei \( a\in\Omega \) ein Punkt mit \[ \mbox{det}\,\partial f(a)\not=0. \] Dann gehört die Umkehrabbildung \( g\colon K_\sigma(b)\to K_\varrho(a) \) der Regularitätsklasse \( C^p(\mathring K_\sigma(b),\mathbb R^m) \) an.

 

Beweisidee

 

Der Beweis kann vermittels der Methode der vollständigen Induktion geführt werden.

1. Der Fall \( p=1, \) also \( g\in C^1(\mathring K_\sigma(b),\mathbb R^m), \) ist Inhalt des vorigen Hilfssatzes.
2. Sei \( f\in C^p(\Omega,\mathbb R^m). \) Nach Induktionsvoraussetzung ist

\[ g\in C^{p-1}(\mathring K_\sigma(b),\mathbb R^m). \]

  Aus dem Beweis des vorigen Hilfssatzes machen wir Gebrauch von

\[ \frac{\partial g_i(y)}{\partial y_j}=\frac{\mbox{det}\,{\mathbf F}_{ij}(g(y))}{\mbox{det}\,\partial f(g(y))}\quad\mbox{für alle}\ i,j=1,\ldots,m. \]

  Wegen \( {\mathbf F}_{ij}\in C^{p-1}(\Omega,\mathbb R^m) \) und \( \partial f\in C^{p-1}(\Omega,\mathbb R^m) \) gehört die rechte Seite ebenfalls der Regularitätsklasse \( C^{p-1}(\mathring K_\sigma(b),\mathbb R) \) an, also gilt \( g\in C^p(\mathring K_\sigma(b),\mathbb R^m). \)

 

Damit ist der Hilfssatz bewiesen.\( \qquad\Box \)

 

 

Keine Aufgaben

 


 

 

14.2.7 Abschluss des Beweises

 

Wir wollen nun mit den bisherigen Hilfsmitteln den Fundamentalsatz über inverse Abbildungen beweisen.

1. Wir setzen zunächst

\[ A:=g(B) \quad\mbox{mit}\quad B:=\mathring K_\sigma(b)=\{z\in\mathbb R^m\,:\,|z-b|\lt\sigma\}. \]

  Für jedes \( x\in A \) gilt dann \( f(x)\in B. \)
2. Wir zeigen, dass \( A \) offen ist. Sei dazu ein \( x'\in A \) beliebig gewählt sowie ein dazugehöriges \( y'=f(x')\in B. \) Da \( B \) offen ist, existiert ein \( \varepsilon\gt 0, \) so dass \( B_\varepsilon(y')\subset B \) für den offenen Ball \( B_\varepsilon(y') \) vom Radius \( \varepsilon\gt 0 \) und mit dem Zentrum \( y'\in B. \) Wegen der Stetigkeit von \( f(x) \) existiert zu diesem \( \varepsilon\gt 0 \) ein \( \delta=\delta(\varepsilon,x')\gt 0 \) mit

\[ |f(x)-f(x')|\lt\varepsilon\quad\mbox{für alle}\ x\in B_\delta(x') \]

  mit dem offenen Ball \( B_\delta(x'). \) Mit anderen Worten ist also

\[ f(B_\delta(x'))\subseteq B_\varepsilon(y')\subset B, \]

  und damit folgt \( B_\delta(x')\subset A. \) Also ist \( A\subset\mathbb R^m \) offen.

 

Vorige Hilfssätze beweisen den Satz.\( \qquad\Box \)

 

Keine Aufgaben

 


 

 

14.2.8 Aufgaben

 

Aufgaben - Der Fundamentalsatz über inverse Abbildungen

 

Aufgabe 14.2.1: (Anwendung des Fundamentalsatzes über inverse Funktionen I)

Mit einer invertierbaren Matrix \( {\mathbf A}\in\mathbb R^{2\times 2} \) mit der Eigenschaft \( \mbox{det}\,{\mathbf A}\not=0 \) betrachten wir die stetig differenzierbare Abbildung \[ f\colon\mathbb R^2\to\mathbb R^2 \quad\mbox{vermöge}\quad f(x,y):={\mathbf A}\circ(x,y)^t\,. \]

(i) Verifizieren Sie für die Wahl von \( a=(0,0) \) und damit \( b=f(a)=(0,0) \) die Voraussetzungen des Fundamentalsatzes über inverse Abbildungen. Was können Sie aus diesem Satz folgern?
(ii) Nach (i) ist \( f(x,y) \) lokal umkehrbar. Ermitteln Sie diese Inverse \( g(u,v). \)
(iii) Wie könnte \( A \) sogar maximal gewählt werden?

 

Lösung

 

(i) Wir berechnen

\[ \mbox{det}\,\partial f(x,y)=\mbox{det}\,{\mathbf A}\not=0. \]

  Die Voraussetzungen des Fundamentalsatzes über inverse Funktionen sind damit erfüllt, d.h. es gibt offene Mengen \( A\subset\mathbb R^2 \) mit \( a\in A \) und \( B\subset\mathbb R^2 \) mit \( b\in B, \) so dass \( f(x,y) \) die Menge \( A \) topologisch auf \( B \) abbildet mit einer stetig differenzierbaren Umkehrabbildung \( g(u,v). \)
(ii) Als Umkehrabbildung ermitteln wir sofort

\[ g(u,v)={\mathbf A}^{-1}\circ(u,v)^t\,,\quad(u,v)\in\mathbb R^2\,. \]

(iii) Wir könnten \( A=\mathbb R^2 \) wählen, d.h. die Funktion ist sogar global umkehrbar. Beachte aber, dass wir im Theorieteil jedoch stets mit \( A\subset\mathbb R^2 \) argumentiert haben.

 

Damit ist alles gezeigt.\( \qquad\Box \)

 

 

Aufgabe 14.2.2: (Anwendung des Fundamentalsatzes über inverse Funktionen II)

Wir betrachten die stetig differenzierbare Abbildung \[ f\colon\mathbb R^2\to\mathbb R^2 \quad\mbox{vermöge}\quad f(x,y):=(e^x\cos y,e^x\sin y). \]

(i) Verfizieren Sie für die Wahl von \( a=(0,0) \) und damit \( b=f(a)=(1,0) \) die Voraussetzungen des Fundamentalsatzes über inverse Abbildungen. Was können Sie nach diesem Satz folgern?
(ii) Nach (i) ist \( f(x,y) \) lokal um \( a\in A \) umkehrbar. Ermitteln Sie diese Inverse \( g(u,v). \)
(iii) Könnte auch hier \( A=\mathbb R^2 \) gewählt werden?

 

Lösung

 

(i) Wir berechnen

\[ \partial f(x,y) =\left( \begin{array}{cc} e^x\cos y & -e^x\sin y \\ e^x\sin y & e^x\cos y \end{array} \right) \]

  und damit in \( a=(0,0) \)

\[ \mbox{det}\,\partial f(0,0) =e^{2x}\,\Big|_{x=0} =\mbox{det}\left(\begin{array}{cc} 1 & 0 \\ 0 & 1 \end{array}\right)=1\not=0. \]

  Die Voraussetzungen des Fundamentalsatzes über inverse Abbildungen sind damit erfüllt, d.h. es gibt offene Mengen \( A\subset\mathbb R^2 \) mit \( a\in A \) und \( B\subset\mathbb R^2 \) mit \( b\in B, \) so dass \( f(x,y) \) die Menge \( A \) topologisch auf \( B \) abbildet mit einer stetig differenzierbaren Umkehrabbildung \( g(u,v). \)
(ii) Wir setzen also

\[ u(x,y):=e^x\cos y,\quad v(x,y):=e^x\sin y \]

  und berechnen

\[ u^2+v^2=e^{2x}(\cos^2y+\sin^2y)=e^{2x} \quad\mbox{bzw.}\quad x(u,v)=\frac{1}{2}\,\ln(u^2+v^2). \]

  Weiter ist für \( u\not=0 \)

\[ \frac{v}{u}=\frac{\sin y}{\cos y}=\tan y \quad\mbox{bzw.}\quad y(u,v)=\arctan\frac{v}{u}\,. \]

  Damit ist die Umkehrabbildung \( g(u,v) \) bestimmt zu

\[ g(u,v)=\left(\frac{1}{2}\,\ln(u^2+v^2),\arctan\frac{v}{u}\right),\quad(u,v)\in B. \]

(iii) Wegen der Periodizität der Winkelfunktionen ist

\[ f(0,y)=f(0,y+2\pi),\quad y\in\mathbb R. \]

  Wir künnen also nicht \( A=\mathbb R^2 \) wählen, d.h. die Funktion ist lokal, aber nicht global umkehrbar.

 

Damit ist alles gezeigt.\( \qquad\Box \)

 

 

Aufgabe 14.2.3: (Anwendung des Fundamentalsatzes über inverse Funktionen III)

Wir betrachten die stetig differenzierbare Abbildung \[ f\colon\mathbb R^2\to\mathbb R^2 \quad\mbox{vermöge}\quad f(x,y):=(xy,x^2-y^2). \]

(i) Verifizieren Sie für die Wahl von \( a=(1,2) \) und damit \( b=f(a)=(2,-3) \) die Voraussetzungen des Fundamentalsatzes über inverse Abbildungen. Was können Sie aus diesem Satz folgern?
(ii) Könnte \( A=\mathbb R^2 \) gewählt werden?

 

Lösung

 

(i) Wir berechnen

\[ \partial f(x) =\left( \begin{array}{cc} y & x \\ 2x & -2y \end{array} \right) \]

  und damit in \( a=(1,2) \)

\[ \mbox{det}\,\partial f(1,2) =\mbox{det}\left(\begin{array}{cc} 2 & 1 \\ 2 & -4 \end{array}\right) =-10\not=0. \]

  Die Voraussetzungen des Satzes über inverse Abbildungen sind damit erfüllt, d.h. es gibt offene Mengen \( A\subset\mathbb R^2 \) mit \( a\in A \) und \( B\subset\mathbb R^2 \) mit \( b\in B, \) so dass \( f(x,y) \) die Menge \( A \) topologisch auf \( B \) abbildet mit einer stetig differenzierbaren Umkehrabbildung \( g(u,v). \)
(ii) Es ist

\[ f(-1,-1)=f(1,1)=(1,0), \]

  d.h. die Abbildung ist nicht global auf ganz \( \mathbb R^2 \) umkehrbar.

 

Damit ist alles gezeigt.\( \qquad\Box \)

 

 

Aufgabe 14.2.4: (Anwendung des Fundamentalsatzes über inverse Funktionen IV)

Wir betrachten die stetig differenzierbare Abbildung \[ f\colon\mathbb R^2\to\mathbb R^2 \quad\mbox{vermöge}\quad f(x,y):=(x^2,y). \]

(i) Sind die Voraussetzungen des Satzes über inverse Abbildungen für die Wahl von \( a=(0,0) \) und damit \( b=f(a)=(0,0) \) erfüllt?
(ii) Zeigen Sie, dass es keine offene Mengen \( A,B\subset\mathbb R^2 \) mit \( (0,0)\in A \) und \( (0,0)\in B \) gibt, so dass \( f\colon A\to B \) invertierbar ist.

 

Lösung

 

(i) Wir berechnen

\[ \partial f(x,y) =\left( \begin{array}{cc} 2x & 0 \\ 0 & 1 \end{array} \right) \]

  und damit in \( a=(0,0) \)

\[ \mbox{det}\,\partial f(0,0) =2x\,\Big|_{x=0} =0. \]

  Die Voraussetzungen des Satzes über inverse Abbildungen sind also nicht erfüllt.
(ii) Für jedes \( \varepsilon\gt 0 \) gilt

\[ f(\sqrt{\varepsilon},0)=f(-\sqrt{\varepsilon},0)=(\varepsilon,0), \]

  und damit folgt, dass es keine offene Menge \( A\subset\mathbb R^2 \) mit \( a\in A \) gibt, auf der \( f(x,y) \) injektiv ist.

 

Damit ist alles gezeigt.\( \qquad\Box \)

 

 


 

 

14.2.9 Wiederholungsfragen

 

1. Formulieren Sie den Fundamentalsatz über inverse Abbildungen.

 


 

14.3 Der Satz über implizite Funktionen

 

14.3.1 Der Satz über implizite Funktionen

 

Aus dem Fundamentalsatz über inverse Abbildungen wollen wir nun den Satz über implizite Funktionen folgern, der die lokale Auflösbarkeit implizit gegebener Gleichungen zum Inhalt hat.

 

Satz: Auf der offenen Menge \( \Omega\subseteq\mathbb R^{m+n} \) sei die Abbildung \[ f(x,y)=(f_1(x,y),\ldots,f_n(x,y))\colon\Omega\longrightarrow\mathbb R^n \] der Regularitätsklasse \( C^p(\Omega,\mathbb R^n) \) mit einem \( p\in\mathbb N \) vorgelegt. Sei ferner \( (a,b)\in\Omega \) ein Punkt mit \[ \begin{array}{l} \displaystyle f(a,b)=0\quad\mbox{und} \\ \displaystyle \mbox{det}\,\partial_yf(a,b):=\mbox{det}\left(\frac{\partial f_i(a,b)}{\partial y_j}\right)_{i,j=1,\ldots,n}\not=0. \end{array} \] Dann existieren eine offene Umgebung \( C\subset\mathbb R^m \) von \( a\in\mathbb R^m \) und eine eindeutig bestimmte Abbildung \[ y=h(x)\colon C\longrightarrow\mathbb R^n \] der Regularitätsklasse \( C^p(C,\mathbb R^n) \) mit den folgenden Eigenschaften:

(i) Es gilt \( h(a)=b. \)
(ii) Für alle \( x\in C \) gilt \( f(x,h(x))=0. \)

 

Beweis

 

Den Beweis dieses Satzes führen wir erneut nach F. Sauvignys Lehrbuch Analysis. Wir zeigen nur die Existenz der Abbildung \( h(x), \) ihre Eindeutigkeit belassen wir als Übung. Dazu gehen wir in mehreren Schritten.

1. Erweitere zunächst \( f\colon\Omega\to\mathbb R^n \) zu einer Abbildung

\[ F\colon\Omega\longrightarrow\mathbb R^{m+n} \]

  vermöge

\[ (x,y)\mapsto F(x,y)=(F_1(x,y),\ldots,F_m(x,y),F_{m+1}(x,y),\ldots,F_{m+n}(x,y)) \]

  mit den Setzungen

\[ \begin{array}{l} \displaystyle F_i(x,y):=x_i\quad\mbox{für}\ i=1,\ldots,m, \\ \displaystyle F_{m+j}(x,y):=f_j(x,y)\quad\mbox{für}\ j=1,\ldots,n, \end{array} \]

  also

\[ F(x,y)=(x_1,\ldots,x_m,f_1(x,y),\ldots,f_n(x,y)), \]

  wobei nach Voraussetzung gilt \( F\in C^p(\Omega,\mathbb R^{m+n}). \)
2. Wir berechnen die Funktionalmatrix von \( F(x,y) \)

\[ \partial F(x,y) =\left( \begin{array}{c|c} \mathbb E^m\in\mathbb R^{m\times m} & {\mathbf 0}\in\mathbb R^{m\times n} \\ \hline \partial_xf(x,y)\in\mathbb R^{n\times m} & \partial_yf(x,y)\in\mathbb R^{n\times n} \end{array} \right), \]

  und hieraus folgt für ihre Determinante

\[ \mbox{det}\,\partial F(x,y)=\mbox{det}\,\partial_yf(x,y)\not=0 \]

  nach Voraussetzung.
3. Nach dem Fundamentalsatz über inverse Abbildungen aus dem vorigen Abschnitt existieren eine offene Menge \( A\subset\Omega\subseteq\mathbb R^{m+n} \) mit \( (a,b)\in A \) und eine offene Menge \( B\subset\mathbb R^{m+n} \) mit

\[ F(a,b)=(a,f(a,b))=(a,0)\in B \]

  sowie eine Abbildung

\[ G=(G_1,\ldots,G_m,G_{m+1},\ldots,G_{m+n})\in C^p(B,\mathbb R^{m+n}) \]

  mit der Eigenschaft

\[ F(G(\xi,\eta))=(\xi,\eta)\quad\mbox{für alle}\ (\xi,\eta)\in B. \tag{\( \alpha \)} \]

  Insbesondere gilt also auch

\[ (a,b)=G(a,0). \tag{\( \beta \)} \]

4. Wir führen nun die Abbildung

\[ g\colon B\longrightarrow\mathbb R^n\in C^p(B,\mathbb R^n) \]

  ein vermöge

\[ g(\xi,\eta):=(G_{m+1}(\xi,\eta),\ldots,G_{m+n}(\xi,\eta)),\quad(\xi,\eta)\in B. \]

  Wegen \( (\beta) \) gilt

\[ g(a,0)=(G_{m+1}(a,0),\ldots,G_{m+n}(a,0))=b \tag{\( \gamma \)} \]

  und nach \( (\alpha) \) allgemeiner

\[ f(\xi,g(\xi,\eta))=\eta\quad\mbox{für alle}\ (\xi,\eta)\in B. \tag{\( \delta \)} \]

5. Wir erklären nun eine den Punkt \( a\in\mathbb R^m \) enthaltene offene Umgebung

\[ C:=\{x\in\mathbb R^m\,:\,(x,0)\in B\} \]

  und darauf die gesuchte Abbildung

\[ h\colon C\longrightarrow\mathbb R^n\quad\mbox{vermöge}\quad h(x):=g(x,0). \]

  Es ist wieder \( h\in C^p(C,\mathbb R^n). \) Nach \( (\gamma) \) gilt außerdem

\[ h(a)=g(a,0)=b, \]

  und nach \( (\delta) \) ist

\[ f(x,h(x))=f(x,g(x,0))=0\quad\mbox{für alle}\ x\in C. \]

 

Damit schließen wir unseren Beweis ab.\( \qquad\Box \)

 

 

Wir bezeichnen \( h(x) \) als Auflösefunktion und sagen, \( f(x,y)=0 \) kann in einer Umgebung um \( (a,b)\in\mathbb R^{m+n} \) nach \( y=h(x) \) aufgelöst werden.

 

Aufgaben zu diesem Abschnitt

 


 

 

14.3.2 Reellwertige Funktionen in zwei Variablen

 

Wir betrachten zur Veranschaulichung den Fall \( m=n=1. \) Es sei also \[ f=f(x,y)\colon\mathbb R^2\longrightarrow\mathbb R \] eine von zwei Variablen \( x,y\in\mathbb R \) abhängige reellwertige Funktion der Klasse \( C^p(\mathbb R^2,\mathbb R). \) In einem Punkt \( (a,b)\in\mathbb R^2 \) seien erfüllt \[ f(a,b)=0\quad\mbox{und}\quad f_y(a,b)\not=0. \]

 

Zwischenbeispiel: Betrachte die Funktion \[ f(x,y):=x^2+y^2-1,\quad(x,y)\in\mathbb R^2\,, \] mit \( f(0,1)=0 \) und mit der Ableitung \( f_y(x,y)=2y. \)

 

Dann existieren eine offene Umgebung \( C\subset\mathbb R \) von \( a\in\mathbb R \) und eine Funktion \[ y=h(x)\colon C\longrightarrow\mathbb R\quad\mbox{der Regularitätsklasse}\quad C^p(C,\mathbb R) \] mit den Eigenschaften

(i) \( h(a)=b \)
(ii) \( f(x,h(x))=0 \) für alle \( x\in C. \)

 

Beispiel: Betrachte die lineare Abbildung \[ f(x,y):=x+y,\quad(x,y)\in\mathbb R^2\,. \] Es gelten \[ f(0,0)=0,\quad f_y(0,0)=1\not=0. \] Tatsächlich kann \( f(x,y)=0 \) nahe \( (0,0)\in\mathbb R^2 \) aufgelöst werden zu \[ y=h(x)=-x, \] und zwar in diesem Beispiel sogar für alle \( x\in\mathbb R. \) Mit dieser Auflösung ergibt sich \[ f(x,y)=f(x,h(x))=x+h(x)=x-x=0,\quad x\in\mathbb R. \]

 

Beispiel: Betrachte die Abbildung \[ f(x,y):=e^y+y^3+x^3+x^2-1,\quad(x,y)\in\mathbb R^2\,, \] mit der Ableitung \[ f_y(x,y)=e^y+3y^2\,. \] Es ist \[ f(0,0)=0,\quad f_y(0,0)=1\not=0. \] Es existiert also eine offene Menge \( C\subset\mathbb R \) mit \( 0\in C, \) so dass die Gleichung \( f(x,y)=0 \) wie folgt aufgelöst werden kann \[ y=h(x),\quad x\in C. \] Diese Auflösung gewinnt man aber nicht durch elementare Umformungen. Und genau daran erkennt man den unschätzbaren Wert des Satzes über implizite Funktionen.

 

Aufgaben zu diesem Abschnitt

 


 

 

14.3.3 Aufgaben

 

Aufgaben - Der Satz über implizite Funktionen

 

Aufgabe 14.3.1: (Auflösen impliziter Gleichungen I)

Betrachten Sie die zweimal stetig partiell differenzierbare Funktion \[ f(x,y):=y+xe^y\,,\quad(x,y)\in\mathbb R^2\,. \]

(i) Beweisen Sie, dass die Gleichung \( f(x,y)=0 \) in einer Umgebung von \( (0,0)\in\mathbb R^2 \) nach \( y=h(x) \) aufgelöst werden kann.
(ii) Ermitteln Sie

\[ \circ\ h(0)\qquad\circ h'(0)\qquad\circ h''(0). \]

(iii) Bestimmen Sie das Taylorpolynom \( T_2(x) \) zweiter Ordnung von \( h(x) \) an der Entwicklungsstelle \( x_0=0. \)

 

Lösung

 

(i) Beachte zunächst \( f(0,0)=0. \) Wir berechnen

\[ f_y(x,y)=1+xe^y \]

  und damit

\[ f_y(0,0)=1\not=0. \]

  Nach dem Satz über implizite Funktionen kann \( f(x,y)=0 \) daher in einer Umgebung von \( (0,0)\in\mathbb R^2 \) nach \( y=h(x) \) aufgelöst werden.
(ii) Die Auflösefunktion \( h(x) \) erfüllt zunächst

\[ h(0)=0. \]

  Wir differenzieren nun \( f(x,h(x))=0 \) und erhalten

\[ 0=f_x(x,h(x))+f_y(x,h(x))h'(x) \]

  bzw. nach Umstellen unter Beachtung von \( f_y(a,b)\not=0 \) nahe \( x=a \) (hier also \( x=0 \))

\[ h'(x)=-\,\frac{f_x(x,h(x))}{f_y(x,h(x))}\,. \tag{\( * \)} \]

  Das liefert wegen \( f_x(x,y)=e^y \)

\[ h'(0) =-\,\frac{f_x(0,h(0))}{f_y(0,h(0))} =-\,\frac{e^0}{1} =-1. \]

  Wir differenzieren \( 0=f_x+f_yh' \) und erhalten (wir lassen die Argumente weg)

\[ 0=f_{xx}+2f_{xy}h'_x+f_{yy}h'^2+f_yh'' \]

  bzw. nach Umstellen

\[ h''=-\,\frac{f_{xx}}{f_y}-2\,\frac{f_{xy}}{f_y}\,h'-\frac{f_{yy}}{f_y}\,h'^2 =-\,\frac{f_{xx}}{f_y}+\frac{2f_{xy}f_x}{f_y^2}-\frac{f_{yy}{f_x^2}}{f_y^3} \]

  oder nach Zusammenfassen

\[ h''=-\,\frac{f_{xx}f_y^2+f_{yy}f_x^2-2f_{xy}f_xf_y}{f_y^3}\,. \tag{\( ** \)} \]

  Unter Beachtung von

\[ f_{xx}(x,y)=0,\quad f_{xy}(x,y)=e^y\,\quad f_{yy}(x,y)=xe^y \]

  haben wir

\[ f_{xx}(0,0)=0,\quad f_{xy}(0,0)=1,\quad f_{yy}(0,0)=0. \]

  Einsetzen in \( (**) \) liefert

\[ h''(0)=-\,\frac{0\cdot 1^2+0\cdot 1^2-2\cdot 1\cdot 1\cdot 1}{1^3}=-2. \] Damit sind alle Größen ermittelt.\( \qquad\Box \)

 

 

Aufgabe 14.3.2: (Auflösen impliziter Gleichungen II)

Betrachten Sie die zweimal stetig partiell differenzierbare Funktion \[ f(x,y):=2x^2+y^2-2,\quad(x,y)\in\mathbb R^2\,. \]

(i) Beweisen Sie, dass die Gleichung \( f(x,y)=0 \) in einer Umgebung von \( (0,\sqrt{2})\in\mathbb R^2 \) nach \( y=h(x) \) aufgelöst werden kann.
(ii) Ermitteln Sie

\[ \circ\ h(0)\qquad\circ h'(0)\qquad\circ h''(0). \]

(iii) Bestimmen Sie das Taylorpolynom \( T_2(x) \) zweiter Ordnung von \( h(x) \) an der Entwicklungsstelle \( x_0=0. \)

 

Lösung

 

(i) Beachte zunächst

\[ f(0,\sqrt{2})=2-2=0. \]

  Wir berechnen \( f_y(x,y)=2y \) und damit

\[ f_y(0,\sqrt{2})=2\sqrt{2}\not=0. \]

  Nach dem Satz über implizite Funktionen kann \( f(x,y)=0 \) daher in einer Umgebung von \( (0,\sqrt{2})\in\mathbb R^2 \) nach \( y=h(x) \) aufgelöst werden.
(ii) Wir ermitteln die partiellen Ableitungen

\[ \begin{array}{l} f_x(x,y)=4x,\quad f_y(x,y)=2y, \\ f_{xx}(x,y)=4,\quad f_{xy}(x,y)=0,\quad f_{yy}(x,y)=2 \end{array} \]

  und damit

\[ \begin{array}{l} f_x(0,\sqrt{2})=0,\quad f_y(0,\sqrt{2})=2\sqrt{2}\,, \\ f_{xx}(0,\sqrt{2})=4,\quad f_{xy}(0,\sqrt{2})=0,\quad f_{yy}(0,\sqrt{2})=2. \end{array} \]

  Also folgen nach der Lösung von Aufgabe 14.3.1

\[ h(0)=\sqrt{2}\,,\quad h'(0)=0,\quad h''(0)=-\,\sqrt{2}\,. \] Damit sind alle Größen ermittelt.\( \qquad\Box \)

 

 

Aufgabe 14.3.3: (Auflösen impliziter Gleichungen III)

Betrachten Sie die zweimal stetig differenzierbare Funktion \[ f(x,y):=2x^2+y^2-2\,,\quad(x,y)\in\mathbb R^2\,. \] Ist die Gleichung \( f(x,y)=0 \) in einer Umgebung des Punktes \( (1,0)\in\mathbb R^2 \) nach \( y=h(x) \) auflösbar? Begründen Sie.

 

Lösung

 

Beachte \[ f(1,0)=0, \quad\mbox{aber auch}\quad f_y(1,0)=0. \] Der Satz über implizite Funktionen kann daher nicht angewendet werden. Tatsächlich sind zunächst \[ f_x(1,0)=4,\quad f_y(1,0)=0, \] so dass bereits \[ h'(x)=-\,\frac{f_x(x,h(x))}{f_y(x,h(x))} \] im Punkt \( x=1 \) nicht definiert ist. Tatsächlich handelt es sich bei \( f(x,y)=0 \) um eine Ellipse durch die Punkte \( (\pm 1,0) \) und \( (0,\pm\sqrt{2}). \) Die Tangente an \( (1,0) \) ist parallel zur \( y \)-Achse, d.h. in einer Umgebung dieses Punktes kann die Ellipse nicht durch eine Funktion \( y=h(x) \) dargestellt werden. \( \qquad\Box \)

 

 


 

 

14.3.4 Wiederholungsfragen

 

1. Formulieren Sie den Satz über implizite Funktionen.
2. Formulieren Sie den Spezialfall \( m=n=1. \)

 


 

14.4 Extremwertaufgaben mit Nebenbedingungen

 

14.4.1 Lagrangemultiplikatoren

 

Wir wollen zunächst den folgenden Satz beweisen.

 

Satz: Auf der offenen Menge \( \Omega\subseteq\mathbb R^{m+n} \) seien Abbildungen \[ f\in C^1(\Omega,\mathbb R) \quad\mbox{und}\quad h_i\in C^1(\Omega,\mathbb R)\ \mbox{für}\ i=1,\ldots,n \] gegeben. Sei \( (a,b)\in\Omega \) ein regulärer Punkt der Niveaumenge \[ M:=\{(x,y)\in\Omega\,:\,h_i(x,y)=0\ \mbox{für}\ i=1,\ldots,n\} \] im folgenden Sinne (wir setzen \( z_k:=x_k \) für \( k=1,\ldots,m \) und \( z_{m+\ell}:=y_\ell \) für \( \ell=1,\ldots,n \)): \[ \mbox{Rang}\left(\frac{\partial h_i(a,b)}{\partial z_j}\right)_{\substack{i=1,\ldots,n \\ j=1,\ldots,m+n}}=n. \] Ferner besitze \( f(x,y) \) in \( (a,b)\in\Omega \) ein lokales Extremum unter den Nebenbedingungen \[ h_i(a,b)=0\quad\mbox{für alle}\ i=1,\ldots,n, \] d.h. mit einem hinreichend kleinen \( \varepsilon\gt 0 \) gilt \[ \begin{array}{l} f(x,y)\ge f(a,b)\quad\mbox{oder}\quad f(x,y)\le f(a,b) \\ \mbox{für alle}\ (x,y)\in M\cap B_\varepsilon(a,b)\subset\Omega. \end{array} \] Dann existieren reelle Zahlen \( \lambda_1,\ldots,\lambda_n\in\mathbb R \) mit \[ \nabla f(a,b)=\lambda_1\nabla h_1(a,b)+\ldots+\lambda_n\nabla h_n(a,b). \]

 

Bemerkung: Die \( \lambda_1,\ldots,\lambda_n\in\mathbb R \) heißen Lagrangeparameter. Mit ihnen überführt man \( f(x,y) \) in die folgende Lagrangeform \[ \widetilde f(x,y;\lambda_1,\ldots,\lambda_n):=f(x,y)-\lambda_1h_1(x,y)-\ldots-\lambda_nh_n(x,y). \] Zur Bestimmung der Extrema von \( f(x,y) \) unter den Nebenbedingungen wird die Lagrangeform \( \widetilde f(x,y) \) auf freie Extrema \[ \nabla\widetilde f(x,y;\lambda_1,\ldots,\lambda_n)=0 \] ohne Nebenbedingungen untersucht, wobei sich der Gradient auf die Koordinaten \( (x,y)\in\mathbb R^{m+n} \) bezieht. Die Lagrangeparameter müssen eventuell mitbestimmt werden, die Nebenbedingungen können in der Form \( \widetilde f_{\lambda_i}=0 \) hinzugezogen werden.

 

Beweis

 

Wir führen den Beweis in mehreren Schritten.

1. Nach eventueller Umbenennung der Variablen

\[ z=(z_1,\ldots,z_m,z_{m+1},\ldots,z_{m+n}) \]

  können wir auf Grund der Voraussetzung

\[ \mbox{Rang}\left(\frac{\partial h_i(a,b)}{\partial z_j}\right)_{\substack{i=1,\ldots,n \\ j=1,\ldots,m+n}}=n \]

  annehmen, dass

\[ \mbox{det}\left(\frac{\partial h_i(a,b)}{\partial y_j}\right)_{\substack{i=1,\ldots,n \\ j=1,\ldots,n}}\not=0. \]

2. Betrachte nun die Abbildung

\[ h(x,y)=(h_1(x,y),\ldots,h_n(x,y))\colon\Omega\longrightarrow\mathbb R^n \]

  mit \( h(a,b)=0. \) Nach dem Satz über implizite Funktionen existieren eine offene Umgebung \( C\subset\mathbb R^m \) von \( a\in\mathbb R^m \) und eine eindeutig bestimmte Abbildung

\[ \varphi(x)\colon C\longrightarrow\mathbb R^n\in C^1(C,\mathbb R^n) \]

  mit den Eigenschaften
 
\( \circ \) \( \varphi(a)=b \)
\( \circ \) \( h(x,\varphi(x))=0 \) für alle \( x\in C. \)
3. Jetzt betrachten wir die Abbildung

\[ F(x_1,\ldots,x_m):=f(x_1,\ldots,x_m,\varphi_1(x_1,\ldots,x_m),\ldots,\varphi_n(x_1,\ldots,x_m)), \]

  die im Punkt \( a\in C \) ein freies Extremum besitzt. Mit der Kettenregel folgt also für alle \( j=1,\ldots,m \)

\[ \partial_{x_j}F(a) =f_{x_j}(a,\varphi(a))+\sum_{k=1}^nf_{y_k}(a,\varphi(a))\,\frac{\partial\varphi_k(a)}{\partial x_j} =0. \]

4. Wir führen nun die Vektoren ein

\[ t_j:=(\delta_{1j},\ldots,\delta_{mj},\partial_{x_j}\varphi_1(a),\ldots,\partial_{x_j}\varphi_n(a))\in\mathbb R^n\,,\quad j=1,\ldots,m, \]

  ausgeschrieben also

\[ \begin{array}{lll} t_1\negthickspace & = & \negthickspace\displaystyle (1,0,0,\ldots,0,\partial_{x_1}\varphi_1(a),\ldots,\partial_{x_1}\varphi_n(a)), \\ t_2\negthickspace & = & \negthickspace\displaystyle (0,1,0,\ldots,0,\partial_{x_2}\varphi_1(a),\ldots,\partial_{x_2}\varphi_n(a))\quad\mbox{usw.} \end{array} \]

  Nach dem dritten Beweispunkt ist

\[ \begin{array}{lll} 0\negthickspace & = & \negthickspace\displaystyle f_{x_j}(a,b)+\sum_{k=1}^nf_{y_k}(a,b)\partial_{x_j}\varphi_k(a) \\ & = & \negthickspace\displaystyle f_{x_1}(a,b)\cdot 0+\ldots+f_{x_j}(a,b)\cdot 1+\ldots+f_{x_m}(a,b)\cdot 0 \\ & & \negthickspace\displaystyle +\,f_{y_1}(a,b)\cdot\partial_{x_j}\varphi_1(a)+\ldots+f_{y_n}(a,b)\cdot\partial_{x_j}\varphi_n(a) \end{array} \]

  für alle \( j=1,\ldots,m \) bzw. unter Benutzung der Vektoren \( t_j \)

\[ 0=\langle\nabla f(a,b),t_j\rangle=\langle\nabla f(a,\varphi(a)),t_j\rangle\,,\quad j=1,\ldots,m, \]

  mit dem \( (m+n) \)-dimensionalen Gradienten

\[ \nabla f(a,b)=(f_{x_1}(a,b),\ldots,f_{x_m}(a,b),f_{y_1}(a,b),\ldots,f_{y_n}(a,b)). \]

  Es steht also dieser Gradient senkrecht auf den \( t_j, \) genauer

\[ \nabla f(a,b)\perp t_j\quad\mbox{für alle}\ j=1,\ldots,m. \]

5. Wir differenzieren ebenso die Nebenbedingungen

\[ h_i(x_1,\ldots,x_m,\varphi_1(x_1,\ldots,x_m),\ldots,\varphi_n(x_1,\ldots,x_m))=0 \]

  für \( i=1,\ldots,n \) und erhalten im Punkt \( (a,\varphi(a))\in\Omega \)

\[ 0=\frac{\partial h_i(a,\varphi(a))}{\partial x_j} +\sum_{k=1}^n\frac{\partial h_i(a,\varphi(a))}{\partial y_k}\,\frac{\partial\varphi_k(a)}{\partial x_j}\,,\quad i=1,\ldots,n, \]

  bzw. mit den Vektoren \( t_j \)

\[ 0=\langle\nabla h_i(a,\varphi(a)),t_j\rangle\,,\quad i=1,\ldots,n,\ j=1,\ldots,m. \]

  Nach Voraussetzung bzw. nach dem ersten Beweispunkt sind aber die \( n \) Vektoren

\[ \nabla h_1(a,b)\in\mathbb R^{m+n}\,,\ldots,\nabla h_n(a,b)\in\mathbb R^{m+n} \]

  linear unabhängig und spannen daher den \( n \)-dimensionalen Orthogonalraum zu dem \( m \) linear unabhängigen Vektoren \( t_1,\ldots,t_m \) auf.
6. Nach dem vierten Beweispunkt folgt also notwendig

\[ \nabla f(a,\varphi(a))=\lambda_1\nabla h_1(a,\varphi(a))+\ldots+\lambda_n\nabla h_n(a,\varphi(a)) \]

  mit geeigneten \( \lambda_1,\ldots,\lambda_n\in\mathbb R. \)

 

Damit ist der Satz bewiesen.\( \qquad\Box \)

 

 

Aufgaben zu diesem Abschnitt

 


 

 

14.4.2 Ein Beispiel

 

Wir diskutieren das folgende, aus Merziger, G. und Wirth, T.: Repetitorium der höheren Mathematik stammende Beispiel.

 

Problemstellung

 

Gesucht sind alle Extrema der Funktion \[ f(x,y):=\sqrt{1-x^2-y^2}\,,\quad (x,y)\in\overline B\ \mbox{mit}\ B:=\{(u,v)\in\mathbb R^2\,:\,u^2+v^2\lt 1\}\,, \] unter der einen Nebenbedingung \[ h(x,y):=\left(x-\frac{1}{2}\right)^2+y^2-\frac{1}{16}=0. \]

Vorüberlegungen

 

Wir machen uns zunächst das Problem geometrisch klar:

\( \circ \) \( f(x,y) \) beschreibt die obere abgeschlossene Kugelsphäre vom Radius \( R=1 \) über der abgeschlossenen Einheitskreisscheibe \( K\subset\mathbb R^2 \) mit Zentrum \( (0,0)\in\mathbb R^2. \)
\( \circ \) Die Nebenbedingung \( h(x,y)=0 \) beschreibt den eindimensionalen Kreis vom Radius \( r=\frac{1}{4} \) mit Zentrum \( \left(\frac{1}{2},0\right) \) in der \( [x,y] \)-Ebene.

 

 

 

\( \circ \) Das globale Maximum von \( f(x,y) \) unter der Nebenbedingung \( h(x,y)=0 \) befindet sich in \( \left(\frac{1}{4},0\right) \) mit dem Bildpunkt

\[ P_{max}=\left(\frac{1}{4},0,\sqrt{\frac{15}{16}}\right). \]

\( \circ \) Das globale Minimum von \( f(x,y) \) unter der Nebenbedingung \( h(x,y)=0 \) befindet sich in \( \left(\frac{3}{4},0\right) \) mit dem Bildpunkt

\[ P_{min}=\left(\frac{3}{4},0,\sqrt{\frac{7}{16}}\right). \]

 

Lösung durch direktes Einsetzen

 

Wir können die Nebenbedingung \[ h(x,y)=\left(x-\frac{1}{2}\right)^2+y^2-\frac{1}{16}=0 \] nach \( y^2 \) auflösen zu \[ y^2=y(x)^2=\frac{1}{16}-\left(x-\frac{1}{2}\right)^2=-\frac{3}{16}-x^2+x,\quad\frac{1}{4}\le x\le\frac{3}{4}\,. \] Das setzen wir in \( f(x,y) \) ein (vergleiche auch mit dem dritten Beweispunkt) und erhalten \[ F(x):=f(x,y(x))=\sqrt{1-x^2-y(x)^2}=\sqrt{\frac{19}{16}-x}\,. \] Diese nur noch von einer reellen Variablen abhängige Funktion \( F(x) \) besitzt im betrachteten Intervall ein globales Maximum in \( \left(\frac{1}{4},0\right) \) und ein globales Minimum in \( \left(\frac{3}{4},0\right). \) Hieraus ergeben sich die bereits oben gefundenen Punkte \( P_{max} \) und \( P_{min}. \)

 

Lösung vermittels der Lagrangeschen Methode

 

Wir bilden zunächst die Lagrangeform \[ \widetilde f(x,y):=\sqrt{1-x^2-y^2}-\lambda\cdot\left\{\left(x-\frac{1}{2}\right)^2+y^2-\frac{1}{16}\right\} \] mit einem noch zu bestimmenden Lagrangeparameter \( \lambda\in\mathbb R. \) In einem inneren kritischen Punkt gilt nach dem Satz \[ \nabla\widetilde f(x,y;\lambda)=0 \] bzw. ausgeschrieben (wir fügen die Bedingung \( \widetilde f_\lambda=0 \) hinzu) \[ \begin{array}{rcl} \widetilde f_x(x,y;\lambda)\negthickspace & = & \negthickspace\displaystyle -\,\frac{x}{\sqrt{1-x^2-y^2}}-2\lambda\left(x-\frac{1}{2}\right)=0, \\ \widetilde f_y(x,y;\lambda)\negthickspace & = & \negthickspace\displaystyle -\,\frac{y}{\sqrt{1-x^2-y^2}}-2\lambda y=0, \\ \widetilde f_\lambda(x,y;\lambda)\negthickspace & = & \negthickspace\displaystyle -\left(x-\frac{1}{2}\right)^2-y^2+\frac{1}{16}=0. \end{array} \] Aus diesen Bedingungen sind nun die Extrempunkte zu bestimmen. Zu diesem Zweck beginnen wir mit \( \widetilde f_y=0, \) also \[ 0=y+2\lambda y\sqrt{1-x^2-y^2}=y\cdot\left(1+2\lambda\sqrt{1-x^2-y^2}\right) \] und daher \[ \begin{array}{l} \widetilde f_y=0\quad\mbox{falls} \\ (\alpha)\quad y=0\qquad\mbox{oder} \\ (\beta)\quad 1+2\lambda\sqrt{1-x^2-y^2}=0. \end{array} \] Beide Fälle sind nun zu untersuchen: Einsetzen von \( (\beta) \) in \( \widetilde f_x=0 \) liefert zunächst \[ \begin{array}{lll} -\widetilde f_x(x,y;\lambda)\negthickspace & = & \negthickspace\displaystyle \frac{x}{\sqrt{1-x^2-y^2}}+2\lambda\left(x-\frac{1}{2}\right) \\ & = & \negthickspace\displaystyle \frac{x}{\sqrt{1-x^2-y^2}}-\frac{x-\frac{1}{2}}{\sqrt{1-x^2-y^2}} \\ & = & \negthickspace\displaystyle \frac{1}{2\sqrt{1-x^2-y^2}} \,\not=\,0 \end{array} \] im Widerspruch zu \( \widetilde f_x=0. \) Die Bedingung \( (\beta) \) fällt damit heraus. Wir setzen daher \( (\alpha) \) in \( \widetilde f_\lambda=0 \) ein und erhalten \[ -\left(x-\frac{1}{2}\right)^2+\frac{1}{16}=0 \quad\mbox{bzw.}\quad x_1=\frac{1}{4}\ \mbox{oder}\ x_2=\frac{3}{4}\,. \] Diese beiden Werte setzen wir in \( \widetilde f_x=0 \) ein, um die zugehörigen Parameterwerte für \( \lambda \) zu erhalten: \[ \lambda_1=\frac{1}{\sqrt{15}}\,,\quad \lambda_2=-\,\frac{6}{\sqrt{7}}\,. \] Extrema der Funktion \( f(x,y) \) unter der Nebenbedingung \( h(x,y)=0 \) können also nur in den Punkten \[ (x_{max},y_{max})=\left(\frac{1}{4},0\right) \quad\mbox{und}\quad (x_{min},y_{min})=\left(\frac{3}{4},0\right) \] auftreten. Beide Punkte erfüllen die Nebenbedingung, und es gilt (bitte selbst verifizieren) \[ f(x_{max},y_{max})\gt f(x_{min},y_{min}). \] Auf der durch die Nebenbedingung erzeugten kompakten Menge nimmt die stetige Funktion \( f(x,y) \) nach dem Fundamentalsatz von Weierstraß ein globales Minimum und ein globales Maximum an, die durch \( (x_{min},y_{min}) \) und \( (x_{max},y_{max}) \) gegeben sind.

 

Keine Aufgaben

 


 

 

14.4.3 Aufgaben

 

Aufgaben - Lagrangemultiplikatoren

 

Aufgabe 14.4.1: (Extrema unter Nebenbedingungen I)

Untersuchen Sie die folgende Funktion \[ f(x,y):=x+y,\quad(x,y)\in\mathbb R^2\,, \] unter der Nebenbedingung \[ h(x,y):=x^2+y^2-1=0 \] vermittels der Lagrangeschen Methode auf Extrema.

 

Lösung

 

Betrachte die Lagrangeform \[ \widetilde f(x,y;\lambda):=x+y-\lambda(x^2+y^2-1) \] mit den Ableitungen \[ \widetilde f_x=1-2\lambda x,\quad \widetilde f_y=1-2\lambda y,\quad \widetilde f_\lambda=-(x^2+y^2-1). \] Die Bedingungen \( \nabla\widetilde f(x,y;\lambda)=0 \) und \( \widetilde f_\lambda=0 \) führen auf die Gleichungen \[ 1=2\lambda x,\quad 1=2\lambda y,\quad 1=x^2+y^2\,, \] und nach Auflösen erhalten wir die kritischen Punkte \[ \begin{array}{l} \displaystyle x_1=\frac{1}{\sqrt{2}}\,,\quad y_1=\frac{1}{\sqrt{2}}\,, \\ \displaystyle x_2=-\,\frac{1}{\sqrt{2}}\,,\quad y_2=-\,\frac{1}{\sqrt{2}} \end{array} \] zusammen mit \( \lambda_1=-\,\frac{1}{\sqrt{2}} \) und \( \lambda_2=\frac{1}{\sqrt{2}}. \) Dabei gilt \[ f(x_1,y_1)=\frac{2}{\sqrt{2}}\gt-\,\frac{2}{\sqrt{2}}=f(x_2,y_2), \] d.h. \( (x_1,y_1) \) stellt ein lokales Maximum und \( (x_2,y_2) \) ein lokales Minimum auf der kompakten Menge \( x^2+y^2-1=0 \) dar (wir übergehen eine Untersuchung der Lagrangefunktion auf hinreichende Bedingungen).\( \qquad\Box \)

 

 

Aufgabe 14.4.2: (Extrema unter Nebenbedingungen II)

Untersuchen Sie die Funktion \[ f(x,y):=xy,\quad(x,y)\in\mathbb R^2\,, \] unter der Nebenbedingung \[ h(x,y):=x^2+y^2-1=0 \] vermittels der Lagrangeschen Methode auf Extrema.

 

Lösung

 

Betrachte die Lagrangeform \[ \widetilde f(x,y;\lambda):=xy-\lambda(x^2+y^2-1) \] mit den Ableitungen \[ \widetilde f_x=y-2\lambda x,\quad \widetilde f_y=x-2\lambda y,\quad \widetilde f_\lambda=-(x^2+y^2-1). \] Nach Auflösen der Bedingungen \( \nabla\widetilde f(x,y;\lambda)=0 \) und \( \widetilde f_\lambda=0 \) erhalten wir die kritischen Punkte \[ \begin{array}{l} \displaystyle x_1=-\,\frac{1}{\sqrt{2}}\,,\quad y_1=-\,\frac{1}{\sqrt{2}}\,, \\ \displaystyle x_2=\frac{1}{\sqrt{2}}\,,\quad y_2=\frac{1}{\sqrt{2}}\,, \\ \displaystyle x_3=-\,\frac{1}{\sqrt{2}}\,,\quad y_3=\frac{1}{\sqrt{2}}\,, \\ \displaystyle x_4=\frac{1}{\sqrt{2}}\,,\quad y_4=-\,\frac{1}{\sqrt{2}} \end{array} \] zusammen mit \( \lambda=\frac{1}{2} \) bzw. \( \lambda=-\frac{1}{2} \) und den Funktionswerten \[ \begin{array}{l} \displaystyle f(x,y)=\frac{1}{2}\quad\mbox{in}\ (x_1,y_1),\ (x_2,y_2), \\ \displaystyle f(x,y)=-\,\frac{1}{2}\quad\mbox{in}\ (x_3,y_3),\ (x_4,y_4)\,. \end{array} \] In den ersten beiden Punkten finden wir also zwei lokale Maxima, in den verbleibenden beiden zwei lokale Minima (wir übergehen erneut eine Untersuchung der Lagrangefunktion auf hinreichende Bedingungen). Die kritischen Punkte lassen sich übrigens übersichtlicher herleiten nach Übergang zu Polarkoordinaten \( (r,\varphi)=(1,\varphi) \) auf der kompakten Menge \( x^2+y^2-1=0. \) Es gilt \[ f(r,\varphi)=r^2\cos\varphi\sin\varphi,\quad \mbox{d.h.}\quad f(1,\varphi)=\cos\varphi\sin\varphi \] mit den kritischen Punkten \[ \sin\varphi=\pm\cos\varphi \quad\mbox{bzw.}\quad \varphi\in\left\{\frac{\pi}{4},\frac{3\pi}{4},\frac{5\pi}{4},\frac{7\pi}{4}\right\}. \] Hieraus erhält man erneut obige Punkte.\( \qquad\Box \)

 

 

Aufgabe 14.4.3: (Extrema unter Nebenbedingungen III)

Welches Rechteck hat bei gegebenem Umfang \( U=20\,\mbox{cm} \) den größten Flächeninhalt?

 

Lösung

 

Wir betrachten ein Rechteck mit den Seiten \( x\gt 0 \) und \( y\gt 0. \) Dessen Inhalt ist dann gegeben durch \[ f(x,y):=xy,\quad(x,y)\in\mathbb R^2\,, \] und der Umfang genügt der Nebenbedingung \[ h(x,y):=2(x+y)-20=0. \] Hieraus folgt \( y=10-x, \) was wir in \( f(x,y) \) einsetzen und damit die neue Darstellung erhalten \[ \varphi(x):=f(x,y(x))=x(10-x)=10x-x^2 \] mit den Ableitungen \[ \varphi'(x)=10-2x,\quad \varphi''(x)=-2. \] Beachte \( \varphi'(5)=0 \) und \( \varphi'(5)\lt 0, \) d.h. in \( x_0=5 \) besitzt \( \varphi(x) \) ein absolutes Maximum. Hierzu gehört der \( y_0=5, \) den wir erneut der Nebenbedingung \( h(5,5)=0 \) entnehmen. Das gesuchte Rechteck ist also ein Quadrat mit der Seitenläge \( x=5.\qquad\Box \)

 

 

Aufgabe 14.4.4: (Extrema unter Nebenbedingungen IV)

Gesucht sind jene Punkt \( P=(x,y) \) Ellipse \[ {\mathcal E}:=\{(x,y)\in\mathbb R^2\,:\,F(x,y)=0\} \] mit der Funktion \[ F(x,y):=\frac{x^2}{a^2}+\frac{y^2}{b^2}-1\quad\mbox{mit}\quad b\gt a\gt 0, \] welche vom Mittelpunkt \( (0,0)\in\mathbb R^2 \) extremalen Abstand haben.

 

Lösung

 

Zu untersuchen ist die (ohne Einschränkung quadratische) Funktion \[ f(x,y):=x^2+y^2\,,\quad(x,y)\in\mathbb R^2\,, \] zusammen mit der Nebenbedingung \[ h(x,y):=\frac{x^2}{a^2}+\frac{y^2}{b^2}-1=0. \] Wir bilden die Lagrangeform \[ \widetilde f(x,y;\lambda)=x^2+y^2-\lambda\left(\frac{x^2}{a^2}+\frac{y^2}{b^2}-1\right). \] Beachte, dass insbesondere \( (0,0)\in\mathbb R^2 \) nicht der Nebenbedingung genügt, und wir diesen Punkt im folgenden ausschließen. Wir ermitteln also außerhalb des Ursprungs die partiellen Ableitungen \[ \begin{array}{lll} \widetilde f_x(x,y;\lambda)\negthickspace & = & \negthickspace\displaystyle 2x-\frac{2\lambda x}{a^2}\,, \\ \widetilde f_y(x,y;\lambda)\negthickspace & = & \negthickspace\displaystyle 2y-\frac{2\lambda y}{b^2}\,, \\ \widetilde f_\lambda(x,y;\lambda)\negthickspace & = & \negthickspace\displaystyle -\left(\frac{x^2}{a^2}+\frac{y^2}{b^2}-1\right). \end{array} \] Diese Ableitungen müssen nun verschwinden. Hierzu unterscheiden wir folgende Fälle:

\( \circ \) Sind \( x=0 \) und \( y\not=0, \) so folgt \( y=\pm b \) aus \( \widetilde f_\lambda=0; \)
\( \circ \) Sind \( x\not=0 \) und \( y=0, \) so folgt \( x=\pm a \) aus \( \widetilde f_\lambda=0; \)
\( \circ \) Sind \( x\not=0 \) und \( y\not=0, \) so folgen \( \lambda^2=a^2 \) und \( \lambda^2=b^2, \) was wegen \( b\gt a\gt 0 \) ein Widerspruch ist.

Damit ergeben sich die vier extremalen Punkte \[ P_1=(a,0),\quad P_2=(0,b),\quad P_3=(-a,0),\quad P_4=(-b,0). \] Es handelt sich genau um die vier Scheitel der Ellipse (wir übergehen erneut eine Untersuchung der Lagrangefunktion auf hinreichende Bedingungen).\( \qquad\Box \)

 

 


 

14.4.4 Wiederholungsfragen

 

1. Erläutern Sie, ohne Beweis, die Lagrangesche Methode (Lagrangemultiplikatoren) zur Lösung von Extremwertaufgaben mit Nebenbedingungen.