微分積分学09:全微分可能性と連鎖公式

こんにちは、ひかりです。

今回は微分積分学から全微分可能性と連鎖公式について解説していきます。

この記事では以下のことを紹介します。

  • 全微分可能性について
  • 合成関数の微分と連鎖公式について
  • 多変数関数の平均値の定理・テイラーの定理について
目次

全微分可能性

1変数関数の場合は微分可能であれば連続となりました。

しかし、2変数関数の場合は偏微分可能であっても、連続とは限りませんでした。

(その例は微分積分学08の記事の例1の(3)をご覧ください。)

これは、偏微分可能性は変数 \( x,y \) の一方だけを動かしてもう一方を固定したときの \( f(x,y) \) の性質を見ているのに対して、連続性は \( x,y \) を同時に動かしたときの \( f(x,y) \) の性質を見ているからです。

つまり、2変数関数の場合は偏微分のほかに別の微分可能性について考える必要があるということになります。

よって、次のような微分可能性を定義します。

定義1 (全微分可能性)

関数 \( f(x,y) \) が点 \( (a,b) \) で全微分可能であるとは、

$$ \lim_{(x,y)\to(a,b)}\frac{f(x,y)-f(a,b)-A(x-a)-B(y-b)}{\sqrt{(x-a)^2+(y-b)^2}}=0 $$

となる定数 \( A,B \) が存在することをいう。

つまり、変数 \( x,y \) を同時に動かしたときの変化率の極限が存在するとき全微分可能であるというわけです。

全微分可能な関数の重要な性質を紹介します。

定理1 (全微分可能な関数の性質)

\( f(x,y) \) は点 \( (a,b) \) で全微分可能であるとき、次が成り立つ。

(1) \( f \) は点 \( (a,b) \) で連続である。

(2) \( f \) は点 \( (a,b) \) で偏微分可能であり、全微分可能の定義の定数 \( A,B \) は次で与えられる。

$$ A=f_x(a,b), \quad B=f_y(a,b) $$

定理1の証明(気になる方だけクリックしてください)

(1) まず、

$$ \frac{f(x,y)-f(a,b)-A(x-a)-B(y-b)}{\sqrt{(x-a)^2+(y-b)^2}}=\varepsilon $$

とおきます。このとき、全微分可能性から \( \displaystyle \lim_{(x,y)\to(a,b)}\varepsilon=0 \) となります。

よって、

$$ \begin{align} f(x,y)&=f(a,b)+A(x-a)+B(y-b)+\varepsilon \sqrt{(x-a)^2+(y-b)^2} \\ &\to f(a,b) \quad ((x,y)\to(a,b)) \end{align} $$

となり、点 \( (a,b) \) での連続性がでました。

(2) \( y=b \) とすると、全微分可能性の式は

$$ \lim_{x\to a}\frac{f(x,b)-f(a,b)-A(x-a)}{x-a}=0 $$

となります。よって、

$$ f_x(a,b)=\lim_{h\to0}\frac{f(a+h,b)-f(a,b)}{h}=\lim_{x\to a}\frac{f(x,b)-f(a,b)}{x-a}=A $$

したがって、 \( f \) は点 \( (a,b) \) で \( x \) に関して偏微分可能であり、 \( A=f_x(a,b) \) となります。

\( y \) に関しても同様に求められます。

逆に、どういう状況のときに全微分可能であるかについて、次が成り立ちます。

定理2 (全微分可能性の十分条件)

\( f_x,f_y \) が存在して、それらのいずれかが連続であれば、 \( f \) は全微分可能である。

とくに、 \( f \) が \( C^1 \) 級であれば、全微分可能である。

\( f \) そのものの連続性は必要ないことに注意してください。ただし、この定理から \( f \) は全微分可能となるので、定理1より結果的に連続となります。

定理2の証明(気になる方だけクリックしてください)

全微分可能性の定義より、

$$ \lim_{(x,y)\to(a,b)}\frac{f(x,y)-f(a,b)-A(x-a)-B(y-b)}{\sqrt{(x-a)^2+(y-b)^2}}=0 $$

となる定数 \( A,B \) が存在することを示します。

平均値の定理を用いると、

$$ \begin{align} f(x,y)-f(a,b)&=f(x,y)-f(a,y)+f(a,y)-f(a,b) \\ &=f_x(c,y)(x-a)+f_y(x,d)(y-b) \end{align} $$

となる \( c \) が \( a \) と \( x \) の間に、 \( d \) が \( y \) と \( b \) の間に存在します。

よって、

$$ \begin{align} &|f(x,y)-f(a,b)-f_x(a,b)(x-a)-f_y(a,b)(y-b)| \\ &=|(f_x(c,y)-f_x(a,b))(x-a)+(f_y(x,d)-f_y(a,b))(y-b)| \\ &≦|(f_x(c,y)-f_x(a,b))\sqrt{(x-a)^2+(y-b)^2}+(f_y(x,d)-f_y(a,b))\sqrt{(x-a)^2+(y-b)^2}| \\ &≦\sqrt{(x-a)^2+(y-b)^2}(|f_x(c,y)-f_x(a,b)|+|f_y(x,d)-f_y(a,b)|) \end{align} $$

となります。よって、 \( (x,y)\to (a,b) \) とすると \( (c,d)\to (a,b) \) となるので、 \( f_x,f_y \) の連続性から、

$$ (|f_x(c,y)-f_x(a,b)|+|f_y(x,d)-f_y(a,b)|)\to 0 \quad ((x,y)\to (a,b)) $$

したがって、

$$ \lim_{(x,y)\to (a,b)}\frac{|f(x,y)-f(a,b)-f_x(a,b)(x-a)-f_y(a,b)(y-b)|}{\sqrt{(x-a)^2+(y-b)^2}}=0 $$

となり、 \( A=f_x(a,b), \ B=f_y(a,b) \) として、全微分可能性の式が成り立つことがいえました。

例1

(1) 次の2変数関数を考える。

$$ f(x,y)=x^2y $$

この関数を \( x,y \) で偏微分すると、

$$ f_x(x,y)=2xy, \quad f_y(x,y)=x^2 $$

よって、 \( f_x,f_y \) は連続であるので、定理2より \( f \) は \( \mathbb{R}^2 \) 上で全微分可能である。


(2) 次の2変数関数を考える。

$$ f(x,y)=\begin{cases} \frac{x^2y}{x^4+y^2} & ((x,y)\not=(0,0)) \\ 0 & ((x,y)=(0,0)) \end{cases} $$

この関数は点 \( (0,0) \) で全微分可能ではない。

実際、 \( y=x^2 \) に沿って \( (x,y)\to(0,0) \) とすると、

$$ \begin{align} \lim_{(x,y)\to(0,0)}\frac{x^2y}{x^4+y^2}&=\lim_{(x,y)\to(0,0)}\frac{x^2\cdot x^2}{x^4+x^4}=\lim_{(x,y)\to(0,0)}\frac{1}{2}=\frac{1}{2} \end{align} $$

一方で、 \( f(0,0)=0 \) であるので、この関数は点 \( (0,0) \) で連続ではない。

したがって、定理1(1)(の対偶)より、この関数は点 \( (0,0) \) で全微分可能ではないことがいえる。

定理1の(2)より、

$$ A=f_x(a,b), \quad B=f_y(a,b) $$

であるので、全微分可能性の式は次のようになります。

$$ \lim_{(x,y)\to(a,b)}\frac{f(x,y)-f(a,b)-f_x(a,b)(x-a)-f_y(a,b)(y-b)}{\sqrt{(x-a)^2+(y-b)^2}}=0 $$

ここで、 \( h=x-a, \ k=y-b \) とおくと、

$$ \lim_{(h,k)\to(0,0)}\frac{f(a+h,b+k)-f(a,b)-f_x(a,b)h-f_y(a,b)k}{\sqrt{h^2+k^2}}=0 $$

となります。

$$ \Delta f=f(a+h,b+k)-f(a,b), \quad \Delta x=(a+h)-a=h, \quad \Delta y=(b+k)-b=k $$

とおくと、

$$ \lim_{(\Delta x,\Delta y)\to(0,0)}\frac{\Delta f-f_x(a,b)\Delta x-f_y(a,b)\Delta y}{\sqrt{(\Delta x)^2+(\Delta y)^2}}=0 $$

この式から次のことがいえます。(定理1の(1)の証明もあわせてご覧ください。)

$$ \Delta f=f_x(a,b)\Delta x+f_y(a,b)\Delta y+\varepsilon \sqrt{(\Delta x)^2+(\Delta y)^2}, \quad \lim_{(\Delta x,\Delta y)\to(0,0)}\varepsilon=0 \tag{1} $$

ここで、1変数関数の微分を思い出すと、

$$ \frac{df}{dx}=\lim_{h\to 0}\frac{f(a+h)-f(a)}{h}=\lim_{\Delta x\to0}\frac{\Delta f}{\Delta x} $$

$$ \Delta f=f(a+h)-f(a), \quad \Delta x=(a+h)-a=h $$

であるので、

$$ df=\lim_{\Delta x\to0}\Delta f, \ dx=\lim_{\Delta x\to0}\Delta x $$

と表すことができます。

つまり、 \( f \) の微小の変化量 \( \Delta f \) の極限を \( df \) と表しているわけです。

このことから、2変数関数においても次のように表すことができます。

$$ df=\lim_{(\Delta x,\Delta y)\to(0,0)}\Delta f, \quad dx=\lim_{\Delta x\to0}\Delta x, \quad dy=\lim_{\Delta y\to0}\Delta y $$

よって、式(1)を \( (\Delta x,\Delta y)\to(0,0) \) とすると、次が得られます。

$$ df=f_x(a,b)dx+f_y(a,b)dy $$

これを全微分とよびます。まとめると、

定義2 (全微分)

\( f(x,y) \) が点 \( (a,b) \) で全微分可能であるとき、 \( f(x,y) \) の点 \( (a,b) \) における全微分 \( df \) を次で定める。

$$ df=f_x(a,b)dx+f_y(a,b)dy $$

例2

(1) \( f(x,y)=x^2y^3 \) のとき、点 \( (-1,2) \) での全微分を求める。

$$ f_x=\frac{\partial}{\partial x}(x^2y^3)=2xy^3, \quad f_y=\frac{\partial}{\partial y}(x^2y^3)=3x^2y^2 $$

よって、

$$ f_x(-1,2)=2\cdot(-1)\cdot2^3=-16, \quad f_y(-1,2)=3\cdot (-1)^2 \cdot 2^2=12 $$

であるので、全微分 \( df \) は

$$ df=f_x(-1,2)dx+f_y(-1,2)dy=-16dx+12dy $$


(2) \( f(x,y)=\tan^{-1}\left(\frac{y}{x} \right) \) のとき、点 \( (1,\sqrt{3}) \) での全微分を求める。

$$ f_x=\frac{\partial}{\partial x}\tan^{-1}\left(\frac{y}{x} \right)=\frac{1}{1+\left(\frac{y}{x}\right)^2}\cdot\left(-\frac{y}{x^2} \right)=\frac{-y}{x^2+y^2} $$

$$ f_y=\frac{\partial}{\partial y}\tan^{-1}\left(\frac{y}{x} \right)=\frac{1}{1+\left(\frac{y}{x}\right)^2}\cdot\left(\frac{1}{x} \right)=\frac{x}{x^2+y^2} $$

よって、

$$ f_x(1,\sqrt{3})=\frac{-\sqrt{3}}{1^2+(\sqrt{3})^2}=-\frac{\sqrt{3}}{4}, \quad f_y(1,\sqrt{3})=\frac{1}{1^2+(\sqrt{3})^2}=\frac{1}{4} $$

であるので、全微分 \( df \) は

$$ df=f_x(1,\sqrt{3})dx+f_y(1,\sqrt{3})dy=-\frac{\sqrt{3}}{4}dx+\frac{1}{4}dy $$

合成関数の微分と連鎖公式

まず、2変数関数と1変数関数との合成関数の微分について、次が成り立ちます。

定理3 (合成関数の微分)

\( f=f(x,y) \) は全微分可能で、 \( x=x(t), \ y=y(t) \) は(1変数関数の意味で)微分可能であるとする。

このとき、 \( z(t)=f(x(t),y(t)) \) も(1変数関数の意味で)微分可能であり、

$$ \frac{dz}{dt}=\frac{\partial f}{\partial x}\frac{dx}{dt}+\frac{\partial f}{\partial y}\frac{dy}{dt} $$

定理3の証明(気になる方だけクリックしてください)

\( \frac{z(t)-z(a)}{t-a} \) の極限を求めるために、変形を行います。

$$ \begin{align} \frac{z(t)-z(a)}{t-a}&=\frac{f(x(t),y(t))-f(x(a),y(a))}{t-a} \\ &=\frac{f(x(t),y(t))-f(x(a),y(a))-A(x(t)-x(a))-B(y(t)-y(a))}{t-a} \\ & \quad +A\frac{x(t)-x(a)}{t-a}+B\frac{y(t)-y(a)}{t-a} \\ &=\frac{f(x(t),y(t))-f(x(a),y(a))-A(x(t)-x(a))-B(y(t)-y(a))}{\sqrt{(x(t)-x(a))^2+(y(t)-y(a))^2}} \\ &\quad \times \frac{\sqrt{(x(t)-x(a))^2+(y(t)-y(a))^2}}{t-a}+A\frac{x(t)-x(a)}{t-a}+B\frac{y(t)-y(a)}{t-a} \\ &=\text{I} \ \times \text{II}+\text{III} \ とおきます \end{align} $$

まず、 \( \text{I} \) を \( t\to a \) とすると、 \( (x(t),y(t))\to (x(a),y(a)) \) であるので、 \( f \) の全微分可能性から、

$$ \lim_{t\to a}\text{I}=\lim_{(x(t),y(t))\to (x(a),y(a))}\frac{f(x(t),y(t))-f(x(a),y(a))-A(x(t)-x(a))-B(y(t)-y(a))}{\sqrt{(x(t)-x(a))^2+(y(t)-y(a))^2}}=0 $$

次に、 \( \text{II} \) を考えます。

$$ \begin{align} \text{II}&=\frac{\sqrt{(x(t)-x(a))^2+(y(t)-y(a))^2}}{t-a} \\ &=\frac{\sqrt{(x(t)-x(a))^2+(y(t)-y(a))^2}}{\text{sgn}(t-a)\sqrt{(t-a)^2}} \\ &=\text{sgn}(t-a)\sqrt{\left(\frac{x(t)-x(a)}{t-a}\right)^2+\left(\frac{y(t)-y(a)}{t-a}\right)^2} \end{align} $$

となります。ここで、 \( \text{sgn}(t-a) \) とは \( t-a \) の符号である。つまり、

$$ \text{sgn}(t-a)=\begin{cases} +1 & (t-a>0のとき) \\ -1 & (t-a<0のとき) \end{cases} $$

( \( t-a<0 \) のとき \( t-a=-\sqrt{(t-a)^2} \) であるため、必要となります。)

よって、 \( |\text{II}| \) を \( t\to a \) とすると、 \( |\text{sgn}(t-a)|=1 \) より、

$$ \begin{align} \lim_{t\to a}|\text{II}|&=\lim_{t\to a}\sqrt{\left(\frac{x(t)-x(a)}{t-a}\right)^2+\left(\frac{y(t)-y(a)}{t-a}\right)^2}=\sqrt{(x'(a))^2+(y'(a))^2} \end{align} $$

最後に、 \( \text{III} \) を \( t\to a \) とすると、

$$ \begin{align} \lim_{t\to a}\text{III}&=\lim_{t\to a}\left(A\frac{x(t)-x(a)}{t-a}+B\frac{y(t)-y(a)}{t-a}\right) \\ &=Ax'(a)+By'(a) \end{align} $$

したがって、すべてをまとめると、

$$ \begin{align} \lim_{t\to a}\frac{z(t)-z(a)}{t-a}&=\lim_{t\to a}(\text{I}\times \text{II}+\text{III}) \\ &=0+Ax'(a)+By'(a) \end{align} $$

ここで、定理1の(2)より、

$$ A=f_x(x(a),y(a)), \quad B=f_y(x(a),y(a)) $$

であるので、

$$ \begin{align} \frac{dz}{dt}(a)&=\lim_{t\to a}\frac{z(t)-z(a)}{t-a}=f_x(x(a),y(a))x'(a)+f_y(x(a),y(a))y'(a) \\ &=\frac{\partial f}{\partial x}(x(a),y(a))\frac{dx}{dt}(a)+\frac{\partial f}{\partial y}(x(a),y(a))\frac{dy}{dt}(a) \end{align} $$

よって、点 \( a \) は任意なので、

$$ \frac{dz}{dt}=\frac{\partial f}{\partial x}\frac{dx}{dt}+\frac{\partial f}{\partial y}\frac{dy}{dt} $$

が得られます。

次に、2変数関数同士の合成関数の微分について考えます。これは連鎖公式とよばれる重要な公式となります。

定理4 (連鎖公式)

\( f=f(x,y) \) は全微分可能で、 \( x=x(u,v), \ y=y(u,v) \) は偏微分可能であるとする。

このとき、 \( z(u,v)=f(x(u,v),y(u,v)) \) も偏微分可能であり、

$$ \frac{\partial z}{\partial u}=\frac{\partial f}{\partial x}\frac{\partial x}{\partial u}+\frac{\partial f}{\partial y}\frac{\partial y}{\partial u},\quad \frac{\partial z}{\partial v}=\frac{\partial f}{\partial x}\frac{\partial x}{\partial v}+\frac{\partial f}{\partial y}\frac{\partial y}{\partial v} $$

定理4の証明(気になる方だけクリックしてください)

\( x=x(u,v), \ y=y(u,v) \) の \( v \) を固定して \( u \) だけの1変数関数としてみると、定理3の結果がそのまま使えて、次が得られます。

$$ \frac{\partial z}{\partial u}=\frac{\partial f}{\partial x}\frac{\partial x}{\partial u}+\frac{\partial f}{\partial y}\frac{\partial y}{\partial u} $$

逆に、 \( u \) を固定して \( v \) だけの1変数関数としてみると、

$$ \frac{\partial z}{\partial v}=\frac{\partial f}{\partial x}\frac{\partial x}{\partial v}+\frac{\partial f}{\partial y}\frac{\partial y}{\partial v} $$

が得られます。

例3

(1) $$ f(x,y)=x^2+y^2, \quad x=\cos t, \quad y=\sin t, \quad z(t)=f(\cos t,\sin t) $$

のとき、 \( \frac{dz}{dt} \) を求める。

$$ \begin{align} \frac{dz}{dt}&=\frac{\partial f}{\partial x}\frac{dx}{dt}+\frac{\partial f}{\partial y}\frac{dy}{dt}=2x(-\sin t)+2y(\cos t) \\ &=-2\cos t\sin t+2\sin t \cos t=0 \end{align} $$


(2) $$ f(x,y)=e^x\cos y, \quad x=u^2-v^2, \quad y=2uv, \quad z(u,v)=f(u^2-v^2,2uv) $$

のとき、 \( \frac{\partial z}{\partial u}, \ \frac{\partial z}{\partial v} \) を求める。

$$ \begin{align} \frac{\partial z}{\partial u}&=\frac{\partial f}{\partial x}\frac{\partial x}{\partial u}+\frac{\partial f}{\partial y}\frac{\partial y}{\partial u}=(e^x\cos y)(2u)+(-e^x\sin y)(2v) \\ &=2e^x(u\cos y-v\sin y) \end{align} $$

$$ \begin{align} \frac{\partial z}{\partial v}&=\frac{\partial f}{\partial x}\frac{\partial x}{\partial v}+\frac{\partial f}{\partial y}\frac{\partial y}{\partial v}=(e^x\cos y)(-2v)+(-e^x\sin y)(2u) \\ &=-2e^x(v\cos y+u\sin y) \end{align} $$

多変数関数の平均値の定理・テイラーの定理

最後に、多変数関数の平均値の定理・テイラーの定理・マクローリンの定理を簡単に紹介していきます。

1変数関数の平均値の定理・テイラーの定理・マクローリンの定理については以下の記事をご覧ください。

定理5 (平均値の定理)

関数 \( f(x,y) \) が点 \( (a,b) \) のまわりで \( C^1 \) 級であるとすると、

$$ f(x,y)=f(a,b)+f_x(c,d)(x-a)+f_y(c,d)(y-b) $$

をみたす \( c \) が \( a \) と \( x \) の間に、 \( d \) が \( y \) と \( b \) の間に存在する。

定理6 (テイラーの定理)

関数 \( f(x,y) \) が点 \( (a,b) \) のまわりで \( C^n \) 級であるとする。このとき、次が成り立つ。

$$ \begin{align} f(x,y)&=f(a,b)+\left( (x-a)\frac{\partial}{\partial x}+(y-b)\frac{\partial}{\partial y}\right)f(a,b) \\ &+\frac{1}{2!}\left( (x-a)\frac{\partial}{\partial x}+(y-b)\frac{\partial}{\partial y}\right)^2f(a,b)+\cdots \\ &\quad +\frac{1}{(n-1)!}\left( (x-a)\frac{\partial}{\partial x}+(y-b)\frac{\partial}{\partial y}\right)^{n-1}f(a,b)+R_n \\ &=\sum_{r=0}^{n-1}\frac{1}{r!}\left( (x-a)\frac{\partial}{\partial x}+(y-b)\frac{\partial}{\partial y}\right)^rf(a,b)+R_n \end{align} $$

ここで、

$$ R_n=\frac{1}{n!}\left( (x-a)\frac{\partial}{\partial x}+(y-b)\frac{\partial}{\partial y}\right)^nf(c,d) $$

をみたす \( c \) が \( a \) と \( x \) の間に、 \( d \) が \( y \) と \( b \) の間に存在する。

定理6で点 \( (a,b)=(0,0) \) とすると、次が得られます。

定理7 (マクローリンの定理)

関数 \( f(x,y) \) が原点 \( (0,0) \) のまわりで \( C^n \) 級であるとする。このとき、次が成り立つ。

$$ \begin{align} f(x,y)&=f(0,0)+\left( x\frac{\partial}{\partial x}+y\frac{\partial}{\partial y}\right)f(0,0)+\frac{1}{2!}\left( x\frac{\partial}{\partial x}+y\frac{\partial}{\partial y}\right)^2f(0,0) \\ &\quad +\cdots+\frac{1}{(n-1)!}\left( x\frac{\partial}{\partial x}+y\frac{\partial}{\partial y}\right)^{n-1}f(0,0)+R_n \\ &=\sum_{r=0}^{n-1}\frac{1}{r!}\left( x\frac{\partial}{\partial x}+y\frac{\partial}{\partial y}\right)^rf(0,0)+R_n \end{align} $$

ここで、

$$ R_n=\frac{1}{n!}\left( x\frac{\partial}{\partial x}+y\frac{\partial}{\partial y}\right)^nf(c,d) $$

をみたす \( c \) が \( 0 \) と \( x \) の間に、 \( d \) が \( 0 \) と \( y \) の間に存在する。

例4

\( f(x,y)=e^x\log(1+y) \) を2次の項までマクローリン展開をする。

$$ f_x=e^x\log(1+y), \quad f_y=\frac{e^x}{1+y} $$

$$ f_{xx}=e^x\log(1+y), \quad f_{xy}=f_{yx}=\frac{e^x}{1+y}, \quad f_{yy}=-\frac{e^x}{(1+y)^2} $$

であるので、

$$ \begin{align} f(x,y)&=f(0,0)+\left( x\frac{\partial}{\partial x}+y\frac{\partial}{\partial y}\right)f(0,0)+\frac{1}{2!}\left( x\frac{\partial}{\partial x}+y\frac{\partial}{\partial y}\right)^2f(0,0)+R_3 \\ &=f(0,0)+x\frac{\partial}{\partial x}f(0,0)+y\frac{\partial}{\partial y}f(0,0) \\ &\quad +\frac{1}{2}x^2\frac{\partial^2}{\partial x^2}f(0,0)+xy\frac{\partial}{\partial x}\frac{\partial}{\partial y}f(0,0)+\frac{1}{2}y^2\frac{\partial}{\partial y^2}f(0,0)+R_3 \\ &=f(0,0)+f_x(0,0)x+f_y(0,0)y+\frac{1}{2}f_{xx}(0,0)x^2+f_{xy}(0,0)xy+\frac{1}{2}f_{yy}(0,0)y^2+R_3 \\ &=y+xy-\frac{y^2}{2}+R_3 \end{align} $$

今回はここまでです。お疲れ様でした。また次回にお会いしましょう。

目次