高校数学では、\(y=x^2\) など、変数が1つのみの関数の微分を習いました。
しかし、データサイエンスの世界では、 \(z=x^2+y^2\) など、変数が2つ以上の関数(多変数関数)になることが多く、多変数関数の微分をする必要に迫られます。
そこで今回は、多変数関数を微分する方法「偏微分」について解説します。
1変数の「微分」の復習
では、まずはじめに1変数の「微分」の復習から始めます。
\(xy\) 平面上に \(y=f(x)\) の曲線を描いたときに(下図では青色の曲線)、\(x\) の変化量 \(\Delta x\) に対する \(y=f(x)\) の変化量 \(f(x+\Delta x)-f(x)\)、つまり、傾き \(\frac{f(x+\Delta x)-f(x)}{\Delta x}\) を求めるのが微分でした。
下図では、\(x\) の変化量に対する \(y\) の変化量を、赤色の直線(=接線)の傾きで表しています。
しかし、\(x\) の変化量 \(\Delta x\) によって傾きは大きく変わります。(ある点と \(\Delta x\) 離れた点の、2点間の傾きを求めているため。)
そこで、\(\Delta x\) を極限まで \(0\) に近づけることで、その点における真の傾きを求めるのが微分でした。
式で書くと以下のようになります。
$$
f'(x) = \frac{df(x)}{dx} = \lim_{\Delta x \to 0} \frac{f(x+\Delta x)-f(x)}{(x+\Delta x)-x} = \lim_{\Delta x \to 0} \frac{f(x+\Delta x)-f(x)}{\Delta x} \\
$$
偏微分の意味と計算方法
偏微分の意味
続いて、「偏微分」について解説します。
たとえば、2変数関数 \(z=f(x,y)\) の場合、\(x\) と \(y\) の組み合わせによって、\(z\) が決まります。
\(xy\) 平面それぞれの位置で、高さ \(z\) が決まるので、グラフは曲面になります(下図では青色の曲面)。
下図は、上図の角度を変えたものです。
ただし、微分しようとすると、\(x\) 軸方向と、\(y\) 軸方向の変化があり、それぞれで高さ \(z\) が変わってしまいます。
そこで、\(x\) 以外(\(=y\))を固定して、\(x\) の変化量に対する \(z=f(x,y)\) の変化量を求めることにします。これを「\(x\) の偏微分」と言います。
上図では紫色の矢印の傾きが \(x\) を偏微分した結果で、式で書くと、以下のようになります。(\(\partial\) は、ラウンド、パーシャルなどと読みます。また、\(x\) の変化量を \(\Delta x\) とします。)
$$
\frac{\partial f(x,y)}{\partial x} = \frac{\partial z}{\partial x} = \lim_{\Delta x \to 0} \frac{f(x+\Delta x, y)-f(x, y)}{\Delta x}
$$
「\(y\) の偏微分」についても同様です。\(y\) 以外(\(=x\)) を固定して、\(y\) の変化量に対する \(z=f(x,y)\) の変化量を求めます。
上図では緑色の矢印の傾きが \(y\) を偏微分した結果で、式で書くと、以下のようになります。(\(y\) の変化量を \(\Delta y\) とします。)
$$
\frac{\partial f(x,y)}{\partial y} = \frac{\partial z}{\partial y} = \lim_{\Delta y \to 0} \frac{f(x, y+\Delta y)-f(x, y)}{\Delta y}
$$
偏微分の計算方法
では、最後に偏微分の計算方法について解説します。
まずは、素直に偏微分の式に当てはめて計算すると、
\begin{eqnarray}
(1) f(x,y)&=&x^2+2y^2 \\ \\
\frac{\partial f(x,y)}{\partial x} &=& \lim_{\Delta x \to 0} \frac{f(x+\Delta x, y)-f(x, y)}{\Delta x} \\
&=& \lim_{\Delta x \to 0} \frac{((x+\Delta x)^2+2y^2)-(x^2+2y^2)}{\Delta x} \\
&=& \lim_{\Delta x \to 0} \frac{(x^2+2x\Delta x+\Delta x^2+2y^2)-(x^2+2y^2)}{\Delta x} \\
&=& \lim_{\Delta x \to 0} (2x+\Delta x) \\
&=& 2x \\ \\
\frac{\partial f(x,y)}{\partial y} &=& \lim_{\Delta y \to 0} \frac{f(x, y+\Delta y)-f(x, y)}{\Delta y} \\
&=& \lim_{\Delta y \to 0} \frac{(x^2+2(y+\Delta y)^2)-(x^2+2y^2)}{\Delta y} \\
&=& \lim_{\Delta y \to 0} \frac{(x^2+2y^2+4y\Delta y+2\Delta y^2)-(x^2+2y^2)}{\Delta y} \\
&=& \lim_{\Delta y \to 0} (4y+2\Delta y) \\
&=& 4y \\ \\
\end{eqnarray}
と求めることができました。結果をみるとわかるように、固定している変数は定数として微分できることがわかります。
以下の問題では、固定している変数を定数として微分すると、
\begin{eqnarray}
(2) f(x,y)&=&3x^2+5xy+3y^3\\ \\
\frac{\partial f(x,y)}{\partial x} &=& 6x+5y \\ \\
\frac{\partial f(x,y)}{\partial y} &=& 5x+9y^2
\end{eqnarray}
\begin{eqnarray}
(3) f(x,y,z)&=&\sin(x+3y+z^3)\\ \\
\frac{\partial f(x,y,z)}{\partial x} &=& \cos(x+3y+z^3) \\ \\
\frac{\partial f(x,y,z)}{\partial y} &=& 3 \cos(x+3y+z^3) \\ \\
\frac{\partial f(x,y,z)}{\partial z} &=& 3z^2 \cos(x+3y+z^3) \\ \\
\end{eqnarray}
というように、機械的に偏微分が計算できました。
まとめ
今回は、偏微分の意味と計算方法について解説しました。計算自体は簡単ですが、ぜひ意味を理解しておきましょう。
コメント