こんにちは、ひかりです。
今回は線形代数学続論から行列の対角化と三角化について解説していきます。
この記事では以下のことを紹介します。
- 固有値と固有ベクトルについて
- 行列の対角化について
- 行列の三角化について
固有値と固有ベクトル
固有値と固有ベクトルについては、線形代数学15の記事で少しだけ紹介しました。
そこでは、行列を用いて固有値と固有ベクトルを定義していましたが、線形代数学続論08の定理3より線形写像と行列は1対1に対応するので、ここでは線形写像を用いて次のように固有値と固有ベクトルを定義します。
\( V \) をベクトル空間とする。線形写像 \( f:V\to V \) に対して、 \( V \) のベクトル \( \mathbf{v}\not=\mathbf{0} \) が次の条件をみたすとき、 \( \mathbf{v} \) を \( f \) の固有ベクトルという。
$$ f(\mathbf{v})=\lambda \mathbf{v} \ となる \ \lambda \in K \ が存在する。 $$
(ここで、 \( K=\mathbb{R} \ \text{or} \ \mathbb{C} \))
また、 \( \lambda \) を \( f \) の固有値という。
また、固有空間も定義しておきます。
\( V \) をベクトル空間とする。線形写像 \( f:V\to V \) に対して、 \( \lambda\in K \) を \( f \) の1つの固有値とする。
このとき、 \( f \) の固有値 \( \lambda \) に対応する固有空間 \( V(\lambda) \) を次で定める。
$$ \begin{align} V(\lambda)&=\{ \mathbf{v}\in V \ | \ \mathbf{v}は\lambdaに対応する固有ベクトル\}\cup \{\mathbf{0}\} \\ &=\{ \mathbf{v}\in V \ | \ f(\mathbf{v})=\lambda\mathbf{v} \} \end{align} $$
固有空間について、次が成り立ちます。
\( V \) をベクトル空間とする。線形写像 \( f:V\to V \) に対して、 \( \lambda\in K \) を \( f \) の1つの固有値とする。
このとき、 \( V(\lambda) \) は \( V \) の部分空間となる。
定理1の証明(気になる方だけクリックしてください)
線形代数学続論05の定理2の条件を確かめればよい。
まず、任意の \( \mathbf{v}_1,\mathbf{v}_2\in V(\lambda) \) に対して、
$$ f(\mathbf{v}_1+\mathbf{v}_2)=f(\mathbf{v}_1)+f(\mathbf{v}_2)=\lambda\mathbf{v}_1+\lambda \mathbf{v}_2=\lambda(\mathbf{v}_1+\mathbf{v}_2) $$
したがって、
$$ \mathbf{v}_1+\mathbf{v}_2\in V(\lambda) $$
次に、任意の \( \mathbf{v}\in V(\lambda) \) と \( \mu\in K \) に対して、
$$ f(\mu\mathbf{v})=\mu f(\mathbf{v})=\mu (\lambda \mathbf{v})=\lambda (\mu\mathbf{v}) $$
したがって、
$$ \mu\mathbf{v}\in V(\lambda) $$
よって、 \( V(\lambda) \) は \( V \) の部分空間となります。
(1) 線形写像 \( f:\mathbb{R}^2\to \mathbb{R}^2 \) を次で与える。
$$ \begin{pmatrix} x \\ y \end{pmatrix} \mapsto A\begin{pmatrix} x \\ y \end{pmatrix}=\begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix}\begin{pmatrix} x \\ y \end{pmatrix} $$
\( f \) が実数の固有値をもたないことを示す。
\( f \) の実数の固有値を \( \lambda\in \mathbb{R} \) とする。
すると、
$$ \begin{pmatrix} x \\ y \end{pmatrix}\not=\begin{pmatrix} 0 \\ 0 \end{pmatrix} \ が存在して、 \ A\begin{pmatrix} x \\ y \end{pmatrix}=\lambda\begin{pmatrix} x \\ y \end{pmatrix} $$
一方で、
$$ A\begin{pmatrix} x \\ y \end{pmatrix}=\begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix}\begin{pmatrix} x \\ y \end{pmatrix}=\begin{pmatrix} y \\ -x \end{pmatrix} $$
より、
$$ \begin{cases} y=\lambda x \\ -x=\lambda y \end{cases} $$
となるので、
$$ -x=\lambda y=\lambda^2 x, \quad y=\lambda x=-\lambda^2 y $$
なので、 \( \lambda^2+1=0 \) となり、このような \( \lambda \) は実数の範囲には存在しない。
よって、 \( f \) が実数の固有値をもたない。
(2) 今度は線形写像 \( f:\mathbb{C}^2\to\mathbb{C}^2 \) を次で与える。
$$ \begin{pmatrix} x \\ y \end{pmatrix} \mapsto A\begin{pmatrix} x \\ y \end{pmatrix}=\begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix}\begin{pmatrix} x \\ y \end{pmatrix} $$
(つまり、(1)と同じ線形写像で定義域と終域を \( \mathbb{C}^2 \) に広げたものを考える)
このとき、 \( f \) は複素数の固有値をもつ。
実際、 \( \lambda^2+1=0 \) は複素数の範囲ならば解けて、 \( \lambda=\pm i \)
よって、 \( f \) の固有値は \( \lambda,-\lambda \) である。また、
$$ \begin{align} V(i)&=\left\{ \begin{pmatrix} x \\ y \end{pmatrix}\in \mathbb{C}^2 \ | \ \begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix}\begin{pmatrix} x \\ y \end{pmatrix}=i\begin{pmatrix} x \\ y \end{pmatrix}\right\} \\ &=\left\{ \begin{pmatrix} x \\ y \end{pmatrix}\in \mathbb{C}^2 \ | \ \begin{pmatrix} -i & 1 \\ -1 & -i \end{pmatrix}\begin{pmatrix} x \\ y \end{pmatrix}=\begin{pmatrix} 0 \\ 0 \end{pmatrix}\right\} \end{align} $$
$$ \begin{align} V(-i)&=\left\{ \begin{pmatrix} x \\ y \end{pmatrix}\in \mathbb{C}^2 \ | \ \begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix}\begin{pmatrix} x \\ y \end{pmatrix}=-i\begin{pmatrix} x \\ y \end{pmatrix}\right\} \\ &=\left\{ \begin{pmatrix} x \\ y \end{pmatrix}\in \mathbb{C}^2 \ | \ \begin{pmatrix} i & 1 \\ -1 & i \end{pmatrix}\begin{pmatrix} x \\ y \end{pmatrix}=\begin{pmatrix} 0 \\ 0 \end{pmatrix}\right\} \end{align} $$
\( f \) の固有値を簡単に求めたい。そのために、固有多項式を定義します。
\( n \) 次正方行列
$$ A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{pmatrix} $$
に対して、
$$ \varphi_A(t)=|A-tE_n|=\begin{vmatrix} a_{11}-t & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22}-t & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}-t \end{vmatrix} $$
によって定義される変数 \( t \) の \( n \) 次多項式 \( \varphi_A(t) \) を \( A \) の固有多項式という。
ここで、 \( E_n \) は \( n \) 次単位行列である。
固有多項式と固有値の関係は次のようになります。
\( V \) を \( n \) 次元ベクトル空間とする。線形写像 \( f:V\to V \) の表現行列 \( A \) とすると、次が成り立つ。
$$ \lambda\in K \ が \ f \ の固有値 \iff \varphi_A(t)=0 $$
定理2の証明(気になる方だけクリックしてください)
(\(\Rightarrow\)) \( \lambda \in K \) を \( f \) の固有値とします。すると、
$$ \mathbf{v}\not=\mathbf{0} \ が存在して、 \ f(\mathbf{v})=\lambda\mathbf{v} $$
いま、 \( f(\mathbf{v})=A\mathbf{v} \) より、 \( A\mathbf{v}=\lambda \mathbf{v} \) となります。
よって、 \( (A-\lambda E_n)(\mathbf{v})=\mathbf{0} \) であるので、 \( \mathbf{v}\not=\mathbf{0} \) に注意すると、 \( \text{Ker} \ (A-\lambda E_n) \) の次元は1以上となります。
(表現行列が \( A-\lambda E_n \) の線形写像のことをそのまま \( A-\lambda E_n \) と書いています)
したがって、線形写像の基本定理より、
$$ \begin{align} 1&≦\dim \text{Ker} \ (A-\lambda E_n)=\dim V-\dim \text{Im} \ (A-\lambda E_n) \\ &=n-\dim \text{Im} \ (A-\lambda E_n) \end{align} $$
となるので、
$$ \dim \text{Im} \ (A-\lambda E_n)≦ n-1 $$
ここで、
$$ \text{rank} \ (A-\lambda E_n) =\dim \text{Im} \ (A-\lambda E_n)≦ n-1 $$
であるので、線形代数学続論10の定理2より、
$$ \varphi_A(t)=|A-tE_n|=0 $$
(\(\Leftarrow\)) (上の議論はすべて同値条件でつながれているので、逆をたどれば示せます。)
今度は
$$ \varphi_A(t)=|A-tE_n|=0 $$
とすると、線形代数学続論10の定理2より、
$$ \dim \text{Im} \ (A-\lambda E_n)=\text{rank} \ (A-\lambda E_n)≦ n-1 $$
したがって、線形写像の基本定理より、
$$ \begin{align} 1&≦n-\dim \text{Im} \ (A-\lambda E_n)=\dim V-\dim \text{Im} \ (A-\lambda E_n) \\ &=\dim \text{Ker} \ (A-\lambda E_n) \end{align} $$
よって、 \( (A-\lambda E_n)(\mathbf{v})=\mathbf{0} \) となる \( \mathbf{v}\not=\mathbf{0} \) が存在します。
したがって、
$$ f(\mathbf{v})=A\mathbf{v}=\lambda \mathbf{v} $$
となり、\( \lambda \) は \( f \) の固有値となります。
線形写像 \( f:\mathbb{R}^3\to \mathbb{R}^3 \) を次で与える。
$$ \begin{pmatrix} x \\ y \\ z \end{pmatrix} \mapsto A\begin{pmatrix} x \\ y \\ z \end{pmatrix}=\begin{pmatrix} 0 & 1 & 1 \\ 1 & 0 & 1 \\ 1 & 1 & 0 \end{pmatrix}\begin{pmatrix} x \\ y \\ z \end{pmatrix} $$
このとき、 \( f \) の固有値と固有空間を求める。
\( A \) の固有多項式 \( \varphi_A(t) \) を計算すると、
$$ \begin{align} \varphi_A(t)&=|A-tE_n|=\begin{vmatrix} -t & 1 & 1 \\ 1 & -t & 1 \\ 1 & 1 & -t \end{vmatrix}=(1+t)^2(2-t) \end{align} $$
したがって、 \( f \) の固有値は \( t=-1,2 \)
また、固有空間は
$$ \begin{align} V(-1)&=\left\{ \begin{pmatrix} x \\ y \\ z \end{pmatrix}\in \mathbb{R}^3 \ | \ (A+E_3)\begin{pmatrix} x \\ y \\ z \end{pmatrix}=\begin{pmatrix} 0 \\ 0 \\ 0 \end{pmatrix}\right\} \\ &=\left\{ \begin{pmatrix} x \\ y \\ z \end{pmatrix}\in \mathbb{R}^3 \ | \ \begin{pmatrix} 1 & 1 & 1 \\ 1 & 1 & 1 \\ 1 & 1 & 1 \end{pmatrix}\begin{pmatrix} x \\ y \\ z \end{pmatrix}=\begin{pmatrix} 0 \\ 0 \\ 0 \end{pmatrix}\right\} \\ &=\left\{ \begin{pmatrix} x \\ y \\ z \end{pmatrix}\in \mathbb{R}^3 \ | \ z=-x-y \right\} \\ &=S\left[ \begin{pmatrix} 1 \\ 0 \\ -1 \end{pmatrix},\begin{pmatrix} 0 \\ 1 \\ -1 \end{pmatrix} \right] \end{align} $$
$$ \begin{align} V(2)&=\left\{ \begin{pmatrix} x \\ y \\ z \end{pmatrix}\in \mathbb{R}^3 \ | \ (A-2E_3)\begin{pmatrix} x \\ y \\ z \end{pmatrix}=\begin{pmatrix} 0 \\ 0 \\ 0 \end{pmatrix}\right\} \\ &=\left\{ \begin{pmatrix} x \\ y \\ z \end{pmatrix}\in \mathbb{R}^3 \ | \ \begin{pmatrix} -2 & 1 & 1 \\ 1 & -2 & 1 \\ 1 & 1 & -2 \end{pmatrix}\begin{pmatrix} x \\ y \\ z \end{pmatrix}=\begin{pmatrix} 0 \\ 0 \\ 0 \end{pmatrix}\right\} \\ &=\left\{ \begin{pmatrix} x \\ y \\ z \end{pmatrix}\in \mathbb{R}^3 \ | \ x=y=z \right\} \\ &=S\left[ \begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix} \right] \end{align} $$
最後に、固有値の重複度について定義しておきます。
\( V \) を \( n \) 次元ベクトル空間とする。そして、線形写像 \( f:V\to V \) の表現行列 \( A \) とする。
このとき、 \( f \) の固有多項式 \( \varphi_A(t) \) が次のように分解されたとする。
$$ \varphi_A(t)=\left( \prod_{i=1}^s(t-\lambda_i)^{m_i} \right)\times \psi(t) $$
ただし、
$$ \lambda_i\not=\lambda_j \ (i\not= j), \quad m_j≧1, \quad \psi(\lambda_i)\not=0 \ (任意のi) $$
このとき、 \( m_i≧1 \) のことを \( f \) の固有値 \( \lambda_i \) の重複度という。
実数の範囲で次の固有多項式を考える。
$$ \varphi_A(t)=(t-2)^2(t^2+1) $$
( \( t^2+1 \) が上の定義でいう \( \psi(t) \) である)
このとき、実数の範囲での固有値は \( \lambda=2 \) であり、固有値 \( 2 \) の重複度は2である。
また、複素数の範囲で固有多項式を考えると、
$$ \varphi_A(t)=(t-2)^2(t^2+1)=(t-2)^2(t+i)(t-i) $$
となるので、 \( \lambda=2,i,-i \) である。
すると、固有値 \( 2 \) の重複度は2、固有値 \( i \) の重複度は1、固有値 \( -i \) の重複度は1である。
行列の対角化
行列の対角化についても線形代数学15の記事で少しだけ解説しました。
\( n \) 次正方行列 \( A \) に対して、ある正則行列 \( P \) が存在して、 \( P^{-1}AP \) が対角行列となるとき、 \( A \) は対角化可能であるといい、行列 \( A \) に対して、正則行列 \( P \) を見つけて、 \( P^{-1}AP \) を対角行列にすることを \( A \) の対角化という。
(1) 線形写像 \( f:\mathbb{R}^3\to \mathbb{R}^3 \) を次で与える。
$$ \begin{pmatrix} x \\ y \\ z \end{pmatrix} \mapsto A\begin{pmatrix} x \\ y \\ z \end{pmatrix}=\begin{pmatrix} 0 & 1 & 1 \\ 1 & 0 & 1 \\ 1 & 1 & 0 \end{pmatrix}\begin{pmatrix} x \\ y \\ z \end{pmatrix} $$
このとき、例2より \( f \) の固有値は \( \lambda=-1,2 \) であり、固有空間は
$$ V(-1)=S\left[ \begin{pmatrix} 1 \\ 0 \\ -1 \end{pmatrix},\begin{pmatrix} 0 \\ 1 \\ -1 \end{pmatrix} \right], \quad V(2)=S\left[ \begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix} \right] $$
ここで、
$$ \mathbf{v}_1=\begin{pmatrix} 1 \\ 0 \\ -1 \end{pmatrix}, \quad \mathbf{v}_2=\begin{pmatrix} 0 \\ 1 \\ -1 \end{pmatrix}, \quad \mathbf{v}_3=\begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix} $$
とおき、
$$ P_1=\begin{pmatrix} \mathbf{v}_1 & \mathbf{v}_2 & \mathbf{v}_3 \end{pmatrix}=\begin{pmatrix} 1 & 0 & 1 \\ 0 & 1 & 1 \\ -1 & -1 & 1 \end{pmatrix} $$
$$ P_2=\begin{pmatrix} \mathbf{v}_1 & \mathbf{v}_3 & \mathbf{v}_2 \end{pmatrix}=\begin{pmatrix} 1 & 1 & 0 \\ 0 & 1 & 1 \\ -1 & 1 & -1 \end{pmatrix} $$
とすると、
$$ P_1^{-1}AP_1=\begin{pmatrix} -1 & 0 & 0 \\ 0 & -1 & 0 \\ 0 & 0 & 2 \end{pmatrix}, \quad P_2^{-1}AP_2=\begin{pmatrix} -1 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & -1 \end{pmatrix} $$
よって、 \( A \) の対角化は1通りとは限らない。
(2) 次の2次正方行列を考える。
$$ A=\begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} $$
このとき、 \( A \) は対角化可能ではない。
なぜなら、もし \( A \) が対角化可能であるとすると、ある正則行列 \( P \) が存在して
$$ P^{-1}AP=\begin{pmatrix} \lambda_1 & 0 \\ 0 & \lambda_2 \end{pmatrix} $$
このとき、
$$ \varphi_A(t)=|A-tE_2|=\begin{vmatrix} 1-t & 1 \\ 0 & 1-t \end{vmatrix}=(1-t)^2 $$
$$ \varphi_{P^{-1}AP}(t)=|(P^{-1}AP)-tE_2|=\begin{vmatrix} \lambda_1-t & 0 \\ 0 & \lambda_2-t \end{vmatrix}=(\lambda_1-t)(\lambda_2-t) $$
ここで、線形代数学続論04の定理6と線形代数学09の定理4より、
$$ \begin{align} \varphi_{P^{-1}AP}(t)&=|(P^{-1}AP)-tE_2|=|(P^{-1}AP)-P^{-1}(tE_2)P| \quad (E_2は単位行列より) \\ &=|P^{-1}(A-tE_2)P|=|P^{-1}||A-tE_2||P| \quad (線形代数学続論04の定理6) \\ &=|A-tE_2| \quad (線形代数学09の定理4より|P^{-1}|=\frac{1}{|P|}) \\ &=\varphi_A(t) \end{align} $$
であるので、 \( \lambda_1=\lambda_2=1 \)
したがって、
$$ P^{-1}AP=\begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}=E_2 $$
であるので、 \( A=E_2 \) となり矛盾する。よって、 \( A \) は対角化可能ではない。
それでは、行列 \( A \) が対角化可能であるための条件を見ていきましょう。
まず準備のため、次を示します。
\( n \) 次正方行列 \( A \) の相異なる固有値全体を \( \lambda_1,\cdots,\lambda_s\in K \) をもつとする。
各 \( \lambda_i \) に対応する固有空間 \( V(\lambda_i) \) からゼロでないベクトル \( \mathbf{x}_i\in V(\lambda_i) \) を1つ取る。
このとき、 \( \mathbf{x}_1,\cdots,\mathbf{x}_s \) は1次独立である。
定理3の証明(気になる方だけクリックしてください)
もし、 \( \mathbf{x}_1,\cdots,\mathbf{x}_s \) が1次従属であるとすると、 \( \mathbf{x}_1,\cdots,\mathbf{x}_r \) は1次独立だが \( \mathbf{x}_1,\cdots,\mathbf{x}_r,\mathbf{x}_{r+1} \) は1次従属であるような \( 1≦r<s \) が存在します。
よって、
$$ c_1\mathbf{x}_1+\cdots+c_r\mathbf{x}_r+c_{r+1}\mathbf{x}_{r+1}=\mathbf{0} $$
と表したとき、 \( c_{r+1}\not=0 \) となります。
(\( c_{r}=0 \) であるとすると、 \( \mathbf{x}_1,\cdots,\mathbf{x}_r \) の1次独立性に反します。)
そこで、 \( c_{r+1} \) で割ると、
$$ \mathbf{x}_{r+1}=\beta_1\mathbf{x}_1+\cdots+\beta_r\mathbf{x}_r \tag{1} $$
となる \( \beta_1,\cdots,\beta_r\in K \) が存在します。
この両辺に \( A \) をかけると、
$$ A\mathbf{x}_{r+1}=\beta_1A\mathbf{x}_1+\cdots+\beta_rA\mathbf{x}_r $$
定理の仮定より、 \( A\mathbf{x}_i=\lambda_i\mathbf{x}_i \) であるので、
$$ \lambda_{r+1}\mathbf{x}_{r+1}=\beta_1\lambda_1\mathbf{x}_1+\cdots+\beta_r\lambda_r\mathbf{x}_r \tag{2} $$
また、式(1)の両辺に \( \lambda_{r+1} \) をかけると、
$$ \lambda_{r+1}\mathbf{x}_{r+1}=\beta_1\lambda_{r+1}\mathbf{x}_1+\cdots+\beta_r\lambda_{r+1}\mathbf{x}_r \tag{3} $$
式(2)と式(3)より、
$$ \beta_1\lambda_1\mathbf{x}_1+\cdots+\beta_r\lambda_r\mathbf{x}_r=\beta_1\lambda_{r+1}\mathbf{x}_1+\cdots+\beta_r\lambda_{r+1}\mathbf{x}_r $$
したがって、
$$ \beta_1(\lambda_1-\lambda_{r+1})\mathbf{x}_1+\cdots+\beta_r(\lambda_r-\lambda_{r+1})\mathbf{x}_r=\mathbf{0} $$
ここで、 \( (\beta_1,\cdots,\beta_r)\not=(0,\cdots,0) \) に注意すると、ある \( 1≦i≦r \) で \( \beta_i(\lambda_i-\lambda_{r+1})\not=0 \) となります。
(定理の仮定より、すべての \( i \) に対して、 \( \lambda_i-\lambda_{r+1}\not=0 \) であることにも注意しましょう)
したがって、 \( \mathbf{x}_1,\cdots,\mathbf{x}_r \) の1次独立性に矛盾するので、 \( \mathbf{x}_1,\cdots,\mathbf{x}_s \) は1次独立となります。
これを用いると、線形代数学15の定理1で紹介した対角化可能の1つの条件を証明することができます。
\( n \) 次正方行列 \( A \) が相異なる \( n \) 個の固有値 \( \lambda_1,\cdots,\lambda_n\in K \) をもつならば、 \( P^{-1}AP \) が対角行列となるような正則行列 \( P \) が存在する。とくに、
$$ P^{-1}AP=\begin{pmatrix} \lambda_1 & & {\LARGE{0}} \\ & \ddots & \\ {\LARGE{0}} & & \lambda_n \end{pmatrix} $$
定理4の証明(気になる方だけクリックしてください)
\( n \) 次正方行列 \( A \) を次の線形写像 \( f:K^n \to K^n \) の表現行列とします。(\( K^n=\mathbb{R}^n \ \text{or} \ \mathbb{C}^n \))
$$ \begin{pmatrix} \alpha_1 \\ \vdots \\ \alpha_n \end{pmatrix} \mapsto A\begin{pmatrix} \alpha_1 \\ \vdots \\ \alpha_n \end{pmatrix} $$
また、 \( A \) の異なる固有値を \( \lambda_1,\cdots,\lambda_n\in K \) とします。
各 \( \lambda_i \) に対する固有空間 \( V(\lambda_i)=\{ \mathbf{x}\in K^n \ | \ A\mathbf{x}=\lambda_i\mathbf{x} \} \) から \( \mathbf{x}_i\not=\mathbf{0} \) を1つずつ取ってきます。
すると、定理3より \( \mathbf{x}_1,\cdots,\mathbf{x}_n \) は1次独立となります。
よって、線形代数学続論07の定理1(の証明)より、
$$ \dim S[\mathbf{x}_1,\cdots,\mathbf{x}_n]=n $$
となります。(\( \mathbf{x}_1,\cdots,\mathbf{x}_n \) の中の1次独立の最大個数が次元となります。)
したがって、 \( K^n\supset S[\mathbf{x}_1,\cdots,\mathbf{x}_n] \) であるので線形代数学続論07の定理3(2)より、
$$ K^n=S[\mathbf{x}_1,\cdots,\mathbf{x}_n] $$
そこで、
$$ P=\begin{pmatrix} \mathbf{x}_1 & \cdots & \mathbf{x}_n \end{pmatrix} $$
とおくと、線形代数学続論08の定理4より、 \( P^{-1}AP \) は基底 \( \mathbf{x}_1,\cdots,\mathbf{x}_n \) に関する \( f \) の表現行列となっています。
ここで、
$$ f(\mathbf{x}_i)=A\mathbf{x}_i=\lambda_i\mathbf{x}_i \ (1≦i≦n) $$
であるので、線形代数学続論08の定理1より、
$$ P^{-1}AP=\begin{pmatrix} \lambda_1 & & {\LARGE{0}} \\ & \ddots & \\ {\LARGE{0}} & & \lambda_n \end{pmatrix} $$
次の行列 \( A \) を考える。
$$ A=\begin{pmatrix} 1 & 2 & 3 \\ 0 & 1 & -3 \\ 0 & -3 & 1 \end{pmatrix} $$
このとき、 \( A \) は対角化可能かどうかを調べて、対角化可能な場合は対角化する。
$$ \begin{align} \varphi_A(t)&=|A-tE_3|=\begin{vmatrix} 1-t & 2 & 3 \\ 0 & 1-t & -3 \\ 0 & -3 & 1-t \end{vmatrix} \\ &=-(t-1)(t-4)(t+2) \end{align} $$
よって、 \( A \) は3つの相異なる固有値 \( t=-2,1,4 \) をもつ。
したがって、定理4より、 \( A \) は対角化可能であり、
$$ P^{-1}AP=\begin{pmatrix} -2 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 4 \end{pmatrix} $$
最後に、一般の固有値に対しては、次のような対角化可能性の同値条件が成り立つことが知られています。
\( K=\mathbb{R} \ \text{or} \ \mathbb{C} \) とする。このとき、 \( K \) -係数 \( n \) 次正方行列に対して、次の4つの条件は同値である。
(1) \( A \) は対角化可能
(2) \( A \) の固有多項式 \( \varphi_A(t) \) が
$$ \varphi_A(t)=(-1)^n\prod_{i=1}^s(t-\lambda_i)^{m_i}, \quad (\lambda_i\not=\lambda_j \ (i\not=j), \ m_i≧1, \ \sum_{i=1}^sm_i=n) $$
と分解されて、各固有値 \( \lambda_i \) に対応する固有空間 \( V(\lambda_i) \) の次元は
$$ \dim V(\lambda_i)=m_i \quad (1≦i≦s) $$
となっている。
(3) \( A \) の固有多項式 \( \varphi_A(t) \) が
$$ \varphi_A(t)=(-1)^n\prod_{i=1}^s(t-\lambda_i)^{m_i}, \quad (\lambda_i\not=\lambda_j \ (i\not=j), \ m_i≧1, \ \sum_{i=1}^sm_i=n) $$
と分解されて、各固有値 \( \lambda_i \) に対応する固有空間 \( V(\lambda_i) \) に対して、
$$ \sum_{i=1}^s \dim V(\lambda_i)=n $$
となっている。
(4) \( n \) 個の1次独立な \( A \) の固有ベクトルが存在する。
(1) 次の行列 \( A \) が対角化可能かどうかを調べる。
$$ A=\begin{pmatrix} 1 & 2 & 1 \\ -1 & 4 & 1 \\ 2 & -4 & 0 \end{pmatrix} $$
\( A \) の固有多項式 \( \varphi_A(t) \) を求めると、
$$ \begin{align} \varphi_A(t)&=|A-tE_3|=\begin{vmatrix} 1-t & 2 & 1 \\ -1 & 4-t & 1 \\ 2 & -4 & -t \end{vmatrix} \\ &=(t-1)(t-2)^2 \end{align} $$
よって、 \( A \) は2つの固有値 \( t=1,2(重複度2) \) をもつ。
ここで、それぞれの固有空間を考えてみると、
$$ \begin{align} V(1)&=\left\{ \begin{pmatrix} x \\ y \\ z \end{pmatrix}\in K^3 \ | \ \begin{pmatrix} 0 & 2 & 1 \\ -1 & 3 & 1 \\ 2 & -4 & -1 \end{pmatrix} \begin{pmatrix} x \\ y \\ z \end{pmatrix}=\begin{pmatrix} 0 \\ 0 \\ 0 \end{pmatrix} \right\} \\ &=S\left[ \begin{pmatrix} 1 \\ 1 \\ 2 \end{pmatrix} \right] \end{align} $$
$$ \begin{align} V(2)&=\left\{ \begin{pmatrix} x \\ y \\ z \end{pmatrix}\in K^3 \ | \ \begin{pmatrix} -1 & 2 & 1 \\ -1 & 2 & 1 \\ 2 & -4 & -2 \end{pmatrix} \begin{pmatrix} x \\ y \\ z \end{pmatrix}=\begin{pmatrix} 0 \\ 0 \\ 0 \end{pmatrix} \right\} \\ &=S\left[ \begin{pmatrix} 2 \\ 1 \\ 0 \end{pmatrix},\begin{pmatrix} 1 \\ 0 \\ 1 \end{pmatrix} \right] \end{align} $$
したがって、
$$ \dim V(1)=1=固有値1の重複度, \quad \dim V(2)=2=固有値2の重複度 $$
となるので、定理5より \( A \) は対角化可能であり、
$$ P^{-1}AP=\begin{pmatrix} 1 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 2 \end{pmatrix} $$
(2) 次の行列 \( A \) が対角化可能かどうかを調べる。
$$ A=\begin{pmatrix} 0 & 1 & 0 \\ 0 & 0 & 1 \\ 1 & -3 & 3 \end{pmatrix} $$
\( A \) の固有多項式 \( \varphi_A(t) \) を求めると、
$$ \begin{align} \varphi_A(t)&=|A-tE_3|=\begin{vmatrix} -t & 1 & 0 \\ 0 & -t & 1 \\ 1 & -3 & 3-t \end{vmatrix} \\ &=(t-1)^3 \end{align} $$
よって、 \( A \) は1つの固有値 \( t=1(重複度3) \) をもつ。
ここで、固有空間を考えてみると、
$$ \begin{align} V(1)&=\left\{ \begin{pmatrix} x \\ y \\ z \end{pmatrix}\in K^3 \ | \ \begin{pmatrix} -1 & 1 & 0 \\ 0 & -1 & 1 \\ 1 & -3 & 2 \end{pmatrix} \begin{pmatrix} x \\ y \\ z \end{pmatrix}=\begin{pmatrix} 0 \\ 0 \\ 0 \end{pmatrix} \right\} \\ &=S\left[ \begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix} \right] \end{align} $$
したがって、
$$ \dim V(1)=1, \quad 固有値1の重複度=3 $$
となるので、定理5より \( A \) は対角化可能ではない。
行列の三角化
例4(2)で見たように、 \( n \) 次正方行列は必ず対角化可能であるとは限りません。
そこで、もう少し条件を緩めた状況でどこまで簡単な形に変換できるかを見ていきましょう。
まず、行列の三角化について定義します。
対角線よりも左下の成分が0の \( n \) 次正方行列
$$ \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ 0 & a_{22} & & \vdots \\ \vdots & \ddots & \ddots & \vdots \\ 0 & \cdots & 0 & a_{nn} \end{pmatrix} $$
のことを、上三角行列または三角行列という。
\( n \) 次正方行列 \( A \) に対して、ある正則行列 \( P \) が存在して、 \( P^{-1}AP \) が三角行列となるとき、 \( A \) は三角化可能であるといい、行列 \( A \) に対して、正則行列 \( P \) を見つけて、 \( P^{-1}AP \) を三角行列にすることを \( A \) の三角化という。
行列の三角化について次が成り立ちます。
\( n \) 次正方行列 \( A \) に対して、 \( A \) の固有値が(重複を込めて) \( n \) 個 \( \lambda_1,\cdots,\lambda_n\in K \) あるとする。
このとき、 \( P^{-1}AP \) が三角行列となるような正則行列 \( P \) が存在する。とくに
$$ P^{-1}AP=\begin{pmatrix} \lambda_1 & & {\LARGE{*}} \\ & \ddots & \\ {\LARGE{0}} & & \lambda_n \end{pmatrix} $$
定理6の証明(気になる方だけクリックしてください)
\( A \) のサイズ \( n≧1 \) に関する数学的帰納法で証明します。
\( n=1 \) のときは明らか
サイズ \( n-1 \) のとき成り立つと仮定して、サイズ \( n \) のときを示します。
\( A \) の固有値が(重複を込めて) \( n \) 個 \( \lambda_1,\cdots,\lambda_n\in K \) あるので、
$$ \varphi_A(t)=(-1)^n\prod_{i=1}^n(t-\lambda_i) $$
まず、固有値 \( \lambda_1 \) に対応する固有空間 \( V(\lambda_1) \) から固有ベクトル \( \mathbf{x}_1\not=\mathbf{0} \) をとります。
すると、残りの \( n-1 \) 個のベクトル \( \mathbf{x}_2,\cdots,\mathbf{x}_n\in K^n \) を適当にとってくることにより、 \( \mathbf{x}_1,\cdots,\mathbf{x}_n \) を \( K^n \) の基底とすることができます。
(例えば、 \(K^n \) の標準基底のうちの \( n-1 \) 個をつけることができます)
\( A \) によって定まる次の線形写像 \( f:K^n\to K^n \) を考えます。
$$ \begin{pmatrix} a_1 \\ \vdots \\ a_n \end{pmatrix} \mapsto A\begin{pmatrix} a_1 \\ \vdots \\ a_n \end{pmatrix} $$
すると、 \( f \) の基底 \( \mathbf{x}_1,\cdots,\mathbf{x}_n \) に関する表現行列は
$$ P_1=\begin{pmatrix} \mathbf{x}_1 & \cdots & \mathbf{x}_n \end{pmatrix} $$
とおくと、 \( f(\mathbf{x}_1)=\lambda_1\mathbf{x}_1 \) より次のような形をしています。
$$ P_1^{-1}AP_1=\left( \begin{array}{c|cc} \lambda_1 & & {\LARGE{*}} \\ \hline 0 & & & \\\vdots & & {\LARGE{A_1}} \\ 0 & & & \end{array} \right) $$
このとき、
$$ \begin{align} \varphi_{P_1^{-1}AP_1}(t)&=|P_1^{-1}AP_1-tE_n|=\left| \begin{array}{c|cc} \lambda_1-t & & {\LARGE{*}} \\ \hline 0 & & & \\\vdots & & {\LARGE{A_1-tE_{n-1}}} \\ 0 & & & \end{array} \right| \\ &=(\lambda_1-t)\varphi_{A_1}(t) \end{align} $$
したがって、 \( \varphi_A(t)=\varphi_{P^{-1}AP}(t) \) より(例4(2)参照)、
$$ \varphi_{A_1}(t)=(-1)^{n-1}\sum_{i=2}^n(t-\lambda_i) $$
したがって、 \( A_1 \) は \( n-1 \) 次正方行列であるので帰納法の仮定より、
$$ P_2^{-1}A_1P_2=\begin{pmatrix} \lambda_2 & & {\LARGE{*}} \\ & \ddots & \\ {\LARGE{0}} & & \lambda_n \end{pmatrix} $$
となる正則行列 \( P_2 \) が存在します。
このとき、
$$ P=P_1\left( \begin{array}{c|ccc} 1 & 0 & \cdots & 0 \\ \hline 0 & & & \\ \vdots & & {\LARGE{P_2}} \\ 0 & & & \end{array} \right) $$
とおくと、
$$ \begin{align} P^{-1}AP&=\left( P_1\left( \begin{array}{c|ccc} 1 & 0 & \cdots & 0 \\ \hline 0 & & & \\ \vdots & & {\LARGE{P_2}} \\ 0 & & & \end{array} \right) \right)^{-1}A\left( P_1\left( \begin{array}{c|ccc} 1 & 0 & \cdots & 0 \\ \hline 0 & & & \\ \vdots & & {\LARGE{P_2}} \\ 0 & & & \end{array} \right) \right) \\ &=\left( \begin{array}{c|ccc} 1 & 0 & \cdots & 0 \\ \hline 0 & & & \\ \vdots & & {\LARGE{P_2}} \\ 0 & & & \end{array} \right)^{-1}P_1^{-1}AP_1\left( \begin{array}{c|ccc} 1 & 0 & \cdots & 0 \\ \hline 0 & & & \\ \vdots & & {\LARGE{P_2}} \\ 0 & & & \end{array} \right) \\ &=\left( \begin{array}{c|ccc} 1 & 0 & \cdots & 0 \\ \hline 0 & & & \\ \vdots & & {\LARGE{P_2}} \\ 0 & & & \end{array} \right)\left( \begin{array}{c|cc} \lambda_1 & & {\LARGE{*}} \\ \hline 0 & & & \\\vdots & & {\LARGE{A_1}} \\ 0 & & & \end{array} \right)\left( \begin{array}{c|ccc} 1 & 0 & \cdots & 0 \\ \hline 0 & & & \\ \vdots & & {\LARGE{P_2}} \\ 0 & & & \end{array} \right) \\ &=\left( \begin{array}{c|cc} \lambda_1 & & {\LARGE{*}} \\ \hline 0 & & & \\\vdots & & {\LARGE{P_2^{-1}A_1P_2}} \\ 0 & & & \end{array} \right)=\begin{pmatrix} \lambda_1 & & {\LARGE{*}} \\ & \ddots & \\ {\LARGE{0}} & & \lambda_n \end{pmatrix} \end{align} $$
よって、定理が成り立ちます。
定理6を用いると、線形代数学14の記事で紹介したケーリー・ハミルトンの定理の一般化を示すことができます。
任意の \( n \) 次正方行列 \( A \) に対して、 \( \varphi_A(A)=O \)
ただし、 \( \varphi_A(A) \) とは \( \varphi_A(t) \) を
$$ \varphi_A(t)=(-1)^nt^n+\alpha_1t^{n-1}+\cdots+\alpha_{n-1}t+\alpha_n $$
と表したときに
$$ \varphi_A(A)=(-1)^nA^n+\alpha_1A^{n-1}+\cdots+\alpha_{n-1}A+\alpha_nE_n $$
で定義する。
定理7の証明(気になる方だけクリックしてください)
\( A \) の固有多項式 \( \varphi_A(t) \) を複素数の範囲で1次式に分解して
$$ \varphi_A(t)=(-1)^n\prod_{i=1}^n(t-\lambda_i) \quad (\lambda_1,\cdots,\lambda_n\in \mathbb{C}) $$
と表しておきます。
(複素数の範囲であれば \( n \) 次多項式は必ず1次式に分解することができます。(代数学の基本定理))
すると、
$$ \varphi_A(A)=(-1)^n\prod_{i=1}^n(A-\lambda_iE_n) $$
一方で、定理6より、
$$ P^{-1}AP=\begin{pmatrix} \lambda_1 & & {\LARGE{*}} \\ & \ddots & \\ {\LARGE{0}} & & \lambda_n \end{pmatrix} $$
となる正則行列 \( P \) が存在します。
これらより、
$$ \begin{align} &P^{-1}\varphi_A(A)P \\ &=P^{-1}\left((-1)^n\prod_{i=1}^n(A-\lambda_iE_n)\right)P \\ &=(-1)^n(P^{-1}(A-\lambda_1E_n)P)(P^{-1} (A-\lambda_2E_2)P)P^{-1}\cdots P(P^{-1}(A-\lambda_nE_n)P) \\ &=(-1)^n(P^{-1}AP-\lambda_1E_n)\cdots(P^{-1}AP-\lambda_nE_n) \\ &=(-1)^n\begin{pmatrix} 0 & & & {\LARGE{*}} \\ & \lambda_2-\lambda_1 & & \\ & & \ddots & \\ {\LARGE{0}} & & & \lambda_n-\lambda_1 \end{pmatrix}\cdots \begin{pmatrix} \lambda_1-\lambda_n & & & {\LARGE{*}} \\ & \ddots & & \\ & & \lambda_{n-1}-\lambda_n & \\ {\LARGE{0}} & & & 0 \end{pmatrix} \end{align} $$
このとき、
$$ \begin{pmatrix} 0 & & & {\LARGE{*}} \\ & \lambda_2-\lambda_1 & & \\ & & \ddots & \\ {\LARGE{0}} & & & \lambda_n-\lambda_1 \end{pmatrix}\cdots \begin{pmatrix} \lambda_1-\lambda_n & & & {\LARGE{*}} \\ & \ddots & & \\ & & \lambda_{n-1}-\lambda_n & \\ {\LARGE{0}} & & & 0 \end{pmatrix} $$
が零行列 \( O \) であることを示します。
この行列の積の中に出現する行列を左から \( k-1 \) 回 ( \( 1≦k≦n \) ) かけて得られる行列が
$$ \left( \begin{array}{ccc|ccc} & & & & & \\ & {\LARGE{O}} & & & {\LARGE{*}} & \\ & & & & & \end{array} \right) \quad (左から \ k \ 列がすべて \ 0 \ ) $$
という形をしていることを \( k≧1 \) に関する数学的帰納法で示します。
\( k=1 \) のときは明らか
\( k-1 \) まで成り立つと仮定して、左から \( k \) 個かけた行列を見てみると、
$$ \begin{align} & \left( \begin{array}{ccc|ccc} & & & & & \\ & {\LARGE{O}} & & & {\LARGE{*}} & \\ & & & & & \end{array} \right)\begin{pmatrix} \alpha_1 & & & & & & \\ & \ddots & & & & {\LARGE{*}} & \\ & & \alpha_{k-1} & & & & \\ & & & 0 & & & \\ & & & & \alpha_{k+1} & & \\ & {\LARGE{O}} & & & & \ddots & \\ & & & & & & \alpha_n \end{pmatrix} \\ & (左の行列は左から \ k-1 \ 列がすべて \ 0 \ ) \\ &=\left( \begin{array}{ccc|c|cc} & & & 0 & & \\ & {\LARGE{O}} & & \vdots & {\LARGE{*}} & \\ & & & 0 & & \end{array} \right) \quad (左から \ k \ 列がすべて \ 0 \ ) \end{align} $$
となるので、帰納法により零行列となります。
したがって、 \( P^{-1}\varphi_A(A)P=O \) となるので、 \( \varphi_A(A)=O \) が得られます。
今回はここまでです。お疲れ様でした。また次回にお会いしましょう。