線形代数学続論15:行列のスペクトル分解とジョルダン標準形

こんにちは、ひかりです。

今回は線形代数学続論から行列のスペクトル分解とジョルダン標準形について解説していきます。

この記事では以下のことを紹介します。

  • 一般固有空間について
  • 行列のスペクトル分解について
  • 行列のジョルダン標準形について
目次

一般固有空間

まず準備として、固有空間を一般化した一般固有空間を考えます。

複素 \( n \) 次正方行列 \( A \) の固有多項式が

$$ \varphi_A(t)=|A-tE_n|=(-1)^n(t-\lambda_1)^{m_1}\cdots(t-\lambda_r)^{m_r} $$

となっているとします。

すると、各 \( \lambda_i \) は \( A \) の固有値となり、重複度はそれぞれ \( m_i \) となります。

このとき、固有値 \( \lambda_i \) の固有空間 \( V(\lambda_i) \) は

$$ V(\lambda_i)=\{\mathbf{x}\in\mathbb{C}^n \ | \ A\mathbf{x}=\lambda_i\mathbf{x} \} $$

で定義されていました。

これをもとに、一般固有空間を次で定義します。

定義1 (一般固有空間)

正方行列 \( A \) の固有値が \( \lambda_1\cdots,\lambda_r \) であり、それぞれの重複度を \( m_1,\cdots,m_r \) とする。

このとき、固有値 \( \lambda_i \) の一般固有空間 \( G(\lambda_i) \) を次で定める。

$$ G(\lambda_i)=\{\mathbf{x}\in\mathbb{C}^n \ | \ (A-\lambda_iE_n)^{m_i}\mathbf{x}=\mathbf{0} \} $$

\( \mathbf{x}\in V(\lambda_i) \) であれば $$ (A-\lambda_iE_n)\mathbf{x}=\mathbf{0} $$ となるので、 $$ \begin{align} (A-\lambda_iE_n)^{m_i}\mathbf{x}&=(A-\lambda_iE_n)^{m_i-1}(A-\lambda_iE_n)\mathbf{x} \\ &=(A-\lambda_iE_n)^{m_i-1}\mathbf{0}=\mathbf{0} \end{align} $$ より \( \mathbf{x}\in G(\lambda_i) \) となります。したがって、 \( V(\lambda_i)\subset G(\lambda_i) \) となります。

また、次の定理を述べるために、ベクトル空間の直和を定義します。

定義2 (ベクトル空間の直和)

\( V \) をベクトル空間、 \( W_1,W_2 \) を部分空間とする。このとき、任意の \( \mathbf{v} \in V \) が

$$ \mathbf{v}=\mathbf{w}_1+\mathbf{w}_2, \quad (\mathbf{w}_1\in W_1,\mathbf{w}_2\in W_2) $$

と一意的に表されるとき、 \( V \) は \( W_1 \) と \( W_2 \) の直和であるといい、

$$ V=W_1\oplus W_2 $$

と表す。

一般固有空間における重要な定理を示す準備として、まず次を示します。

定理1

\( f_1(t),f_2(t) \) を共通根(つまり \( f_i(t)=0 \) となる \( t \) )をもたない多項式とする。

このとき、正方行列 \( A \) に対して、

$$ W_1=\{ \mathbf{x}\in\mathbb{C}^n \ | \ f_1(A)\mathbf{x}=\mathbf{0} \} $$

$$ W_2=\{ \mathbf{x}\in\mathbb{C}^n \ | \ f_2(A)\mathbf{x}=\mathbf{0} \} $$

$$ W=\{ \mathbf{x}\in\mathbb{C}^n \ | \ f_1(A)f_2(A)\mathbf{x}=\mathbf{0} \} $$

とおくと、 \( W=W_1\oplus W_2 \) となる。

ただし、 \( f_i(A) \) とは \( f_i(t) \) を

$$ f_i(t)=\alpha_nt^n+\alpha_{n-1}t^{n-1}+\cdots+\alpha_{1}t+\alpha_0 $$

と表したときに

$$ f_i(A)=\alpha_nA^n+\alpha_{n-1}A^{n-1}+\cdots+\alpha_{1}A+\alpha_0E_n $$

で定義する。

定理1の証明(気になる方だけクリックしてください)

\( f_1(t),f_2(t) \) は共通根をもたない多項式であるので、

$$ f_1(t)g_1(t)+f_2(t)g_2(t)=1 $$

となる多項式 \( g_1(t),g_2(t) \) が存在します。(詳しくは省略します)

この式に行列 \( A \) を代入すると、

$$ f_1(A)g_1(A)+f_2(A)g_2(A)=E $$

となります。( \( E \) は単位行列)

したがって、任意の \( \mathbf{x}\in W \) に対して、

$$ \mathbf{x}=f_1(A)g_1(A)\mathbf{x}+f_2(A)g_2(A)\mathbf{x} $$

ここで、 \( \mathbf{x}_1=f_2(A)g_2(A)\mathbf{x} \) とおくと、

$$ \begin{align} f_1(A)\mathbf{x}_1&=f_1(A)(f_2(A)g_2(A)\mathbf{x}) \\ &=g_2(A)(f_1(A)f_2(A)\mathbf{x}) \quad (f_1,f_2,g_2はAの多項式なので交換可能) \\ &=g_2(A)\mathbf{0} \quad (\mathbf{x}\in W) \\ &=\mathbf{0} \end{align} $$

より、 \( \mathbf{x}_1\in W_1 \) となります。

同様に、 \( \mathbf{x}_2=f_1(A)g_1(A)\mathbf{x} \) とおくと、

$$ \begin{align} f_2(A)\mathbf{x}_2&=f_2(A)(f_1(A)g_1(A)\mathbf{x}) \\ &=g_1(A)(f_1(A)f_2(A)\mathbf{x}) \quad (f_1,f_2,g_1はAの多項式なので交換可能) \\ &=g_1(A)\mathbf{0} \quad (\mathbf{x}\in W) \\ &=\mathbf{0} \end{align} $$

より、 \( \mathbf{x}_2\in W_2 \) となります。

したがって、 \( W=W_1+W_2 \) となります。あとはこの表し方が一通りであることを示せばよいです。

$$ \mathbf{x}=\mathbf{x}_1+\mathbf{x}_2=\mathbf{y}_1+\mathbf{y}_2, \quad \mathbf{x}_1,\mathbf{y}_1\in W_1, \quad \mathbf{x}_2,\mathbf{y}_2\in W_2 $$

と表せたとします。このとき、

$$ z=\mathbf{x}_1-\mathbf{y}_1=\mathbf{x}_2-\mathbf{y}_2 $$

とおくと、 \( \mathbf{x}_1-\mathbf{y}_1\in W_1 \) かつ \( \mathbf{x}_2-\mathbf{y}_2\in W_2 \) であるので、 \( \mathbf{z}\in W_1\cap W_2 \) となります。よって、

$$ \begin{align} \mathbf{z}&=f_1(A)g_1(A)\mathbf{z}+f_2(A)g_2(A)\mathbf{z} \quad (初めの議論) \\ &=g_1(A)(f_1(A)\mathbf{z})+g_2(A)(f_2(A)\mathbf{z}) \quad (交換可能) \\ &=g_1(A)\mathbf{0}+g_2(A)\mathbf{0} \quad (z\in W_1\cap W_2) \\ &=\mathbf{0} \end{align} $$

より、 \( \mathbf{z}=\mathbf{0} \) であるので、 \( \mathbf{x}_1=\mathbf{y}_1, \ \mathbf{x}_2=\mathbf{y}_2 \) となります。

したがって、表し方が一通りであることが示せたので、 \( W=W_1\oplus W_2 \) となります。

定理1を繰り返し用いることにより、次が成り立ちます。

定理2

\( f_1(t),\cdots,f_r(t) \) を共通根(つまり \( f_i(t)=0 \) となる \( t \) )をもたない多項式とする。

このとき、正方行列 \( A \) に対して、

$$ W_i=\{ \mathbf{x}\in\mathbb{C}^n \ | \ f_i(A)\mathbf{x}=\mathbf{0} \} \quad (i=1,\cdots,r) $$

$$ W=\{ \mathbf{x}\in\mathbb{C}^n \ | \ f_1(A)\cdots f_r(A)\mathbf{x}=\mathbf{0} \} $$

とおくと、 \( W=W_1\oplus \cdots \oplus W_r \) となる。

定理2とケーリー・ハミルトンの定理より、全空間が一般固有空間の直和で表すことができることが示せます。

定理3 (全空間が一般固有空間の直和で表せる)

正方行列 \( A \) の固有値が \( \lambda_1\cdots,\lambda_r \) であり、それぞれの重複度を \( m_1,\cdots,m_r \) とする。

このとき、固有値 \( \lambda_i \) の一般固有空間を \( G(\lambda_i) \) とおくと、次が成り立つ。

$$ \mathbb{C}^n=G(\lambda_1)\oplus \cdots \oplus G(\lambda_r) $$

定理3の証明(気になる方だけクリックしてください)

定理2の \( f_i(t) \) として、 \( f_i(t)=(t-\lambda_i)^{m_i} \) とおくと、 \( W_i=G(\lambda_i) \) になります。

したがって、

$$ \begin{align} W&=W_1\oplus \cdots \oplus W_r \\ &=G(\lambda_1)\oplus \cdots \oplus G(\lambda_r) \end{align} $$

であるので、

$$ \begin{align} W&=\{ \mathbf{x}\in\mathbb{C}^n \ | \ (A-\lambda_1E)^{m_1}\cdots (A-\lambda_rE)^{m_r}\mathbf{x}=\mathbf{0} \} \\ &=\{ \mathbf{x}\in\mathbb{C}^n \ | \ \varphi_A(A)\mathbf{x}=\mathbf{0} \} \end{align} $$

よって、ケーリー・ハミルトンの定理を用いると、 \( \varphi_A(A)=O \) であるので \( W=\mathbb{C}^n \) となります。したがって、

$$ \mathbb{C}^n=G(\lambda_1)\oplus \cdots \oplus G(\lambda_r) $$

行列のスペクトル分解

次に、複素正方行列 \( A \) を固有値ごとに分解することを考えてみましょう。

話を簡単にするために複素 \( 2 \) 次正方行列 \( A \) を考えます。

\( A \) の固有値を \( \lambda_1,\lambda_2 \) (相異なるとします)として、その固有ベクトルを \( \mathbf{v}_1,\mathbf{v}_2 \) とします。つまり、

$$ A\mathbf{v}_i=\lambda_i\mathbf{v}_i, \quad \mathbf{v}_i\not=\mathbf{0}, \quad (i=1,2) $$

このとき、

$$ A\begin{pmatrix} \mathbf{v}_1 & \mathbf{v}_2 \end{pmatrix}=\begin{pmatrix} \lambda_1\mathbf{v}_1 & \lambda_2\mathbf{V}_2 \end{pmatrix}=\begin{pmatrix} \mathbf{v}_1 & \mathbf{v}_2 \end{pmatrix}\begin{pmatrix} \lambda_1 & 0 \\ 0 & \lambda_2 \end{pmatrix} $$

したがって、 \( U=\begin{pmatrix} \mathbf{v}_1 & \mathbf{v}_2 \end{pmatrix} \) がもし逆行列 \( U^{-1} \) が存在するならば、最両辺に \( U^{-1} \) を左からかけると、

$$ U^{-1}AU=\begin{pmatrix} \lambda_1 & 0 \\ 0 & \lambda_2 \end{pmatrix} $$

となり、 \( A \) は対角化可能となります。

以降、 \( U^{-1} \) が存在すると仮定すると、線形代数学続論06の定理6より \( \mathbf{v}_1,\mathbf{v}_2 \) は1次独立となります。

すると線形代数学続論06の定理2より、任意のベクトル \( \mathbf{x}\in \mathbb{C}^2 \) は

$$ \mathbf{x}=a_1\mathbf{v}_1+a_2\mathbf{v}_2 $$

と1通りに表すことができます。

このことを用いて、次の2つの線形写像 \( p_1,p_2:\mathbb{C}^2\to\mathbb{C}^2 \) を定義します。

$$ p_i:\mathbf{x} \mapsto a_i\mathbf{v}_i(=\mathbf{x}_iとおく), \quad (i=1,2) $$

\( p_1,p_2 \) の表現行列を \( P_1,P_2 \) とおくと、次をみたします。

$$ P_1^2=P_1, \quad P_2^2=P_2, \quad P_1P_2=P_2P_1=O, \quad E=P_1+P_2 $$

ここで、 \( O \) は2次零行列、 \( E \) は2次単位行列になります。

(くわしくは下の定理4をご覧ください。)

\( \mathbf{x}_1,\mathbf{x}_2 \) は \( \mathbf{v}_1,\mathbf{v}_2 \) の定数倍なので、 \( \mathbf{x}_1,\mathbf{x}_2 \) も \( A \) の固有ベクトルとなるので、

$$ A\mathbf{x}_i=\lambda_i\mathbf{x}_i, \quad (i=1,2) $$

したがって、

$$ \begin{align} A\mathbf{x}&=A(\mathbf{x}_1+\mathbf{x}_2)=A\mathbf{x}_1+A\mathbf{x}_2=\lambda_1\mathbf{x}_1+\lambda_2\mathbf{x}_2 \\ &=\lambda_1(P\mathbf{x})+\lambda_2(P\mathbf{x})=(\lambda_1P_1+\lambda_2P_2)\mathbf{x} \end{align} $$

なので、 \( \mathbf{x} \) は任意なので、

$$ A=\lambda_1P_1+\lambda_2P_2 $$

となります。これを \( A \) のスペクトル分解といいます。

上の議論より、 \( U=\begin{pmatrix} \mathbf{v}_1 & \mathbf{v}_2 \end{pmatrix} \) が必ず逆行列をもつような場合、つまり \( A \) が実対称行列やエルミート行列などを含む正規行列の場合はこのようにスペクトル分解ができます。

\( U=\begin{pmatrix} \mathbf{v}_1 & \mathbf{v}_2 \end{pmatrix} \) が逆行列をもたないような場合でも、このような \( P_1,P_2 \) は存在します。しかし、その場合のスペクトル分解は $$ A=\lambda_1P_1+\lambda_2P_2+N $$ となります。ここで、 \( N \) はこのあと定義するベキ零行列というものになります。(くわしくは定理5からの話をご覧ください。)

スペクトル分解は次の性質をみたします。

定理4 (スペクトル分解の性質)

上の複素2次正方行列 \( A \) のスペクトル分解について次が成り立つ。

(1) $$ P_1^2=P_1, \quad P_2^2=P_2, \quad P_1P_2=P_2P_1=O $$

(2) $$ E=P_1+P_2 $$

(3) $$ (A-\lambda_iE)P_i=O \quad (i=1,2) $$

定理4の証明(気になる方だけクリックしてください)

(1) 上の議論により、任意のベクトル \( \mathbf{x}\in \mathbb{C}^2 \) は

$$ \mathbf{x}=a_1\mathbf{v}_1+a_2\mathbf{v}_2=\mathbf{x}_1+\mathbf{x}_2 $$

と1通りに表すことができます。したがって、

$$ P_1^2\mathbf{x}=P_1(P_1\mathbf{x})=P_1(\mathbf{x}_1)=\mathbf{x}_1=P_1\mathbf{x} $$

$$ P_2^2\mathbf{x}=P_2(P_2\mathbf{x})=P_2(\mathbf{x}_2)=\mathbf{x}_2=P_2\mathbf{x} $$

$$ P_1P_2\mathbf{x}=P_1(P_2\mathbf{x})=P_1(\mathbf{x}_2)=\mathbf{0} $$

$$ P_2P_1\mathbf{x}=P_2(P_1\mathbf{x})=P_2(\mathbf{x}_1)=\mathbf{0} $$

より、

$$ P_1^2=P_1, \quad P_2^2=P_2, \quad P_1P_2=P_2P_1=O $$


(2) 任意のベクトル \( \mathbf{x}\in \mathbb{C}^2 \) に対して、

$$ \begin{align} \mathbf{x}&=a_1\mathbf{v}_1+a_2\mathbf{v}_2=\mathbf{x}_1+\mathbf{x}_2 \\ &=P_1\mathbf{x}+P_2\mathbf{x} \end{align} $$

より、

$$ E=P_1+P_2 $$


(3) 任意のベクトル \( \mathbf{x}\in \mathbb{C}^2 \) に対して、

$$ \begin{align} AP_i\mathbf{x}&=A\mathbf{x}_i=\lambda_i\mathbf{x}_i=\lambda_iP_i\mathbf{x} \end{align} $$

より、

$$ (A-\lambda_iE)P_i=O \quad (i=1,2) $$

定理3を用いると、一般の複素 \( n \) 次正方行列 \( A \) に対しても同様のことが成り立つことが示せます。

定理5 ( \( n \) 次正方行列のスペクトル分解)

\( A \) を複素 \( n \) 次正方行列として、 \( \lambda_1,\cdots,\lambda_r \) を相異なる \( A \) の固有値とする。

このとき、次をみたす \( r \) 個の行列 \( P_1,\cdots,P_r \) が存在する。

(1) $$ P_i^2=P_i, \quad P_iP_j=P_jP_i=O \ (i\not=j) $$

(2) $$ E=P_1+\cdots+P_r $$

(3) ある正の整数 \( \ell_i \) が存在して、

$$ (A-\lambda_iE)^{\ell_i}P_i=O \quad (i=1,\cdots,r) $$

\( P_1,\cdots,P_r \) は一意に定まることも示すことができますが省略します。また、 $$ AP_i=P_iA \quad (i=1,\cdots,r) $$ が成り立つことが知られています。

定理5の証明(気になる方だけクリックしてください)

定理3より任意の \( \mathbf{x}\in \mathbb{C}^n \) は

$$ \mathbf{x}=\mathbf{x}_1+\cdots+\mathbf{x}_r, \quad \mathbf{x}_i\in G(\lambda_i) $$

と一通りに表すことができます。

よって、次の写像 \( p_i:\mathbb{C}^n\to G(\lambda_i) \) を考えます。

$$ p_i:\mathbf{x}\mapsto \mathbf{x}_i \quad (i=1,\cdots,r) $$

そして、写像 \( p_i \) の表現行列を \( P_i \) と定めます。つまり、 \( \mathbf{x}_i=P_i\mathbf{x} \)

このとき、 \( P_1,\cdots,P_r \) が(1)から(3)の条件をみたすことを示せば定理が成り立ちます。

(1) 任意の \( \mathbf{x}\in \mathbb{C}^n \) に対して、

$$ P_i^2\mathbf{x}=P_i(P_i\mathbf{x})=P_i\mathbf{x}_i=\mathbf{x}_i=P_i\mathbf{x} $$

$$ P_iP_j\mathbf{x}=P_i(P_j\mathbf{x})=P_i\mathbf{x}_j=\mathbf{0} \quad (i\not=j) $$

より、

$$ P_i^2=P_i, \quad P_iP_j=P_jP_i=O \ (i\not=j) $$

(2) 任意の \( \mathbf{x}\in \mathbb{C}^n \) に対して、

$$ \begin{align} E\mathbf{x}&=\mathbf{x}=\mathbf{x}_1+\cdots+\mathbf{x}_r \\ &=P_1\mathbf{x}+\cdots+P_r\mathbf{x} \\ &=(P_1+\cdots+P_r)\mathbf{x} \end{align} $$

より、

$$ E=P_1+\cdots+P_r $$

(3) 任意の \( \mathbf{x}\in \mathbb{C}^n \) に対して、 \( P_i\mathbf{x}=\mathbf{x}_i\in G(\lambda_i) \) より、

$$ (A-\lambda_iE)^{m_i}P_i\mathbf{x}=(A-\lambda_iE)^{m_i}\mathbf{x}_i=\mathbf{0} $$

したがって、 \( \ell_i=m_i \) として

$$ (A-\lambda_iE)^{\ell_i}P_i=O \quad (i=1,\cdots,r) $$

よって、定理が成り立ちます。

このときのスペクトル分解を定義するために、ベキ零行列を定義します。

定義3 (ベキ零行列)

\( N^k=O \) をみたす正の整数 \( k \) が存在するとき、正方行列 \( N \) をベキ零行列という。

まず、次が成り立ちます。

定理6

定理5の状況において、

$$ N=A-\lambda_1P_1-\cdots-\lambda_rP_r $$

とおくと、 \( N \) はベキ零行列となる。

定理6の証明(気になる方だけクリックしてください)

定理5の \( \ell_1,\cdots,\ell_r \) を用いて、 \( k≧\max\{\ell_1,\cdots,\ell_r\} \) とおくと、

$$ \begin{align} N^k&=N^kE \\ &=(A-\lambda_1P_1-\cdots-\lambda_rP_r)^k(P_1+\cdots+P_r) \quad (定理5の(2)) \\ &=\sum_{i=1}^r(A-\lambda_iP_i)^kP_i \quad (P_iP_j=O, \ AP_i=P_iA) \\ &=\sum_{i=1}^r(A-\lambda_iE)^kP_i \quad (P_i^2=P_i) \\ &=O \quad (kの定め方と定理5の(3)) \end{align} $$

したがって、 \( N \) はベキ零行列となります。

したがって、複素 \( n \) 次正方行列 \( A \) に対して、定理5の \( P_1,\cdots,P_r \) を用いて

$$ A=\lambda_1P_1+\cdots+\lambda_rP_r+N, \quad Nはベキ零行列 $$

と分解することを行列 \( A \) のスペクトル分解といいます。

行列のジョルダン標準形

それでは、行列のスペクトル分解を用いて、行列のジョルダン標準形というものを考えてみましょう。

ジョルダン標準形というのは一言でいうと、対角化できないような複素正方行列に対しても対角化に近い形にすることができるというものです。

(線形代数学続論11の定理6より、複素正方行列は必ず三角化することができますので、三角行列以上対角行列以下の形ということになります)

それでは、まずいろいろと準備をしていきます。

定理7

行列のスペクトル分解の行列 \( P_1,\cdots,P_r \) を表現行列とする線形写像

$$ P_i:\mathbb{C}^n\to \mathbb{C}^n $$

の像 \( \text{Im} \ P_i \) を \( W_i \) とおくとき、次が成り立つ。

$$ \mathbb{C}^n=W_1\oplus \cdots \oplus W_r $$

定理8

任意の複素正方行列 \( A \) に対して、次をみたす対角化可能行列 \( S \) とベキ零行列 \( N \) が存在する。

$$ A=S+N, \quad SN=NS $$

定理9

$$ Nがベキ零行列 \iff \ N \ の固有多項式が \ \varphi_N(t)=t^n $$

(とくに、ベキ零行列の固有値はすべて0となる)

定理10

ベキ零行列 \( N \) に対して、 \( N^i \) の核(行列とその行列を表現行列とする線形写像を同じ文字で書いている) \( \text{Ker} \ N^i \) を \( W_i \) とおくと、自然数 \( k \) が存在して次が成り立つ。

$$ \{ \mathbf{0} \} \not= W_1⊊ W_2⊊\cdots ⊊W_k=\mathbb{C}^n $$

定理11

定理10の \( W_{j-1} \) の基底に \( d_j \) 個のベクトル

$$ \mathbf{x}_1,\cdots,\mathbf{x}_{d_j} $$

を付け加えたベクトルの組が \( W_j \) の基底であるとする。

このとき、次の \( j\times d_j \) 個のベクトルは1次独立である。

(同じ文字 \( N \) でベキ零行列 \( N \) を表現行列とする線形写像とする)

$$ \mathbf{x}_1,\mathbf{x}_2,\cdots,\mathbf{x}_{d_j}, $$

$$ N(\mathbf{x}_1),N(\mathbf{x}_2),\cdots,N(\mathbf{x}_{d_j}), $$

$$ N^2(\mathbf{x}_1),N^2(\mathbf{x}_2),\cdots,N^2(\mathbf{x}_{d_j}), $$

$$ \vdots $$

$$ N^{j-1}(\mathbf{x}_1),N^{j-1}(\mathbf{x}_2),\cdots,N^{j-1}(\mathbf{x}_{d_j}) $$

それでは、ジョルダン細胞を定義してジョルダン標準形について述べていきましょう。

定義4 (ジョルダン細胞)

\( k \) 次正方行列 \( J(\lambda,k) \) を

$$ J(\lambda,k)=\begin{pmatrix} \lambda & 1 & & {\Large{O}} \\ & \ddots & \ddots & \\ & & \ddots & 1 \\ {\Large{O}} & & & \lambda \end{pmatrix} $$

によって定めて、これをジョルダン細胞またはジョルダン・ブロックという。

まず、ベキ零行列に対するジョルダン標準形を示します。

定理12 (ベキ零行列に対するジョルダン標準形)

ベキ零の \( n \) 次正方行列 \( N \) に対して、適当な正則行列 \( P \) を選ぶことにより

$$ P^{-1}AP=\begin{pmatrix} J(0,k_1) & & & {\Large{O}} \\ & J(0,k_2) & & \\ & & \ddots & \\ {\Large{O}} & & & J(0,k_p) \end{pmatrix} $$

という形になる。この形のことをベキ零行列のジョルダン標準形といい、

$$ P^{-1}AP=J(0,k_1)\oplus J(0,k_2)\oplus \cdots \oplus J(0,k_p) $$

と表す。

ジョルダン標準形の形は一見対角行列のように見えるが、ジョルダン細胞の定義から対角行列とは限らないことに注意してください。ただし、 \( J(0,1)=0 \) であるので、 $$ k_1=\cdots=k_n=1 \quad (p=nとなる) $$ のときは対角行列となります。(しかし、これは零行列 \( O \) となります)

定理12の証明(気になる方だけクリックしてください)

\( N^m=O \) として、 \( m \) に関する数学的帰納法で示します。

\( m=1 \) のときは \( N=O \) で \( O \) はジョルダン標準形であるので定理は成り立ちます。

よって、 \( m≧2 \) として \( N^m=O \) かつ \( N^{m-1}\not=O \) とします。

このとき、定理10より \( W_i=\text{Ker} \ N^i \) とおくと、次が成り立ちます。

$$ \{ \mathbf{0} \} \not= W_1⊊ W_2⊊\cdots ⊊W_m=\mathbb{C}^n $$

ここで、

$$ s_k=\dim W_k-\dim W_{k-1}, \quad (1≦k≦m) $$

とおき、 \( t_m=s_m \) とします。

そして、

$$ \mathbb{C}^n=W_m=S[\mathbf{x}_{m,1},\cdots,\mathbf{x}_{m,t_m}]\oplus W_{m-1} $$

となるように1次独立なベクトルの組 \( \mathbf{x}_{m,1},\cdots,\mathbf{x}_{m,t_m} \) をとると、定理11より、

$$ \mathbf{x}_{m,1},\cdots,\mathbf{x}_{m,t_m}, $$

$$ N(\mathbf{x}_{m,1}),\cdots,N(\mathbf{x}_{m,t_m}), $$

$$ \vdots $$

$$ N^{m-1}(\mathbf{x}_{m,1}),\cdots,N^{m-1}(\mathbf{x}_{m,t_m}) $$

は1次独立なベクトルの組となります。

次に、 \( t_{m-1}=s_{m-1}-s_m \) とおき、

$$ W_{m-1}=S[N(\mathbf{x}_{m,1}),\cdots,N(\mathbf{x}_{m,t_m})]\oplus S[\mathbf{x}_{m-1,1},\cdots,\mathbf{x}_{m-1,t_{m-1}}]\oplus W_{m-2} $$

となるように1次独立なベクトルの組 \( \mathbf{x}_{m-1,1},\cdots,\mathbf{x}_{m-1,t_{m-1}} \) をとると、定理11より、

$$ N(\mathbf{x}_{m,1}),\cdots,N(\mathbf{x}_{m,t_m}),\mathbf{x}_{m-1,1},\cdots,\mathbf{x}_{m-1,t_{m-1}}, $$

$$ N^2(\mathbf{x}_{m,1}),\cdots,N^2(\mathbf{x}_{m,t_m}),N(\mathbf{x}_{m-1,1}),\cdots,N(\mathbf{x}_{m-1,t_{m-1}}), $$

$$ \vdots $$

$$ N^{m-1}(\mathbf{x}_{m,1}),\cdots,N^{m-1}(\mathbf{x}_{m,t_m}),N^{m-2}(\mathbf{x}_{m-1,1}),\cdots,N^{m-2}(\mathbf{x}_{m-1,t_{m-1}}) $$

は1次独立なベクトルの組となります。

\( t_k=s_k-s_{k-1} \) とおいて、この議論を繰り返し行うと、1次独立なベクトルの組

$$ \mathbf{x}_{m,1},\cdots,\mathbf{x}_{m,t_m}, $$

$$ N(\mathbf{x}_{m,1}),\cdots,N(\mathbf{x}_{m,t_m}),\mathbf{x}_{m-1,1},\cdots,\mathbf{x}_{m-1,t_{m-1}}, $$

$$ N^2(\mathbf{x}_{m,1}),\cdots,N^2(\mathbf{x}_{m,t_m}),N(\mathbf{x}_{m-1,1}),\cdots,N(\mathbf{x}_{m-1,t_{m-1}}),\cdots, \mathbf{x}_{m-2,1},\cdots,\mathbf{x}_{m-2,t_{m-2}}, $$

$$ \vdots $$

$$ N^{m-1}(\mathbf{x}_{m,1}),\cdots,N^{m-1}(\mathbf{x}_{m,t_m}),N^{m-2}(\mathbf{x}_{m-1,1}),\cdots,N^{m-2}(\mathbf{x}_{m-1,t_{m-1}}),\cdots, \mathbf{x}_{1,1},\cdots,\mathbf{x}_{1,t_{1}} $$

が得られます。

この中から、各 \( 1≦i≦t_m \) に対して、1次独立なベクトルの組

$$ N^{m-1}(\mathbf{x}_{m,i}),N^{m-2}(\mathbf{x}_{m,i}),\cdots,\mathbf{x}_{m,i} $$

をとり、そのベクトルの組で生成される \( \mathbb{C}^n \) の部分空間

$$ W(m;i)=S[N^{m-1}(\mathbf{x}_{m,i}),N^{m-2}(\mathbf{x}_{m,i}),\cdots,\mathbf{x}_{m,i}] $$

を考えます。

このとき、写像 \( N \) は \( W(m;i) \) を \( W(m;i) \) に移し、 \( N \) の定義域を \( W(m;i) \) に制限すると、その制限した写像の表現行列は

$$ J(0;m)=\begin{pmatrix} 0 & 1 & & {\Large{O}} \\ & \ddots & \ddots & \\ & & \ddots & 1 \\ {\Large{O}} & & & 0 \end{pmatrix} \quad (m次正方行列) $$

となり、 \( J(0,m) \) の個数は \( t_m=s_m \) となります。

同様にして、 \( 1≦k≦m \) に対して、各 \( 1≦i≦t_k \) を固定して1次独立なベクトルの組

$$ N^{k-1}(\mathbf{x}_{k,i}),N^{k-2}(\mathbf{x}_{k,i}),\cdots,\mathbf{x}_{k,i} $$

をとり、そのベクトルの組で生成される \( \mathbb{C}^n \) の部分空間

$$ W(k;i)=S[N^{k-1}(\mathbf{x}_{k,i}),N^{k-2}(\mathbf{x}_{k,i}),\cdots,\mathbf{x}_{k,i}] $$

を考えます。

すると、 \( N \) の定義域を \( W(k;i) \) に制限すると、その制限した写像の表現行列は \( J(0;k) \) となり、その個数は \( t_k \) となります。

したがって、ベキ零行列はジョルダン標準形に変換することができます。

それではいよいよ一般の複素正方行列に対するジョルダン標準形を示していきます。

定理13 (ジョルダン標準形)

複素 \( n \) 次正方行列 \( A \) に対して、 \( \lambda_1,\cdots,\lambda_r \) を相異なる \( A \) の固有値とする。

このとき、適当な正則行列 \( P \) を選ぶことにより

$$ P^{-1}AP=\begin{pmatrix} J(\lambda_1,k_1) & & & {\Large{O}} \\ & J(\lambda_2,k_2) & & \\ & & \ddots & \\ {\Large{O}} & & & J(\lambda_r,k_r) \end{pmatrix} $$

もし \( A \) が対角化可能である場合は、重複を込めた \( n \) 個の固有値 \( \lambda_1,\cdots,\lambda_n \) を用いて、次のようになります。 $$ P^{-1}AP=\begin{pmatrix} \lambda_1 & & & {\Large{O}} \\ & \lambda_2 & & \\ & & \ddots & \\ {\Large{O}} & & & \lambda_n \end{pmatrix}=\begin{pmatrix} J(\lambda_1,1) & & & {\Large{O}} \\ & J(\lambda_2,1) & & \\ & & \ddots & \\ {\Large{O}} & & & J(\lambda_n,1) \end{pmatrix} $$

定理13の証明(気になる方だけクリックしてください)

行列のスペクトル分解より、

$$ A-\lambda_1P_1-\cdots-\lambda_rP_r $$

はベキ零行列となります。

また、写像 \( A \) を一般固有空間 \( G(\lambda_i) \) に制限した写像を \( A_i \) とおきます。

すると、ベキ零行列 \( A_i-\lambda_iP_i \) は定理12よりジョルダン標準形

$$ J(0;k_{i,1})\oplus \cdots \oplus J(0;k_{i,m_i}) $$

と表されます。

\( A_i \) の \( G(\lambda_i) \) における固有値は \( \lambda_i \) なので、 \( A_i \) の表現行列は

$$ J(\lambda_1;k_{i,j})=\lambda_1E+J(0;k_{i,j}), \quad (1≦j≦m_i) $$

の直和となります。

同様のことをすべての \( i \) に対して行うことにより、複素 \( n \) 次正方行列 \( A \) のジョルダン標準形が得られます。

最後にジョルダン標準形の具体的な変換方法をまとめておきます。

STEP
変換する行列の固有値とその重複度を求める。

まず、与えられた複素 \( n \) 次正方行列 \( A \) に対して、 \( A \) の固有多項式 \( \varphi_A(t) \) を計算して、 \( \varphi_A(t)=0 \) となる \( t \) を求めます。

具体的には、 \( A \) の固有多項式が

$$ \varphi_A(t)=|A-tE_n|=(-1)^n(t-\lambda_1)^{m_1}\cdots(t-\lambda_r)^{m_r} $$

であれば、各 \( \lambda_i \) は \( A \) の固有値となり、重複度はそれぞれ \( m_i \) となります。

STEP
それぞれの固有値に対する一般固有空間の核の次元を求める。

次で用いるので、次のように段階的に求めていきます。

まず、 \( \lambda \) を \( A \) の1つの固有値として、 \( r \) をその重複度とします。

このとき、自然数 \( i \) に対して、 \( n_i \) を次で定めます。

$$ \begin{align} n_i&=\dim \text{Ker} \ (A-\lambda E_n)^i=\dim \mathbb{C}^n-\dim \text{Im} \ (A-\lambda E_n)^i \\ &=n-\text{rank} \ (A-\lambda E_n)^i \end{align} $$

これを \( n_{k-1}<n_k=r \) となる \( k \) まで順番に計算していきます。

STEP
それぞれの固有値に対するジョルダン細胞を求める。

STEP2で求めた \( n_1,\cdots,n_k \) に対して、次のようにして \( d_i,b_i \) を定めます。

$$ d_1=n_1, \quad d_j=n_j-n_{j-1} \ (2≦j≦k) $$

$$ b_k=d_k, \quad b_j=d_j-d_{j+1} \ (1≦j≦k-1) $$

すると、 \( A \) の1つの固有値 \( \lambda \) に対するジョルダン細胞は次のようになります。

$$ J(\lambda,k)\oplus \cdots \oplus J(\lambda,k) \quad (b_k個の直和) $$

$$ \oplus J(\lambda,k-1)\oplus \cdots \oplus J(\lambda,k-1) \quad (b_{k-1}個の直和) $$

$$ \vdots $$

$$ \oplus J(\lambda,1)\oplus \cdots \oplus J(\lambda,1) \quad (b_1個の直和) $$

このステップをすべての固有値に対して行い、そのすべてのジョルダン細胞の直和をとったものが \( A \) のジョルダン標準形になります。

例1

(1) 次の行列 \( A \) のジョルダン標準形を求める。

$$ A=\begin{pmatrix} 0 & 1 & 1 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{pmatrix} $$

これは \( A^2=O \) よりベキ零行列である。

したがって、定理9より \( A \) の固有値は \( 0 \ (重複度3) \) である。よって、

$$ n_1=3-\text{rank} \ A=3-1=2 $$

$$ n_2=3-\text{rank} \ A^2=3-0=3 $$

から

$$ d_1=2, \quad d_2=3-2=1, \quad b_2=1, \quad b_1=2-1=1 $$

となるので、固有値 \( 0 \) のジョルダン細胞は

$$ J(0,2)\oplus J(0,1) $$

となり、 \( A \) の固有値は \( 0 \) のみなので、結局

$$ P^{-1}AP=J(0,2)\oplus J(0,1)=\begin{pmatrix} 0 & 1 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{pmatrix} $$


(2) 次の行列 \( A \) のジョルダン標準形を求める。

$$ A=\begin{pmatrix} 2 & 0 & 0 \\ 0 & 1 & 0 \\ 1 & 0 & 2 \end{pmatrix} $$

まず、 \( A \) の固有多項式 \( \varphi_A(t) \) を計算すると、

$$ \varphi_A(t)=|A-tE_3|=\begin{vmatrix} 2-t & 0 & 0 \\ 0 & 1-t & 0 \\ 1 & 0 & 2-t \end{vmatrix} $$

よって、 \( A \) は2つの固有値 \( 1,2 \ (重複度2) \) をもつ。

まず、固有値 \( 1 \) を考える。

$$ n_1=3-\text{rank} \ (A-E)=3-2=1 $$

から

$$ d_1=1, \quad b_1=1 $$

となるので、固有値 \( 1 \) のジョルダン細胞は

$$ J(1,1) $$

次に、固有値 \( 2 \) を考える。

$$ n_1=3-\text{rank} \ (A-2E)=3-2=1 $$

$$ n_2=3-\text{rank} \ (A-2E)^2=3-1=2 $$

から

$$ d_1=1, \quad d_2=2-1=1, \quad b_2=1, \quad b_1=1-1=0 $$

となるので、固有値 \( 2 \) のジョルダン細胞は

$$ J(2,2) $$

したがって、 \( A \) のジョルダン標準形は

$$ P^{-1}AP=J(1,1)\oplus J(2,2)=\begin{pmatrix} 1 & 0 & 0 \\ 0 & 2 & 1 \\ 0 & 0 & 2 \end{pmatrix} $$

今回までで線形代数学の内容について標準的なところまで含めて一通り紹介しました。お疲れ様でした。

次に勉強するのにおすすめなシリーズとしては、「微分積分学」シリーズもしくは「確率・統計」シリーズとなっています。

それでは、またどこかの記事でお会いしましょう。ひかりでした。

目次