更新:2024/09/21

【二次形式】半正定値行列の定義、性質、具体例について

ふゅか
ふゅか
半正定値行列ってどういう意味か知ってる?たとえば、行列がどんな条件を満たせばそう呼ばれるのかな?
はるか
はるか
簡単に言うと、二次形式 \( \mathbf{x}^T A \mathbf{x} \) が常に0以上になる行列のこと。

1. 半正定値行列とは

ある \( n \times n \) の実対称行列 \( A \) が半正定値であるとは、任意の \( n \) 次元ベクトル \( \mathbf{x} \) の二次形式に対して次の条件を満たすときに言います。

\[ \mathbf{x}^T A \mathbf{x} \geq 0 \]

正定値行列もあり、$\mathbf{x}^T A \mathbf{x}> 0$となる。

1.1. 例

例えば、実対称行列

\[ A = \begin{pmatrix} 2 & -1 \\ -1 & 2 \end{pmatrix} \]

を考えます。この行列に対して、任意のベクトル \( \mathbf{x} = \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} \) に対して、

\[ \mathbf{x}^T A \mathbf{x} = \begin{pmatrix} x_1 & x_2 \end{pmatrix} \begin{pmatrix} 2 & -1 \\ -1 & 2 \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} = 2x_1^2 – 2x_1x_2 + 2x_2^2 = (x_1 – x_2)^2 + x_1^2 + x_2^2 \]

この値は常に非負であるため、この行列は半正定値です。

1.2. 正定値行列と半正定値行列のイメージ

2. 半正定値行列の性質

はるか
はるか
固有値がすべて0以上、半正定値行列は同値。
ふゅか
ふゅか
へぇ~、じゃ固有値を使って、行列が半正定値かどうかも簡単にチェックできるってことね!

2.1. 半正定値行列の固有値

半正定値行列の固有値はすべて0以上である。また、

半正定値行列 $\Leftrightarrow$ 固有値はすべて0以上

が成り立つ。

まず、 $\Leftarrow$ を証明する。

\( A \) を \( n \times n \) の半正定値行列とします。半正定値行列の定義により、次の性質が成り立ちます。

\[ \forall \mathbf  x \in \mathbb{R}^n, \quad x^\top A x \geq 0 \]

ここで、固有値 \( \lambda \) とそれに対応する固有ベクトル \( \mathbf v \) (すなわち、 \( A \mathbf v = \lambda \mathbf v \) を満たす \( \mathbf v \neq 0 \) のベクトル)を考えます。このとき、ベクトル \( \mathbf v \) に対して次の式を考えます。

\[ \mathbf v^\top A \mathbf v =\mathbf v^\top (\lambda \mathbf v) = \lambda \mathbf v^\top \mathbf v \]

このとき、\( \mathbf v^\top \mathbf v > 0 \) であるため、上式は次のように書き換えられます。

\[ \lambda = \frac{v^\top A v}{v^\top v} \]

半正定値行列の定義より \( v^\top A v \geq 0 \) であるので、

\[ \lambda \geq 0 \]

が成り立ちます。

次に、まず、 $\Rightarrow$ を証明する。Pは対称行列であるので、直交行列Uで対角化することができる。したがって、

\( x= U x’ \)と定義します。これにより二次形式は、

\[ x^{T}Px = (U^T x’)^T A (U^T x’) = x’^T U^T A U x’ = x’^T U^{-1} A U x’ = x’^T D x’ \]

\( D \)の対角成分(固有値)が\( \lambda_i \)となるため、

\[  = \lambda_1 x_1^2 + \lambda_2 x_2^2 + \ldots + \lambda_n x_n^2 \geq 0 \]

固有値はすべて0いじょうであるため、二次形式は0以上になる。したがって、Pは半正定値行列である。

これは二次形式の標準形を求める方法としても使われます。

2.2. 半正定値行列の分解

半正定値行列 \( P \) が、正方行列 \( Q \) とその転置行列 \( Q^\top \) を用いて、次の形で分解できる。

\[ P = Q^\top Q \]

また、

Pが半正定値行列$ \Leftrightarrow $$P = Q^\top Q $

が成り立つ。

$\Rightarrow$を証明する。

任意の対称行列 \( P \) は、直交行列$U$によって対角化することができるので、

$$U^{-1}P U = \Lambda $$

\[ P = U \Lambda U^\top \]

ここで、

  • \( U \) は直交行列で、固有ベクトルを列ベクトルとして持つ行列です。
  • \( \Lambda \) は対角行列で、対角成分には \( P \) の固有値が並んでいます。

\( \Lambda \) の対角成分は固有値であるから、すべて非負です。

固有値が非負であるため、対角行列 \( \Lambda \) の平方根 \( \Lambda^{\frac{1}{2}} \) を取ることができます。これは、対角成分ごとに平方根を取った対角行列です。すなわち、次のように書けます。

\[ \Lambda^{\frac{1}{2}} = \text{diag}(\sqrt{\lambda_1}, \sqrt{\lambda_2}, \dots, \sqrt{\lambda_n}) \]

ここで、\( \lambda_i \geq 0 \) です。

この \( \Lambda^{\frac{1}{2}} \) を用いて、行列 \( P \) を次のように分解できます:

\[ \begin{align*}P &= U \Lambda U^{-1} \\ &= U \Lambda^{\frac{1}{2}} \Lambda^{\frac{1}{2}}U^{-1}  \end{align*}\]

ここで、\( Q = \Lambda^{\frac{1}{2}}U^{-1} \) と置くと、

$$ \begin{align*}Q^\top &= (\Lambda^{\frac{1}{2}}U^{-1} )^{\top} \\
&=(U^{-1})^{\top}(\Lambda^{\frac{1}{2}})^{\top} \\
&= U\Lambda^{\frac{1}{2}}\end{align*}$$

したがって、

\[ P = Q^\top Q\]

次に、$\Leftarrow$を証明する。

Pは次のように表すことができる。

\[ P = Q Q^\top \]

二次形式は次のように表すことができる。

$$ \begin{align*}\mathbf x^\top P \mathbf x &= \mathbf  x^\top Q^\top Q \mathbf x \\
&=(Q \mathbf  x)^\top  Q \mathbf x \\
&=\|Q \mathbf  x\| ^2 \geq 0\end{align*}$$

3. 例題

3.1. 例題1: 固有値の判定

次の行列 \( A \) が半正定値行列かどうかを固有値を使って判定しなさい。

\[ A = \begin{pmatrix} 4 & 2 \\ 2 & 3 \end{pmatrix} \]

固有値を求めます。行列 \( A \) の固有値は次の式から求めます。

\[ \text{det}(A – \lambda I) = 0 \]

ここで、\( I \) は単位行列、\( \lambda \) は固有値です。

\[ \text{det}\begin{pmatrix} 4 – \lambda & 2 \\ 2 & 3 – \lambda \end{pmatrix} = 0 \]

行列式を計算します。

\[ (4 – \lambda)(3 – \lambda) – (2)(2) = 0 \]

\[ \lambda^2 – 7\lambda + 8 = 0 \]

これを解の公式で解きます。

\[ \lambda = \frac{7 \pm \sqrt{49 – 32}}{2} = \frac{7 \pm \sqrt{17}}{2} \]

したがって、固有値は

\[ \lambda_1 = \frac{7 + \sqrt{17}}{2}, \quad \lambda_2 = \frac{7 – \sqrt{17}}{2} \]

この2つの固有値は両方正です。したがって、行列 \( A \) は半正定値行列です。

3.2. 例題2: 半正定値行列の分解

次の半正定値行列 \( P \) を$Q^\top Q$の形に分解しなさい。

\[ P = \begin{pmatrix} 4 & 3 \\ 3 & 4 \end{pmatrix} \]

まず、行列 \( P = \begin{bmatrix} 4 & 3 \\ 3 & 4 \end{bmatrix} \) の固有値と固有ベクトルを計算し、それに基づいて \( U \) と \( \Lambda^{\frac{1}{2}} \) を求めます。

固有値は次の式から求めます。

\[ \text{det}(P – \lambda I) = 0 \]

\[ \text{det}\begin{bmatrix} 4 – \lambda & 3 \\ 3 & 4 – \lambda \end{bmatrix} = 0 \]

行列式を計算すると、

\[ (4 – \lambda)^2 – 9 = 0 \]

\[ \lambda^2 – 8\lambda + 7 = 0 \]

この二次方程式を解くと、固有値は次のようになります。

\[ \lambda_1 = 7, \quad \lambda_2 = 1 \]

次に、固有値に対応する固有ベクトルを求めます。

固有値 \( \lambda_1 = 7 \) に対する固有ベクトル \( v_1 \):

\[ (P – 7I)v_1 = 0 \]

\[ \begin{bmatrix} -3 & 3 \\ 3 & -3 \end{bmatrix} \begin{bmatrix} v_{11} \\ v_{12} \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} \]

これにより、固有ベクトル \( v_1 \) は

\[ v_1 = \begin{bmatrix} 1 \\ 1 \end{bmatrix} \]

固有値 \( \lambda_2 = 1 \) に対する固有ベクトル \( v_2 \):

\[ (P – I)v_2 = 0 \]

\[ \begin{bmatrix} 3 & 3 \\ 3 & 3 \end{bmatrix} \begin{bmatrix} v_{21} \\ v_{22} \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} \]

これにより、固有ベクトル \( v_2 \) は

\[ v_2 = \begin{bmatrix} 1 \\ -1 \end{bmatrix} \]

固有ベクトルを正規化して直交行列 \( U \) を作成します。

\[ U = \frac{1}{\sqrt{2}} \begin{bmatrix} 1 & 1 \\ 1 & -1 \end{bmatrix} \]

固有値から対角行列 \( \Lambda \) を作成します。

\[ \Lambda = \begin{bmatrix} 7 & 0 \\ 0 & 1 \end{bmatrix} \]

次に、固有値の平方根を取った対角行列 \( \Lambda^{\frac{1}{2}} \) を作ります。

\[ \Lambda^{\frac{1}{2}} = \begin{bmatrix} \sqrt{7} & 0 \\ 0 & 1 \end{bmatrix} \]

直交行列 \( U \) と \( \Lambda \) を用いて行列 \( P \) を次のように分解できます。

\[\begin{align*} P &= U \Lambda \Lambda U^{-1} \\ &=U  \Lambda^{\frac{1}{2}} \Lambda^{\frac{1}{2}} \Lambda U^{-1} \\ &=U  \Lambda^{\frac{1}{2}} \Lambda^{\frac{1}{2}} \Lambda U^{\top} \end{align*} \]

ここで、\(Q^{\top} =  U  \Lambda^{\frac{1}{2}}\) とすると、

$$\begin{align*} Q^{\top} &= \frac{1}{\sqrt{2}} \begin{bmatrix} 1 & 1 \\ 1 & -1 \end{bmatrix} \begin{bmatrix} \sqrt{7} & 0 \\ 0 & 1 \end{bmatrix} \\
&=\frac{1}{\sqrt{2}} \begin{bmatrix} \sqrt{7} & 1 \\\sqrt{7} & -1 \end{bmatrix}  \end{align*}$$

$Q^{\top}$より、$Q$を求めると、

$$Q=\frac{1}{\sqrt{2}}\begin{bmatrix} \sqrt{7} & \sqrt{7}\\ 1 & -1 \end{bmatrix} $$

このようにして、$Q^{\top}Q$と分解できる。

ここで、$Q^{\top}Q$を実際に計算すると、

$$\begin{align*} Q^{\top}Q&= \frac{1}{\sqrt{2}} \begin{bmatrix} \sqrt{7} & 1 \\\sqrt{7} & -1 \end{bmatrix} \frac{1}{\sqrt{2}}\begin{bmatrix} \sqrt{7} & \sqrt{7}\\ 1 & -1 \end{bmatrix}\\
&=\frac{1}{2} \begin{bmatrix} \sqrt{7} & 1 \\\sqrt{7} & -1 \end{bmatrix} \begin{bmatrix} \sqrt{7} & \sqrt{7}\\ 1 & -1 \end{bmatrix}\\
&=\frac{1}{2}\begin{bmatrix} 8 & 6\\ 6 & 8 \end{bmatrix}\\
&=\begin{bmatrix} 4 & 3\\ 3 & 4 \end{bmatrix} \\
&= P  \end{align*}$$

PR