【二次形式】半正定値行列の定義、性質、具体例について



1. 半正定値行列とは
正定値行列もあり、$\mathbf{x}^T A \mathbf{x}> 0$となる。
1.1. 例
例えば、実対称行列
\[ A = \begin{pmatrix} 2 & -1 \\ -1 & 2 \end{pmatrix} \]
を考えます。この行列に対して、任意のベクトル \( \mathbf{x} = \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} \) に対して、
\[ \mathbf{x}^T A \mathbf{x} = \begin{pmatrix} x_1 & x_2 \end{pmatrix} \begin{pmatrix} 2 & -1 \\ -1 & 2 \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} = 2x_1^2 – 2x_1x_2 + 2x_2^2 = (x_1 – x_2)^2 + x_1^2 + x_2^2 \]
この値は常に非負であるため、この行列は半正定値です。
1.2. 正定値行列と半正定値行列のイメージ
2. 半正定値行列の性質


2.1. 半正定値行列の固有値
まず、 $\Leftarrow$ を証明する。
\( A \) を \( n \times n \) の半正定値行列とします。半正定値行列の定義により、次の性質が成り立ちます。
\[ \forall \mathbf x \in \mathbb{R}^n, \quad x^\top A x \geq 0 \]
ここで、固有値 \( \lambda \) とそれに対応する固有ベクトル \( \mathbf v \) (すなわち、 \( A \mathbf v = \lambda \mathbf v \) を満たす \( \mathbf v \neq 0 \) のベクトル)を考えます。このとき、ベクトル \( \mathbf v \) に対して次の式を考えます。
\[ \mathbf v^\top A \mathbf v =\mathbf v^\top (\lambda \mathbf v) = \lambda \mathbf v^\top \mathbf v \]
このとき、\( \mathbf v^\top \mathbf v > 0 \) であるため、上式は次のように書き換えられます。
\[ \lambda = \frac{v^\top A v}{v^\top v} \]
半正定値行列の定義より \( v^\top A v \geq 0 \) であるので、
\[ \lambda \geq 0 \]
が成り立ちます。
次に、まず、 $\Rightarrow$ を証明する。Pは対称行列であるので、直交行列Uで対角化することができる。したがって、
\( x= U x’ \)と定義します。これにより二次形式は、
\[ x^{T}Px = (U^T x’)^T A (U^T x’) = x’^T U^T A U x’ = x’^T U^{-1} A U x’ = x’^T D x’ \]
\( D \)の対角成分(固有値)が\( \lambda_i \)となるため、
\[ = \lambda_1 x_1^2 + \lambda_2 x_2^2 + \ldots + \lambda_n x_n^2 \geq 0 \]
固有値はすべて0いじょうであるため、二次形式は0以上になる。したがって、Pは半正定値行列である。
これは二次形式の標準形を求める方法としても使われます。
2.2. 半正定値行列の分解
\[ P = Q^\top Q \]
また、
Pが半正定値行列$ \Leftrightarrow $$P = Q^\top Q $
が成り立つ。
$\Rightarrow$を証明する。
任意の対称行列 \( P \) は、直交行列$U$によって対角化することができるので、
$$U^{-1}P U = \Lambda $$
\[ P = U \Lambda U^\top \]
ここで、
- \( U \) は直交行列で、固有ベクトルを列ベクトルとして持つ行列です。
- \( \Lambda \) は対角行列で、対角成分には \( P \) の固有値が並んでいます。
\( \Lambda \) の対角成分は固有値であるから、すべて非負です。
固有値が非負であるため、対角行列 \( \Lambda \) の平方根 \( \Lambda^{\frac{1}{2}} \) を取ることができます。これは、対角成分ごとに平方根を取った対角行列です。すなわち、次のように書けます。
\[ \Lambda^{\frac{1}{2}} = \text{diag}(\sqrt{\lambda_1}, \sqrt{\lambda_2}, \dots, \sqrt{\lambda_n}) \]
ここで、\( \lambda_i \geq 0 \) です。
この \( \Lambda^{\frac{1}{2}} \) を用いて、行列 \( P \) を次のように分解できます:
\[ \begin{align*}P &= U \Lambda U^{-1} \\ &= U \Lambda^{\frac{1}{2}} \Lambda^{\frac{1}{2}}U^{-1} \end{align*}\]
ここで、\( Q = \Lambda^{\frac{1}{2}}U^{-1} \) と置くと、
$$ \begin{align*}Q^\top &= (\Lambda^{\frac{1}{2}}U^{-1} )^{\top} \\
&=(U^{-1})^{\top}(\Lambda^{\frac{1}{2}})^{\top} \\
&= U\Lambda^{\frac{1}{2}}\end{align*}$$
したがって、
\[ P = Q^\top Q\]
次に、$\Leftarrow$を証明する。
Pは次のように表すことができる。
\[ P = Q Q^\top \]
二次形式は次のように表すことができる。
$$ \begin{align*}\mathbf x^\top P \mathbf x &= \mathbf x^\top Q^\top Q \mathbf x \\
&=(Q \mathbf x)^\top Q \mathbf x \\
&=\|Q \mathbf x\| ^2 \geq 0\end{align*}$$
3. 例題
3.1. 例題1: 固有値の判定
\[ A = \begin{pmatrix} 4 & 2 \\ 2 & 3 \end{pmatrix} \]
固有値を求めます。行列 \( A \) の固有値は次の式から求めます。
\[ \text{det}(A – \lambda I) = 0 \]
ここで、\( I \) は単位行列、\( \lambda \) は固有値です。
\[ \text{det}\begin{pmatrix} 4 – \lambda & 2 \\ 2 & 3 – \lambda \end{pmatrix} = 0 \]
行列式を計算します。
\[ (4 – \lambda)(3 – \lambda) – (2)(2) = 0 \]
\[ \lambda^2 – 7\lambda + 8 = 0 \]
これを解の公式で解きます。
\[ \lambda = \frac{7 \pm \sqrt{49 – 32}}{2} = \frac{7 \pm \sqrt{17}}{2} \]
したがって、固有値は
\[ \lambda_1 = \frac{7 + \sqrt{17}}{2}, \quad \lambda_2 = \frac{7 – \sqrt{17}}{2} \]
この2つの固有値は両方正です。したがって、行列 \( A \) は半正定値行列です。
3.2. 例題2: 半正定値行列の分解
\[ P = \begin{pmatrix} 4 & 3 \\ 3 & 4 \end{pmatrix} \]
まず、行列 \( P = \begin{bmatrix} 4 & 3 \\ 3 & 4 \end{bmatrix} \) の固有値と固有ベクトルを計算し、それに基づいて \( U \) と \( \Lambda^{\frac{1}{2}} \) を求めます。
固有値は次の式から求めます。
\[ \text{det}(P – \lambda I) = 0 \]
\[ \text{det}\begin{bmatrix} 4 – \lambda & 3 \\ 3 & 4 – \lambda \end{bmatrix} = 0 \]
行列式を計算すると、
\[ (4 – \lambda)^2 – 9 = 0 \]
\[ \lambda^2 – 8\lambda + 7 = 0 \]
この二次方程式を解くと、固有値は次のようになります。
\[ \lambda_1 = 7, \quad \lambda_2 = 1 \]
次に、固有値に対応する固有ベクトルを求めます。
固有値 \( \lambda_1 = 7 \) に対する固有ベクトル \( v_1 \):
\[ (P – 7I)v_1 = 0 \]
\[ \begin{bmatrix} -3 & 3 \\ 3 & -3 \end{bmatrix} \begin{bmatrix} v_{11} \\ v_{12} \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} \]
これにより、固有ベクトル \( v_1 \) は
\[ v_1 = \begin{bmatrix} 1 \\ 1 \end{bmatrix} \]
固有値 \( \lambda_2 = 1 \) に対する固有ベクトル \( v_2 \):
\[ (P – I)v_2 = 0 \]
\[ \begin{bmatrix} 3 & 3 \\ 3 & 3 \end{bmatrix} \begin{bmatrix} v_{21} \\ v_{22} \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} \]
これにより、固有ベクトル \( v_2 \) は
\[ v_2 = \begin{bmatrix} 1 \\ -1 \end{bmatrix} \]
固有ベクトルを正規化して直交行列 \( U \) を作成します。
\[ U = \frac{1}{\sqrt{2}} \begin{bmatrix} 1 & 1 \\ 1 & -1 \end{bmatrix} \]
固有値から対角行列 \( \Lambda \) を作成します。
\[ \Lambda = \begin{bmatrix} 7 & 0 \\ 0 & 1 \end{bmatrix} \]
次に、固有値の平方根を取った対角行列 \( \Lambda^{\frac{1}{2}} \) を作ります。
\[ \Lambda^{\frac{1}{2}} = \begin{bmatrix} \sqrt{7} & 0 \\ 0 & 1 \end{bmatrix} \]
直交行列 \( U \) と \( \Lambda \) を用いて行列 \( P \) を次のように分解できます。
\[\begin{align*} P &= U \Lambda \Lambda U^{-1} \\ &=U \Lambda^{\frac{1}{2}} \Lambda^{\frac{1}{2}} \Lambda U^{-1} \\ &=U \Lambda^{\frac{1}{2}} \Lambda^{\frac{1}{2}} \Lambda U^{\top} \end{align*} \]
ここで、\(Q^{\top} = U \Lambda^{\frac{1}{2}}\) とすると、
$$\begin{align*} Q^{\top} &= \frac{1}{\sqrt{2}} \begin{bmatrix} 1 & 1 \\ 1 & -1 \end{bmatrix} \begin{bmatrix} \sqrt{7} & 0 \\ 0 & 1 \end{bmatrix} \\
&=\frac{1}{\sqrt{2}} \begin{bmatrix} \sqrt{7} & 1 \\\sqrt{7} & -1 \end{bmatrix} \end{align*}$$
$Q^{\top}$より、$Q$を求めると、
$$Q=\frac{1}{\sqrt{2}}\begin{bmatrix} \sqrt{7} & \sqrt{7}\\ 1 & -1 \end{bmatrix} $$
このようにして、$Q^{\top}Q$と分解できる。
ここで、$Q^{\top}Q$を実際に計算すると、
$$\begin{align*} Q^{\top}Q&= \frac{1}{\sqrt{2}} \begin{bmatrix} \sqrt{7} & 1 \\\sqrt{7} & -1 \end{bmatrix} \frac{1}{\sqrt{2}}\begin{bmatrix} \sqrt{7} & \sqrt{7}\\ 1 & -1 \end{bmatrix}\\
&=\frac{1}{2} \begin{bmatrix} \sqrt{7} & 1 \\\sqrt{7} & -1 \end{bmatrix} \begin{bmatrix} \sqrt{7} & \sqrt{7}\\ 1 & -1 \end{bmatrix}\\
&=\frac{1}{2}\begin{bmatrix} 8 & 6\\ 6 & 8 \end{bmatrix}\\
&=\begin{bmatrix} 4 & 3\\ 3 & 4 \end{bmatrix} \\
&= P \end{align*}$$