更新:2024/12/09

二次形式と標準形、最大値最小値について

$はるか$

はるか

$ \mathbf{x}^T A \mathbf{x} $なにこれ…行列とベクトルで関数みたいなやつが出てきた。

$ふゅか$

ふゅか

これはね、二次形式と呼ばれるものよ！

1. 二次形式の定義
1.1. 二次形式の具体例
1.2. 2変数の二次形式
1.3. 3変数の二次形式
2. 二次形式の標準形
2.1. 標準形への変換
2.2. 二次形式の標準形の例題
2.2.1. それぞれのグラフ
3. 二次形式の最大値・最小値

1. 二次形式の定義

線形代数において、二次形式は特定の形を持つ関数で、主にベクトルと行列を使って表されます。二次形式の一般的な定義は次のようになります。

ベクトル$ \mathbf{x}$と、$ n \times n $ 正方行列 $ A $ が与えられたとき、二次形式 $ Q $ は次のように定義されます。

\[ Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} \]

ここで、$\mathbf{x} = \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix}$となるベクトル。$ \mathbf{x}^T $ は $ \mathbf{x} $ の転置ベクトルを表します。行列 $ A $ は、対称行列である。$ A = A^T $を満たしているとする。

1.1. 二次形式の具体例

例として、二次形式を具体的に見てみましょう。以下の行列 $ A $ とベクトル $ \mathbf{x} $ を考えます。

\[ A = \begin{bmatrix} 3 & 2 \\ 2 & 6 \end{bmatrix}, \quad \mathbf{x} = \begin{bmatrix} x \\ y \end{bmatrix} \]

二次形式 $ Q $ は次のように計算されます。

\[ \begin{align*} Q(\mathbf{x}) &= \begin{bmatrix} x & y \end{bmatrix} \begin{bmatrix} 3 & 2 \\ 2 & 6 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} \\ &= \begin{bmatrix} x & y \end{bmatrix} \begin{bmatrix} 3x + 2y \\ 2x + 6y \end{bmatrix} \\ &= x(3x + 2y) + y(2x + 6y) \\ &= 3x^2 + 4xy + 6y^2 \end{align*} \]

この式は $ x $ と $ y $ の二次の項と、それらの積である項を含んでいます。

1.2. 2変数の二次形式

2変数 $ x $ と $ y $ の場合、一般的な対称行列 $ A $ とベクトル $ \mathbf{x} = \begin{bmatrix} x \\ y \end{bmatrix} $ を使って次のように二次形式を定義します。

\[ A = \begin{bmatrix} a & b \\ b & c \end{bmatrix} \]

としたとき、二次形式$Q(\mathbf x)$は次のように計算できます。

$$\begin{align*} Q(\mathbf{x}) &= \mathbf{x}^T A \mathbf{x} = \begin{bmatrix} x & y \end{bmatrix} \begin{bmatrix} a & b \\ b & c \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} \\ &= x(ax + by) + y(bx + cy) \\ &= ax^2 + 2bxy + cy^2 \end{align*}$$

1.3. 3変数の二次形式

3変数 $ x $, $ y $, $ z $ の場合、一般的な対称行列 $ A $ とベクトル $ \mathbf{x} = \begin{bmatrix} x \\ y \\ z \end{bmatrix} $ を使って次のように二次形式を定義します。

\[ A = \begin{bmatrix} a & b & c \\ b & d & e \\ c & e & f \end{bmatrix} \]

としたとき、二次形式$Q(\mathbf x)$は次のように計算できます。

$$\begin{align*} Q(\mathbf{x}) &= \mathbf{x}^T A \mathbf{x} = \begin{bmatrix} x & y & z \end{bmatrix} \begin{bmatrix} a & b & c \\ b & d & e \\ c & e & f \end{bmatrix} \begin{bmatrix} x \\ y \\ z \end{bmatrix} \\ &= x(ax + by + cz) + y(bx + dy + ez) + z(cx + ey + fz) \\ &= ax^2 + dy^2 + fz^2 + 2bxy + 2cxz + 2eyz \end{align*}$$

2. 二次形式の標準形

二次形式の標準形とは、変数の平方の和（または差）の形で表される形式です。例えば、
\[ Q(x_1,x_2,\cdots x_n) = \lambda_1 x_1^2 + \lambda_2 x_2^2 + \ldots + \lambda_n x_n^2 \]ここで、$ \lambda_i $はスカラー値です。

2.1. 標準形への変換

二次形式を標準形に変換するためには、適切な直交行列$ U $を見つけ、座標変換を行います。

対称行列$ A $を対角化するために、固有ベクトルからなる直交行列$ U $を求めます。$ A $が対称行列である場合、直行行列で対角化ができます。これを使って、\[ U^T A U = D \]ここで$ D $は対角行列で、その対角成分には$ A $の固有値が並びます。

$$D=\begin{bmatrix} \lambda_1 & 0 & \cdots & 0 \\ 0 & \lambda_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n \end{bmatrix}$$

$ x= U x’ $と定義します。これにより二次形式は、
\[ x^{T}Ax = (U^T x’)^T A (U^T x’) = x’^T U^T A U x’ = x’^T U^{-1} A U x’ = x’^T D x’ \]
となります。ここで、Uは直行行列であることより、$U^T=U^{-1}$となることを用いました。

$ D $の対角成分（固有値）が$ \lambda_i $となるため、標準形は
\[ Q(x_1,x_2,\cdots x_n) = \lambda_1 x_1^2 + \lambda_2 x_2^2 + \ldots + \lambda_n x_n^2 \]
となります。

2.2. 二次形式の標準形の例題

次の二次形式を標準化せよ。

$x^2+4xy+y^2=3$

ベクトル$ \mathbf{x} =\begin{bmatrix} x \\ y \end{bmatrix} $とする。与えられた2次形式は次のように表すことができる。

$x^2+4xy+y^2$

$=\begin{bmatrix} x & y \end{bmatrix}\begin{bmatrix}1 & 2 \\ 2 & 1 \end{bmatrix}\begin{bmatrix} x \\ y \end{bmatrix}$

$=x^T A x$

とあらわすことができる。

次にAを対角化するために、固有方程式を解く。

$\det(A-\lambda E)$

$= \begin{vmatrix} 1-\lambda & 2 \\ 2 & 1-\lambda \end{vmatrix}$

$= (1-\lambda)(1-\lambda) – 2 \times 2 = \lambda^2 – 2\lambda + 1 – 4 = \lambda^2 – 2\lambda – 3$

この方程式を因数分解すると、

\[ (\lambda – 3)(\lambda + 1) = 0 \]

したがって、固有値は $ \lambda = 3 $ と $ \lambda = -1 $ です。

次に、これらの固有値に対応する固有ベクトルを求めます。

[1]固有値 $ \lambda = -1 $ であるとき

\[ \begin{bmatrix} 2 & 2 \\ 2 & 2 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} \]
$rank \begin{bmatrix} 2 & 2 \\ 2 & 2 \end{bmatrix} =　1$より、解の自由度が1であるため、任意定数kを用いて、$x=k$とすると、

固有ベクトルは、$$\begin{bmatrix} x \\ y \end{bmatrix} =k\begin{bmatrix} 1 \\ -1 \end{bmatrix}$$となる。$u_1=\dfrac{1}{\sqrt{2}}\begin{bmatrix} 1 \\ -1 \end{bmatrix}$とする。

[2]固有値 $ \lambda = 3 $ であるとき、

\[ \begin{bmatrix} -2 & 2 \\ 2 & -2 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} \]

$rank \begin{bmatrix} -2 & 2 \\ 2 & -2 \end{bmatrix} =　1$より、解の自由度が1であるため、任意定数kを用いて、$x=k$とすると、

固有ベクトルは、$$\begin{bmatrix} x \\ y \end{bmatrix} =k\begin{bmatrix} 1 \\ 1 \end{bmatrix}$$となる。$u_2==\dfrac{1}{\sqrt{2}}\begin{bmatrix} 1 \\ 1 \end{bmatrix}$とする。

次に、直行行列$U=\begin{bmatrix} u_1 & u_2\end{bmatrix}==\dfrac{1}{\sqrt{2}}\begin{bmatrix}1 & 1 \\ -1 & 1 \end{bmatrix}$とする。

$x = Ux’$と置き、$x^T A x$の式に代入すると、

$x^T A x$

$=(Ux’)^T A Ux’$

$=x’^T U^T A Ux’$

$=x’^T U^{-1} A Ux’$

$=x’^T \begin{bmatrix} -1 & 0 \\0 & 3 \end{bmatrix}x’$

$=-x^2+3y^2$

になる。したがって、

$-\dfrac{x^2}{3}+y^2 = 1$
となる。

2.2.1. それぞれのグラフ

3. 二次形式の最大値・最小値

制約条件$\displaystyle\sum ^n _{i=1} x_i^2 =1$であるとき、二次形式の最大値は固有値の最大値、最小値は固有値の最小値になる。

$はるか$

はるか

標準化を行う前に制約条件を少し変える。

$\mathbf{x} = \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix}$ $\mathbf{x’}=\begin{bmatrix} x_1′ \\ x_2′ \\ \vdots \\ x_n’ \end{bmatrix}$とします。直行行列を用いて、$\mathbf{x} =U\mathbf{x’}$と直行変換を行うとします。制約条件より、

$\displaystyle\sum ^n _{i=1} x_i^2 $

$=\mathbf{x^T}\mathbf{x}$

$=(U^T\mathbf{x’})^T U\mathbf{x’}$

$=\mathbf{x’}U^{-1}U\mathbf{x’}$

$=\mathbf{x’}^T\mathbf{x’}$

$=\displaystyle\sum^n_{i=1} (x’_i)^2$

$=1$

したがって、$\displaystyle\sum^n_{i=1} (x’_i)^2=1$であることがわかりました。

$ふゅか$

ふゅか

直行変換の内積の大きさは変化しないということを用いたわ！

任意の二次形式$Q(x_1,x_2,\cdots x_n)$を標準形に変換すると、

\[ Q(x_1,x_2,\cdots x_n) = (\lambda_1 x^{‘}_1)^2 + (\lambda_2 x^{‘}_2)^2 + \ldots + (\lambda_n x^{‘}_n)^2 \]

$\lambda_i$は固有値とする。

ここで、$\lambda_{\max}$を最大の固有値、$\lambda_{\min}$を最小の固有値とします。したがって、次の不等式が成立します。

\[ \lambda_{\min} \displaystyle\sum_{i=1}^n (x’_i)^2 \leq Q \leq \lambda_{\max} \displaystyle\sum_{i=1}^n (x’_i)^2 \]

これにより、

\[ \lambda_{\min} \leq Q \leq \lambda_{\max} \]となります。

ホームに戻る