更新:2024/11/24

中央値と最頻値の意味、特徴、具体例について

はるか
はるか
中央値…真ん中にある値のこと。
ふゅか
ふゅか
そうそう!データを小さい順に並べて、真ん中にくる数が「中央値」ね。外れ値があっても、影響を受けにくいのがいいよね!

1. 中央値(Median)

中央値とは、データを小さい順から大きい順に並べたときに真ん中に位置する値のことです。データの大小関係に影響されないため、極端な値(外れ値)が含まれる場合でも、データの中心的な傾向を捉えるのに有効です。

1.1. 例1:データの個数が奇数の場合

家賃のデータが以下のように与えられたとします。

部屋番号 部屋101 部屋102 部屋103 部屋104 部屋105
家賃 (万円) 1 3 4 6 8

この場合、家賃の真ん中に位置する値は「4」なので、このデータの中央値は4です。

1.2. 例2:データの個数が偶数の場合

データが偶数個の場合は、真ん中の2つの値の平均をとります。例えば、パズルの納入数の表が次のように与えられていたとします。

パズル パズルA パズルB パズルC パズルD パズルE パズルF
納入数(個) 1 3 4 6 8 9

この場合、真ん中の2つの値は「4」と「6」なので、中央値は次のように計算します。

\[ \frac{4 + 6}{2} = 5 \]

したがって、このデータの中央値は5です。

1.3. 中央値の特徴

極端に小さい値や大きい値があっても、その影響を受けません。つまり、外れ値の影響を受けにくいです。

2. 最頻値(Mode)

最頻値とは、データの中で最も頻繁に出現する値のことです。頻度が高い値を知ることで、データの中で何が多いのかを把握できます。

ふゅか
ふゅか
次に「最頻値」も見てみようよ。よく出てくる値だね!
はるか
はるか
最も頻繁に出る値。それが最頻値。

2.1. 例1:単一の最頻値

カレーに使われているスパイスの使用量が以下のように与えられたとします。

スパイス ターメリック クミン コリアンダー ガラムマサラ チリパウダー
使用量 (g) 2 4 4 6 7

この場合、「4」が2回出現しており、最も頻繁に現れるため、最頻値は4です。

2.2. 例2:複数の最頻値

データに同じ頻度で出現する値が複数ある場合、最頻値は複数存在することがあります。サーバーに対する年間の攻撃数が以下のように与えられたとします。

1月 2月 3月 4月 5月 6月
攻撃数(千回) 1 2 2 3 3 4

この場合、「2」と「3」がそれぞれ2回ずつ出現しているため、最頻値は2と3です。

2.3. 例3:すべてが最頻値

データの中にすべての値が一度しか出現しない場合、最頻値はすべての値になります。モンスターのレベルアップに必要な経験値数が次のように与えられたとします。

モンスター ゴブリン オーク トロール ドラゴン リッチ
必要な経験値数(exp) 1 2 3 4 5

この場合、すべての値が1回出現しているため、1, 2, 3, 4, 5のすべてが最頻値となる。

PR