更新:2025/02/10

箱ひげ図と四分位範囲の意味と見方について

はるか
はるか
箱ひげ図って、データの分布を見るのに使うやつ。
ふゅか
ふゅか
そうそう!データの最小値から最大値、四分位数とかが一目で分かるの!

1. 箱ひげ図とは

箱ひげ図(Box Plot)は、データの分布を視覚的に表現するための統計的なグラフの一種です。データの中心傾向や散らばり、外れ値の有無を把握するのに役立ちます。

1.1. 箱ひげ図の構成要素

箱ひげ図は以下の要素で構成されます。

  • 最小値(Minimum): 外れ値を除いた最小のデータ値
  • 第一四分位数(Q1, 25%分位点): データの下位25%の値
  • 中央値(Q2, 50%分位点): データの中央の値
  • 第三四分位数(Q3, 75%分位点): データの上位25%の値
  • 最大値(Maximum): 外れ値を除いた最大のデータ値
  • 四分位範囲(IQR, Interquartile Range): Q3とQ1の差、つまりIQR = Q3 - Q1

2. 四分位範囲(IQR)

四分位範囲(Interquartile Range, IQR)は、データのばらつきを測る指標の一つです。

2.1. 定義

四分位範囲は、

$$ IQR = Q3 - Q1 $$

と定義されます。IQRは、データの50%が含まれる範囲を示しており、データのばらつきを直感的に理解するのに役立ちます。

はるか
はるか
四分位範囲(IQR)はQ3からQ1を引いたもの。

 

3.  箱ひげ図の描き方

  1. データを昇順に並べる。
  2. 第一四分位数(Q1)、中央値(Q2)、第三四分位数(Q3)を求める。
  3. 四分位範囲(IQR)を求める。
  4. 箱を描き、両端にひげを伸ばして最小値・最大値を表す。

4.  箱ひげ図の解釈

  • 箱の長さ(IQR)が大きいほどデータのばらつきが大きい。
  • 箱の中央にある線(中央値)の位置でデータの偏りを確認できる。

PR