更新:2025/02/10
箱ひげ図と四分位範囲の意味と見方について


はるか
箱ひげ図って、データの分布を見るのに使うやつ。

ふゅか
そうそう!データの最小値から最大値、四分位数とかが一目で分かるの!
1. 箱ひげ図とは
箱ひげ図(Box Plot)は、データの分布を視覚的に表現するための統計的なグラフの一種です。データの中心傾向や散らばり、外れ値の有無を把握するのに役立ちます。
1.1. 箱ひげ図の構成要素
箱ひげ図は以下の要素で構成されます。
- 最小値(Minimum): 外れ値を除いた最小のデータ値
- 第一四分位数(Q1, 25%分位点): データの下位25%の値
- 中央値(Q2, 50%分位点): データの中央の値
- 第三四分位数(Q3, 75%分位点): データの上位25%の値
- 最大値(Maximum): 外れ値を除いた最大のデータ値
- 四分位範囲(IQR, Interquartile Range): Q3とQ1の差、つまりIQR = Q3 - Q1
2. 四分位範囲(IQR)
四分位範囲(Interquartile Range, IQR)は、データのばらつきを測る指標の一つです。
2.1. 定義
四分位範囲は、
$$ IQR = Q3 - Q1 $$
と定義されます。IQRは、データの50%が含まれる範囲を示しており、データのばらつきを直感的に理解するのに役立ちます。

はるか
四分位範囲(IQR)はQ3からQ1を引いたもの。
3. 箱ひげ図の描き方
- データを昇順に並べる。
- 第一四分位数(Q1)、中央値(Q2)、第三四分位数(Q3)を求める。
- 四分位範囲(IQR)を求める。
- 箱を描き、両端にひげを伸ばして最小値・最大値を表す。
4. 箱ひげ図の解釈
- 箱の長さ(IQR)が大きいほどデータのばらつきが大きい。
- 箱の中央にある線(中央値)の位置でデータの偏りを確認できる。
PR