更新:2025/02/25

量的データの意味と具体例について

はるか
はるか
量的データって、数値で表せるデータのこと。身長、体重とか。
ふゅか
ふゅか
そうそう!あと売上高や温度も含まれるよね。統計分析でめっちゃ大事!

1. 量的データ

量的データ(quantitative data)とは、数値で表されるデータのことを指します。つまり、測定可能であり、計算が可能なデータです。例えば、身長、体重、温度、売上高などが量的データに該当します。

量的データは、統計学やデータ分析において重要な役割を果たし、データの特性を分析するための基本的な情報となります。

比例尺度と間隔尺度

量的データは、 主に比例尺度間隔尺度 に分類されます。

はるか
はるか
比例尺度と間隔尺度がある。

ふゅか
ふゅか
例えば体重は比例尺度!0kgは存在しないし、50kgの人は25kgの人の2倍の重さだね!

比例尺度(Ratio Scale)

比例尺度は、絶対的なゼロ点 を持ち、比率の計算が可能な尺度です。たとえば、身長や体重、売上高、時間などのデータは比例尺度に分類されます。

例: 50kgの人は25kgの人の 2倍の重さ であるといった比率が成立します。

間隔尺度(Interval Scale)

間隔尺度は、データ間の差(間隔)には意味がある尺度です。代表的な例としては、摂氏温度や華氏温度があります。

例:「20℃と40℃の差は20℃」といえますが、「40℃は20℃の 2倍の温度 」とは言えません。

2.  量的データの統計的性質

量的データは、統計学においてさまざまな性質を持ち、それらを利用することで次のようにデータの特徴を分析できます。

2.1. 平均(Mean)

データの平均(期待値)は、すべてのデータを合計し、データの個数で割ることで求められます。

\[ \bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i \]

ここで、\( x_i \) は各データの値、\( n \) はデータの個数です。

2.2. 分散(Variance)と標準偏差(Standard Deviation)

データの散らばり具合を示す指標として、分散と標準偏差が用いられます。

分散は次の式で求められます。

\[ \sigma^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2 \]

標準偏差は分散の平方根として定義されます。

\[ \sigma = \sqrt{\sigma^2} \]

標準偏差はデータのばらつきを直感的に理解するために使われます。

2.3. 中央値(Median)

中央値は、データを小さい順に並べたときに中央に位置する値です。データの分布が偏っている場合、中央値の方が平均値よりも代表値として適切な場合があります。

2.4. 最頻値(Mode)

最頻値は、データの中で最も頻繁に出現する値を指します。例えば、テストの得点が \{80, 85, 90, 85, 85, 95\} の場合、最も多く出現する 85 が最頻値となります。

PR