頑張れ!受験生! 数学の公式・定理集あります。物理のヒント集始めました。
スポンサーリンク

データの分析|データの代表値について

数学1 データの分析 数学I

今回はデータの代表値について学習しましょう。データの様子を知ることができるのが代表値ですが、その代表値にも色々あります。ここでは基本的なものを学習します。

スポンサーリンク

この単元で学習すること

「データの代表値」では以下のような事柄を学習します。

  • データの大きさと代表値
  • 平均値
  • 中央値(メジアン)
  • 最頻値(モード)

データを扱うために色々な用語が定義されているので、1つずつ丁寧に確認していきましょう。

データの大きさと代表値

データとは、調査や実験などで得られた変量の観測値や測定値の集まりのことでした。

このデータを構成する観測値や測定値の個数のことをデータの大きさと言います。観測値や測定値の個数が多ければ多いほど、データの大きさは大きくなります。

また、データ全体の特徴を適当な1つの数値で表すとき、その数値をデータの代表値と言います。代表値を見れば、データ全体の特徴を知ることができます。

データの代表値には、たとえば、以下の数値があります。

データの代表値

  • 平均値
  • 中央値(メジアン)
  • 最頻値(モード)

データの平均値

データの平均値は、「データの分析」の単元で最も利用する数値と言っても良いかもしれません。平均値は、データの値の総和をデータの大きさで割った値のことです。一般に、以下のように表されます。

データの平均値
\begin{align*}
&\text{大きさ $n$ のデータの値を} \\[ 5pt ]
&\quad x_{\scriptsize{1}} \ , \ x_{\scriptsize{2}} \ , \ \cdots \ , \ x_{\scriptsize{n}} \\[ 5pt ]
&\text{とするとき} \\[ 10pt ]
&\quad \overline{x} = \frac{1}{n} ( x_{\scriptsize{1}} + x_{\scriptsize{2}} + \cdots + x_{\scriptsize{n}} ) \\[ 5pt ]
&\text{または} \\[ 5pt ]
&\quad \overline{x} = \frac{1}{n} \displaystyle \sum_{ k = 1 }^{ n } x_{\scriptsize{k}} \\[ 5pt ]
&\scriptsize{\text{(数列の知識があれば、文字式ではこちらの方が扱いやすい)}}
\end{align*}

たとえば、平均値の計算は以下のようになります。

【例】平均値の計算
データ $2 \ , \ 3 \ , \ 5 \ , \ 6$ の平均値
\begin{align*}
\quad \overline{x} &= \frac{1}{4} ( 2 + 3 + 5 + 6 ) \\[ 5pt ]
&= \frac{1}{4} \cdot 16 \\[ 5pt ]
&= 4
\end{align*}

データの値の総和 $2 + 3 + 5 + 6$ をデータの大きさ(個数) $4$ で割る割り算をします。データの分析では、平均値を求めることからスタートすることが多いので、きちんと計算できるようにしておきましょう。

データの中央値(メジアン)

データの中央値(メジアン)は、データを値の大きさの順に並べたとき、中央の位置にくる値のことです。データを値の大きさの順に並べ替えることに注意しましょう。

中央値は、データの大きさが偶数か奇数かでその求め方が異なります。データの大きさが奇数であれば、中央の位置にくる値は1つだけですが、データの大きさが偶数であれば、中央の位置にくる値がありません。

データの大きさと中央値
奇数のとき…○○●○○
偶数のとき…○○●●○○

データの大きさが奇数のとき、中央の位置にくる値をそのまま中央値とします。たとえば、データの大きさが5個であれば、3番目の値が中央値になります。

それに対して、データの大きさが偶数のとき、中央の2つの平均値を中央値とします。たとえば、データの大きさが6個であれば、3番目と4番目の平均値が中央値になります。

たとえば、中央値の計算は以下のようになります。

【例】中央値の計算
\begin{align*}
&\text{データ $1 \ , \ 3 \ , \ 6 \ , \ 7 \ , \ 8$ の中央値は $6$} \\[ 10pt ]
&\text{データ $2 \ , \ 3 \ , \ 6 \ , \ 8$ の中央値は} \\[ 5pt ]
&\quad \frac{3 + 6}{2} = 4.5
\end{align*}

データの大きさが奇数のときは、中央の値をそのまま抜き出せば良いので計算することはありません。

データの最頻値(モード)

データによっては、同じ数値がいくつもある場合があります。データの最頻値(モード)は、データにおいて、最も個数の多い値のことです。最頻値は、データにおいて、最も度数の大きい値とも言えます。

なお、データが度数分布表に整理されていて、個々の値が分からないときがあります。そのようなときは、度数が最も大きい階級の階級値を最頻値とすることになっています。

これまでに出てきた用語をまとめると、以下のようになります。

データの代表値に関する用語

データの大きさ…データを構成する観測値や測定値の個数
データの代表値…データ全体の特徴を表す数値

平均値…データの値の総和をデータの大きさで割った値
中央値(メジアン)…データを値の大きさの順に並べたときの中央の値
最頻値…データにおいて最も個数の多い値

次はデータの代表値を扱った問題を実際に解いてみましょう。

スポンサーリンク
Amazon ノート・メモ帳ランキング
楽天市場 学習参考書ランキング
スポンサーリンク
スポンサーリンク
気になる教材があればコチラで探せます。
数学I
この記事が気に入ったら
いいね!しよう
最新情報をお届けします。
フォローする
ちょっとど忘れしたときの公式・定理集

数学で覚えるべき公式や定理は、一覧で眺めてみるとそれほど多くはありません。大切なことは覚えることではなく、「公式や定理をどのように使うか」です。

公式・定理集で確認しつつ、演習で積極的に使っていきましょう。

日々是鍛錬 ひびこれたんれん
タイトルとURLをコピーしました