データの分析

08/03/2018

データの分析

データの代表値

平均値 $\bar{ x }$

\begin{align*} \bar{x} = & \frac{1}{n} \bigl( x_{\tiny{1}} + x_{\tiny{2}} + \cdots \cdots +x_{\tiny{n}} \bigr) \\[ 10pt ] = & \frac{1}{n} \sum_{ i = 1 }^{ n } x_{\tiny{i}} \end{align*}

中央値(メジアン)

データを値の大きさの順に並べたとき、中央の位置にくる値。
データの大きさが偶数のときは、中央に並ぶ2つの値の平均値

最頻値(モード)

データにおける最も個数の多い値。
度数分布表に整理したときは、度数が最も大きい階級の階級値。

箱ひげ図

データのうち5つの数値を箱と線(ひげ)で表した図。
箱ひげ図に必要な5つの数値
  • 最小値
  • 第1四分位数 Q1
  • 中央値(=第2四分位数 Q2
  • 第3四分位数 Q3
  • 最大値

分散と標準偏差

偏差

変量 $x$ の各値と平均値 $\bar{ x }$ との差
変量が $x = x_{\tiny{1}} \ , \ x_{\tiny{2}} \ , \cdots \cdots , \ x_{\tiny{n}}$ であるとき、
偏差は $x_{\tiny{1}} \ – \bar{x} \ , \ x_{\tiny{2}} \ – \bar{x} \ , \cdots \cdots , \ x_{\tiny{n}} \ – \bar{x}$

分散

偏差の2乗の平均値
\begin{align*} s^{\scriptsize{2}} = & \frac{1}{n} \Bigl\{ {\bigl( x_{\tiny{1}} \ – \bar{x} \bigr)}^{\scriptsize{2}} + {\bigl( x_{\tiny{2}} \ – \bar{x} \bigr)}^{\scriptsize{2}} + \\[ 10pt ] & \quad \cdots \cdots + {\bigl( x_{\tiny{n}} \ – \bar{x} \bigr)}^{\scriptsize{2}} \Bigr\} \\[ 10pt ] = & \frac{1}{n} \sum_{ i = 1 }^{ n } {\bigl( x_{\tiny{i}} \ – \bar{x} \bigr)}^{\scriptsize{2}} \end{align*}

標準偏差

分散の正の平方根
\begin{equation*} s = \sqrt{\text{分散}} \end{equation*}

分散と平均値の関係式

\begin{equation*} s^{2} = \overline{x^{\scriptsize{2}}} – {\left( \bar{x} \right)}^{\scriptsize{2}} \end{equation*}
分散の式を変形すると得られる。
(分散) = (2乗の平均) – (平均の2乗)

相関係数

2つの変量 $x \ , \ y$ の共分散 $s_{\tiny{xy}}$ は
\begin{align*} s_{\tiny{xy}} = & \frac{1}{n} \Big\{ {\left( x_{\tiny{1}} \ – \bar{x} \right)}{\left( y_{\tiny{1}} \ – \bar{y} \right)} + {\left( x_{\tiny{2}} \ – \bar{x} \right)}{\left( y_{\tiny{2}} \ – \bar{y} \right)} + \\[ 10pt ] & \quad \cdots \cdots + {\left( x_{\tiny{n}} \ – \bar{x} \right)}{\left( y_{\tiny{n}} \ – \bar{y} \right)} \Bigr\} \\[ 10pt ] = & \frac{1}{n} \sum_{ i = 1 }^{ n } {\left( x_{\tiny{i}} \ – \bar{x} \right)}{\left( y_{\tiny{i}} \ – \bar{y} \right)} \end{align*}
変数 $x \ , \ y$ の標準偏差をそれぞれ $s_{\tiny{x}} \ , \ s_{\tiny{y}}$ とし、$x$ と $y$ の共分散を $s_{\tiny{xy}}$ とすると、相関係数 $r$ は
\begin{equation*} r = \frac{s_{\tiny{xy}}}{s_{\tiny{x}} \ s_{\tiny{y}}} \quad \left( -1 \leqq r \leqq 1 \right) \end{equation*}
2つの変量 $x \ , \ y$ について、それぞれの平均値を $\bar{x} \ , \ \bar{y}$ とし、$\left( x- \bar{x} \right) \left( y- \bar{y} \right)$ の総和を $a$、${\left( x- \bar{x} \right)}^{2}$ の総和を $b$、${\left( y- \bar{y} \right)}^{2}$ の総和を $c$ とするとき、相関係数 $r$ は
\begin{align*} r = & \frac{s_{\tiny{xy}}}{s_{\tiny{x}} \ s_{\tiny{y}}} \\[ 10pt ] = & \frac{\frac{1}{n} \sum {\left( x_{\tiny{i}} \ – \bar{x} \right)}{\left( y_{\tiny{i}} \ – \bar{y} \right)}}{\sqrt{{\frac{1}{n} \sum {\left( x_{\tiny{i}} \ – \bar{x} \right)}^{2}} \cdot {\frac{1}{n} \sum {\left( y_{\tiny{i}} \ – \bar{y} \right)}^{2}}}} \\[ 10pt ] = & \frac{\frac{1}{n} \sum {\left( x_{\tiny{i}} \ – \bar{x} \right)}{\left( y_{\tiny{i}} \ – \bar{y} \right)}}{\frac{1}{n} \sqrt{{ \sum {\left( x_{\tiny{i}} \ – \bar{x} \right)}^{2}} \cdot { \sum {\left( y_{\tiny{i}} \ – \bar{y} \right)}^{2}}}} \\[ 10pt ] = & \frac{a}{\sqrt{bc}} \quad \left( -1 \leqq r \leqq 1 \right) \end{align*}

おすすめの数学辞典

公式や定理をまとめた数学辞典です。1冊あると便利です。

導出が丁寧に記載されている公式集を1冊もっておくと困ったときに辞書代わりになります。 ポケットサイズのものと違いサイズが少し大きいので、図が豊富です。

公式・定理・定義は左ページ、活用例・解説・証明は右ページの見開き構成になっているので、使いやすいです。

難関大を志望している人向けです。大学に進学してからも使えます。

Posted by kiri