勉強法
問題演習を通して,次の状態を目指す
- (must)各パターンの構造式をイメージでき,分散分析表を書ける
- 各平方和の計算ができる(修正項を使用した公式は必須)
- それぞれの平方和の自由度が分かる
- (want)各水準の平均値や各データの信頼区間の式がイメージできる
- 自由度$\phi_e$のt分布が出てくる
- 有効繰り返し数$n_e$が計算できる(田口の公式)
QC検定2級 他の記事
QC検定2級に関して、他の学習事項についても下記にまとめている。
フィッシャーの3原則
- 無作為
- 繰り返し
- 局所管理
一元配置分析
1つの因子に対して、$a$個水準$A_1, A_2, \cdots A_a$を選び、水準間で違いがあるかの比較する手法である.
次の分散分析表を書けるように準備する.
要因 | 平方和S | 自由度 | 分散 | F比 | 検定 |
---|---|---|---|---|---|
因子$A$ | $S_A$ | $\phi_A = a-1$ | $S_A/\phi_A$ | $V_A/V_e$ | $F(\phi_A, \phi_e; \alpha)$ |
誤差$e$ | $S_e$ | $\phi_e = a(n-1)$ | $S_e/\phi_e$ | ||
計 | $S_T$ | $\phi_T = an-1$ |
- データの構造式: $x_{ijk} = \mu + a_i + \epsilon_{ij}$
- 意味:データ=総平均+$A_i$の効果+誤差
- $\epsilon_{ij}$は,サンプリング誤差,測定誤差,環境条件を含んでいる
- 平方和分解:総平方和は水準間平方和$S_A$と残差平方和$S_e$に分解できる
- $S_T = S_e + S_A$
- 平方和の計算法
- 修正項(変動平均値)$CT = \frac{T^2}{an}$
- 修正項CTは”Correction Term”の略、値は「変動の平均値」になる
- $S_T = \sum_{i=1}^a \sum_{j=1}^b x_{ij}^2 – CT$
- $S_A = \sum_{i=1}^a \frac{T_{A_i}^2}{n} – CT$
- $S_e = S_T – S_A$
- 修正項(変動平均値)$CT = \frac{T^2}{an}$
- それぞれの自由度
- 偏差の和が0になるため、足し合わせた数から-1する
- $\phi_T = an -1$
- $\phi_A = a -1$
- $\phi_e = \phi_T – \phi_A = a(n-1)$
- 水準間分散$V_A$と残差分散$V_e$
- 水準間分散$V_A = S_A / \phi_a$
- 残差分散$V_e = S_e / \phi_e$
- F値を計算する
- $F = \frac{V_A}{V_e}$ を計算する
- $V_A$が$V_e$に比べて大きければ、つまり$F値$が大きければ、因子Aの効果がある可能性が高い
二元配置分析
繰返しなし
交互作用のない$A, B$の水準の影響度を検定する.
$A, B$に交互作用があるときは、繰返し実験が必要なため、「繰返しあり」の二元配置分析法を用いる.
次の分散分析表を書けるように準備する.
要因 | 平方和S | 自由度 | 分散 | F比 | 検定 |
---|---|---|---|---|---|
要因$A$ | $S_A$ | $\phi_A = a-1$ | $S_A/\phi_A$ | $V_A/V_e$ | $F(\phi_A, \phi_e; \alpha)$ |
要因$B$ | $S_B$ | $\phi_B = b-1$ | $S_B/\phi_B$ | $V_B/V_e$ | $F(\phi_A, \phi_e; \alpha)$ |
誤差$e$ | $S_e$ | $\phi_e = (a-1)(b-1)$ | $S_e/\phi_e$ | ||
計 | $S_T$ | $\phi_T = an-1$ |
- データの構造式:$x_{ij} = \mu + a_i + b_i + \epsilon_{ij}$
- 意味:データ=総平均+$A_i$の効果+$B_i$の効果+誤差
- 平方和の計算法
- 修正項(変動平均値)$CT = \frac{T^2}{ab}$
- $S_T = \sum_{i=1}^a \sum_{j=1}^b x_{ij}^2 – CT$
- $S_A = \sum_{i=1}^a \frac{T_{A_i}^2}{b} – CT$
- $S_B = \sum_{j=1}^b \frac{T_{B_j}^2}{a} – CT$
- $S_e = S_T – S_A -S_B$
- 最適条件:水準$A, B$それぞれで一番結果が良かった水準を$A_{best}, B_{best}$とすると、結果が一番良い最適条件は$A_{best} B_{best}$になる
- 最適条件での母平均の信頼区間
- $\mu(A_i, B_j) = \bar{A_i} + \bar{B_j} – \bar{T} \pm t(\phi_e, 0.05) \sqrt{\frac{V_e}{n_e}}$
- $n_e$は有効繰り返し数であり,後述する.
繰返しあり
交互作用のある$A, B$の水準の影響度を検定する.
各条件で$n$回検定するとすると、全部で$abn$回の実験をすることになる.
次の分散分析表を書けるように準備する.
要因 | 平方和S | 自由度 | 分散 | F比 | 検定 |
---|---|---|---|---|---|
要因$A$ | $S_A$ | $\phi_A = a-1$ | $S_A/\phi_A$ | $V_A/V_e$ | $F(\phi_A, \phi_e; \alpha)$ |
要因$B$ | $S_B$ | $\phi_B = b-1$ | $S_B/\phi_B$ | $V_B/V_e$ | $F(\phi_A, \phi_e; \alpha)$ |
要因$A\times B$ | $S_{A\times B}$ | $\phi_{A\times B} = (a-1)(b-1)$ | $S_{A\times B}/\phi_{A \times B}$ | $V_{A\times B}/V_e$ | $F(\phi_{A \times B}, \phi_e; \alpha)$ |
誤差$e$ | $S_e$ | $\phi_e = (a-1)(b-1)$ | $S_e/\phi_e$ | ||
計 | $S_T$ | $\phi_T = abn-1$ |
- データの構造式:$x_{ijk} = \mu + a_i + b_j + (ab)_{ij} + e_{ijk}$
- 意味:データ=総平均+$A_i$の効果+$B_i$の効果+$A_iB_j$の相互作用+誤差
- 平方和の計算法
- 修正項(変動平均値)$CT = \frac{T^2}{abn}$
- $S_T = \sum_{i=1}^a \sum_{j=1}^b \sum_{k=1}^n x_{ijk}^2 – CT$
- $S_A = \sum_{i=1}^a \frac{T_{A_i}^2}{bn} – CT$
- $S_B = \sum_{j=1}^b \frac{T_{B_j}^2}{an} – CT$
- $S_{AB} = \sum_{i=1}^a \sum_{j=1}^b \frac{T_{A_i B_j}^2}{n} – CT$
- 平方和同士の関係
- $S_T = S_{AB} + S_e = S_A + S_B + S_{A\times B} + S_e$
- $S_{AB} = S_A + S_B + S_{A\times B}$
- 最適条件での母平均の信頼区間
- $\mu(A_i, B_j) = \bar{A_i B_j} \pm t(\phi_e, 0.05) \sqrt{\frac{V_e}{n}}$
有効繰り返し数について
有効繰り返し数$n_e$については,田口の式を覚えると個別での暗記を回避できる.
次に,田口の公式とそれぞれの場合の有効繰り返し数を列挙する.
- 田口の公式:$n_e = \frac{総データ数}{1+(推定に用いた要因の自由度の和)}$
- 一元配置分析のとき
- $n_e = \frac{an}{1+(a-1)} = n$
- 二元配置分析のとき
- $n_e = \frac{ab}{1+(a-1)+(b-1)} = \frac{ab}{a+b-1}$
- 二元配置分析(繰り返しあり)のとき
- $n_e = \frac{abn}{1+(a-1)+(b-1)+(a-1)(b-1)} = \frac{abn}{ab} = n$
- 二元配置分析(繰り返しあり)で相互作用(A×B)が優位でないとき
- 相互作用(A×B)が優位でないため,分母の(a-1)(b-1)が消える
- $n_e = \frac{abn}{1+(a-1)+(b-1)} = \frac{abn}{a+b-1}$
回帰分析・相関分析
回帰分析とは,目的変数$y$と説明変数$x$のデータから、回帰式$\hat{y_i}=\alpha + \beta x_i$(線形回帰の場合)を求める分析のことである.
重要語句
- 変数$y$:目的変数
- 変数$x$:説明変数
- 変数$\alpha$:切片
- 変数$\beta$:回帰係数
- メディアン線:$x, y$の散布図に中央値$Me(x)$と$Me(y)$を引くことがある
相関係数
相関係数 $r$は,2変数の比例関係の強さを-1~1で表す指標である.
- 定義:$r = \frac{S_{xy}}{\sqrt{S_{xx} S_{yy}}}$
- 各平方和
- $S_{xx} = \sum_{i=1}^n(x_i-\bar{x})^2 = \sum_{i=1}^n x_i^2 – \frac{(\sum_{i=1}^n x_i)^2}{n}$
- $S_{yy} = \sum_{i=1}^n(y_i-\bar{y})^2 = \sum_{i=1}^n y_i^2 – \frac{(\sum_{i=1}^n y_i)^2}{n}$
- $S_{xy} = \sum_{i=1}^n(x_i-\bar{x})(y_i-\bar{y}) = \sum_{i=1}^n x_i y_i – \frac{\sum_{i=1}^n x_i\sum_{i=1}^n y_i}{n}$
- 各分散(各平方和の公式より覚えやすいため,平方和は下記で分散を求めて$n$をかけて求める)
- $x$分散:$V_{xx} = \frac{S_{xx}}{n} = \frac{\sum_{i=1}^n(x_i-\bar{x})^2}{n} = E(x^2)-{E(x)}^2$
- $y$分散:$V_{yy} =\frac{S_{xx}}{n} = \frac{\sum_{i=1}^n(y_i-\bar{y})^2}{n} = E(y^2)-{E(y)}^2$
- 共分散:$V_{xy} =\frac{S_{xy}}{n} = \frac{\sum_{i=1}^n(x_i-\bar{x})(y_i-\bar{y})}{n} = E(xy)^2-E(x)E(y)$
- 寄与率$R$:説明変数の目的変数への影響度合を表す
- $R=r^2$(相関係数$r$の2乗)
最小二乗法
最小二乗法は,実際の値$y_i$と回帰式を$\hat{y_i}=\alpha + \beta x_i$とした時の予測量$\hat{y_i}$の差を$e_i = y_i – \hat{y_i}$としたとき,
この残差$e_i$の平方和$\sum_{i=1}^n {e_i}^2$を最も小さくする$\alpha, \beta$で近似する手法である.
- 公式:βを必ず暗記し,αは都度導出する
- $\beta= \frac{{S_{xy}}}{S_{xx}}$ ベジータのSexyなxx(ペケペケ)で覚える
- $\alpha = \bar{y} – \frac{S_{xy}}{S_{xx}} \bar{x}$
回帰式の分散分析
回帰式を求める意味があるかを分散分析によって検定できる.
分散分析表を書けるよう準備する.
要因 | 平方和S | 自由度 | 分散 | F比 | 検定 |
---|---|---|---|---|---|
回帰 | $S_R$ | $\phi_R = 1$ | $S_R/\phi_R$ | $V_R/V_e$ | $F(\phi_R, \phi_e; \alpha)$ |
残差$e$ | $S_e$ | $\phi_e = n-2$ | $S_e/\phi_e$ | ||
計 | $S_T$ | $\phi_T = n-1$ |
下記の関係式は,時短のため暗記または短時間で導出できるよう準備する.
- 平方和分解:$S_T = S_{yy}= S_e + S_R$
- 平方和は$y$の平方和$S_{yy}$と同じであることに注意
- $S_T = \sum_{i=1}^n(y_i-\bar{y})^2 = S_{yy}$
- 回帰平方和:$S_R = \sum_{i=1}^n(\hat{y} – \bar{y})^2$
- 回帰平方和と平方和の関係:$S_R = \frac{{S_{xy}}^2}{S_{xx}}$
- 導出:$S_R = \sum_{i=1}^n(\hat{y_i}-\bar{y})^2 = \beta^2 \sum_{i=1}^n(x_i-\bar{x})^2$
- 回帰平方和と総平方和の比は寄与率になる
- $\frac{S_R}{S_T} = \frac{{S_{xy}}^2}{S_{xx} S_{yy}} = r^2$
無相関の検定
相関係数が0でないと言えるかを検定する方法である.
- 帰無仮説$H_0$:母集団の相関係数$r$は$r=0$
- 対立仮説$H_0$:母集団の相関係数$r$は$r\neq 0$
- 検定統計量 $t = |r| \frac{\sqrt{n-2}}{\sqrt{1-r^2}}$
検定統計量の導出
- 回帰分析での検定量$F$は、
$F(1, n-2, \alpha) = \frac{V_R}{V_e} = \frac{S_R/\phi_R}{S_e/\phi_e}$ - 上記に代入して整理すると、
$F(1, n-2, \alpha) = \frac{{S_{xy}}^2 (n-2)}{S_{xx}S_{yy}(1-\frac{{S_{xy}}^2}{S_{xx}S_{yy}})} = r^2 \frac{n-2}{1-r^2}$ - F分布とt分布の関係で、「$X$が自由度$\phi$のt分布に従うとき、$X^2$は自由度$(1, \phi)$のF分布に従う」がある
- この関係を用いて整理すれば、
$t(n-2;\alpha)^2 = r^2 \frac{n-2}{1-r^2} \leftrightarrow t(n-2;\alpha) = |r| \frac{\sqrt{n-2}}{\sqrt{1-r^2}}$
参考文献
- 教科書(日本規格協会)
- 過去問題集(日本規格協会)
コメント