目次
データの基礎
データとは
ある現実(事実)を皆に理解できるように客観的な観測値や測定値に置き換えたものを ”データ” と呼ぶ。数値化される前の事実や、定性的なものを言葉(文字)で表したものも、データに含まれる。同じ条件で同じ状態で作業したつもりでも、複数のデータの間には違いがあるのが普通であり、これを ”ばらつき” という。
母集団とサンプル
ある特性を測定しデータを得る目的は、測定された個々の対象に対して処置を行うことではなく、調査対象全体に関する情報を得て、処置を行うことである。この処置を行おうとする対象全体を、”母集団” という。この母集団の情報を得る目的で抜き取ったものを ”サンプル” という。サンプルは標本や試料ともいわれる。
母集団からサンプルを抽出することを ”サンプリング” という。偏りなくランダム(無作為)にサンプリングすることを ”ランダムサンプリング(無作為抽出)” という。
層別サンプル
”層別サンプリング” とは、「サンプルの部分が様々な層から抽出され、かつ、各層が少なくとも一つのサンプリング単位をもつように抽出されるサンプリング」である。”層別”とは、「母集団を層に分ける分割」であり、”層”とは、「調べている特性に関して母集団全体より均一と考えられる、互いに排反でその全体が母集団に一致する部分母集団」である。(JIS Z 8101-2:2015)
”層別比例サンプリング”とは、事前に各層のサイズの比率がわかっているときに、その比率に応じて全体のサンプルサイズを各層に割り当てることである。
ロット
”ロット”とは、「サンプリングの対象となる母集団として本質的に同じ条件で構成された、母集団の明確に分けられた部分」と低芸される。 (JIS Z 8101-2:2015)
ロットは、工業(製造業)の分野でよく用いられる用語で、製品、半製品、部品または原材料などの集団であり、生産や出荷の単位として用いられる。
データの種類(計量値、計数値)
計量値と計数値の違いを下の表に示している。
分類 | 定義と説明 | 具体例 |
計量値 | ●はかる(量る、測る)ことで得られる数値データで、連続的な値をとる。 ●収率のように計量値/計量値は連続的な値をとるので計量値である。 | 重さ 長さ 温度 時間 |
計数値 | ●数えるで得られる数値データで、非連続な値をとる。 ●出席率のように、計数値/計数値は非連続な値をとるので計数値である。 | 人数 個数 |
計量値や計数値の他(分類データ、順位データ、言語データ)を下の表に示している。言語データを扱う手法として、新QC七つ道具がある。
分類 | 定義 | 具体例 |
分類データ | ●単なる分類を示すデータ | 合格・不合格 作業者の性別 血液型、等級 |
順位データ | ●測定結果によって順序付けされたデータ | 陸上競技の順位 成績の順位 到着順位 |
言語データ | ●数値化されていない言葉(言語)を扱うデータ | 今日は晴れ レベルが低い 相手がいない |
データの使用目的の分類を下の表に示している。
使用目的 | 具体例 |
1)現状把握 | 部品のばらつきはどのくらいか? |
2)解析 | ある成分の含有率と製品強度との間に関係があるかどうか? |
3)管理 | ある部品は在庫切れになっていないか? |
4)調整 | 材料温度は現状より上げなくてよいか? |
5)検査 | この品物を適合品と判断してよいか? |
6)記録 | (記録保存用の)製品1錠中の各成分の含有量 |
データのとり方、まとめ方
データのとり方、まとめ方のポイントを下の表に示している。
大項目 | 中項目 | 小項目 |
事実を観察する | 「三現主義」や「五ゲン主義」で観察する。 | ①テーマをもって現場を見る。 ②ばらつきという考え方で見る。 ③比較してみる。 ④非定常状態のときはどうか? ⑤誰も気がつかなかったことはないか? ⑥「やってみる」「やらせてみる」 ⑦自分で体験し、体験を積み上げる。 |
記録に残す | 事実をそのままの形で記録する。5W1H | ①言葉で残す(書き留める)。 ②音・絵で残す(録音・録画) ③事実を測って記録する。 →チェックシート→データ化 |
測れないものを測れるようにする。 | ①測定方法を工夫する。 ②五感を磨く。→人の能力を高める。 ③五感を超えて測る。→測定技術を開発する。 | |
データをまとめる | 見える形に変換する。 | ①図示する・絵にする。 ②止める(動いているものを止めて見る)。 ③動かす(止まっているものを動かして見る)。 |
特徴・違いを浮き立たせる。 | ①分けて見る(層別する)。 ②基準と比較して見る。 ③正常と異常を区分する。 |
平均とばらつきの概念
”ばらつき”とは、「観測値・測定結果の大きさがそれっていないこと、又は、不ぞろいの程度」のことである。品質管理では、製品のばらつきがなぜ発生するのか原因を追究し、ばらつきをコントロール(制御)しようとする。データの中心を表わすものに”平均値”が、データのばらつきを表わすものに”範囲”がある。
平均と範囲
平均値 x
平均値は、データ群の中心となる値で、次の式で計算される。
範囲 R
1組のデータの中の最大値と最小値の差を”範囲”R(アール)という。範囲Rは、次の式で計算される。
参考文献:「QC検定受験テキスト 4級」, 細谷克也ほか, 日科技連