John R. Taylor(2000)『計測における誤差解析入門』(林茂雄(訳), 馬場凉(訳)), 東京化学同人

統計について驚くほどすばらしい入門書だ。特に理系は学生実験が始まるまで読むとよい。



親切心と配慮にあふれたすばらしい入門書

本書は、筆者の長年の指導経験が随所に感じられる。難しそうな装丁の割に、親切心と配慮にあふれた本だ。初めて統計学を学ぶ人や、大学に入って学生実験を始める人など、ひろくおすすめしたい。巷の入門書は、数学的な厳密さに欠け、数式の意味も説明せず、天下り式に計算を進めるもの軽薄短小な本が多い。それらに比べ、本書はあまりにできがよい。本書の内容は、なぜ誤差を考えるのかといったとても平易な疑問点から始まり、χ2検定で終わる。前編を通して、説明がとても細かく、学生の視点に立っており、配慮が行き届いている。具体例も多い。

どのような点で親切で配慮がされているのか。本書では、自由度や帰無仮説といった言葉がほとんど出てこない。本書では、


  • なぜ検定では y-f(x) と σ の比をとるのか。
  • なぜカイ二乗はχ^2 = Σ(y-f(x)^2/σの形をしているのか。
  • なぜ仮定を設定するのか


といった点についても、自然に納得のいく説明がなされる。そのおかげで、根本的な考え方を身に着けることができて、気が付けば「棄却」や「帰無仮説」という概念がわかるようになる。つまり、次のように手順に自然と納得いくのだ。

  1. まず分布を仮定してみる
  2. その分布からどれだけ離れた測定値を得たか、比をとってみる
  3. 仮定した分布からデータが離れすぎていたら仮定を棄却する

といった考えが自然と身につくようになる。巷の無味乾燥な参考書には、次のような無味乾燥な手続きの紹介に終わるものが多い。

  1.  まず帰無仮説を仮定する
  2. 公式にしたがって数字をあてはめる
  3. 5%信頼区間においてキム仮説が棄却される

比べてみれば、本書がいかに優れているか想像つくと思う。

以下に、著者の配慮、理解や率直さが輝き、理解を促す箇所を具体的に挙げた。特に、「標準偏差と誤差」の項に説明したが、標準偏差は測定をいくら繰り返しても小さくならないという点は学んだものが大きい。

気に留めておくべき本書の引用

最良推定値は平均値か

測定を繰り返した際の最良な推定値は、しばし無条件に平均値を採用する本が多いが、本書では、平均値を採用する態度が明瞭である。
この場合の最良推定値としては, 五つの測定値の平均値x barとするのがよいであろう. なお, この判断が一般的には最良のものであることは第五章で証明する. (P.103)
q_1, ……, q_Nがわかれば平均値 q barを計算することができ, これはqについての最良推定値であると仮定する. (P.216) 
実際、後で正規分布と最尤推定よる説明がなされる。その際にも、
上の二節では測定値が正規分布をしていると仮定して議論した. この仮定は妥当なものであるが, 実際に照明するのは困難であり, 厳密には成り立たないこともときどきある. (P.150) 
という厳密性への配慮がなされる。

説明には、最尤法と、
P(x)∝exp(-(x-X)**2/σ**2)
という正規分布を用いる。ただし、Xは最良推定値であり、まだそれが平均値かはわからない。

x=[x[1], ..., x[n]]という値を同時に得る確率は、積の法則より
P(x) ∝ exp(-(x[1]-X)**2/σ**2) *...* exp(-(x[n]-X)**2/σ**2)
を得る。測定値は標準偏差σで散らばっている。即ち、
P(x) ∝ exp[-(x[1]-X)**2/σ**2 - ..- (x[n]-X)**2/σ**2]
最尤推定によって、XはこのP(x)を最も大きくする値だと考えられる。右辺をXで微分し、導関数を0として、X=∑x[i]/Nを得る。

誤差はランダム誤差と系統誤差の二乗和か


また、ランダム誤差と系統誤差の二乗和について、
また, この答えの意味も明らかではなく, たとえば, 真の答えが68%の信頼度でk bar ± δkの範囲に存在するなどということはできない. (pp.115-116)
などと説明があり、広く使用される誤差の二乗和――性質の異なる誤差の二乗和であり、意味が解せない式――にどういった態度で向かえばよいか率直な説明をする。

学生実験の意義

次のように、学生実験そのものに対する違和感も吐露することがある。自分も、なぜ値が恐るべき精度でわかっているものを学生実験で改めて追試しないといけないのかわからないものだった。 答えがわかっている問で訓練をしても、答えのわからない問題に立ち向かうには役に立たないような気がしたからだ。
学生実験では, 重力加速度など, 正確な値が既知であるような物理量の値を求めよといったちょっと奇妙に聞こえる課題を出されることがある.このような実験では, 何のために誤差解析をしなくてはいけないのかとまどってしまう. (P.116)

そもそも真の値は存在するのか

しかしながら、どのような物理量であっても真の値は存在するという, まことに都合のいい過程をすることにしよう. (P.139)
真の値というのは、イデア的で、自分たちは知り得ないものだ。測定を繰り返して本当に真の値に近づいているのか、そもそも真の値などあるのかは、 自明ではない。その点にも留意しつつ、筆者は真の値があるものとして話を進める。

説明不足への言及

次のように、自分たちがどの地点にいるか、何を証明して、何を証明せず、どこまで基盤を盤石にしてきたかを確認してくれるのは、とてもありがたい。多くの著作者は、単に「◯◯で述べた。」で終わってしまうくせに、◯◯を見ても、どのようにしてそれが導かれたかがわからない場合があり――筆者すらわかっていないのかもしれないが――、読者が置いていかれることがある。ただ、次のように白状してくれると、「証明もなく天下り式に降ってきた式の説明が足りていないという違和感は正しいのだ」と、少なくとも納得して進むことができる。
証明はしなかったが, x, yの誤差が独立かつランダムであれば, もっと良い式は次のような二次式であると述べた (P.214)

標準偏差の分母がNかN-1か

また、標準偏差の分母をNにするかN-1にするかという混乱を招く問題については、常に気を配っている。
さて, ここでも (9・4) 式のσ_xを使うべきか, 分母のNをN-1で置き換えた改良版を使うべきかという問題が生じる。 (PP.215-216)
ひどい入門書では、勝手にNやN-1で話をすすめていこうとするものだ。筆者は、どちらにしても首尾一貫していればよいと説明して、ここでNを採用して話を進める。

帰無仮説をどう設定するか

帰無仮説がどういったものであるか、多くの本では「無に帰する仮説」とか説明になってないような説明をするが、本書では
この仮説に従えば, 検定からどのような確率で種々の結果が生じるかが計算でき, ある特定の結果について意味づけができる. (P.242)
とある。つまり、とりあえず計算をすすめ、評価するためにたてられる仮説であり、その真偽がどうであるかを期待して立てるわけではないのだ。

片側確率か両側確率か

片側確率、両側確率については、
片側確率と両側確率のどちらが適当かは, もともとの仮説に対する対立仮説をどう考えるかによる.(P.245)
とあり、初心者が混乱しがちな点も触れてある。

標準偏差と誤差

今まで混同していたが、

  • 分布についての 平均値±測定値の標準偏差
  • 平均値についての 平均値±平均値の標準偏差

は異なるものだ。平均値の標準偏差は、誤差と言われ、標準偏差を√Nで除すことで得る。そのため、測定回数が多くなるほど、平均値の幅は狭くなる。しかし、標準偏差はデータのばらつきであるので、どれだけ測定回数を増やそうと、より確からしいばらつきの値が得られるだけで、ゼロにはならない。

平均値の標準偏差

主にPP.156-157を下地にしている。

平均値

m = ∑x[i]/N

の真の値を調べる。各x[i]の真の値は同一のxで、分布も等しい。なので、

∑X/N = X

となり、mの真の値もxである。また、全微分により

dm = (∂m/∂x_1)dx_1 + ... + (∂m/∂x_n)dx_N



を得る(この式から二乗和を計算して誤差伝播の式を得るが、本書では珍しい事にその説明は怪しい(P.156))。
∂m/∂x[i] = 1 for all i
であるから
dm = dx_1 + ... + dx_n = N

σ_m = sqrt[(∑((∂m/∂x[i])dx[i])**2)]
dx[i] = σ_x
であるので、
σ_m = σ/√N
となる。よって
m = x±σ/√N

検定について

  1. 予想値x_expを中心とした分布である
  2. 分布の幅は実験で推定されたσに等しい
という仮定をする。そして、

t = |x_best - x_exp|/σ

は、予想値x_expとx_bestの不一致がどの程度かを示すため、σの何倍かを計算している。仮定が正しければtの値は十分に小さいと期待される。逆に、この程度tが大きいほど、仮定が崩れ去ることになる。したがって、十分にtの値が小さければ、仮定は信頼でき、そして測定値は受託できる(参考: PP.159-161)。

ここからが自分の考えだ。
自分が大学入って初めて検定を学んだときにも思ったことだが、tの値が小さいからといって仮定を受託できるとは限らない気していた。偶然tが小さい値になることは、ないのだろうか。

仮定1∧仮定2 ↔ t<<1

と言えるのだろうか。たしかに、仮定が成り立っていれば、tが小さいだろうと思う。しかし、逆は成り立つのだろうか。

自分はあまり納得できていない。何が起こっているのか、論理学で考えてみた。多くの統計学の参考書では、次のような推論を言う。表記の簡便のため、
仮定 = 仮定1∧仮定2
として、

(仮定), (仮定→t<<1)
―――――――――
       t<<1

これは推論規則として認めておく。では、もし測定して得られた結果が、「¬(t<<1)」であったら、何が言えるのか。「仮定→t<<1」は真であるから、「仮定」が成立していなかったことになる。

また、もっと簡単に、次のように対偶を考ると、

仮定が真である → t<<1
¬(t<<1) → 「仮定が偽である」

tが十分小さい値のとき、仮定が間違っていたとわかる。

ポアソン分布

もし、T秒間計り、νという値を得たとする。すると、標準偏差√νを考慮すれば、

ν±√ν

となる。たとえば、放射性元素の壊変率だとしてもよい。単位時間の壊変率R=ν/Tはは、

R±δR = (ν±√ν)/T

だと期待できる。平方根則は、実際の測定値にのみ使用できるので、Rの標準偏差を√(ν/T)としてはならない (参考: P.254)。

では、次の問題を考えたい。もし何かの値を二人が測定して、

Aくん: 9 (1min)
Cくん: 120(10min)

という値を得たとき、二人の値は一致しているだろうか。このように筆者は質問し、次のような要旨を言う。「Aくんが正しいなら、90±√90 (10分間) とAくんは予言する。そして、σ=√90=10であり、予言された90から3σも離れた120はとうていあやしいと結論づける。」(参考: P.256)。

ここで疑問がわく。Aくんが正しいなら、10(9±3)になるのではないか。2ページ前の壊変率の話で筆者はそのようなことを言っていたではないか。ここは珍しく筆者の説明が足りない。

Aくん「ぼくは1分間に9を測定した。だから、10分間測定したら、90が測定されるだろう。もし、誰かが『実際に』10分間測定すれば、90を得るはずで、標準偏差は√90だとその人は結論づけるに違いない。」

Cくん「そうですか。ぼくは実際に10分間測定して、120±√120を得ました。σ=√120=11ですので、Aくんが言っていた、90という予言からは3σ離れています。おかしいですね。また、僕の測定は、1分間あたりに計算し直すと、(120±11)/10 = 12±1なので、9というのは、ここでも3σ離れてますね。Aくんの測定か、僕の測定どちらか、もしくは両方ともおかしいのかな。」

Aくん「僕の測定値からは、誤差伝播の考えから、10(9±3) = 90±30になります。ぼくの1分間の測定では、雑な予想しかできません。Cくんの120という値は僕の測定値から1σにあるので、ぼくの荒っぽい予想と矛盾していません (でも、本当はCくんは120ではなく90を観測するはずです)。」

結局、どう捉えればよいのかわからない。どなたか詳しい人が読んでいたら、意見が欲しい。





コメント

人気の投稿