2012年11月アーカイブ

疫学的研究(統計的研究)に関する意見

被ばくによる発病等に因果関係がない、という研究が、政府・東電側から主張されますが、それに関する反論です。


統計に詳しくない方

→ぜひ、統計的に有意ということの実態がどのようなものか理解するためにお読みください。

統計に詳しい方

→私の知る限りの統計的知識によっていますが、なにか問題があればぜひお教えください。


 「統計的に有意でない」とは,何らかの主張が立証されたことを意味するものではない

(1) 疫学的研究の方法論

疫学的研究の場合,どれだけの資料を収集・分析して導かれた命題であっても,全数調査をするのでない限り,その結果が偶然である可能性は排除できない。

たとえば,「1mSvの追加的被ばくで疾病A(たとえば甲状腺がん)の発生率が上がる」という論証は,論理的には,地球上の人口が60億人であるとして「その全員が被ばくしなかった場合(統計学では,「統制群」という。)」と「(同じ)全員が1mSvの追加的被ばくをし,それ以外の条件は全く同じである場合(統計学では,「比較群」という。)」で,統制群は疾病Aの発症者が1000人で,比較群では1001人であれば,「1mSvの追加的被ばくで疾病Aの発生率が上がる」という言明は,真実であり,その結論に何の論理的飛躍もない。

しかし,全員の数値をとることは現実にはできないし,何よりも,同一人において被ばくしなかった場合と,追加的被ばくした場合の両方のデータを取ることは論理的に不可能である。そのため,疫学的研究では,被ばくしてないと考えられる集団の一部の人々(当該調査の研究対象になった人々)の発症率と,被ばくしたと考えられる集団の一部の人々の被ばく率の違いを論じることになる。ここで,たとえ真実の数値が被ばくの有無にかかわらず同一であったとしても,60億人全員を調査するわけではなくサンプル調査した結果であるので,その2つの数値は異なるのが普通である(同時期に行われる世論調査の結果が,たとえ傾向は一致しているとしてもパーセンテージが一致しないのがその一例である)。そのため,一般的に2つの違う数値が,真実の値が異なると考えるべきか,サンプリングの誤差によってありうる違いなのかを,統計学的な手法を用いて,確率論的に主張(推定)するのである。

(2) 統計的主張の方法

以下,統計的主張の意味を解説する例として,ある特定のコインに歪みがあるか否かを検証することを想定して説明する。そのコインがゆがみのないコインであれば,無限回投げれば2回に1回の割(確率50%)で表面が出るはずであり,無限回投げて正確にその半数が表面,残りの半数が裏面が出るという事実をもって,「このコインは2回に1回の割で表面が出る」と主張することができる。しかし,現実には無限回投げることは不可能なので,限られた回数,たとえば20回そのコインを投げることによって「そのコインが50%の確率で表が出る」という主張が合理的か否かを推定する技法が統計学である。

例として,実際に20回投げた場合,10回表が出ることが期待されるが,実際には6回の場合も,8回の場合も,はたまた偶然にも20回全部表ということもあり得る。ここでは,2回しか表が出なかったとする。その結果から,「当該コインを投げたときに表が出る確率は50%ではない」という仮説を主張するためには,「当該コインを投げた場合,表が出る確率は50%である。」という対立仮説(統計学では,「帰無仮説」という。)をまず立論する。そして,この帰無仮説が,「相当程度の偶然が起こらないと生じえない」という根拠によって棄却されることにより,間接的に「仮説が検証された」と考えるのである。

上述の例で考えると,理論的にある特定のコインが表を出る確率(x%)はコインの鋳造方法などで任意にコントロールできるとして,その「x%の確率で表が出るコイン」を,20回投げた場合,2回以下しか表が出ない確率が2.5%以下となるようなxの最小値と,2回より多く表が出る確率が約2.5%以下になるようなxの最大値を計算する。これを当該コインが表に出る確率xの「95%信頼区間」といい,それはこの例の場合は計算上約3.125%から約31.721%である(このことの意味は,表が出る確率が3.125%になるように鋳造されたコインであれば,20回中2回以上表が出る確率が2.5%であり,かつ,表が出る確率を31.721%に設定されたコインであれば20回中2回以下しか表が出ない確率が2.5%である,という意味である)。

ここで,この信頼区間の範囲内に帰無仮説の値(50%)が

 1)含まれている場合

 2)含まれていない場合

が考えられる。

2)の場合,帰無仮説を前提にすると,このようなことは,偶然に起こりえないとは言えないが,起こることは稀な(可能性は5%に満たない)ことである。そこで,

① 今回の施行に限り極めて例外的なことが起こったと考える

  よりは,

② そもそも,当該コインが50%の確率で表が出るという前提(帰無仮説)が間違いであると考える

方が現実的であろう,というのが統計学の基本的な考え方である。

統計学では,1)の場合は,「有意差がない」といい,2)の場合,「統計的に有意」という。つまり,一般に「このコインが歪んでいることは統計的に有意である」などと主張されがちであるが,この厳密な言明は,「当施行結果から推測するに,当該コインを投げたときに表が出る確率が50%であると主張するのは,確率論的には難しい。」ということである。

ましてや,1)の場合に,「このコインが歪んでいない」などと主張するのは統計学を知るものであれば周知の間違いである。

(3) 統計学が必然的にはらむ2つの誤謬リスク

      以上のことからわかるように,統計学には根本的に2つの誤謬のリスクがある。

「第一種の誤り」:帰無仮説が正しいのに,棄却してしまう危険性。真実は50%の確率で表が出るコインであるにもかかわらず,偶然にも2回しか表が出なかったために,表が出る確率は50%とは言えない,と推測してしまうリスク。

「第二種の誤り」:帰無仮説を棄却するべきときに,棄却しないリスク。真実は当該コインの表が出る確率が50%ではないのに,偶然に表が10回出たために,「表が出る確率は50%とは言えない」とはいえない,と推論してしまうリスク。

これらのリスクはトレードオフの関係にあり,どちらかのリスクを減らすともう一方のリスクが上がる関係にある。この2種類のリスクを同一のウエイト付けをするならば,50%信頼区間を採用するべきであるが,統計学では,科学的な確実性を担保するために第一種の過誤を犯すリスクをできる限りとらないように95%信頼区間を設定することが多い。

95%信頼区間を前提にするとき,例外的な度合を示すために,p<0.05と記述し,もしくは観測値に*を付記し,99%信頼区間を前提に判断した場合は,p<0.01と記述するか,観測値に**を付すのが一般的である。

(4) 統計学は因果関係の不存在を立証しない

統計学は,前述のように95%ないし99%の確からしさ(第二種の過誤のリスクが大きくなるのを容認して,第一種の過誤のリスクを避ける)というバイアスをかけた単なる数値比較の確率論であるから,統計的に有意であるということが「因果関係」を立証するものではない。統計的に有意であるというのは,事実として,2つの集団に差が存在することや相関が存在することを確率的に示唆するに過ぎないのである。因果関係は,理論によって仮説されているにすぎないのである。

前述のコインの例で言えば,「そのコインが表が出る確率が50%でないと主張するのは確率的に困難である」ということは,統計的手続きで主張できるが,そのことを持って「表が出る確率は50%である」とは主張することはできないし,「コインが歪んでいない」と主張するのは論理の飛躍である(表が出る確率以外にも歪みの変数がありうる)。

ましてや,統計的に有意でないということは,第二種の過誤のリスクを大きくとっているので,①差や相関が存在しない,という証明でもなければ,②「因果関係がない」という証明には全くならないのである。

(5) 科学的議論と防護(不安に基づく回避行動)との違い

上述のように,統計学を援用する研究は確率論に基づいており,立証側に重い負荷をかけている。なぜなら,科学と非科学を区別するものは,哲学者カール・ポパーが言うように,その言明に反証可能性があるか否かであり,科学的議論は,ある程度の理論的整合性と「もっともらしい」証拠があれば「仮説」の提示が許され,その仮説が反証されない間は暫定的にその仮説を採用する,というルールに従っているから,仮説を立てる側と反証する側に同程度のハードルを立てるのでは,科学という様式的な議論の安定性が保てないからである。つまり,棄却されない間は,否定も肯定も推定されない「仮説」として生きながらえる,というのが科学的に正しい態度である。

それは,「100mSv未満の被ばくでも健康に影響がある」という仮説においても同じである。これが統計的に検証されるとは,「100mSv未満の被ばくをしても(しない場合と比較して)健康に差がない」という帰無仮説が,少なくとも95%の確率で棄却されることである。

しかし,親が子供に「この食品を食べても食中毒にならない」という(帰無)仮説が棄却される確率が30%程度しかない食品は食べさせ,その確率が95%なら食べさせない,ということがありうるだろうか。

原発の設置許可において,1%の確率で起こりうるリスクは対処策が講じられている必要性があるはずである。それは,1%の確率であってもリスクがあるなら注意するべきであるというのが一般的な感覚であろう。つまり,放射線防護や,フェールセーフの前提に立てば,第二種の過誤こそ避けるべきであり,1%信頼区間でもよいぐらいである。

少なくとも,民事訴訟における証拠の優越の考え方からすると,50%信頼区間で議論すべきなのであり,5%有意(95%信頼区間),1%有意(99%信頼区間)を前提とした議論は,健康被害を立証するハードルがきわめて高く,攻撃防御の公平さから見てもそのような前提の研究結果を証拠として採用するべきではないのである。

逆に,「統計的に有意でない」とは,因果関係が否定されたことの立証を意味するものでもない。単に「帰無仮説を前提にすると,5%(ないしは1%)しか起こらないほどの偶然な結果ではないので,帰無仮説が間違っているとまでは言えない。」というだけのことである。

(6) 小括

以上のことから,厳密に,低線量被ばくによる発がん等の健康被害が「ない」ということを立証することはそもそも理論的に不可能である(上記本項(1)参照)。

厳密な比較ができないゆえに統計学的な比較をする場合,統計学の理論的な性質上,「健康被害がない」ということを否定することはできるが,積極的に「健康被害がないこと」を立証することはできない。「健康被害がないことが否定できない」,という結果を「健康被害がない」と言い換えるのは,統計を知らない(ないしは悪用した)詭弁である。概ね100~200mSv以下の被曝量においては過剰リスクが統計的に有意とはいえない,とは,100~200mSv以下の被曝量ならば安全という事実を立証するものではない。

| コメント(0)

ウェブページ

このアーカイブについて

このページには、2012年11月に書かれたブログ記事が新しい順に公開されています。

前のアーカイブは2012年9月です。

次のアーカイブは2012年12月です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

Powered by Movable Type 5.12