統計に詳しくない方
→ぜひ、統計的に有意ということの実態がどのようなものか理解するためにお読みください。
統計に詳しい方
→私の知る限りの統計的知識によっていますが、なにか問題があればぜひお教えください。
「統計的に有意でない」とは,何らかの主張が立証されたことを意味するものではない
疫学的研究の場合,どれだけの資料を収集・分析して導かれた命題であっても,全数調査をするのでない限り,その結果が偶然である可能性は排除できない。
たとえば,「1mSvの追加的被ばくで疾病A(たとえば甲状腺がん)の発生率が上がる」という論証は,論理的には,地球上の人口が60億人であるとして「その全員が被ばくしなかった場合(統計学では,「統制群」という。)」と「(同じ)全員が1mSvの追加的被ばくをし,それ以外の条件は全く同じである場合(統計学では,「比較群」という。)」で,統制群は疾病Aの発症者が1000人で,比較群では1001人であれば,「1mSvの追加的被ばくで疾病Aの発生率が上がる」という言明は,真実であり,その結論に何の論理的飛躍もない。
しかし,全員の数値をとることは現実にはできないし,何よりも,同一人において被ばくしなかった場合と,追加的被ばくした場合の両方のデータを取ることは論理的に不可能である。そのため,疫学的研究では,被ばくしてないと考えられる集団の一部の人々(当該調査の研究対象になった人々)の発症率と,被ばくしたと考えられる集団の一部の人々の被ばく率の違いを論じることになる。ここで,たとえ真実の数値が被ばくの有無にかかわらず同一であったとしても,60億人全員を調査するわけではなくサンプル調査した結果であるので,その2つの数値は異なるのが普通である(同時期に行われる世論調査の結果が,たとえ傾向は一致しているとしてもパーセンテージが一致しないのがその一例である)。そのため,一般的に2つの違う数値が,真実の値が異なると考えるべきか,サンプリングの誤差によってありうる違いなのかを,統計学的な手法を用いて,確率論的に主張(推定)するのである。
以下,統計的主張の意味を解説する例として,ある特定のコインに歪みがあるか否かを検証することを想定して説明する。そのコインがゆがみのないコインであれば,無限回投げれば2回に1回の割(確率50%)で表面が出るはずであり,無限回投げて正確にその半数が表面,残りの半数が裏面が出るという事実をもって,「このコインは2回に1回の割で表面が出る」と主張することができる。しかし,現実には無限回投げることは不可能なので,限られた回数,たとえば20回そのコインを投げることによって「そのコインが50%の確率で表が出る」という主張が合理的か否かを推定する技法が統計学である。
例として,実際に20回投げた場合,10回表が出ることが期待されるが,実際には6回の場合も,8回の場合も,はたまた偶然にも20回全部表ということもあり得る。ここでは,2回しか表が出なかったとする。その結果から,「当該コインを投げたときに表が出る確率は50%ではない」という仮説を主張するためには,「当該コインを投げた場合,表が出る確率は50%である。」という対立仮説(統計学では,「帰無仮説」という。)をまず立論する。そして,この帰無仮説が,「相当程度の偶然が起こらないと生じえない」という根拠によって棄却されることにより,間接的に「仮説が検証された」と考えるのである。
上述の例で考えると,理論的にある特定のコインが表を出る確率(x%)はコインの鋳造方法などで任意にコントロールできるとして,その「x%の確率で表が出るコイン」を,20回投げた場合,2回以下しか表が出ない確率が2.5%以下となるようなxの最小値と,2回より多く表が出る確率が約2.5%以下になるようなxの最大値を計算する。これを当該コインが表に出る確率xの「95%信頼区間」といい,それはこの例の場合は計算上約3.125%から約31.721%である(このことの意味は,表が出る確率が3.125%になるように鋳造されたコインであれば,20回中2回以上表が出る確率が2.5%であり,かつ,表が出る確率を31.721%に設定されたコインであれば20回中2回以下しか表が出ない確率が2.5%である,という意味である)。
ここで,この信頼区間の範囲内に帰無仮説の値(50%)が
1)含まれている場合
2)含まれていない場合
が考えられる。
2)の場合,帰無仮説を前提にすると,このようなことは,偶然に起こりえないとは言えないが,起こることは稀な(可能性は5%に満たない)ことである。そこで,
① 今回の施行に限り極めて例外的なことが起こったと考える
よりは,
② そもそも,当該コインが50%の確率で表が出るという前提(帰無仮説)が間違いであると考える
方が現実的であろう,というのが統計学の基本的な考え方である。
統計学では,1)の場合は,「有意差がない」といい,2)の場合,「統計的に有意」という。つまり,一般に「このコインが歪んでいることは統計的に有意である」などと主張されがちであるが,この厳密な言明は,「当施行結果から推測するに,当該コインを投げたときに表が出る確率が50%であると主張するのは,確率論的には難しい。」ということである。
ましてや,1)の場合に,「このコインが歪んでいない」などと主張するのは統計学を知るものであれば周知の間違いである。
以上のことからわかるように,統計学には根本的に2つの誤謬のリスクがある。
「第一種の誤り」:帰無仮説が正しいのに,棄却してしまう危険性。真実は50%の確率で表が出るコインであるにもかかわらず,偶然にも2回しか表が出なかったために,表が出る確率は50%とは言えない,と推測してしまうリスク。
「第二種の誤り」:帰無仮説を棄却するべきときに,棄却しないリスク。真実は当該コインの表が出る確率が50%ではないのに,偶然に表が10回出たために,「表が出る確率は50%とは言えない」とはいえない,と推論してしまうリスク。
これらのリスクはトレードオフの関係にあり,どちらかのリスクを減らすともう一方のリスクが上がる関係にある。この2種類のリスクを同一のウエイト付けをするならば,50%信頼区間を採用するべきであるが,統計学では,科学的な確実性を担保するために第一種の過誤を犯すリスクをできる限りとらないように95%信頼区間を設定することが多い。
95%信頼区間を前提にするとき,例外的な度合を示すために,p<0.05と記述し,もしくは観測値に*を付記し,99%信頼区間を前提に判断した場合は,p<0.01と記述するか,観測値に**を付すのが一般的である。
統計学は,前述のように95%ないし99%の確からしさ(第二種の過誤のリスクが大きくなるのを容認して,第一種の過誤のリスクを避ける)というバイアスをかけた単なる数値比較の確率論であるから,統計的に有意であるということが「因果関係」を立証するものではない。統計的に有意であるというのは,事実として,2つの集団に差が存在することや相関が存在することを確率的に示唆するに過ぎないのである。因果関係は,理論によって仮説されているにすぎないのである。
前述のコインの例で言えば,「そのコインが表が出る確率が50%でないと主張するのは確率的に困難である」ということは,統計的手続きで主張できるが,そのことを持って「表が出る確率は50%である」とは主張することはできないし,「コインが歪んでいない」と主張するのは論理の飛躍である(表が出る確率以外にも歪みの変数がありうる)。
ましてや,統計的に有意でないということは,第二種の過誤のリスクを大きくとっているので,①差や相関が存在しない,という証明でもなければ,②「因果関係がない」という証明には全くならないのである。
上述のように,統計学を援用する研究は確率論に基づいており,立証側に重い負荷をかけている。なぜなら,科学と非科学を区別するものは,哲学者カール・ポパーが言うように,その言明に反証可能性があるか否かであり,科学的議論は,ある程度の理論的整合性と「もっともらしい」証拠があれば「仮説」の提示が許され,その仮説が反証されない間は暫定的にその仮説を採用する,というルールに従っているから,仮説を立てる側と反証する側に同程度のハードルを立てるのでは,科学という様式的な議論の安定性が保てないからである。つまり,棄却されない間は,否定も肯定も推定されない「仮説」として生きながらえる,というのが科学的に正しい態度である。
それは,「100mSv未満の被ばくでも健康に影響がある」という仮説においても同じである。これが統計的に検証されるとは,「100mSv未満の被ばくをしても(しない場合と比較して)健康に差がない」という帰無仮説が,少なくとも95%の確率で棄却されることである。
しかし,親が子供に「この食品を食べても食中毒にならない」という(帰無)仮説が棄却される確率が30%程度しかない食品は食べさせ,その確率が95%なら食べさせない,ということがありうるだろうか。
原発の設置許可において,1%の確率で起こりうるリスクは対処策が講じられている必要性があるはずである。それは,1%の確率であってもリスクがあるなら注意するべきであるというのが一般的な感覚であろう。つまり,放射線防護や,フェールセーフの前提に立てば,第二種の過誤こそ避けるべきであり,1%信頼区間でもよいぐらいである。
少なくとも,民事訴訟における証拠の優越の考え方からすると,50%信頼区間で議論すべきなのであり,5%有意(95%信頼区間),1%有意(99%信頼区間)を前提とした議論は,健康被害を立証するハードルがきわめて高く,攻撃防御の公平さから見てもそのような前提の研究結果を証拠として採用するべきではないのである。
逆に,「統計的に有意でない」とは,因果関係が否定されたことの立証を意味するものでもない。単に「帰無仮説を前提にすると,5%(ないしは1%)しか起こらないほどの偶然な結果ではないので,帰無仮説が間違っているとまでは言えない。」というだけのことである。
以上のことから,厳密に,低線量被ばくによる発がん等の健康被害が「ない」ということを立証することはそもそも理論的に不可能である(上記本項(1)参照)。
厳密な比較ができないゆえに統計学的な比較をする場合,統計学の理論的な性質上,「健康被害がない」ということを否定することはできるが,積極的に「健康被害がないこと」を立証することはできない。「健康被害がないことが否定できない」,という結果を「健康被害がない」と言い換えるのは,統計を知らない(ないしは悪用した)詭弁である。概ね100~200mSv以下の被曝量においては過剰リスクが統計的に有意とはいえない,とは,100~200mSv以下の被曝量ならば安全という事実を立証するものではない。
以前、この裁判をはじめ、続けている初志を書きました。
今日、支援してくださる方とお話していて、もう一つ大きなことを思い出しました。
自衛隊インド洋派遣の時だったか、もしかしたら、湾岸戦争のときだったか、ああ、ついに日本は戦争当事国になったんだ、と思いました。
当時、派遣自体を批判する動きは結構ありましたが、これは日本が戦争に参戦することなんだ、たまたま米軍が圧倒的に強いからないけど、日本が爆撃されたりICBMを打ち込まれても仕方ない事態になったんだ、という私の感覚と同じ類のものは報道されませんでした(報道されたのかもしれませんが、あまりテレビを見ない私に届くほどには報道されていませんでした)し、国民の多くの人たちは、そういう意味付けを持って理解しなかったと思います。
改めていま検索してみて、そういう見解を発表している記事を見つけてちょっとうれしく思いました。
小学校の時、日本は世界に誇る憲法第9条がある、と習いました。ほとんどの日本人はそれを習ってきたはずです。しかし、日本全土が廃墟と化した後は、竹やりも武器だという過剰なまでの潔癖さがあったかもしれません。しかし日本人は冷めやすく、そしてなによりも、少しずつ日々の現実に妥協し魂を売ることで、面倒なことがない快適な生活をしてきました。
良しあしは別として、少なからぬ人が体を張ってでもという覚悟で(自分の問題として)自分たちの国の在り方を考えていたのは安保闘争の頃までなのでしょうか。
戦争をしないためには、いくつもの苦渋の決断が必要だと思います。たとえば中学の時に「永世中立国」と習ったスイスは、軍隊もない平和な国、というイメージを持ってましたが、実際には有事の備えを重視し、軍備にも非常に力を入れています。永世中立=軍隊もいらないというようなファンタジーでは、現実の国際社会で中立を保てません。そのスイスも、永世中立を捨てても経済を取るのか(=EU加盟問題)で揺れているようです。
話を戻すと、日々の無関心が、いつのまにか憲法第9条があるのに戦争をする国になってしまった現実に、一個人として、どう責任が取れるのか、それはずっと考えていました。
戦争をしないための、決定的な何かがあるのだとは思えません。
しかし、大事な問題であるなら、自分がおかしいと思ったことにちょっぴり目をつぶって、魂を売るのはやめたい、そんな風に思いました。
原発事故を引き起こした責任、、、おそらく集団的無責任体制と利権に左右される政治・行政は目をつぶってはいけない問題だと感じました。
デモをするのもいいでしょう。政府に抗議の電話をするのもいいし、ネットでいろいろやるのもいいでしょう。多くの人が自分がやれることで社会がよくなるための何かをすればいいと思います。そんなわけで私は様々な矛盾*を感じながらも東電を訴えました。
*:東電の役職員は給料をもらって会社のお金で裁判をしていて、我々は本業の合間に自分のお金で裁判をしているとか、裁判に勝って賠償金をもらっても結局それは電気代の値上げにつながり行って来いだとか、、、、