読者です 読者をやめる 読者になる 読者になる

Take a Risk:林岳彦の研究メモ

自らの研究に関連するエトセトラについてのメモ的ブログです。主にリスク学と統計学を扱っています。

みなさまにご相談:この生涯当たりリスクの簡易概算法ってOKですかね?

リスク 統計

今日はちょっと「生涯当たりリスクの簡易概算法」を思いついたのですが*1、この考え方でOKかどうかの相談も兼ねて書いてみたいと思います。

前置き:比較の際にはリスクの単位に気をつけよう!

異なる事柄のリスクの比較をするときによく間違えやすいのが、異なった単位のリスクの値をうっかりと比べてしまうことです。

例えば、あるリスクが「一生涯当たりで0.1%(1000人に1人分)の死亡リスクの増加」であるとしましょう。そのとき、もう一つのリスクが「年当たり0.01%(10000人に1人分)の死亡リスクの増加」であるときに、単位の違いを考えずに「前者のリスクのほうが高い」と早合点してしまうことが良くあります。

そのため、多くの場合には「生涯当たり」の単位に値を統一して比較を行う必要があります。しかし、人口統計データに載っているガン死亡率などのデータはしばしば「年当たり」のデータであり、これを「生涯あたり」に換算するのはテクニカルにけっこう面倒くさい作業だったりします。

これってOKかな?:死亡要因の年次割合から生涯当たりリスクを概算する

そんなときにちょっと思いついたのは、

一生涯において要因Xにより死亡するリスク(確率)

というのは、

  • 人口の年齢分布が経年変化しない
  • 社会的・環境的要因が経年変化しない

という(強い)仮定のもとでは:

一生涯において要因Xにより死亡するリスク
≒ある基準とする年の要因Xによる死亡数/ある基準とする年の全死亡数

というやり方で近似・概算できるのではないだろうか、というアイデアです*2。一見ちょっとトリッキーなかんじですが、要するに一定の仮定のもとでは「死因の割合ってそのまま生涯当たりのリスクの近似とみなせるよね?」という考え方です。


これって概算法のアイデアとして合ってますかね?>リスククラスターなどの方々

【20110615追記:人口学クラスターの方からコメントをいただきましたので追記します*3。結論から言うと、この方法だと、それなりのバイアスが入るのは避けられないようです*4 *5。ただし、仮設コーホートを使った標準的な手法から得られる結果と比べても、値がずれる場合でも1〜2割程度のずれに留まるようです*6。なので、あくまでフェルミ推定的な近似的概算法だと割り切れば、現時点では*7そこそこ使えるものと思います。】


ちなみに、この計算の前提となる

  • 人口の年齢分布が経年変化しない
  • 社会的・環境的要因が経年変化しない

というのは強い仮定ではありますが、リスク計算の目的が「将来のリスク」や「過去のリスク」の推定ではなく、とりあえず「基準とする年におけるリスクのありよう」の大まかな推定であるならば*8、そんなに変な仮定ではないものと思います*9

OKなのかよく分からんが試算してみた

というわけで試算してみました。

使ったデータは
厚生労働省:平成21年人口動態統計(確定数)の概況

第6表 性別にみた死因順位(第10位まで)別死亡数・死亡率(人口10万対)・構成割合(PDF
です。

この表によると、基準とする年(H20年)*10の全死亡数は「114万2407人」です。一方、ガン(悪性新生物)による死亡数は「34万2963人」なので:

一生涯において要因Xにより死亡するリスク
≒ある基準とする年の要因Xによる死亡数/ある基準とする年の全死亡数

の概算式を用いると、「一生涯にガンにより死亡するリスク」は「約0.30」になります。学校のクラスをイメージして、1クラスが40人だとすると、だいたい1クラスに12人が生涯のうちにガンで死亡するというイメージになるかと思います。ここで「男性のガンの原因の40%がタバコに起因する」と仮定してかなりざっくりと概算すると、ガン死亡リスクの内訳の一つとして「男性が一生涯にタバコによりガン経由で死亡するリスク=約0.12」と概算できるかと思います*11

一方、「不慮の事故」による死亡数は「3万8153人」であるため、「一生涯に不慮の事故により死亡するリスク」は「約0.033」です。1クラスが40人だと、だいたい1クラスに1人強が生涯のうちに「不慮の事故」で死亡するというイメージになります。さらに、その内訳を見ると、主なところでは「窒息9419人」「交通事故7499人」「転倒・転落7170人」「溺死6484人」になります。それぞれのリスクは「窒息リスク=約0.0082」「交通事故=約0.0066」「転倒・転落リスク=約0.0063」「溺死リスク=約0.0056」と概算されます。

また、「自殺」による死亡数は「3万229人」であるため、「一生涯に自殺により死亡するリスク」は「約0.026」と概算されます。1クラスが40人だと、だいたい1クラスに1人が生涯のうちに「自殺」で死亡するというイメージになります。


ここで参考までに、ある化学物質*12にある人が強く暴露されたときに、「一生涯にその化学物質による暴露によって死亡するリスクが0.001(0.1%)だけ純増」したとしましょう。このときのリスクの純増分は、交通事故による死亡の生涯当たりリスクのだいたい1/6程度に相当することがわかります。このレベルの暴露があったときには、1クラスが40人だと、だいたい25クラスに1人が生涯のうちにその化学物質が原因で死亡するというイメージになります。

まとめ

せっかくなので、上の結果をちょっと表にまとめてみました。あくまで概算なのでだいたいこんなもんかー、という感じで捉えていただければ良いかと思います。

要因 内訳の項目 死亡数(人) 生涯当たり死亡リスク
ガン 34万2963 約0.30
タバコ経由のガン(男性) 約0.12*13
不慮の事故 3万8153 約0.033
窒息 9419 約0.0082
交通事故 7499 約0.0066
転倒・転落 7170 約0.0063
溺死 6484 約0.0056
自殺 3万229 約0.026


ふう。自殺が多いことは有名な話ですが、意外と、溺死・窒息・転倒・転落による死亡も多いんですね*14。。。

というか、この生涯リスクの概算法って本当に妥当なのでしょうか?(もし妥当なら普通の人でも簡単に概算できるのでかなり有効だと思うのだけれど。。。)
というわけで今回の結論:この考え方の検証・検算を大歓迎します!*15
【→*妥当性については上記の追記コメントをご参照ください*】



【*補遺:尚、死亡数だけでなく、「若くして死ぬこと」により重み付けを置いたリスク指標として「損失余命」という概念があります。興味のある方はぜひググってみてください】

*1:車輪の再発明である可能性も高い

*2:ここでの「リスク」は全人口での平均をとった値であることに注意

*3:Iさま大変感謝いたします

*4:まあ強引な仮定を置いているのであたりまえと言えば、あたりまえですが

*5:細かく言うと、「現在の年齢別死亡率と出産数から求められる安定例分布」と「現在の人口ピラミッド」の間の乖離が大きいほど、この近似の精度は悪くなる性質があります。特に、死亡率の高い高齢部分での乖離が大きいほうがより精度が悪くなります。

*6:33%->30%、とか10%->12%とか

*7:ベビーブーム世代が死亡率の高い年齢区分に入ってくると推定の精度がさらに落ちる

*8:ちょっと専門的に言えば「この推算が"prediction"ではなく"projection"であるという立場をとるのであれば」

*9:ですよね?

*10:「不慮の事故」の内訳データがH20年しか見つからなかったのでH20年を使いました。とくに深い意味はないっす

*11:ここでの計算は「ガン=死亡」などなどのかなり強い仮定のもとでのかなりざっくりとした概算であることにご注意ください/あとここでの0.12というのは男性に限定した場合の値です(男性である場合の条件付き確率)

*12:ちなみにここは「放射線」でも論旨は変わりません

*13:男性にとってのリスクの値であることに注意/かなーりのざっくりした概算であることに注意

*14:小さい子どもをお持ちの方、誤飲には気をつけましょう!また幼児の居る家ではお風呂に残り湯を残しておくのは意外と本気で危険だからダメ絶対!

*15:検証・検算していただいた知人の皆様には今度なにかおごらさせていただきますよー