Take a Risk:林岳彦の研究メモ

自らの研究に関連するエトセトラについてのメモ的ブログです。主にリスク学と統計学を扱っています。

何人いれば適切なの?:学術知と政策とテクノクラート

どもです。林岳彦です。いまだに壇蜜檀ふみの区別がつきません。

さて。


1月はずっとPM2.5の基準値に関するUS EPA(米国環境保護庁)の文書を読んでいました。で、それらの膨大な文書群(総計約5000ページ!)をチェックしていく中で、「学術知と政策を繋ぐセクションにおける日米のマンパワーの差」について改めて痛感せざるをえない部分がありましたので、今日はその辺りについてつらつらと書いて行きたいと思います。

「経済学」と「政策」のあいだ:日本のマクロ経済モデルの"中の人"の数

さて。どういうところから話を始めようか迷ったのですが、とりあえず経済学界隈の話から始めてみようかと思います。

SYNODOSの「日本を変える知」という本の中で:

日本を変える「知」 (SYNODOS READINGS)

日本を変える「知」 (SYNODOS READINGS)

経済学者である飯田泰之さんが「学術知と政策を繋ぐマンパワー」について語っているところを引用してみます(69pより引用、強調引用者):

私はいま、経済社会総合研究所という内閣府の部署で、日本のマクロ経済モデルの現代化に関する研究・開発グループに所属しています。自分で言うのもなんですが、結構重要な仕事だと思います。


それを何人でやっているかというと、専任が2人、任期付専任が2人、私のような客員が3人で、あとは外部有識者の協力という体制です。従来型のマクロモデルの改善に当たっている人数はもっと少なくて、しかも担当者はしょっちゅう異動で変わるので知識が蓄積されない。マクロモデルを作成しているのは政府では内閣府と日銀くらいですが、日銀も内閣府よりやや大きいグループが二つ三つあるくらいのようです。


この状況を海外の中央銀行関係者に説明してもたいていは信じてくれません。たとえば、カナダでは中央銀行の部局ごと、そして省庁ごとにマクロモデルを開発しています。それぞれのグループに博士号を持ったエコノミストが何人も常駐し、リサーチアシスタントを使ってマクロモデルを開発しています。政策リサーチが必要だという認識が強いんです。アメリカに至っては、もう数えきれない数のシンクタンクが実証的な政策分析をしている。


それに比べて、世界第2位の経済大国でマクロ政策の大規模な分析・予想ツールを作っているのが、合計しても20人程度だなんて、考えただけでも恐ろしいですよ。

はい。

みなさまは、この:

「アメリカに至っては、もう数えきれない数のシンクタンクが実証的な政策分析をしている」
「世界第2位の経済大国でマクロ政策の大規模な分析・予想ツールを作っているのが、合計しても20人程度だなんて、考えただけでも恐ろしい」

という文章を読んでどう思いますか?


「考えただけでも恐ろしい」でしょうか?


もしかするとこの文章を読んで新鮮な驚きを感じる方も多いのかもしれませんが、あの、これ、日本の公的セクション系で働くひとにとっては実に「あるある」な話なんですよね。。。

「環境科学」と「政策」のあいだ:US EPA環境省の"中の人"の数

では、私にとってもっと身近な例として、環境科学関連の事情を見てみたいと思います。

単純に、US EPA(米国環境庁)と日本の環境省の人数を比べてみます。

実はこんなかんじになっております:

US EPAが17359人、環境省が1235人です*1。人員数で10倍以上の差があります。

ただし、この比較はフェアではないかもしれません。なぜかと言うと、US EPAは行政組織であると同時に、研究機関も兼ねているからです。日本の感覚で言うと「US EPA = 環境省+国立環境研究所」というのがより実態に近いかもしれません。

では、国立環境研究所の人数も加えてみましょう(人数のソース):

はい。国立環境研究所の実質的な人数は390人程度なので*2、それほど人数は変わりません。

どちらにしろ、人員数は10倍程度の差があります。


もちろんUS EPAと日本の環境省では業務内容に違いがある(かもしれない)ので、単純な人数比較は厳密には余り意味がないかもしれませんが*3それにしてもかなり人数に差があるわけです。


そうなんすよ。

プレーヤー側から見える景色:「野球場でオレひとりぼっち」的な不安

で、私の経験からは、このような彼我の「マンパワーの差」を実感する機会は普段はそんなにありません。


だがしかし、国際会議や国際学会などで欧米の公的機関系の中の人に会ったり、欧米のテクノクラート*4たちが本気で作った文書を読んでしまったりすると、やはりその圧倒的な彼我のマンパワーの差に正直目眩がします。

なんかですね、自分の感覚が「野球場のだだっ広いフィールド全体を全部ひとりで守ってる」という感覚だとすると、欧米のテクノクラートは「野球場のフィールド全体に9人、それぞれの領域に特化した高い専門性を持った人員がちゃんと配置されていて、それぞれの領域をがっちり守っている」ような感じなんですよね。で、そういう実情を目の当たりにしちゃうと

「あれ??? もしかして野球(テクノクラート)って本来そういうスポーツ(存在)だった!?」

的なものすごく根源的なカルチャーギャップおよび不安を感じてしまうんですよね。「圧倒的(に手薄)ではないか我が軍は」的な。テラヤバス(悪い意味で)的な。


なんというか、欧米でも日本でも「いわゆる"テクノクラート"が『学術知と政策』の間を繋いでいる」と言えるとは思うのです。でもその一方で、「欧米におけるテクノクラートと日本におけるテクノクラート」の量感って、 やっぱり「壇蜜檀ふみ」の量感くらいには違うよね、という感覚も現場にはごくフツウにあったりするわけです。

欧米では「民間のテクノクラート」の層もまた分厚い

欧米と日本でのテクノクラートの違いに関して、もう少し述べてみたいと思います。(*ここからは、"テクノクラート"の語を「高度な学術的専門知を活かすことを求められて公共政策/行政に関わる人たち」という広義の意味で使っていきます)

実は、国際会議などに出たときに欧米と日本の差を最も感じるのは、公的セクション以上に、民間のコンサル/シンクタンク企業における「人材の厚さ」と「存在感」における差だったりします。欧米では、それらの企業に在籍する専門家がとてもディープに「学術的専門知を活かすことを求められて公共政策/行政に関わって」いたりします。というか、関わっているどころか事実上「胴元として主導」していることもあります*5

日本だと、一般的にはコンサル企業は「官公庁の下請け」的な位置づけのことが多いように思います。一方、欧米ではそれらのコンサル企業と官公庁の「中の人」がしばしば入れ替わったりしてることもあり、学術知と政策を繋げる業務における「位置づけ・専門性・人材の厚さ」の全てでコンサルが官公庁に勝るとも劣らない実力と存在感がもっていたりします*6


というわけで、公的セクションのみならず民間においても、欧米と日本における「学術知と政策を繋げる人材」の状況は「壇蜜の誕生日パーティと段田男の誕生日パーティ」の状況くらい大きく異なるわけです。

欧米の「テクノクラート支配」:"PhDリーグ"の存在

はい。では次は、欧米と日本における「テクノクラート支配」の違いについて考えてみたいと思います。


ざっくり言うと、近代以降の社会はとても複雑なので政策遂行において高度に専門的な知識が必要になることが多いです。その結果、(意思決定の"正統性"を持つ政治家や市民ではなく)テクノクラートが事実上の政治的決定を担いがちになります。そのような状況に起因する実害が大きくなると、「テクノクラート支配による弊害ガー」という声が出てきます(←今ココ)。

で、現代社会においては欧米でも日本でも文言としては同じく「"テクノクラート支配"が起きている」と言えるとは思うのです。ただし、欧米のそれと日本のそれはやっぱり「壇蜜写真集と仏壇写真集」くらい内実の異なるものであるように思われます。(*以下からは基本的に私の観測範囲に依る話でありエビデンスが不十分なので話半分に聞いてくださいね)

何が異なるかというと、欧米では高度に専門的な政治的決定に関して「政・官・学・産・民」における比較的広い範囲の利害関係者が関与できているように思います。なので、その意味での「権力の偏在」は、欧米では比較的弱いと言えるかもしれません。

但し、これってもう少し細かくというか意地悪く書き直すと、実際に関わることができるのは『「政・官・学・産・民」の様々な利害関係者(*但しPhDホルダーに限る)』だったりするんですよね。。。立場としてはいろんな方面のアクターが参加できるのですが、実質的な参加条件として「PhDホルダーであること」というのがわりと強固にあり、その意味で、学術知の担い手としての「PhDホルダー」に権力が偏在している、とは言えるのかなぁと思います。

また、このような状況を前提に、政・官・学・産・民がPhDホルダーを"用心棒"として採用することにより、政・官・学・産・民において「テクノクラート」の分厚い層が形成されてきているという側面もあるのだと思います。


一方、日本ではそもそもテクノクラート的な業務をしている人の中で博士号を持っている人は寧ろマイノリティだと言えるでしょう*7。なので日本には、欧米の"PhDリーグ(PhD/博士号を持っている人以外が議論に参加することが基本的に前提とされていないような場所/領域)"のようなものはありません。むしろ、先日の麻生財務相の「日銀総裁に学者はふさわしくない」発言に典型的に見られるように、日本では学術知よりも素人知の方が(善かれ悪しかれ)尊重される傾向があるように思います。

その意味で、日本の場合には、「テクノクラートへの権力の偏在」と言った場合にはどちらかと言うと、「政・官・学・産・民」の「セクター間での権力の配分」における「偏在」の意味が比較的*8強いのかなぁ、と思います。

PhDリーグにおける「学術的disciplineによる支配」

で、様々な立場を代表するテクノクラートたちによる"PhDリーグ"が形成されて、その中で"(サブ)政治"が回るようになって何が生じるかというと、良くも悪くも「学術的disciplineの支配」みたいのが生じてるのかなあと思います。(*ここでの「学術的disciplineの支配」というのは「法の支配」のニュアンスで理解いただければと思います)

欧米の"PhDリーグ"の中ではいろんな立場からのシュートな論戦が起こりうるのですが、"PhDリーグ"における基本的ルールとしての「最初に言っておくが学術的におかしいことはNGだぜ」という"掟"はわりと強いように思います。その"掟"によって、各自が持つ政治的思惑/ポジショントークの暴走に対して一定の歯止めがかかっているように思います*9


一方、日本の場合には層としての"PhDリーグ"というものがなく(そもそも"リーグ"を形成できるだけの人数がいない!)、その結果としてテクノクラートによる「学術的disciplineの支配」の機能も弱いように思います。なので、わりと学術的におかしいことも政治的意向(というか単に少数の「声の大きい人」の意向)によってまかり通ってしまう傾向が強いのではないでしょうか。

地味だけど重要な問いとして:「何人いれば適切なの?」

はい。


では、最後にまた「人数」の話に戻って来たいと思います。

本記事の最初の方で、US EPAと日本の環境省の人数が10倍以上違うという話をしました。

さてさて。では、果たして、そもそも環境省には「何人くらいいるのが適切」なんでしょうかね?


人口比を考えれば、日本の環境省もUS EPAの1/3くらいの人数(6000人くらい)は居てもおかしくないでしょうか? あるいは寧ろ、人口が小さいからといって「対応しなければいけない問題の数」というのは単純に比例して減少するようなものではないので、US EPAと同じくらいの人数がいても良いのだ、という考え方もあるかもしれません。

あるいは逆に、テクノクラティックな業務のクオリティは人数には比例しないので、人数は今よりももっと少なくても良いのだ、という考え方もありうるのかもしれません。実際に、公務員の定員削減により官庁や政府系研究所の人数は着実に減らされてきていますし。


で、やっぱり、結局のところ、この「そもそも何人くらいいるのが適切なの?」という問いにはアプリオリな「正解」はないのだと思います。

でも、この問いって地味だけどとても重要だと思うんですよね。「官庁(および広義のテクノクラート)の中の人が少なすぎ」というのは、高度な学術的判断を伴う政策・行政の機能不全に繋がりうるひとつの明らかな「リスク要因」ですし、その「リスク」を我々(市民)はどこまで許容するべきなのか、というのは真剣に考慮に値する問いなのではないでしょうか?

(例えば、原発事故の前後で原子力規制委員会などが明らかに機能していなかった点を省みるにあたっては、この「そもそも原子力規制委員会には何人いるのが適切なの?/適切だったの?」という問いも主要な問いの一つとしてあってしかるべきだと思うんですよ)

まとめ

はい。というわけで今回も長くなってしまいました。

今回のキモを短くまとめてみます:

  • 日本では学術知と政策を繋ぐ役割を担う「中の人」の数がとっても少ない
  • プレーヤー側から見るとやっぱり正直不安だったりします
  • 欧米では(善かれ悪しかれ)「PhDリーグ」による「学術的disciplineによる支配」が機能しているっぽい
  • 「何人いれば適切か?」というのは地味だけどとても重要な問いだと思うよ
  • 壇蜜檀ふみは違う


はい。


うーむ今回はあまりとりとめないエントリーになってしまったような気もしますし、エビデンスに欠ける感想文的な話に終始してしまったような気もしますが、まあその辺りは割り引いてご理解いただければ幸いです(ども申し訳ない)。



(次回のエントリーからはしばらく「統計的因果推論」周りのエトセトラについてガッツリ書いていきたいと思います)

*1:*但しソースはwikipedia環境省は定員数ではなく2011年の職員数

*2:職員255人+ポスドク等契約研究員135人

*3:ちなみに国立公園は日本では環境省の管轄ですが、米国では内務省の管轄です

*4:官僚や政府系研究所で専門知を活かして公共政策/行政に関わる人たち

*5:例えばこの時のOECDの会議もそうでした→[http://d.hatena.ne.jp/takehiko-i-hayashi/20110909/1315544002:title=過去記事]

*6:もちろん場合にもよりますが

*7:研究機関にいる人は殆ど持ってるけど、霞ヶ関にいる人は殆ど持っていない

*8:欧米と比較的した場合ね

*9:本当のところはよく分からんけど

発表資料アプ/連続的なリスクのどこに「線」を引くのか:米国EPAのPM2.5基準値改訂、その"正当化ロジック"を読む

こんにちは林岳彦です。ここ数ヶ月の「朝7時55分のもこみち」と「朝8時10分あたりのもこみち」の落差は大魔神佐々木のフォークといい勝負だと思います。


さて。

今回は昨日のFoRAM研究会での発表資料をアップしてみます*1

研究会当日はこのスライド資料を見ながらiPadで適宜拡大+書き込みながらプレゼンしたので、このスライド資料だけをこの形で見せられてもよくわからないかもしれませんが、とりあえず「こういうかんじの話をしましたよ」というご報告まで。


ちなみに昨日の研究会の案内文は以下(もうちょっと詳しい案内はこちら):

「連続的なリスクのどこに「線」を引くのか:米国EPAのPM2.5&オゾン基準値から見る"基準値ガバナンス"」

日時:2013年1月23日(水)14:00〜17:30頃(このあと懇親会を予定しております)

場所:産総研つくば西事業所本館第二会議室
===

講演(1)「連続的なリスクのどこに「線」を引くのか:米国EPAのPM2.5基準値改訂、その"正当化ロジック"を読む」
林 岳彦(国立環境研究所)

講演(2)「米国EPAのオゾン基準値の変遷を例に、疫学研究、諮問委員会、規制影響評価、判例などの役割、すなわち「基準値ガバナンス」を考える(仮題)」
岸本 充生(産業技術総合研究所

===
今回は、PM2.5(微小粒子状物質)とオゾン(光化学オキシダント)という近年話題の(だけど伝統的な)大気汚染物質について、その環境基準値の策定という、アカデミックな科学(疫学調査や動物試験)と政策意思決定(基準値の策定)をつなぐレギュラトリーな科学の部分に焦点をあてて、その背景、ロジック、説明の仕方(これこそリスクコミュニケーション!)などついて、米国の事例を紹介し、議論したいと思います。あわせて日本の現状と向かうべき方向などについても議論できればと思います。

ちなみに「ていうかPM2.5って何?」という方は是非こちらをどうぞ(リンク集もあります):

PM2.5の基礎情報:その定義と発生源と環境中濃度と健康影響と基準値とYシャツと私(v1.2版) - Take a Risk: 林岳彦の研究メモ


#今後ちょっとまた暫く更新が止まるかもしれませんが、何卒よろしくメカドック >みなさま


.

*1:おかげさまで大変盛況でした

PM2.5の基礎情報:その定義と発生源と環境中濃度と健康影響と基準値とYシャツと私(v1.2版)

こんにちは林岳彦です。はじめて買ったCDは「種ともこ」です。


さて。

私はここ最近は来週のリスク評価研究会での発表のために、PM2.5関連のいろんな文書を読んでました。

ちょうどそんな折、中国のPM2.5汚染がホットなニュースになっているようなので、もののついでに「PM2.5」についての情報をつらつらとまとめてみようと思います。(もし図が小さすぎる場合にはクリックしてみてください)

(ひとくちで言うと、 PM2.5は濃度としてはおそらく1970年代(高度成長期)をピークとして後は一貫して低下するようなある意味"古典的"な汚染物質なのですが、現状でもそのリスクは低くはない、というかんじの物質です)

【編集注:2012/1/18の21時くらいに発生源の項および資料リストをupdateしてv1.1としました】【編集注2:2012/2/5に1970年代のSPM濃度データとして吉野(2012)からの引用を加えてv1.2としました】

PM2.5って何すか?


PM2.5とは、粒径が2.5μm以下の粒子のことです。上の図では髪の毛とP2.5の大きさを比べていますが、だいたい髪の毛の太さの30分の1くらいですね。花粉(Pollen)が10μmくらいなので、花粉よりもさらに1オーダー小さいかんじになります。

サイズが問題なの?


サイズが問題です。2.5μm以下だと鼻や喉でトラップされずに気管方面に直接入り込んでしまい、健康に影響が出やすくなります(後述)。

PM2.5の中身(成分組成)は?


PM2.5の成分組成は場所により、また時により異なります。(少なくとも日本の場合には)多くの場合には概ね上図のような割合比で、EC(元素状炭素)、OC(有機炭素)、NO3イオン、SO4イオン、NH4イオンなどから構成されます。

おそらく「成分ごとに毒性が異なる」可能性も高く、そのような観点からの研究も盛んにされているのですが、未だあまり明確なところは良くわかっていません(けっきょく粒径が一番クリティカルな要素なのかも?)。

PM2.5はどうやって発生するの?



PM2.5の内訳を大きく分けると(1)燃焼等の際に最初から粒子として発生し直接大気中へ排出されるもの、(2)大気中においてNOxやSOxなどの反応によりガスから生成されてくる粒子、の2つに分かれます(上図参照)。前者を一次生成粒子、後者を二次生成粒子と呼びます。PM2.5の発生源としてはこのどちらも重要です。

【*v1.1版でこのパラグラフ追加*】ちなみに人為的影響の無い(少ない)地点でもPM2.5濃度は5〜10μg/Lm3ほどはあるようです。(つまり、5〜10μg/Lm3程度は自然発生源由来と解釈できます→ 手島 2010 *1

一次粒子の発生源には少し意外なものもあります。発生源(と目されるもの)におけるPM2.5の濃度を見ていきましょう:



「燃焼由来のPM2.5」の発生源として、廃棄物の焼却炉を思い浮かべる人も多いかと思います。しかし、上図から分かる通り、現在(H20調査)は廃棄物の焼却炉からは殆どPM2.5は出ていません(70μg/m3程度)。

これは昔からそうであったわけではなく、ダイオキシン対策のために焼却炉が高性能化したために排出が少なくなったものと思われます(ぱちぱち)。H12調査でとH20調査での「ばいじん」を比較すると、高性能化前後での違いをうかがい知ることができます。

一方、管理されていない燃焼からはけっこうな量のPM2.5が出ているようです:


この図によると、「野焼き」のPM2.5は「15000μg/m3」程度のようです。(実際に、伏見ら(2011)の総説で言及されている研究(Hagino et al. 2006)では、冬期の埼玉におけるPM2.5中の全炭素に対して野焼きが12〜55%(平均31%)寄与していると推定されているそうです*2

室内での例を見てみると:


家庭の厨房(つまり調理)でも「700μg/m3」程度のPM2.5が発生しているようですね。調理の際にはPAH(ベンゾピレンなど)なども発生しますし、できるだけ換気を心がけたいものです。

【*v1.1版でこのパラグラフ追加*】 上野(2010)によると、2008年度の都内17か所での冬期の調査にもとづく計算からは次のような発生源別寄与割合が推定されたようです:


2次生成粒子が6割くらいを占めているようですね*3。自動車排ガスの寄与は全体の16%ほどになっています。


#中国からの影響なども含めて発生源についてのさらなる詳細を知りたい方は、伏見ら(2011)上野(2010)樋口(2010)の御一読をオススメいたします!

環境中のPM2.5濃度はだいたいどうなってるの?

まずは長期のトレンドを探ってみましょう:


この図は、SPM(粒径が10μm以下の浮遊粒子状物質)とPM2.5の年平均値の経年変化を示したものです。ここ30年の間にSPM濃度が着実に減ってきていることが分かると思います。

2000年以前のPM2.5の測定データはありませんが、ザックリと考えて、SPM濃度の0.8倍くらいがPM2.5濃度になるという対応が概ねあるので、1980年のPM2.5濃度(年平均)はだいたい「35-45μg/m3」くらいであると推測できます。SPMのグラフの傾きを見ると、1970年代のPM2.5濃度は高いところ(工業地帯など)では年平均濃度で「60μg/m3」以上あったとしても何ら不思議ではないでしょう(*憶測*)。

現状のPM2.5の年平均濃度は「15-20μg/m3」くらいなので、おそらくPM2.5濃度は1970年代より相対的にはかなり減っているものと思われます。(が、ご存知の通り、お隣の中国が未だ日本の高度成長期的な状態なので、なかなか大変です)

【*v1.1版での追記*】 上野(2010)内のグラフを見ると、都内の自排局の場合には1990年にもかなり高いピーク(SPM濃度で70μg/m3程度)があるようです)


【*v1.2版でこのパラグラフ追加*】 吉野(2012)に、00年代中盤の中国と70年代の日本のSPM濃度*4の図があったので追加で引用しておきます:


1974年のデータを見ると、大田区、北九州市でSPMの平均濃度が90μg/m3に達していることが分かります。0.8倍換算で考えると、これらの地域では1970年代のPM2.5濃度は年平均で70μg/m3くらいあったと考えても何ら不思議はなさそうです。【*v1.2で追加されたパラグラフはここまで*】 


もう少し短期のトレンドも見てみましょう:


この図は2001-2008のPM2.5の年平均値(の平均値)の経年変化です。黒四角が非都市部、白丸が都市部、黒三角が自排局(自動車の影響が強いと思われる測定地点)になります。

現状では、だいたい都市部と自排局が「20μg/m3」、非都市部が「15μg/m3」くらいになっています。

トレンドを見ると自排局の濃度が着実に下がっていることが分かります。これは、 ディーゼル規制などにより、自動車由来のPM2.5が少なくなったためだと思われます(ぱちぱち)。(ちなみに80年代以前とは異なり、現在では、自動車からの排ガス由来のPM2.5はそれほど多くないそうです→ 上図の発生源寄与率の推計では自動車由来は全体の16%)

最後に、日変動も見てみましょう:


この図は青梅街道におけるPM2.5濃度の日変動を示したものです。低い時は「10μg/m3」、高い時は「60μg/m3」程度の濃度になっていることが分かります。

こういう大きな変動は、もしかしたら環境データを見慣れていない人は驚かれるのかもしれませんが、大気中や河川中の環境中濃度ってけっこうこれくらいは普通にばらつくものだったりします。(わりと高度なことをサラッと書きますが、大気や河川中などで起こりやすい拡散濃縮過程での誤差影響は相乗的に効くので、濃度分布が対数正規分布的になりやすいのです)

また、上図の値は24時間平均値ですが、もし1時間平均値のデータを見てみれば、値は当然もっともっと大きな範囲でばらついているはずです。(そのため「1時間平均値」と「24時間平均の基準値」を比較すると、単に通常のばらつきの範囲内の変動でも、「1時間平均値」がその「24時間平均の基準値」を大きく超えるケースはフツウに頻繁に起こりえます)

PM2.5は健康に影響はあるの?

米国EPA(環境保護庁)が2009年にまとめた科学レビューの結論は以下のようになっています:


短期・長期曝露の影響ともに死亡率(Mortality)および心臓血管系への影響*5(Cardiovascular Effects)に関しては「因果的影響あり(Causal)」、呼吸器系への影響に関しては「因果的影響がありそう(likely to be causal)」という判定になっています。

一方、がん(Cancer)に関しては「示唆的(Suggesstive)」に留まっています*6

影響の大きさについての疫学結果も見てみましょう:


この表は、「長期間のPM2.5濃度が10μg/m3増加したとき」の健康影響に関する複数の疫学研究の結果をまとめたものです。

上の表の"Effect Estimates (95CI)"というのは、「PM2.5濃度が10μg/m3増加したとき」の相対リスク*7の推定値(とその95%信頼区間)を表しています。例えば、一番上の行の"Zeger et al. (2008)"を見てみると、Outcomeは"All-Cause Mortality"、"Effect Estimate"は1.15程度になっています。これは、「PM2.5濃度が10μg/m3増加したときに、全死亡率の相対リスクが、1.15倍になっている」ということです。

上記の図を見ると、全死亡で見たときの相対リスクは1.03〜1.2くらいの値をとっていることが判ります。これは、ものすごくザックリ言うと*8、だいたい「長期的にPM2.5濃度が10μg/m3増加」すると「100人の死亡者がいたらそのうちの3人から20人くらいがPM2.5が原因で死亡してるはず」ということになります*9


この潜在的なリスクはかなり高いものであると言えます。(現状の環境中化学物質の中では屈指*10の高リスク物質だと思います)


(*ちょっと「但し書き」を書いておくと、上記に示した疫学研究は米国/米国人を対象としたものなので、日本のケースに上記の研究結果がそのまま当てはまるかどうかについては一定の留保が必要になります。例えば、米国人は心臓血管系の疾患のベースレートが高いので、心臓疾患系の死亡リスクが日本よりかなり高い可能性があります。その辺りの議論については中央環境審議会(2008)微小粒子状物質環境基準専門委員会報告をご参照ください*)


#PM2.5の健康影響に関する科学的知見の詳細を知りたい方はとにかくUSEPA(2009)Integrated Science Assessment for Particulate Matterをオススメいたします(*全1070ページもあるけど!)

PM2.5の環境基準値はどうなってるの?

そろそろ疲れてきたのであっさり書きますが:

  • 日本:年平均値15μg/m3;24時間平均値35μg/m3
  • 米国(2012/12/14に改訂):年平均値12μg/m3;24時間平均値35μg/m3
  • EU:年平均値25μg/m3*11
  • WHO:
    • (暫定目標1)年平均値35μg/m3;24時間平均値75μg/m3
    • (暫定目標2)年平均値25μg/m3;24時間平均値50μg/m3
    • (暫定目標3)年平均値15μg/m3;24時間平均値37.5μg/m3
    • (大気質指針)年平均値10μg/m3;24時間平均値25μg/m3

WHOは各国の内情に合わせて異なる目標値を用意しています。ざっくり言うと、中国は目標1(を遠いゴールとして目指す)、EUは目標2、日本は目標3、米国は「目標3と大気質指針のあいだ」くらいの現状になっています。

ちなみに、米国の最近の基準値改訂については来週のリスク評価研究会で発表する予定です。

PM2.5資料のリンク集(むしろここがメイン)

最後に、これからPM2.5について調べたい方々に向けての助けになるようリンク集を載せておきます。【v1.1での追加を赤で示しました】

全般:

    • 東京都環境局HP 微小粒子状物質(PM2.5)対策(←HP内に資料多数)(link
    • 東京都環境局シンポジウム(2010)微小粒子状物質(PM2.5)の現状と今後の課題link
    • 日本自動車工業会 (2011) 微小粒子状物質:SPMからPM2.5へ(link
    • 中央環境審議会大気環境部会(2008)微小粒子状物質環境基準専門委員会報告(link
    • 東京都微小粒子物質検討会報告(2011)(link
    • USEPA(2009)Integrated Science Assessment for Particulate Matter(link

発生源関係:

    • (*オススメ)東京都微小粒子物質検討会報告(2011)(link
    • 上野(2010)都内のPM2.5環境の現状と発生源調査の状況についてlink
    • 樋口(2010)東京都PM2.5総合調査の経過と今後の課題についてlink
    • 伏見ほか(2009)「PM2.5の実態解明に向けて ー 最近の研究と今後の課題 ー」(link
    • 微小粒子状物質(PM2.5)等発生源調査結果報告書(2011)(link

健康影響:

    • (*オススメ)新田(2010)PM2.5 の健康影響と環境基準(link
    • 大気汚染に係る粒子状物質による長期曝露調査検討会 (2009)大気汚染に係る粒子状物質による長期曝露影響調査報告書(link)
    • 中央環境審議会大気環境部会(2008)微小粒子状物質環境基準専門委員会報告(link
    • 中央環境審議会大気環境部会(2008)微小粒子状物質の定量的リスク評価手法について(link
    • (*オススメ)USEPA(2009)Integrated Science Assessment for Particulate Matter(link
    • Krewski et al. (2009) Extended Follow-Up and Spatial Analysis of the American Cancer Society Study Linking Particulate Air Pollution and Mortality (link

基準値関係:

    • (*オススメ)新田(2010)PM2.5 の健康影響と環境基準(link
    • 欧米における粒子状物質に関する動向について (link)
    • 欧州における新大気質に関する指令について(link
    • 中央環境審議会大気環境部会(2008)微小粒子状物質環境基準専門委員会報告(link

てゆうか

書いてみたら思ったよりだいぶ長くなっちゃいました。誠にありがとうございます。。>ここまで読んでくれたみなさま

(Tシャツと私)

*12
.

*1:あ、あの手島さんじゃないすか!(今気づいた)

*2:ここ孫引きなので自信ない

*3:2次生成の過程はとても複雑で不明な点が多く、なかなか明確に有効な対策がないので難しいところです

*4:図中には"SMP"と誤記されているけど

*5:ちなみに想定される作用機序は[http://f.hatena.ne.jp/takehiko-i-hayashi/20130118084002:title=この図]のようなかんじらしいです

*6:疫学研究から、PM2.5の濃度上昇は肺がん死亡を増加させる一方で、肺がん罹患率は低下させるというmixedな結果が得られているため

*7:相対リスク=(PM2.5濃度が10μg/m3増加したときの死亡率/PM2.5濃度が10μg/m3増加してないときの死亡率)

*8:あまり正確な言い方ではない

*9:ちなみに最も質の高い研究と目されているっぽい[http://pubs.healtheffects.org/getfile.php?u=478:title=Krewski et al. (2009)]で示されている相対リスク値は1.03です

*10:というか一番かも/誰か他に候補思いつきますか?>識者がた

*11:この値に関してはなんか細かい設定があるようなんだけどちょっとフォローできてません/20μg/m3という説もある?

*12:ZAZEN BOYSの松下さんと吉田さんのサイン入りTシャツ。いいでしょ!

あの娘ぼくがiPadでプレゼンしたらどんな顔するだろう

今年も生きてるよ!明けましておめでとうございます。みなさま年末年始はどう過ごされましたでしょうか?*1


今日はエア後輩およびプレゼン倦怠期*2のみなさまに向けて、「iPadを用いたプレゼン」について書いていこうと思います。


さいきん私は、なるべくiPadを用いてプレゼンテーションを行なっています。

その理由は、「仕事にも使うから」という理由で妻にiPadを買うのを許可してもらったので、無理をしてでも仕事のどこかでiPadを使う必要があるからです。

はい。でも、いや、それだけではなく、iPadを用いたプレゼンには実際に幾つかの大きなメリットがあるので、つらつらと書いていきたいと思います。

メリット(1)スライドを拡大できる

まず第一のメリットは「スライドを拡大できる」という点です。

例えば、こんなスライドのとき:


上図の部分をこんなかんじに拡大(ピンチアウト)すると:


その図表の詳細について、スライドを変えぬまま話の流れを切らずに紹介していくことができます。

また、拡大できることにより図表のフォントサイズの制限が少なくなるので、例えば論文PDFを図表そのままコピペしても何とかなる場合も多く*3、プレゼン資料作成の手間を一部省力化することもできます*4

メリット(2)スライドにリアルタイムで書き込みできる

第二の大きなメリットは、スライドにリアルタイムで書き込みできることです(注:書き込み対応のアプリが必要)。

これは、例えば上記の拡大した図に:


のような注釈をプレゼンの最中にリアルタイムで書き込むことができます。


この「リアルタイムで書き込みできること」のメリットは、何といっても「プレゼンにライブ感が出る」ことだと思います。

聞き手の立場になってみると、プレゼンを聞いてると基本的になぜか突然ものすごく眠くなりますよね?

そのような聴衆を襲う睡魔を追い払うために有効なのは、プレゼンにできるだけ「ライブ感」を出すことだと思うのですが、「リアルタイム書き込み」はその「ライブ感」の演出として一定の効果があると思います。

(また、講義・講習などのときには、スカスカ気味のスライド資料を用意/配布して、話をしながら順次内容を書き込んでいくのも良いかと思います。最初からびっちり内容が詰まった配布資料を渡されると、つい配布資料を得た時点でなんだか満足してしまうというのが人のサガですよね)

メリット(3)ドヤ顔できる

第三のメリットは、「ドヤ顔」できることです。

今ならまだ、iPadを用いたリアルタイム書き込み」スタイルのプレゼンをする人は少ないので、このプレゼンスタイルを用いることにより周りの人に向けてドヤ顔することができます。

はい。できればこんなかんじでドヤ顔しましょう:





はい。


で、この「iPadを使ったリアルタイム書き込み」スタイルのプレゼンにはもちろんデメリットもあります

デメリット(1)もしプロジェクターにiPadが繋がらなかったら大ピンチ!

いちばん怖いのは、いざ本番となったときに「プロジェクターとiPadの相性が悪くてつながりません」となることです。

個人的には今までそういう事態になったことはありませんが、こうなる可能性はいつでもあるかと思います。もしあらかじめ動作確認ができる環境であるならば、プロジェクターとの相性は事前に確かめておきましょう

プレゼンを行う場所が出先の場合には、念のため、「iPadでのリアルタイム書き込み」ができない口頭のみの説明(PCでの説明)でもそれなりに成立するようなプレゼンの様式にしておきましょう。

デメリット(2)コネクタが抜けやすい

細かいところですが、iPadとDVIなどを繋げるケーブルは抜けやすいので、注意しましょう。

iPadを手に持ってプレゼンするのはやめたほうがいいかもです。

デメリット(3)盲点:字の下手さがバレる

あと、意外な盲点として、スライドにリアルタイムで字の書き込みをすると、字の下手さがみんなにバレてしまいます

なので、字が下手な人は、あらかじめ「まだiPadスタイラスの精度が悪いなぁ。。ちゃんと字を書いてるのに認識しくれないよぅ。。。」とプレゼンの最初のほうで独り言を呟いておくと効果的でしょう。


はい。

実はここからが本題:アプリとペンの選択について(2013年初頭版)

ということで、iPadでリアルタイム書き込みスタイルのプレゼンする際に悩ましいのは、プレゼンの際に使うiPadアプリとスタイラスペンの選択です。

私はいつもプレゼン資料のファイル自体はKeynoteかパワーポイントで作り、本番はそのファイルをPDFに書き出しして使っています*5。そのようなケースでは、プレゼンの際のiPadアプリに必要な要件は:

  1. PDFがキビキビ読めて、さらにスタイラスペンで快適に書き込みできる
  2. 動作が安定している(プレゼン途中でクラッシュしたらかなわん)
  3. 外部プロジェクターへ画面を映すことができる

の3つとなります。

現在のところ、この要件を満たすアプリの私のファーストチョイスはiPadの定番ソフトであるGood Readerです。

ASCII.jp:何でも見られる神ビューアー「GoodReader」を徹底解説 (1/4)|柳谷智宣の「神アプリの説明書」
iTunes の App Store で配信中の iPhone、iPod touch、iPad 用 GoodReader for iPad

なんといっても、アプリの安定感・PDF表示の速さ・取り回しの良さ*6などはさすがiPadにおける定番ソフトだと思います。ペン入力の反応も悪くありません(アップデートにより以前と比べても良くなっている気がする)。


ちなみに現在使っているスタイラスペンはこちらです:

iPad/iPhone用スタイラスペン(タッチペン) Su-Pen P170M-CLB (ブラック)

iPad/iPhone用スタイラスペン(タッチペン) Su-Pen P170M-CLB (ブラック)

ちょっとお高いですが、かなり書き味は良いです*7


そんなかんじが現時点での私のオススメです。

はい。


というわけで、みなさまも「iPadを用いたリアルタイム書き込み」スタイルのプレゼンにぜひ挑戦してみてはいかがでしょうか? (ていうかやってみるとプレゼンしていて意外と楽しいですから!)


【もし他にもオススメのアプリやペンなどがありましたら、いろいろブクマコメントなどをいただけましたら幸いです】


それでは、今年もよろしくお願いいたします。





(*ちなみに本エントリーの標題の件につきましては、"あの娘"がアラフォー以上だと「OHPみたいで懐かしいね!」という反応が返ってくることが多いです。。。)

*1:私は録り貯めていた「[http://ja.wikipedia.org/wiki/%E3%82%A6%E3%83%AC%E3%83%AD%E2%98%86%E6%9C%AA%E7%A2%BA%E8%AA%8D%E5%B0%91%E5%A5%B3:title=ウレロ未完成少女]」とhuluで見れる「ウレロ未確認少女」を見て過ごしました。面白すぎて最高すぎ、そして早見あかりの青春ゆえの輝きが眩しすぎの年末年始でした

*2:プレゼンのスタイルがすっかりマンネリ化してしまい、日々のプレゼン作成において新鮮味や楽しさが感じられず、ただただ「義務と演技」でプレゼンをこなすようになっている状態のこと

*3:論文ゼミのように相手も同じ資料を持っている場合には、むしろPDFからそのままコピペの方がコミュニケーションが捗ることもある

*4:もちろんその省力化がOKかどうかはプレゼンのTPOにもよります

*5:「プリント」からPDF書き出しをすると周りに若干の余白ができてGoodReaderのツールバーと被らないので捗る

*6:複数の資料を切り替えながら見せたいときに、異なるファイルをタブ切り替えできるのはかなり便利

*7:そもそも書き味優先ならば、アプリに[https://product.metamoji.com/ja/anytime/:title=Note Anytime]を使うというのも候補に入るかもしれませんが、少なくとも私のiPad(第三世代)で試してみた限りでは、PDFの表示が遅いのでプレゼン用としてはちょっとまだ難があると思います。ただ、「PDFに書き込みできるアプリ」としてはかなり快適なので、論文を読むときには現在私はNote AnytimeとSu-penの組み合わせでやっています

【研究会告知】連続的なリスクのどこに「線」を引くのか:米国EPAのPM2.5&オゾン基準値から見る"基準値ガバナンス"

ジーザスアンドメリークリスマス!やっと論文執筆に充てる時間がでてきたと思ったらもう年末という今日この頃です。みなさまはお元気でしょうか?


ところで来年の1月23日(水)に以下の研究会を行うので告知いたします:

第30回リスク評価研究会(FoRAM)を下記の通り開催します。みなさまのご参加をお待ちしております。:


「連続的なリスクのどこに「線」を引くのか:米国EPAのPM2.5&オゾン基準値から見る"基準値ガバナンス"*1


日時:2013年1月23日(水)14:00〜17:30頃(このあと懇親会を予定しております)

場所:産総研つくば西事業所本館第二会議室


===
講演(1)「連続的なリスクのどこに「線」を引くのか:米国EPAのPM2.5基準値改訂、その"正当化ロジック"を読む」
林 岳彦(国立環境研究所)


講演(2)「米国EPAのオゾン基準値の変遷を例に、疫学研究、諮問委員会、規制影響評価、判例などの役割、すなわち「基準値ガバナンス」を考える(仮題)」
岸本 充生(産業技術総合研究所
===


今回は、PM2.5(微小粒子状物質)とオゾン(光化学オキシダント)という近年話題の(だけど伝統的な)大気汚染物質について、その環境基準値の策定という、アカデミックな科学(疫学調査や動物試験)と政策意思決定(基準値の策定)をつなぐレギュラトリーな科学の部分に焦点をあてて、その背景、ロジック、説明の仕方(これこそリスクコミュニケーション!)などついて、米国の事例を紹介し、議論したいと思います。あわせて日本の現状と向かうべき方向などについても議論できればと思います。


産総研の外部から参加される方は、前日お昼までに事務局(foram-desk-ml@aist.go.jp)ご連絡をいただければ、本館受付に事前登録しておきますので手間無く入ることができます。

FoRAMは、基本的に研究者や専門家の方を対象とした研究会となっております。参加ご希望の方は、事務局(foram-desk-ml@aist.go.jp)の方までお気軽にその旨事ご連絡ください。

ちょっとだけよ:内容のプレビュー

上記の研究会において、私は米国EPA(環境保護局)におけるPM2.5(PM2.5@Wikipedia)の基準値改訂についてお話いたします。

実は、PM2.5は現状の大気汚染物質の中ではそのリスクが比較的とても高いものとして知られています。例えば、米国におけるPM2.5の疫学研究のメタレビューをチラ見してみますと以下のようになっています*2

この表は、「長期間のPM2.5濃度が10μg/m3増加したとき」の健康影響に関する複数の疫学研究の結果をまとめているものです。(注:「PM2.5濃度が10μg/m3増加」というのは、ものすごくざっくり言うと、汚染レベルとしては日本の都市部において10年前の汚染水準に戻るくらいのかんじです→ http://www.env.go.jp/press/press.php?serial=14869

上の表の"Effect Estimates (95CI)"というのは、「PM2.5濃度が10μg/m3増加したとき」の相対リスク*3の推定値(とその95%信頼区間)を表しています。例えば、一番上の行の"Zeger et al. (2008)"を見てみると、Outcomeは"All-Cause Mortality"、"Effect Estimate"は1.15程度になっています。これは、「PM2.5濃度が10μg/m3増加したときに、全死亡率*4の相対リスクが、1.15倍になっている」ということです*5

上記の図を見ると、全死亡で見たときの相対リスクは1.03〜1.2くらいの値をとっていることが判ります。


で、これらの値は、全死亡というもののベースレート(元々の率)の高さを考えると非常に高いリスクであると言えます。

仮に、(PM2.5の濃度上昇がない場合の)元々の年あたりの全死亡率を0.015(1500人/10万人)*6、相対リスクを1.03*7として考えてみましょう。このとき、「PM2.5濃度が10μg/m3増加したとき」の絶対リスクは1.03*0.015=0.01545で、絶対リスクの【年あたり】の増分は0.00045になります。つまり、PM2.5により【1年あたり】で10万人あたり45人が死亡している計算になります。

また、例えばこれを「生涯あたりのリスク」で考えるために「45年分*8」での絶対リスクを(最も単純に)積算すると、絶対リスクの増分は0.00045*45≒0.02となり、「(長期間のPM2.5濃度が10μg/m3増加したとき)生涯あたりでは100人に2人以上がPM2.5が原因で死亡する」という計算になります*9


上記はあくまでもかなりの概算*10ですが、PM2.5の基本的なリスクの高さのレベルがお分かりいただけたでしょうか。
(米国での直近のPM2.5の改訂の際にはパブコメが23万通も来たそうですが、その背景にはこのような基本的なリスクの高さがあるわけです)


はい。で、今回の研究会の私の発表ではその「PM2.5の米国における環境基準値の変遷」がテーマになります。


今回の議論のポイントとなるのは、PM2.5のリスクは「PM2.5の濃度上昇とともにリスクも連続的に上昇する(と考えられる)」というところです。

このようにリスクが連続的に存在する場合においては、(要介入/非介入の境を決定する)環境基準値の値にアプリオリな「正解」はなく、正解が無い中でどこかにエイヤッと「基準値」の線を引かなければなりません。果たして、米国EPA(環境保護庁)はどのようにその「線」を引いたのか。そして、その「線引き」についてどう説明(正当化)しているのか。


今回の私の発表では、その辺りのところについてみんなで議論できたら良いなあ、と思っています。


【2013/1/24追記:こちら→ http://d.hatena.ne.jp/takehiko-i-hayashi/20130124/1358985673 に発表資料をアプしました】



(*「その辺りのことについてみんなと議論してる暇があったらさっさと論文書け」とかいうツッコミはくれぐれもご自重ください)
.

*1:このタイトル勝手に私がつけました

*2:US EPAの「Integrated Science Assessment for Particulate Matter (Final Report)」 @ http://cfpub.epa.gov/ncea/cfm/recordisplay.cfm?deid=216546 のp2-15より引用

*3:相対リスク=(PM2.5濃度が10μg/m3増加してないときの死亡率/PM2.5濃度が10μg/m3増加したときの死亡率)

*4:ここで"全"というのは、死因ごとに分けずに全部まとめた死亡率、のことを意味しています

*5:表中のmeanは「調査対象地域における平均PM2.5濃度」のこと

*6:Quantitative Health Risk Assessment for Particulate Matter @ http://www.epa.gov/ttn/naaqs/standards/pm/s_pm_2007_risk.html のTable3-4 in p 3-60を参照した。ただしこの値は30歳以上の集団を対象としたものであることに注意

*7:上記に挙げられている研究の中で、もっとも質の高い研究と目されているKrewski (2009)( [https://www.google.co.jp/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&cad=rja&ved=0CEQQFjAB&url=http%3A%2F%2Fpubs.healtheffects.org%2Fgetfile.php%3Fu%3D478&ei=k-3YUOalDaf3mAXTsYHQAw&usg=AFQjCNHJfSg1tO65eTNS3Srj5GjIIZiuIw&sig2=6_6bPCCp9g965e_MPjjnqg&bvm=bv.1355534169,d.dGY:title=こちらから]DL可)からの値

*8:ベースレートの死亡率として30歳以上の集団を対象しているので、30→75歳の45年分で生涯辺りのリスクの概算とした。先進国では30歳まではそんなに死亡しないので、近似計算としてはそれほど問題ないと思うけど、どうかな?

*9:計算が合ってれば

*10:なので、この値は"このブログ記事内限りの推定値"ということで取り扱いの方よろしくお願いいたします

RStudioからknitrでレポートを自動作成してみた

こんにちは。オソブサ*1でおなじみの林です。お盆なのでBON JOVI聞いています*2。論文はまだ書けていませんけど何か。


さて。さいきんTokyo.Rの和田計也さんという方のちょう素晴らしいプレゼンファイルを拝見いたしました。

そろそろRStudioの話でもしてみようと思う
そこでRStudioからレポートを自動作成できるknitrというツールが紹介されていたので、自分でも少しいじってみました。今回はその自習のまとめも兼ねてここにも書いてみたいと思います。

そもそも:Rの結果をどうやって保存してます?

ええと。まずそもそもの問題意識なのですが、みなさまはRでの計算結果ってどう保存してますか?

これって結構メンドクサイ問題で、いままで私は基本的に:

  • テキスト系のアウトプットはテキストファイルへ書き出し(またはコンソールからコピペ)
  • 画像系のアウトプットはpng/PDFなどへ書き出し

していました。

このときに「なんかうまい方法ないかなぁ」と常々思っていたのが、「書きだした結果のファイル」と「その結果を算出した際に用いたパラメータやソースコード」の対応付けの問題です。

Rで行った計算の結果が、どのようなパラメータやソースコードのもとで生成されたものなのかをちゃんと記録しておくのはとっても大事です。しかし、「ソースコードやパラメータ」「コンソールへのアウトプット」「グラフ画像ファイル」などの異なる形式のものをスマートかつ分かりやすい形でまとめておくのは案外むずかしいですよね。


ですよね?


そこで、knitrなのですよ!(ドヤ顔)

knitrってなんすか?

knitrとはその開発者サイトによると、"Elegant, flexible and fast dynamic report generation with R"というものらしいです。

自分で"elegant"とか言うかよ、と一瞬思うかもしれませんが*3、要するにRのソースコードから「ソースコードやパラメータ」「コンソールへのアウトプット」「グラフ画像ファイル」などの異なった形式のオブジェクトが混在したレポートを自動的に生成できるツールです。


とりあえず最新版(0.96.330)のRStudio には実装されているので使ってみましょう。百聞は一見にスガシカオです。

とりあえずは、knitrパッケージをインスコしておきましょう*4

install.packages("knitr")


で、RStudioからknitrへの扉は意外と近くに隠されています。新規ファイルとして"R Markdown"形式のものを開いてみましょう:

そうすると新規ファイルとして"untitled.Rmd"という名のデフォルトのファイルがRStudio内の左上ウィンドウで開きます。そしたら、適当な名前(test.Rmdとか)をつけてそのファイルを保存してから、"Knit HTML"と書いてあるアイコンをとりあえずクリックしてみましょう。

そうすると、Markdown形式で書かれた左上ウィンドウ内のRmdファイルがhtml形式に変換されて表示されます。とりあえずプレビュー画面が出るので、必要に応じて"Save As"から好みの形式で保存したりできます*5


まあ基本的な段取りはだいたいこんなかんじです(←雑)。

ええと、そのMarkdownってなんすか?

Markdownというのは、要するに「はてな記法」みたいなもんです。より一般的に言えば、htmlとかLaTexとかの簡易版みたいなものをイメージすればよいかもしれません。

とりあえずR版Markdownの文法などの情報はこちら:
Using Markdown with RStudio

Markdownの文法の詳しい情報はこちら:
blog::2310 » Markdown文法の全訳


あと、Rstudioでの"knit HTML"の左側にある"MD"と書いてあるアイコンを押すとMarkdownの文法のヘルプが出てきます。


上記のようなMarkdown文法のコードを交えてRのコードを書き、そこでknitrを使うとレポートが自動生成できるわけなのです。

とりあえずサンプル解析ファイルを書いてみたので晒してみる

とはいえとっつきにくいと思うので、自作のRmdサンプル解析ファイルを晒してみます。以下では注を入れるために画像にしていますが、実際にRStudio内で試してみたい方はこちらのblog.Rmd 直ファイルをRStudioで開いてみてください。

ちなみに以下のコードをRStudioで開き、"knitr html"のアイコンをポチるとこういうかんじのhtmlが生成されます*6サンプルhtml

【追加】上記の画像では見ずらいかもと思ったので一応ベタテキスト版も追加しました↓(*リストの部分の"*"がはてな記法と干渉しやがるのでそこだけ改変してます)

論文数とtweet数の関係についての線形回帰分析
========================================================
## 背景
近年、日本の研究者の論文生産数の減少が指摘されている。その原因として、twitterにより研究時間が浪費されている可能性が指摘されている。本解析では、論文数とtweet数の関係について予備的な統計解析を行った。

## データ
データはCounterfactual News (2011)の調査報告書より引用した。ここで *tweet* は一ヶ月あたりのtweet数、 *article* は過去5年間の論文数(第一著者のみ)である。
```{r data}
tweet <- c(259, 265, 367, 699, 293, 395, 843, 986, 833, 373, 560, 704, 394, 138, 881, 17, 873, 157, 764, 250, 24, 583, 81, 946, 175, 534, 458, 168, 32, 776, 616, 292)
article <- c(7.41, 6.35, 6.33, 2.01, 7.07, 6.05, 3.57, 0, 2.67, 7.27, 1.40, 4.96, 7.06, 9.62, 0, 4.83 , 0.27, 12.43, 4.36, 5.50, 8.76, 3.17, 8.19, 0, 7.25, 3.66, 7.42, 6.32, 8.68, 1.24, 0.84, 8.08)
```

## 散布図
散布図は以下の通りであり、明瞭な負の傾向がみられた。
```{r scatter_plot, fig.width=5, fig.height=5}
plot(article ~ tweet, xlab="Number of Tweet (per Month)", ylab="Number of Articles (past 5 years)")
```

## 線形回帰
線形回帰を行ったところ、以下のような結果が得られた。tweet数の効果は有意であり(p<0.001)、1 tweetあたり約0.009本分の論文数の減少に繋がることが示唆された。
```{r linear_regression, fig.width=5, fig.height=5}
lm_res <- lm(article ~ tweet)
plot(article ~ tweet, xlab="Number of Tweet (per Month)", ylab="Number of Articles (past 5 years)")
abline(lm_res,col=2)
summary(lm_res)
```

## 残差分析
線形回帰のチェックのため、残差プロットおよび正規Q-Qプロットを行った。論文数はカウントデータであるため、本来ならばポワソンモデルを用いるべきであるが、残差プロットおよび正規Q-Qプロットの結果を見る限り、残差は良好な正規性を示していると判断できる。
```{r regression_check, fig.width=5, fig.height=5}
plot(lm_res, which=1:2)
```

## 考察
今回の解析より、tweet数が論文数に有意な影響をもたらすことが示唆された。しかしながら、この因果関係の向きについては:

tweet数の増加 → 研究がうまくいかない
研究がうまくいかない → tweet数の増加

の2つの異なる可能性が存在する。今後、この因果関係の向きを明らかにするために、若手研究者を対象とした前向きコホート研究が必要である。

## 参考文献
[津田大介(2012)Twitter社会論~新たなリアルタイム・ウェブの潮流](http://www.amazon.co.jp/Twitter%E7%A4%BE%E4%BC%9A%E8%AB%96-~%E6%96%B0%E3%81%9F%E3%81%AA%E3%83%AA%E3%82%A2%E3%83%AB%E3%82%BF%E3%82%A4%E3%83%A0%E3%83%BB%E3%82%A6%E3%82%A7%E3%83%96%E3%81%AE%E6%BD%AE%E6%B5%81-%E6%96%B0%E6%9B%B8y-%E6%B4%A5%E7%94%B0-%E5%A4%A7%E4%BB%8B/dp/4862484824/ref=sr_1_7?ie=UTF8&qid=1344845029&sr=8-7)

#### このファイルの作成日時
```{r timelog}
Sys.time()
```

使い道は?

おそらくRStudio-knitr-Rmdの組み合わせは(研究者にとっても)以下のような使い道があるのではないでしょうか:

  • 自身のRコードの開発・解析結果の私的ログ管理
  • 共同研究者との統計解析に関するやりとりのためのツール・インフラとして
  • 研究室などでのルーティン統計解析のテンプレとして採用する
  • 論文のSupplementary Materialsにそのまま使うのもいけると思う
  • RやRStudioの講習資料の作成にも使えそう


今回はあまり詳しいことを書けませんでしたが*7、より詳しいTipsについてはknitrの開発者のサイトRMarkdownのサイト和田さんのプレゼン資料を適宜ご参照いただければと思います。



ではよいお盆を!





.

*1:論文を書くのが遅い上にブサイク、の略

*2:

*3:でも使ってみたらたしかにelegantだったよ

*4:R2.14.1以上が必要らしい

*5:"publish"を押すとRPubsというコード公開サイトへの投稿となります

*6:画像ファイルもhtml内に埋め込まれているのでhtmlファイル一つでレポートは完結しているぽい。これはありがたいすね

*7:そもそも詳しいこと知らないので。申し訳ないっす