自分支援機構

10年後には黒歴史

『統計学基礎』を読んだ

 ここ数日『統計学基礎』(東京大学出版会東京大学教養学部統計学教室編)という本をざっと読んだので、Amazonウィジェットの貼り方を覚えたついでに紹介していきます。練習問題はチラ見しつつ無視しましたが、だいたい全体を読み通すことができたと思います(完全に理解したとは言っていない)。統計学の専門的な知識はまったくないので間違ったことを書くかもしれないですが、そのことで誰かが何らかの損害を被っても責任は取らないので悪しからず。私はお金が大好きでがめつい人間なので、下のリンクはアフィリエイト登録もバッチリ済ませてあるが、なるべく中身のあるレビューをするので許してほしい。

(↓これがやってみたかったんだよ)

 

 

1.この本を読んだ理由・動機

 大学の実験の授業などで断片的に統計の知識はあったのですが、一回はちゃんと体系的な知識を突っ込んでおきたいと思ってなにか入門書を読むことにしました。統計学の入門書は大量にありますが、数学的な表現をなるべく正面から扱っている入門書を選ぼうと思ったのでこの本を選びました。理系の大学生(のキモオタ)なので、さすがに初心者向けに数式を過度に省いてあるものは読む気にならなかったわけです。全ての入門書を見たわけではないですが、私が某書店で立ち読みした入門書の中ではこの本が一番目的に適っていると感じました(主観)。

 

2.おおまかな内容と個別の感想

 1章にはイントロダクションのありがたい前書きが書いてあります。歴史的なお話や統計学のあらましなどが書いてあります。

 2,3章には「記述統計学」と呼ばれる分野の統計学が簡単に説明されています。記述統計学とは、対象の母集団のデータが全て得られている時にそのデータから意味ある特徴を読み取ろうとする学問です。現実的には限られた場合しか全データの測定なんてできないですが、こうした各種統計量の知識がこの先の統計を扱うのに役立ちます。

 4~7章には統計学を扱う上での基本になる確率論の知識が簡潔にまとめられています。統計力学量子力学の勉強をするにあたって簡単な確率論の基礎部分は知っていたのであまり苦もなく読み進めることができました。

 8章は中心極限定理です。同じ確率分布に従う独立なn個の確率変数の平均は、n→∞で正規分布に近づくというとても面白い定理ではありますが、(ググったりした感じ)数学的には通り扱いが難しいので内容の紹介だけです。せっかくなのでExcelで乱数を使って二項分布を大量に生み出してみたらホントに正規分布っぽくなったのでちょっと感動しました。

 9~13章は、母集団のデータが一部しか得られないとき、限られたサンプルから母集団の特徴を読み取る方法についての議論です。このあたりから難易度が急上昇してきます。9,10章は同じ母集団からn個のサンプルを取り出したときに従う確率分布(標本分布)の話で、名前だけは聞いたことのあったχ^2分布、t分布、F分布などが導入されます。11章はサンプルから得た情報で母集団の統計量を推定する方法が説明されます。最尤法、モーメント法が簡単に説明されます(正直ちょっと消化不良です)。12章では検定の理論が取り扱われます。まずは示したいor反証したい仮説と「ここまでは現実的に起こり得ない」とみなす有意水準を定めて、得られたサンプルからその仮説が有意水準の元で採用されるか棄却されるかを計算する方法を学ぶことができます。完全には把握しきれなかったので、近いうちに再び読み直して章末問題も解いて記憶を確かにしたいです。13章では少し毛色が変わり、例えば確率分布がy=f(x)のような形で与えられている場合、サンプルから得られた情報でf(x)を関数形(?)を誤差が最小になるように推定する方法を学びます。

 

3.想定される読者と必要な前提知識

 Amazonのレビューにも「難しい」という声がありますが、確かに入門書にしてはかなり骨太に感じられました。しかも7章くらいまではけっこう流して読めてしまうので「あっ、これは気軽に読める本だな」と思ってしまうと11章以後はギャップで少し苦しみます。とはいえ、行間が広かったり高度な数学が使われているわけではなく、式が煩雑だったり似たような用語が多かったり情報の密度が高いだけでゆっくり整理して読めばわかる程度だと思います。

 必要な前提知識はだいたい高校数学+α程度で、高校レベルの微積分や数列の知識がない人が読むにはかなり無理があるでしょう。今の高校数学の課程では確率分布や推定・検定が入ってるようなので、もしかすると私の次くらいの世代の大学生はそんなに苦労せず読めちゃうのかもしれませrん。

4.最後に

 全体的な感想として、この本はある程度数学的な知識のある人が統計学の基本的な知識を身につけるにあたって良い本だったと思います。前書きに書いてあるように、基本的な内容をレベルを落とさずに説明できていると思います。図版や演習問題が豊富で、数学書めいた体裁になっているので、わかりやすい大学の教科書を読む感じで勉強できます(そもそも大学の教科書ですし)。

 私は数日でざっと読み込んだので細かい部分は抜け落ちていますが、少なくとも一度目は通したのでこれから統計関係で困ることがあればこの本に立ち返って調べることができるでしょう。また時間があればきちんと(特に最後の方を)読み込んで計算などがスムーズにできるようにしたいです。統計や数学のプロの方々は「なめとんのかワレ!そんなん読めたうちに入らんわ!!」と思うかもしれないですが、私は別にプロでもないですし内容の参照ができるようになれば専門書・教科書読むうえでの第一段階くらいは突破したと思っています。

 統計学関連でこれから本を読むとすれば、より数学的な詳細を求めていわゆる数理統計学関連に進むか、ベイズ統計みたいな各論めいた統計に進むか、あるいはExcelやRなどの詳しい使い方の本でも読んでみるか、まあそんな感じでしょうか。予定は未定ですが。いずれにせよ、こんなに長くてつまらない記事を最後まで読んでくださった方がいらっしゃったらありがとうございます。そしてページトップにあるAmazonのリンクから本を買うと私に少しばかりのお金が入るらしいのでクリックしてください(催促)。

 

P.S.

書くのに時間がかかったので、本のレビューでこんなに長い記事を書くのはこれきりにしたい。読む側も大変そうだし簡潔に書く技術がほしい。