薬学部シラバス2024
医療統計学
Basic Statistics with a View Toward Medical Sciences
1年 後期 1年必修科目 1.5単位 | |
---|---|
片野 修一郎 |
すべて開く
すべて閉じる
授業の目的(ねらい)
ChatGPTなどの生成AIが日常生活の中に登場する時代になりました。ビッグデータという言葉も20世紀には聞かなかった言葉です。AIやスーパーコンピュータの力を借りれば、ビッグデータの解析なんて簡単さ。先進諸国の中で図抜けて数学への興味関心が低く、数学嫌いが多い日本人はそう考えたくもなるのかもしれません。そこまでいかなくても、Windowsパソコンを使うほとんどのユーザーがインストールしているExcelにも統計関係の組み込み関数が用意されており、日常的に仕事で統計に携わっている人の多くはこれで事足りると思っているのではないでしょうか。確かに便利です。しかし、統計学はその基礎理論の構築に数学をフルに利用します。その部分を全く理解せずに統計ソフトを使うのは、「連立方程式の解」の意味がわからないのに「やり方」だけは覚えていて解くことはできる、というのと同じです。微分が何なのか説明できないし、対数関数のグラフも描けないのに (log x)' = 1/x は覚えている、というのと同じです。こういう態度の行き着く先に「コンピュータが科学的に算出した数字だから、この統計は絶対的である」という野蛮な態度や言動が透けて見えています。この風潮が跳梁跋扈するようになったら、きっと国民の生命を脅かすような事件が起こることでしょう。
この講義では、上に述べたような態度とは正反対のことをやります。すなわち、統計解析の意味をきちんと理解して実行するために必要な基礎に軸足を置いて主要理論を解説します。統計ソフトの使い方なんてのは1日、いや半日あれば簡単に覚えられます。しかし統計学の基礎理論はとてもとてもそういうわけにはいきません。それをできるだけゆっくり丁寧に説明したいのです。
ところで皆さんはビッグデータの定義を知っていますか。どうせ殆どの人は「巨大なデータ」のことだと思っていますよね。違います。実はビッグデータに確定した定義はないのです。ひとつの確率変数しか必要のないデータであれば、それがどれだけ巨大でもビッグデータとは言いません。また、本講義で学ぶような従来の解析手法で間に合うようなデータも、どれだけ巨大でもビッグデータとは言いません。中学校で学ぶ2次方程式が理解できない人が微積分を学んでも無意味です。近代統計学の基礎理論を全く理解しない人が、ビッグデータの解析に口を差し挟むのはそれと同じことです。
さあ皆さん、腰を据えて統計学の基礎を勉強しよう。
学修到達目標
薬学を学び、さらに薬学データの解析をする上で必要なデータ処理の基礎概念と統計データの解析方法を学ぶ。方法論の羅列とその丸暗記というありがちな事態に陥らないように、基本概念をしっかり理解することをまず目標とした上で、薬学で実践できる統計的手法を我がものとする。
授業概要
教科書に基づいて、統計理論と実践とをオーソドックスに解説する。まずは言葉を使って基礎概念を丁寧に説明する。それが終わったら、理解できているかどうかがわかるような例題をやってもらう。ときには演習問題を出して、黒板に出てきてその解答を書いてもらう。その繰り返しで、確率変数がひとつ、或いはふたつの場合の、典型的な統計解析手法を一通り講義する。
定期試験に際しては、必要な公式集を配るので、公式を意味もわからず覚えるという一片の血肉にもならない無駄な勉強には1秒も割く必要はない。従って、勉強時間はすべて「これはどういう意味か」「どのような設計に基づいて話が構成されているのか」「なぜこのように考えるのか」といったことを理解するために捧げてほしい。詳しくは教科書の目次を見てください。
授業計画
回数 | 担当 | 内容 | コアカリとの 関連コード |
---|---|---|---|
1 | 片野 | データの代表値(平均値、中央値、最頻値)、散布度(分散、標準偏差)の意味および定義式について説明できる。それらを実際に計算して求められる。 | T-1-1-1 |
2-3 | 〃 | まず、推測統計学の基盤をなす母集団と標本の概念を、次に確率変数・標本変数という概念を理解する。確率変数の平均(期待値)や分散の定義を理解する。母集団上の確率変数の平均・分散と、勝手知ったる単なるデータの平均・分散が異なる概念であることをよくわかる。我々の統計学の主役は前者である。標本変数の関数である統計量についても解説する。 | T-1-1-1 |
4 | 〃 | 確率分布の代表例をいくつか挙げられる。特に、最も重要な正規分布の特性について説明でき、正規分布表が正しく読みとれるようになる。 | T-1-1-1 |
5 | 〃 | 確率分布の母数の点推定の意味がわかる。標本の分散、不偏分散、標準偏差、不偏標準偏差の定義を説明でき、それらの関係式を用いて具体的に求められる。 | T-1-1-1 |
6 | 〃 | 母集団分布に対して、推測統計学の中心である標本分布という考え方を理解する。特に標本平均の分布に親しむ。中心極限定理という大定理の意味を理解し、標本平均の分布の特徴を、それを用いて説明できる。 | T-1-1-1 |
7 | 〃 | 母平均を、正規分布やt分布を正しく使い分けて、標本から区間推定できる。 | T-1-1-1 |
8 | 〃 | 母比率の分布の特徴を説明でき、それを標本から区間推定できる。 | T-1-1-1 |
9 | 〃 | 検定における基本的な考え方を、帰無仮説と対立仮説、第1種と第2種の誤り、第1種の誤りと有意水準(危険率)などに関連させて説明できる。 | T-1-1-1 |
10 | 〃 | 2つのグループの平均値や比率の違いを、正規分布やt分布を正しく使い分けて、検定できる。 | T-1-1-1 |
11 | 〃 | データの独立性や適合度を、カイ2乗分布を用いて検定できる。 | T-1-1-1 |
12 | 〃 | パラメトリック検定、ノンパラメトリック検定の違いを明晰に理解する。パラメトリック検定のいくつかの手法を実際に運用できる。 | T-1-1-1 |
授業で行っている工夫(アクティブラーニング、思考力・判断力・表現力の向上に向けた取り組み)
・「これは何なのか」「どうしてこんなものを考えるのか」「なぜそんなことがわかるのか」といった、
現代の学生がとかく軽視しがちな理屈もしくはストーリー部分を、腹の底から納得できるように丁寧に解説している。
・例や例題を可能な限り多く紹介し、実践的な理解が深まるように配慮している。
・学生自身が手を動かして演習問題を考えることができる時間をとるように心がけている。
成績評価方法
<試験により評価する>
1)形成的評価
a) 知識:演習問題の解答を授業内で発表するとか、質問(するのと答えるのと両方)、WebClassへの詳細な解説記事の掲載などを通じて主体的に考えることを促す。
2)総括的評価
a) 知識:基本的には定期試験(100%)で評価するが、(可能なら)授業時間内の演習問題の解答発表や(自主的な)レポートの提出などは勘案する。
教科書
片野修一郎 『根底から理解する 統計学入門』(ムイスリ出版)
現段階では鋭意執筆中です。開講に間に合うように頑張ります。もし間に合わなかったら旧板の
片野修一郎 『統計学の基礎』(ムイスリ出版)
を使わせてもらいます。間に合わなかった場合でも、新板の原稿も一部授業で使います。
参考書
統計初歩の教科書はどれも大同小異です。必要なら適宜紹介します。高等学校数学Bの教科書にも、本講義の目的である推測統計学の初歩が解説されているようです。数学Bの教科書を持っている人はぜひ参考にするとよい。
オフィスアワー
毎週火曜午後に学習相談の時間が設定してありますが、それとは関係なく、質問は1105研究室にていつでも受け付けます。予約と遠慮は不要。
準備学習(予習・復習等)
特定の分野を前提とするというより、中学・高校・大学1年で学んできた数学全般の基礎学力がものをいいます。以下の項目については常識的に知っていること、慣れていることを要請します。甘く見ないでください。こういう数学的“脳体力”というべき力は、ボディーブローのようにズシンと効いてきて、あっという間に何もわからなくなります。
・高等学校で学んだ確率の基本事項
・関数概念、和記号Σ、数式の計算などの基本的な数学の運用能力
・微積分で学んだこと。特に自然対数eを底とする指数関数や、定積分が面積を表すこと
もうひとつ、極めて重要なことがあります。たとえば微積分で、sin x の微分が cos x だというのは、意味を全く理解していなくても、禅問答のように覚えてしまえば正しく答えることができます。小学校低学年生でも答えられます。大学の勉強とは、このような1問1答の短いクイズに正しく答えられるように訓練することではありません。統計学においては、統計的な解析を待っている現実があり、先ずその状況を理解して、どのように統計的な手法を適用するかを考えなければなりません。従って、この授業の特に後半では、皆さんは常にある程度長い状況説明の文章を読まなければならなくなります。SNSに代表されるスラング的な短文のやり取りに浸りがちな日本の若者の読解力欠如が漸く最近になって本格的に危惧されるようになってきましたが、皆さんは大丈夫ですか。そういう意味で、この授業を、文章をきちんと正確に読むための訓練の場ともしたいと思っています。また、準備として高等学校の教科書を予め読んでおくこともよいかもしれません。
学生へのフィードバック
重要な内容に関しては、典型的な演習問題を事前に配布し、時間的余裕があれば(対面授業が可能なら)それを黒板に書いて発表してもらい、その解答について解説や添削をする。時間的余裕がない場合も、できるだけ典型的問題の演習と解説をWebClassに資料としてアップすることでフィードバックとしたい。
備考
現在は表計算ソフトExcelや統計ソフトRにより、煩瑣な統計計算は簡単にできるようになっています。それらを用いた実習授業を取り入れることも考えたのですが、人数的に無理があって断念しました。代わりに関数電卓または普通の電卓(ただしルートの計算ができるもの)を持ってきてもらうといいですね。関数電卓は使いこなせれば非常に便利ですが、ただ持っているだけで使い方のわからない人を多く見かけます。宝の持ち腐れですよ。前期試験では電卓を使わないと計算できない問題ばかりが出題されますから、メモリー計算には今のうちから慣れておくといいです。
ナンバリングコード
RB11202