専門演習2008年度演習記録
(作成:西郷 浩;掲示開始:2008年3月11日;最終更新:2009年1月20日)
専門演習(3年生 第14期生)
l 曜日・時限・教室:火3・3-329(演習3)
l 教科書:
Ø [1] 山田 剛史・杉澤 武俊・村井 潤一郎(2008)『Rによるやさしい統計学』オーム社
Ø [2] 金 明哲(2007)『Rによるデータサイエンス』森北出版
l 評価:presentation + project
l 出席確認:あり
l 講義記録:
1. 4月15日:自己紹介、ゼミのルール等の説明、幹事の選出
2. 4月22日:教科書[1]の輪読(第1章のデモ)
3. 5月13日:教科書[1]の輪読
Ø 126・127・128:教科書[1] 第2章「1つの変数の記述統計」pp. 37-54
4. 5月20日:教科書[1]の輪読
Ø 129・130・131:教科書[1] 第3章「2つの変数の記述統計」pp. 55-69.
5. 5月27日:校務出張のため休講(補講:夏合宿)
6. 6月 3日:教科書[1]の輪読
Ø 132・133・134:教科書[1] 第4章「母集団と標本」pp. 69-92.
Ø 課題:「統計量の標本分布」について、書籍・webpageなどで各自調べて、報告する。出所を明示すること。
7. 6月10日:教科書[1]の輪読
Ø 132・133・134:教科書[1] 第4章「母集団と標本」pp. 93-107.
Ø 全員:「統計量の標本分布」について、書籍・webpageなどで各自が調べたことを報告
8. 6月17日:教科書[1]の輪読
Ø 126・135・136:教科書[1] 第5章「統計的仮説検定」pp. 110-118.
9. 6月24日:教科書[1]の輪読
Ø 126・135・136:教科書[1] 第5章「統計的仮説検定」pp. 119-135.
10. 7月 1日:教科書[1]の輪読
Ø 126・135・136:教科書[1] 第5章「統計的仮説検定」pp. 135-137.
Ø 127・129・131:教科書[1] 第6章「2つの平均を比較する」pp. 141-150.
11. 7月 8日:教科書[1]の輪読
Ø 127・129・131:教科書[1] 第6章「2つの平均を比較する」pp. 150-158.
12. 9月20日—23日:ゼミ合宿(教科書輪読+4年生のゼミ論中間報告。4年生の記録も参照)
Ø 9月21日 9:00-12:00:128・130・132:教科書[1] 第7章「分散分析」pp. 159-201.
Ø 9月21日 14:00-15:30:126・133・135:教科書[1] 第8章「ベクトルと行列の基礎」pp. 205-221.
Ø 9月21日 15:30-17:00:127・134・136:教科書[1] 第9章「データフレーム」pp. 223-246.
Ø 9月22日 15:00-15:30:127・134・136:教科書[1] 第9章「データフレーム」pp. 223-246.
Ø 9月22日 15:30-17:00:128・129・131:教科書[1] 第10章「外れ値が相関係数におよぼす影響」pp. 248-254.
13. 9月30日:教科書[1]の輪読
Ø 130・132・135:教科書[1] 第11章「統計解析で分かること・分からないこと」pp. 255-265.
Ø 127・133・136:教科書[1] 第12章「二項検定」pp. 267-271.
14. 10月 7日:教科書[1]の輪読
Ø 127・133・136:教科書[1] 第12章「二項検定」pp. 271-274(ランダム検定の宿題)
Ø 126・129・134:教科書[1] 第13章「プリ・ポストデザインデータの分析」pp. 275-282.(回帰分析を終えてからここにもう一度もどる)
15. 10月14日:教科書[1]の輪読
Ø 127・133・136:ランダム検定についての補足
Ø 128・131・135:教科書[1] 第14章「質問紙尺度データの処理」pp. 283-289.
Ø 132・133・136:教科書[1] 第15章「回帰分析」pp. 291-298.
16. 10月21日:創立記念日
17. 10月28日:教科書[1]の輪読
Ø 128・131・135:α係数について
Ø 127・130・134:教科書[1] 第16章「因子分析」pp. 299-305.
18. 11月 4日:教科書[1]の輪読
Ø 127・130・134:教科書[1] 第16章「因子分析」pp. 305-308.
Ø 126・128・129:教科書[1] 第17章「共分散構造分析」pp. 309-315.
19. 11月11日:教科書[1]の輪読
Ø 126・128・129:教科書[1] 第17章「共分散構造分析」pp. 316-319.
Ø 126・127・134:教科書[1] 第13章 共分散分析
20. 11月18日:教科書[1]の輪読
Ø 131・133・135:教科書[1]第18章「人工データの発生」pp. 321-327.
21. 11月25日:教科書[1]の輪読
Ø 131・133・135:教科書[1]第18章「人工データの発生」pp. 327-332.
22. 12月 2日:教科書[1]の輪読
Ø 131・133・135:教科書[1]第18章「人工データの発生」pp. 332-341.
Ø 132・134・136:教科書[1]第19章「検定の多重性と第1種の誤りの確率」pp. 343-345.
23. 12月 9日:教科書[1]の輪読
Ø 132・134・136:教科書[1]第19章「検定の多重性と第1種の誤りの確率」pp. 345-355.
Ø 126・127・130:教科書[1]第20章「検定力分析によるサンプルサイズの決定」pp. 257-375.
Ø 教科書[1] 読了
24. 12月16日:教科書[2]の輪読
Ø 131・132:教科書[2] 第I部第4章データの視覚化
25. 集中ゼミ:補講期間中(12月17日、18日、19日のうちから10コマ);教科書[2]の輪読・実習
Ø 12月17日9:00-12:10
I. 130・133:教科書[2] 第II部第1章「主成分分析」
II. 134・136:教科書[2] 第II部第2章「因子分析」
III. 126・129:教科書[2] 第II部第3章「対応分析」
Ø 12月18日:10:40-17:20
I. 126・129:教科書[2] 第II部第3章「対応分析」
II. 128・135:教科書[2] 第II部第4章「多次元尺度法」
III. 126・127:教科書[2] 第II部第5章「クラスター分析」
IV. 128・132:教科書[2] 第II部第6章「自己組織化マップ」
Ø 12月20日:9:00-14:30
I. 130・135:教科書[2] 第II部第7章「線形回帰モデル」
II. 133・136:教科書[2] 第II部第8章「非線形回帰モデル」
III. 127・134:教科書[2] 第II部第9章「線形判別分析」
26. 12月20日(土)14:40—18:50 ゼミ論報告会
Ø レポート:
I. 内容:ゼミ論報告の中からひとつを選び、内容を要約して論評せよ。
II. 提出期限:2008年12月31日(郵送の場合は消印有効)
III. 提出方法:メールへの添付ファイルまたは郵送
IV. 用紙・分量:A4用紙1枚程度
27. 1月13日:教科書[2]の輪読
Ø 131:第10章「非線形判別分析」
28. 1月20日:教科書[2]の輪読、レポート提出
Ø 129:第10章「非線形判別分析」
Ø レポートの構成
I. 分析の目的
II. データの説明
III. 分析と考察
IV. 結論
V. 参考文献
VI. 書式など:A4・横書き。最初のページに、(1)表題、(2) 作成者の番号・氏名、(3)提出or作成年月日、を記すこと。図表には、番号と表題をつけること。
Ø ゼミ論計画書(4年生の第1回演習で提出)
I. テーマ(目的)
II. 利用データ
III. 利用データの基本分析
IV. 分析手法
V. 参考文献
VI. 書式など:A4・横書き。最初のページに、(1)表題、(2) 作成者の番号・氏名、(3)提出or作成年月日、を記すこと。図表には、番号と表題をつけること。提出期限:2009年度第1回ゼミ(2009年4月XX日4時限)
専門演習(4年生 第13期生)
l 曜日・時限・教室:火4・3-329(演習3)
l 内容:ゼミ論作成の指導
l 評価:presentation + ゼミ論
l 出席確認:あり
l 講義記録:
1. 4月15日:(3年生の初ゼミに顔を出せる人は出席)、ゼミ論計画書提出、ゼミ論中間報告
@ 120「日本人の死因」
Ø 内容:都道府県別の死因別死亡率の検証的因子分析
Ø 検討課題:人口統計学における死亡率についての研究、厚生労働省『厚生の指標』掲載論文の検索
A 121「株価決定要因の分析」
Ø 内容:経済変数を利用した株価モデルの構築
Ø 検討課題:景気因子の利用、文献の探索
B 125「JGSS2000-2003における共分散構造分析の実践」
Ø 内容:JGSS2000における娯楽の検証的因子分析
Ø 検討課題:JGSS個票データの利用
2. 4月22日:ゼミ論中間報告
@ 119「プロ野球にまつわる数字の分析」内容:プロ野球のデータを利用したチーム順位予想
Ø 内容:プロ野球のデータを利用したチーム順位予想
Ø 検討課題:分析モデルの検討、過去のゼミ論の検索、樋口美雄編著(1993)『プロ野球の経済学』日本評論社の参照
A 122「酒類の消費分析」
Ø 内容:世帯における酒類の消費分析
Ø 検討課題:総務省統計局「家計調査」の利用
B 123 「インターネットについての統計的分析」
Ø 内容:世帯におけるインターネットの利用
Ø 検討課題:総務省統計局「社会生活基本調査」、「家計消費状況調査」の利用
3. 5月13日:ゼミ論中間報告
@ 118「日本の渋滞・交通事故、その原因の分析と改善策」
Ø 内容:交通統計をもちいた交通渋滞・交通事故の分析
Ø 課題:Eno交通財団『道路交通解析のための統計学』で利用されているデータとモデルの確認、現在のデータによるモデルの再推定
A 119 「プロ野球にまつわる数字の分析」
Ø 内容:SABR metrics にもちいられる変数の説明
Ø 課題:多次元データの次元縮小の観点からのデータの観察、因子モデル・主成分分析の活用、データの磁気媒体化
4. 5月20日:ゼミ論中間報告
@ 120「日本人の死因」
Ø 内容:生命表の読み方についての解説
Ø 課題:人口統計学の確認、死因モデルの修正
A 121「株価決定要因の分析」
Ø 内容:東証株価指数の決定要因の探索(回帰分析における変数選択の応用)
Ø 課題:回帰分析における変数選択法の確認、説明変数の候補の大幅増加
5. 5月27日:校務出張のため休講(補講:夏合宿)
6. 6月 3日:ゼミ論中間報告
@ 122「酒類の消費分析」
Ø 内容:総務省統計局「家計調査」のデータによる、酒類別四半期購入頻度の時間的推移
Ø 課題:総務省統計局「家計調査」のデータの吟味
A ポイント:季節性の変化、世帯主の年齢別消費量の相違・時間的変化
7. 6月 10日:ゼミ論中間報告
@ 125「JGSS2000-2003における共分散構造分析の実践」
Ø 内容:JGSS2000にもとづく、職業意識・政党・家事・ペットに関する因子分析
Ø 課題:「研究テーマ」の設定(手法はテーマにはならない)
A 123「インターネットについての統計分析」
Ø 内容:総務省統計局「家計消費状況調査」・「社会生活基本調査」の紹介
Ø 課題:2つの調査データの分析
8. 6月17日:ゼミ論中間報告
@ 119「プロ野球にまつわる数字の分析」
Ø 内容:前回の質問への回答、投手の評価指標
Ø 課題:中心テーマの設定、チームの成績と勝率との関係
A 118「交通事故分析、データの把握」
Ø 内容:交通事故統計の説明
Ø 課題:データの利用可能性を考慮した中心テーマの設定
9. 6月24日:ゼミ論中間報告
@ 120「ロトカの方程式の証明と実践」
Ø 内容:ロトカの方程式にもとづく日本の安定人口の試算
Ø 課題:コーホート要因法による将来人口推計
A 121「業種別に見た株価」
Ø 内容:業種別株価(水準)とTOPIX(水準)の相関・回帰分析
Ø 課題:変数増加法の適用、長期的趨勢(水準)と短期的変動(変化率)の分析
10. 7月1日:ゼミ論中間報告
@ 122「酒類の需要分析」
Ø 内容:総務省「家計調査」による、酒類の購入頻度・単価・購入金額の分析
Ø 課題:テーマ(たとえば、ビールの需要)を絞って具体的に分析結果を出してみる。
A 123「インターネットについての統計分析」
Ø 内容:総務省「社会生活基本調査」H18年による、インターネット行動者率の性・最終学歴・年齢別行動者率の比較
Ø 課題:性・最終学歴・年齢別・就業状態別インターネット行動者率の分析(交互作用の検出、など)
11. 7月 8日:ゼミ論中間報告
@ 125「日本人の意識調査—JGSSにおける共分散構造分析」
Ø 内容:JGSS2000をもちいた因子分析
Ø 課題:JGSS200Xをもちいた同様の分析、個票分析
12. 9月20日—23日:ゼミ合宿(ゼミ論中間報告+3年生の教科書輪読。3年生の記録も参照)
Ø 3年生への報告にふくめること:(1)分析目的、(2)分析データの性質、(3)分析手法、(4)分析結果
Ø 9月20日 19:00-20:00:120「人口統計学による日本人口の推測」
ü 内容:Total Fertility Rate, 生命表の見方、ロトカの方程式の利用、コーホート要因法の仕組み
ü 課題:コーホート要因法を利用した独自のシナリオの作成
Ø 9月20日 20:00-21:00:119「貢献度に見るプロ野球選手評価」
ü 内容:セイバーメトリックスを利用した、プロ野球における個人成績指標の作成、共分散構造分析の適用
ü 課題:次元縮小手法(主成分分析など)の利用
Ø 9月21日 19:00-20:00:122「酒」
ü 内容:総務省統計局「家計調査」の酒類の分析
ü 課題:標準的な需要関数の推計、その結果の改良
Ø 9月21日 20:00-21:00:121「株価決定要因の分析」
ü 内容:変数選択法を利用した株価決定要因の抽出、外国人投資家が株価変動におよぼす影響
ü 課題:外国人投資家が株価変動におよぼす影響の数値化(移動分散の計算)
Ø 9月22日 9:00-10:50:125「日本人の意識調査—JGSSにおける共分散構造分析—」
ü 内容:JGSSの紹介、共分散構造分析、個票による分析(娯楽と年収、就業意識と年収、職業と生活の満足度)
ü 課題:性別・年齢・就業状態の制御(多母集団とするか、変数として取り入れるか)
Ø 9月22日 10:50-12:00:118「交通事故の分析」
ü 内容:条件別交通事故死者数の時系列的推移
ü 課題:要因分解(加法型)、回帰分析による計測
Ø 9月22日 14:00-15:00:123「インターネットについての統計分析」
ü 内容:総務省統計局「社会生活基本調査」平成18年 の分析
ü 課題:分割表解析の手法(対数線形モデル、など)の利用、ゼミ論(No.60)の参照
13. 10月7日:ゼミ論中間報告
@ 118「交通事故の分析」
Ø 内容:月別交通事故死者数の寄与度分解
Ø 課題:交通事故死者数の要因別寄与度分解(他の要因について)
A 119「貢献度に見るプロ野球選手評価」
Ø 内容:投手の貢献度分析(チーム別)、回帰式の結果とDIPSとの比較
Ø 課題:個別の投手の貢献度分析、統計的分類
14. 10月14日:ゼミ論中間報告
@ 121「株価決定要因の分析」
Ø 内容:移動標準偏差、移動変動係数、移動相対四分位範囲による、外国人投資家の影響(外国人投資家は短期の株価変動を増大させ、長期の株価変動を減少させる要因となる)の検証
Ø 課題:株価決定要因の機械的(統計的な変数選択法)・実質的(景気動向指数を参考にした要因別経済変数の選択)探索
15. 10月21日:創立記念日
16. 10月28日:ゼミ論中間報告
@ 123「インターネットについての統計分析」
Ø 内容:度数分布表に対する対数線形モデルの説明
Ø 課題:社会生活基本調査への対数線形モデルの当てはめ
17. 11月4日:ゼミ論中間報告
@ 125「日本人の意識調査—JGSSにおける共分散構造分析」
Ø 内容:多母集団モデルによる男女差の検定
Ø 課題:因子分析モデルによる多母集団の比較、年収に関する回答誤差の検証
A 118「交通事故の分析」
Ø 内容:交通事故死者数の寄与度分解
Ø 課題:正確な再計算
B 123「インターネットについての統計分析」
Ø 内容:SPSSによる分割表の解析
Ø 課題:その実行
18. 11月11日:ゼミ論中間報告
@ 118「交通事故の分析」
Ø 内容:要因分解
Ø 課題:回帰分析
A 123「インターネットについての統計分析」
Ø 内容:ロジット分析
Ø 課題:SASによるロジット分析の実行
19. 11月18日:ゼミ論執筆指導(希望者のみ研究室にて)
20. 11月25日:ゼミ論執筆指導(希望者のみ研究室にて)
21. 12月 2日:ゼミ論提出
22. 12月 9日:ゼミ論報告会用ハンドアウト原稿提出
Ø ハンドアウトの構成
I. 分析の目的
II. データの説明
III. 分析と結果の考察
IV. 結論
V. 参考文献
Ø 書式など:A4用紙で2ページないし4ページ、最初のページに、(1)表題、(2) 作成者の番号・氏名、(3)提出or作成年月日、を記すこと。図表には、番号と表題をつけること。
23. 12月20日(土)14:40—18:00 ゼミ論報告会
Ø プログラム
I. はじめに(14:40-14:45)
II. 121「株価決定要因の分析」(14:45-15:20)
III. 119「貢献度に見るプロ野球選手評価」(15:20-15:50)
IV. 125「日本人の意識調査—JGSSにおける共分散構造分析」(15:50-16:20)
V. 休憩(16:45-16:30)
VI. 118「交通事故の分析」(16:30-17:00)
VII. 123「インターネットについての統計分析」(17:00-17:30)
VIII. 第14期生ゼミ論抱負(17:30-17:50)
IX. おわりに(17:50-18:00)
Ø レポート:
I. 内容:自分のもの以外のゼミ論報告の中からひとつを選び、内容を要約して論評せよ。
II. 提出期限:2008年12月31日(郵送の場合は消印有効)
III. 提出方法:メールへの添付ファイルまたは郵送
IV. 用紙・分量:A4用紙1枚程度
24. 1月13日:ゼミ論執筆指導(希望者のみ研究室にて)
25. 1月20日:ゼミ論再提出
Ø 再提出ゼミ論回収
以上