専門演習2017年度演習記録
(作成:西郷 浩;掲示開始:2017年4月1日;最終更新:2018年1月16日)
専門演習(3年生 第23期生)
l 曜日・時限・教室:火3・3-609
l 教科書:
Ø [1] 末吉正成、里洋平、酒巻隆治、小林雄一郎、大城信晃(2014)『Rではじめるビジネス統計分析』翔泳社
Ø [2] Lander, J. P. (高柳慎一・牧山幸史・蓑田高志訳)(2015)『みんなのR:データ分析と統計解析の新しい教科書』マイナビ
l 評価:presentation + project
l 出席確認:あり
l 講義記録:
1. 4月11日:ゼミのルールの説明、教科書の割り当て、幹事の選出
2. 4月18日:教科書[1]の輪読
Ø 213、219、221:第1章 Rの基本操作
3. 4月25日:教科書[1]の輪読
Ø 215、220、222:第2章 データを視覚化する
4. 5月9日:教科書[1]の輪読
Ø 215、220、222:第2章 データを視覚化する;214、216:第3章 データを要約する
5. 5月16日:教科書[1]の輪読
Ø 216:第3章データを要約する;211、212、223、224:第4章データの関連性を見る
6. 5月23日:教科書[1]の輪読
Ø 224:第4章データの関連性を見る;222, 224:第5章未知のデータを予測する
7. 5月30日:教科書[1]の輪読
Ø 216、221、222:第5章未知のデータを予測する;212:第6章データを分類する
8. 6月6日:教科書[1]の輪読
Ø 212、213、216、219、223:第6章データを分類する
9. 6月13日:教科書[1]の輪読
Ø 215、216:第6章 データを分類する;217:第7章 テキストマイニングを行う
10. 6月20日:
Ø 211、214、220:第7章 テキストマイニングを行う;218、219:第8章 ログデータからクラスター分析を行う
11. 6月27日:教科書[1]の輪読
Ø 212、213、221、223:第8章 ログデータからクラスター分析を行う
12. 7月4日:教科書[1], [2] の輪読
Ø 212、213、221、223:第8章 ログデータからクラスター分析を行う
Ø 220、221:教科書[2] 第4章 Rの基本
13. 7月11日:教科書[2]の輪読
Ø 223、217:第5章 高度なデータ構造
Ø 216:第6章 Rへのデータの取り込み
14. 7月18日:休講(講師が本庄高等学院で模擬講義を実施するため。補講:夏合宿)
15. 7月25日:教科書[1]の輪読
Ø 216、219:第6章 Rへのデータの取り込み
Ø 224:第7章 統計グラフ
16. 9月12日--14日:教科書[1] 輪読+4年生のゼミ論中間報告。4年生の記録も参照。
Ø 9月12日14:00-17:00:教科書[2] 輪読
@ 222:第7章 統計グラフ
A 212、215:第8章 Rの関数を書く、第9章 コントロール文、第10章 ループ・Rの方法ではない反復方法
Ø 9月12日20:00-22:00:コンパ
Ø 9月13日9:00-12:00:4年生のゼミの中間報告
Ø 9月13日14:00-16:30:屋外コートでレクリエーション
Ø 9月13日19:00-21:00:教科書[2]輪読
@ 211、216:第11章 グルーピング
A 213、214:第12章 データ整形
Ø 9月14日9:20-11:45:教科書[2]輪読
@ 211、221:第13章 文字列操作
A 215、216:第14章 確率分布
B 214、217:第15章 基本統計
Ø 9月14日12:00:現地解散
17. 10月3日:教科書[1]
Ø 217:第15章 基本統計
18. 10月10日:教科書[1]の輪読
Ø 220:第16章 線形モデル
19. 10月17日:教科書[1]の輪読
Ø 222:第16章 線形モデル
20. 10月24日:教科書[1]の輪読
Ø 222:第16章 線形モデル
21. 10月31日:教科書[1]の輪読
Ø 224:第17章 一般化線形モデル
22. 11月7日:休講(大学が1-4時限休講となったため)
23. 11月14日:教科書[1], [2]の輪読
Ø 216:第17章 一般化線形モデル
Ø 219:第18章 モデル評価
24. 11月21日:教科書[2]の輪読
Ø 219、212:第18章 モデル評価
25. 11月28日:教科書[2]の輪読
Ø 220、222:第19章 正則化と縮小
Ø 223:第20章 非線形推定
26. 12月5日:教科書[2]の輪読
Ø 222:第19章 正則化と縮小
27. 12月12日:教科書[2]の輪読
Ø 213:第20章 非線形モデル(データがうまく読めず次回)
Ø 213:第21章 時系列と自己相関
28. 12月16日:ゼミ論報告会(4年生の記録参照)
Ø レポート:
@ 内容:ゼミ論報告の中からひとつの報告を選び、内容を要約して論評せよ。
A 提出期限:2018年12月31日23:59
B 提出方法:Course N@vi への添付ファイル(PDF)
C 用紙・分量:A4用紙1枚程度
29. 12月19日:教科書[2]の輪読
Ø 213:第20章 非線形モデル
Ø 217:第21章 時系列と自己相関
30. 1月9日:教科書[2]の輪読
Ø 213、217:第21章 時系列と自己相関
Ø 212:第22章 クラスタリング
31. 1月16日:教科書[3]の輪読
Ø 212、219:第22章 クラスタリング
32. 1月23日:期末レポート執筆指導(希望者のみ)
Ø レポート提出(期限:2018年1月31日23:59@Course N@vi)
Ø レポートの構成
@ 分析の目的
A データの説明
B 分析と考察
C 結論
D 参考文献
書式など:A4・横書き。最初のページに、(1)表題、(2) 作成者の番号・氏名、(3)提出or作成年月日、を記すこと。図表には、番号と表題をつけること。
Ø ゼミ論計画書(4年生の第1回演習で提出)
@ テーマ(目的)
A 利用データ
B 利用データの基本分析
C 分析手法
D 参考文献
書式など:A4・横書き。最初のページに、(1)表題、(2) 作成者の番号・氏名、(3)提出or作成年月日、を記すこと。図表には、番号と表題をつけること。提出期限:2016年度第1回ゼミ
専門演習(4年生 第22期生)
l 曜日・時限・教室:火4・3-609
l 内容:ゼミ論作成の指導+教科書の輪読
l 教科書:
Ø [1] 舟尾暢男(2014)『Rで学ぶプログラミングの基礎』カットシステム
Ø [2]石田基広、市川太祐、瓜生真也、湯谷啓明(2017)『Rによるスクレイピング入門』C&R研究所
l 評価:presentation + ゼミ論
l 出席確認:あり
l 講義記録:
1. 4月11日:教科書[1]輪読・実習
@ 全員
Ø 内容:第1章から第5章まで
Ø 課題:第5章から
2. 4月18日:教科書[1]輪読・実習
@ 全員
Ø 内容:第5章から第6章まで
Ø 課題:第6章から
3. 4月25日:教科書[1]輪読・実習
@ 全員
Ø 内容:第6章、第7章
Ø 課題:第6章から、ゼミ論で使用するデータと論文のテーマの説明
4. 5月9日:予備(質問者が研究室に来ること)
5. 5月16日:ゼミ論中間報告(ゼミ論で使用するデータと論文のテーマの説明)
@ 208「」
Ø 内容:首都圏のJR線の混雑率等のデータの提示
Ø 課題:輸送料(車両数*定員)と通過人員数の決定要因の整理、散布図の提示
A 210「」
Ø 内容:地区別一人当たり医療費の相違の分析、データの提示
Ø 課題:文献の探索(「厚生の指標」など)、箱ひげ図による一人当たり医療費の地区別分布の比較
B 225「」
Ø 内容:経済成長の要因分析、散布図の提示
Ø 課題:変数の定義の確認、Barroの論文の内容紹介
6. 5月23日:教科書[1]輪読・実習
@ 全員
Ø 内容:第6章、第7章、第8章
Ø 課題:第9章から
7. 5月30日:教科書[1]輪読・実習
@ 210:第9章 グラフ作成の概要
A 208:第10章 問題集
8. 6月 6日:ゼミ論執筆相談(希望者のみ)
9. 6月13日:ゼミ論中間報告
@ 208「」
Ø 内容:医療施設等と関連する要因(人口など)との相関分析
Ø 課題:データの確認、参考文献の探索
A 208「」
Ø 内容:混雑率の定義の確認、混雑率と関連する変数の相関分析
Ø 課題:回帰分析
B 225「」
Ø 内容:次回報告
Ø 課題:
10. 6月20日:ゼミ論中間報告
@ 225「」
Ø 内容:バロー論文に登場した散布図を最近のデータでの検証、回帰モデルの当てはめ
Ø 課題:バロー論文の符号条件の理由づけの検証
11. 6月27日:ゼミ論中間報告
@ 225:第11章 簡単なゲームの作成(ブラックジャック)
A 208:第11章 簡単なゲームの作成(○×ゲーム)
12. 7月4日:ゼミ論中間報告
@ 208:第11章 簡単なゲームの作成(○×ゲーム)
A 208:第11章 簡単なゲームの作成(デイトレード)
13. 7月11日:ゼミ論中間報告
@ 208:第1章 ウェブスクレイピングの準備、第2章ウェブ技術入門
A 208:第2章ウェブ技術入門
14. 7月18日:休講(講師が本庄高等学院で模擬講義を実施するため。補講:夏合宿)
15. 7月 25日:予備
@ 208「」
Ø 内容:変数選択
Ø 課題:東京以外の地域の分析
A 210(欠席)補講:8月22日17:00-18:00「」
Ø 内容:散布図作成、GISの利用
Ø 課題:人口をコントロールした変数での回帰分析、地域ダミーの導入
B 225「」
Ø 内容:バロー論文の符号条件の理由づけの検証
Ø 課題:教育変数の定義の確認、バロー以外の論文の参照
16. 9月12日--14日@:ゼミ論中間報告+3年生の教科書[1] 輪読。3年生の記録も参照。
Ø 9月12日14:00-17:00:3年生の教科書[2]輪読
Ø 9月12日20:00-22:00:コンパ
Ø 9月13日9:00-12:00:ゼミ論中間報告
@ 210「病院数、医師数への影響」
ü 内容:2次医療圏別の医師数、病床数、病院数の決定要因の分析
ü 課題:対数変換の利用
A 225「経済成長の決定要因」
ü 内容:Barro 論文の紹介と最近のデータによる追加検証
ü 課題:Barro モデル(連立方程式モデル)の確認
B 208「大都市圏の放射鉄道混雑率の統計的分析」
ü 内容:混雑率の定義と関連する変数との散布図、回帰分析の結果の紹介
ü 課題:雛形になる論文(「交通経済学」など)の探索
Ø 9月13日14:00-16:30:屋外コートでのリクリエーション
Ø 9月13日19:00-21:00:3年生の教科書[2]輪読
Ø 9月14日9:20-11:45:3年生の教科書[2]輪読
Ø 9月14日12:00 現地解散
17. 10月3日:ゼミ論中間報告
今後の予定の確認
@ 210「病院数、医師数への影響」
Ø 内容:ANOVA, AIC, BIC によるモデル選択
Ø 課題:残差分析
A 208「大都市圏の放射鉄道混雑率の統計的分析」
Ø 内容:首都圏・大阪圏をプールしたモデルの推定、交差検証法によるモデル選択
Ø 課題:変数の吟味(上限が1であることの改良)、交差項の解釈
B 225「経済成長の決定要因」
Ø 内容:2SLSによる推定、変数の追加(貨幣供給量、研究・開発投資)
Ø 課題:パネルデータ分析の適用の検討
18. 10月10日:教科書[2]輪読
@ 225:第2章第15節 HTTP
19. 10月17日:教科書[2]輪読
Ø 225:第2章第16節 認証、208:第3章 ウェブスクレイピング、API入門
20. 10月24日:休講(補講:2017年12月16日)
21. 10月31日:ゼミ論中間報告
@ 208「大都市圏の放射鉄道混雑率の統計的分析」
1. 内容:路線競合についての変数の改良、交差項に関連する分析
2. 課題:交互作用(傾きの異なるモデル)の有無の検定
A 210「医療圏別医師数・病床数に関する統計的分析」
1. 内容:対数変換の検討、残差の検討
2. 課題:目的変数の対数変換の再検討
B 225「経済成長の決定要因」
Ø 内容:パネルデータ分析の適用
Ø 課題:2006年からのデータへのパネルデータ分析の適用
C 226「日韓の国際旅客数に関する統計的分析」
Ø 内容:日韓の旅客数のデータの提示
Ø 課題:説明変数データの収集、散布図の作成
22. 11月7日:教科書[2]輪読
Ø 226「日韓の国際旅客数に関する統計的分析」
Ø 内容:日本への外国人観光客の数と為替レート、原油価格の散布図
Ø 課題:データセットの作成
Ø 210「医療圏別医師数・病床数に関する統計的分析」
Ø 内容:対数変換(目的変数)の利用、残差分析
Ø 課題:説明変数への対数変換の検討
23. 11月14日:ゼミ中間報告
@ 226「日韓の国際旅客数に関する統計的分析」
Ø 内容:出発国別の観光客数と一人当たりGDPとの関係
Ø 課題:他の変数も含めたモデルの推定
A 208「大都市圏の放射鉄道混雑率の統計的分析」
Ø 内容:首都圏と関西圏における傾きの差の検定(t検定、F検定)
Ø 課題:ゼミ論の作成
B 225「経済成長の決定要因」
Ø 内容:fixed effects model と random effects model との比較、各種の検定
Ø 課題:ゼミ論の作成
24. 11月21日:休講(学外研究会のため。補講:ゼミ論報告会)
25. 11月28日:ゼミ論中間報告
Ø 210「医療圏別医師数・病床数の偏在に関する統計的分析」
Ø 内容:論文の構成
Ø 課題:ゼミ論の作成
Ø 208「大都市圏の放射鉄道混雑率の統計的分析」
Ø 内容:論文の構成、モデル選択についての補足
Ø 課題:ゼミ論の作成
Ø 225「経済成長の決定要因」
Ø 内容:論文の構成
Ø 課題:第2章、第3章の構成の再検討、論文の執筆
Ø 226「日韓の国際旅客数に関する統計的分析」
Ø 内容:アメリカから日本に訪れる観光客数の推計式
Ø 課題:構造変化への対応、説明変数としての為替レート(消費者物価指数と合成するかどうか)
26. 12月5日:ゼミ論提出(on line by 16:30)
27. 12月12日:ゼミ論報告会用ハンドアウト原稿提出(on line by 16:30)
Ø ハンドアウトの構成
I. 分析の目的
II. データの説明
III. 分析と結果の考察
IV. 結論
V. 参考文献
Ø 書式など:A4用紙で2ページないし4ページ、最初のページに、(1)表題、(2) 作成者の番号・氏名、(3)提出or作成年月日、を記すこと。図表には、番号と表題をつけること。
28. 12月16日(土)ゼミ論報告会(場所:3-809)15:05-17:30
Ø 報告会プログラム
I. はじめに(西郷) 15:05-15:15
II. 報告
@ 15:15-15:55 208「鉄道の混雑率に関する統計的分析」
A 15:55-16:30 210「医師数、病院数偏在の原因と改善方法」
16:30-16:45 休憩
B 16:45-17:25 225「経済成長の決定要因」
C (2017年12月19日@3-712)16:30-17:00 226「日韓の観光需要についての統計的分析」
III. 第23期生ゼミ論抱負 17:25-17:55
IV. おわりに(西郷)17:55-18:00
(終了後、忘年会)
Ø レポート:
I. 内容:自分のもの以外のゼミ論報告の中からひとつを選び、内容を要約して論評せよ。
II. 提出期限:2017年12月31日23:59
III. 提出方法:Course N@vi への添付ファイル(PDF)
IV. 用紙・分量:A4用紙1枚程度
29. 12月19日:ゼミ論報告会(2)
Ø 報告会プログラム
30. 1月9日:ゼミ論執筆指導(希望者のみ研究室にて)
31. 1月16日:ゼミ論執筆指導(希望者のみ研究室にて)
32. 1月23日:ゼミ論再提出(印刷物)
プレ演習(2年生 第24期生)
l 曜日・時限・教室:
l 内容:プリント「経済データ分析」をもちいたR実習
l 評価:課題の提出状況
l 出席確認:あり
l 講義記録:
1. 11月27日:自己紹介、今後のプレ演習の進め方
Ø 今後の進め方:Course N@vi に教材を配信して、各自でRを予習する。課題提出あり。
以上