専門演習2011年度演習記録
(作成:西郷 浩;掲示開始:2011年4月1日;最終更新:2012年2月6日)
専門演習(3年生 第17期生)
l 曜日・時限・教室:火3・7-407
l 教科書:
Ø [1] Crawley, M.J.(野間口謙太郎・菊池泰樹 訳、2008年)『統計学:Rを用いた入門書』共立出版
Ø [2] 金明哲(2007)『Rによるデータサイエンス』森北出版
l 評価:presentation + project
l 出席確認:あり
l 講義記録:
1. 5月10日:ゼミのルールの説明、教科書の割り当て、幹事の選出
2. 5月17日:教科書[1]の輪読
Ø 153・154・156:第1章 基本
3. 5月24日:教科書[1]の輪読
Ø 153・154・156:第1章 基本
Ø 159・163・165:第2章 データフレーム
4. 5月31日:教科書[1]の輪読
Ø 159・163・165:第3章 さまざまな中心値
Ø 161・162:第4章 分散
5. 6月7日:教科書[1]の輪読
Ø 161・162:第4章 分散
6. 6月14日:教科書[1]の輪読
Ø 161・162:第4章 分散
Ø 150・157・164:第5章 1標本問題
7. 6月21日:教科書[1]の輪読
Ø 150・157・164:第5章 1標本問題
8. 6月28日:教科書[1]の輪読
Ø 151・152・160:第6章 2標本データ
9. 7月 5日:教科書[1]の輪読
Ø 151・152・160:第6章 2標本データ
10. 7月12日:教科書[1]の輪読
Ø 151・152・160:第6章 2標本データ
Ø 149・158・165:第7章 統計モデル
11. 7月19日:教科書[1]の輪読
Ø 149・158・165:第7章 統計モデル
Ø 153・163・164:第8章 回帰モデル
12. 7月26日:教科書[1]の輪読
Ø 153・163・164:第8章 回帰モデル
13. 8月2日:教科書[1]の輪読
Ø 153・163・164:第8章 回帰モデル
Ø 149・154・159:第9章 分散分析
14. 9月14日—17日:ゼミ合宿@山中湖グリーンロッヂ(教科書[1]輪読+4年生のゼミ論中間報告。4年生の記録も参照)
Ø 9月14日14:00-17:00:149・154・159:第9章 分散分析
Ø 9月14日19:00-21:30:4年生のゼミ論中間報告
Ø 9月15日9:00-12:00:150・152・155:第10章 共分散分析・第11章 重回帰、151・160・161:第12章 対比
Ø 9月15日14:00-17:00:4年生のゼミ論中間報告、151・160・161:第12章 対比
Ø 9月15日19:00-21:30:4年生のゼミ論中間報告、151・160・161:第12章 対比、156、157、158:第13章 計数データ
Ø 9月16日9:00-12:00:4年生のゼミ論中間報告
Ø 9月16日:13:00-16:00:レクリエーション(フットサル、ソフトボール)
Ø 9月17日:10:00-12:00:観光(紅富士の湯)
15. 9月27日:教科書[1]
Ø 156・157・158:第13章 計数データ
Ø 152・162・163:第14章 比率データ
16. 10月4日:教科書[1]の輪読
Ø 152・162・163:第14章 比率データ
17. 10月11日:教科書[1]の輪読
Ø 149・154・155:第15章 死亡及び故障データ、第16章 2項応答変数
18. 10月18日:教科書[1,2]の輪読
Ø 149・154・155:[1] 第15章 死亡及び故障データ、第16章 2項応答変数
Ø 149・156・161:[2] 第4章 データの視覚化
19. 10月25日:教科書[2]の輪読
Ø 149・156・161:[2] 第4章 データの視覚化
Ø 157・162・163:[2] 第1章 主成分分析
20. 11月1日:教科書[2]の輪読
Ø 157・162・163:[2] 第1章 主成分分析
Ø 151・155・160:[2] 第2章 因子分析
21. 11月8日:教科書[2]の輪読
Ø 152・164・165:[2] 第3章 対応分析
Ø 150・153・154:[2] 第4章 多次元尺度法
22. 11月15日:休講(補講:2011年12月17日 ゼミ論報告会)
23. 11月22日:教科書[2]の輪読
Ø 156・158・159:第5章 クラスター分析
Ø 150・162・163:第6章 自己組織化マップ
24. 11月29日:教科書[2]の輪読
Ø 150・162・163:第6章 自己組織化マップ
Ø 149・154・164:第7章 線形回帰分析
25. 12月6日:教科書[2]の輪読
Ø 149・154・164:第7章 線形回帰分析
Ø 153・157・159:第8章 非線形回帰分析
26. 12月13日:教科書[2]の輪読
Ø 151・155・165:教科書[2] 第9章 線形判別分析
Ø 152・160・161:教科書[2] 第10章 非線形判別分析
27. 12月17日(土)13:00—17:30 ゼミ論報告会@1-302(11月15日の補講をふくむ)
Ø 第16期生の箇所参照
Ø レポート:
I. 内容:ゼミ論報告の中からひとつを選び、内容を要約して論評せよ。
II. 提出期限:2011年12月31日
III. 提出方法:Course N@vi
IV. 用紙・分量:A4用紙1枚程度
28. 12月20日:教科書[2]の輪読
Ø 152・160・161:教科書[2] 第10章 非線形判別分析
Ø 152・158・163:教科書[2] 第11章 生存時間分析
29. 1月17日:教科書[2]の輪読
Ø 152・158・163:教科書[2] 第11章 生存時間分析
30. 1月24日:教科書[2]の輪読、レポート提出
Ø 160・船原 丈寛:教科書[2] 第12章 時系列分析
Ø レポート提出
Ø レポートの構成
I. 分析の目的
II. データの説明
III. 分析と考察
IV. 結論
V. 参考文献
書式など:A4・横書き。最初のページに、(1)表題、(2) 作成者の番号・氏名、(3)提出or作成年月日、を記すこと。図表には、番号と表題をつけること。
Ø ゼミ論計画書(4年生の第1回演習で提出)
I. テーマ(目的)
II. 利用データ
III. 利用データの基本分析
IV. 分析手法
V. 参考文献
書式など:A4・横書き。最初のページに、(1)表題、(2) 作成者の番号・氏名、(3)提出or作成年月日、を記すこと。図表には、番号と表題をつけること。提出期限:2012年度第1回ゼミ
専門演習(4年生 第16期生)
l 曜日・時限・教室:火4・7-407
l 内容:ゼミ論作成の指導
l 評価:presentation + ゼミ論
l 出席確認:あり
l 講義記録:
1. 5月10日:3年次レポートの返却、ゼミ論計画書提出、ゼミ論中間報告
@ 147「ニューラルネットワークと株価」
Ø 内容:東証株価指数・日経平均株価の水準と変化率
Ø 課題:ニューラルネットワークを利用した株価分析に関する文献の探索
2. 5月17日: ゼミ論中間報告
@ 141「地方交付税の統計的分析から見る地方財政」
Ø 内容:地方交付税・人口などの多変量を利用した都道府県のクラスター分析
Ø 課題:130.「地方交付税に見る地方格差と問題点」の参照、データの獲得、教師ありの分類の利用
A 143「住宅投資の計量分析(仮題)」
Ø 内容:国土交通省「建築着工統計」にもとづく分析のアイディアの紹介
Ø 課題:住宅投資に関する計量モデルによる分析を参照する。「建築着工統計」データへの時系列モデルの適用
3. 5月24日:ゼミ論中間報告
@ 144「スキー場の入場者数に関する分析」
Ø 内容:SKI MAPPLE データをもちいた回帰分析・主成分分析・クラスター分析
Ø 課題:因果関係の特定、データの信頼性(変数の定義など)の検証、需要分析の視点、社会生活基本調査データの利用
A 145「地域格差と住みやすさ」
Ø 内容:全国物価地域差指数や人口密度、面積などによる東京都と高知県との比較
Ø 課題:企業ランキングなどの多変量解析を利用したデータ縮約方法の探索
4. 5月31日:ゼミ論中間報告
@ 140「競馬のすすめ」
Ø 内容:着順の決定要因(odds, など)
Ø 課題:従属変数(着順かタイムか;変数変換)と独立変数の工夫
A 148「都道府県別夫婦の賃金と家賃の合計特殊出生率に与える影響」
Ø 内容:都道府県別合計特殊出生率への経済的要因の影響
Ø 課題:合計特殊出生率決定要因に関する論文の探索、合計特殊出生率データの表示
5. 6月7日:ゼミ論中間報告
@ 147「ニューラルネットワークによる日経平均株価予測」
Ø 内容:テクニカル分析に使われる指標と、それらを入力としてつかったニューラルネットワークによる日経平均株価予測」
Ø 課題:指標の追加と評価方法の検討
A 141「地方交付税の統計的分析から見る地方財政」
Ø 内容:産業構造(第1・2・3次産業別県内総生産)を変数に追加して実施した判別分析
Ø 課題:地方交付税決定要因の概念化、概念化にもとづく変数選択、人口規模の処理
6. 6月14日:ゼミ論中間報告
@ 143「住宅投資の計量分析」
Ø 内容:新規住宅着工件数へのARモデルの適用、マンション価格へのヘドニックアプローチ
Ø 課題:時系列モデルの選択(トレンドの処理)、リフォーム統計・国勢調査(世帯構造の変化)の確認、マンションの売買(カタログ)価格の入力
7. 6月 21日:ゼミ論中間報告
@ 144「スキー場の入場者数に関する分析」
Ø 内容:H18年社会生活基本調査による、属性別スキー・スノーボード行動者数の分析
Ø 課題:H18年よりも前の社会生活基本調査による分析(コーホート分析)
8. 6月28日:ゼミ論中間報告
@ 146「埼玉西武ライオンズの野球データ解析」
Ø 内容:埼玉西部ライオンズの試合結果に関するデータの提示と、分析案の紹介
Ø 課題:投手力指標の工夫
A 140「競馬の進め:競馬投票券必勝法の発見」
Ø 内容:odds の対数変換、主成分分析による騎手の能力の測定、バラツキの測定の工夫(変動係数)、treeモデルによる勝ち馬oddsの分析
Ø 課題:主成分得点の活用
9. 7月5日:ゼミ論中間報告
@ 141「地方財政に関する統計的分析」
Ø 内容:人口、歳入・歳出、第1次産業生産額、出生(率)、死亡(率)最低賃金によるクラスター分析と地方交付税のクラスター分析との比較
Ø 課題:教師ありの分類の試算(CARTなど)、人口規模の処理、外れ値(北海道)の処理の検討
10. 7月12日:ゼミ論中間報告
@ 147「ニューラルネットワークによる日経平均株価予測」
Ø 内容:3指標(10指標中)を入力としたニューラルネットワークモデルによる日経平均株価の予測
Ø 課題:4以上の指標をもちいたニューラルネットワークモデルの推定、変数の意味による選別
A 143「住宅投資の計量分析」
Ø 内容:国土交通省「年度別新設住宅着工戸数」へのARIMAモデルの適用と予測
Ø 課題:1983年における趨勢の分岐の可能性の検討、対数階差データへの2次の階差の適用
11. 7月19日:ゼミ論中間報告
@ 144「スキー場の入場者数に関する分析」
Ø 内容:H18年社会生活基本調査によるスキー・スノーボード行動者率の分析(学歴の影響)
Ø 課題:コーホート分析、行動者率への影響要因の整理、レジャー白書(時系列データ)の分析
A 140「競馬のすすめ」
Ø 内容:サンプルサイズを拡大した主成分分析の実行、変動係数の利用、馬の体重の変化の利用
Ø 課題:体重の変化の取り扱い(非線形性の考慮、一般化加法モデルの検討)
12. 7月26日:ゼミ論中間報告
@ 146「先発投手の潜在能力による勝率の推定」
Ø 内容:セイバーメトリックスを利用した先発投手の評価、logitモデルによる推定
Ø 課題:相手投手の能力の反映、合成変数の作成(e.g. 主成分分析)、home or visitor 変数と他の変数との交互作用
A 145「都道府県住みやすさランキングの作成」
Ø 内容:総務省統計局『統計で見る都道府県の姿2011』をもちいた、住みやすさ指標作成のための因子分析
Ø 課題:自分の考える「住みやすさ」の概念化、概念に対応した変数の選択、変数の基本分析(ヒストグラム、散布図行列など)の徹底
B 全員
Ø 課題:夏合宿の準備
ü 分析目的の明示
ü 使用データの説明
ü 使用データの基本的な性質
ü 分析
13. 8月2日:予備日(研究室においてゼミ論相談)
14. 9月14日—17日:ゼミ合宿(ゼミ論中間報告+3年生の教科書輪読。3年の記録も参照)
Ø 9月14日14:00-17:00:3年生の教科書[1]の輪読
Ø 9月14日19:00-21:00:
@ 145「地域格差と住みやすさ」
ü 内容:因子分析をもちいた暮らしやすさ因子の抽出
ü 課題:「暮らしやすさ」概念の整理、概念に沿った変数の選択
A 146「地域格差と住みやすさ」
ü 内容:先発投手の能力(セイバーメトリックス利用)による試合の勝敗確率の推定
ü 課題:計数データの分析の利用
Ø 9月15日9:00-12:00:3年生の教科書[1]の輪読
Ø 9月15日14:00-17:00:4年生のゼミ論中間報告、3年生の教科書[1]の輪読
@ 140「競馬のすすめ」
ü 内容:オッズと着順との関係、体重変化・オッズのバラツキの考慮、末足の標準化(レース内容への対応)
ü 課題:種牡馬の影響の分析
A 144「スキー場の入場者数に関する分析」
ü 内容:「Ski Mapple」による供給側の分析、総務省統計局「社会生活基本調査」による需要側の分析(コーホート効果)
ü 課題:「社会生活基本調査」の詳細な分析(就業状態の効果など)
Ø 9月15日19:00-21:40:4年生のゼミ論中間報告、3年生の教科書[1]の輪読
@ 147「ニューラルネットワークによる株価予測」
ü 内容:ニューラルネットワークによる日経平均株価の分析
ü 課題:ニューラルネットワークにおける変数選択の問題、個別銘柄の予測
Ø 9月16日:9:00-12:00:4年生のゼミ論中間報告
@ 141「地方財政に関する統計的分析」
ü 内容:地方交付税の決定要因の概念化、概念に沿った変数の選択、クラスター分析(地方交付税を加えないで実行したクラスターと地方交付税との対応)
ü 課題:教師ありの分類(たとえば、回帰木)の実行
A 143「住宅投資の計量分析」
ü 内容:ARIMAモデルによる1974年以降の新設住宅戸数の推定と予測、世帯に関する統計による補足
ü 課題:世帯類型データの分析
B 148「都道府県別夫婦の賃金と住居費用、持ち家比率の合計特殊出生率に与える影響」
ü 内容:男性の給与と女性の賃金率、平均住居費、持ち家率を説明変数とした都道府県別合計特殊出生率の
ü 課題:都道府県別合計特殊出生率の相違をもたらす理論的要因の探索
Ø 9月16日:13:00-16:00:レクリエーション(フットサル、ソフトボール)
Ø 9月17日:10:00-12:00:観光(紅富士の湯)
15. 9月27日:ゼミ論中間報告
@ 140「競馬のすすめ」
Ø 内容:位置取り変数の追加(レースの質をあらわす)
Ø 課題:多項選択モデルの適用
A 141「地方財政に関する統計的分析」
Ø 内容:クラスター分析の結果の表示、回帰木のあてはめ
Ø 課題:地方交付税の配分の条件に照らした回帰木の結果の評価
16. 10月4日:ゼミ論中間報告
@ 144「スキー場の入場者に関する分析」
Ø 内容:コーホート分析による、スキー・行動者率への世代効果の検討
Ø 課題:性別による区分、0日行動者の表章
A 148「都道府県別合計特殊出生率に影響を与える要因の検証」
Ø 内容:25-29歳の女子有配偶率、大学進学率の
Ø 課題:モデルの推定
17. 10月11日:ゼミ論中間報告
@ 145「地域格差と住みやすさ」
Ø 内容:安心度・利便度・娯楽度・将来性に対応した変数選択
Ø 課題:4つの側面の具体化(変数選択の根拠としての)、変数選択の根拠の精緻化
A 147「ニューラルネットワークによる株価予測」
Ø 内容:個別銘柄(りそなホールディングス)へのニューラルネットワークの適用、入力変数の数・種類の吟味
Ø 課題:ニューラルネットにおける予測のための変数選択の指標、ニューラルネットで選択された変数の関係の吟味
18. 10月18日:ゼミ論中間報告
@ 143「住宅投資の計量分析」
Ø 内容:都道府県別借家家賃の分布に関する因子分析、クラスター分析
Ø 課題:分布を説明するモデルの探索、国勢調査データの分析(世帯類型)
A 146「西武ライオンズの勝率についての分析」
Ø 内容:推定モデルから予測した勝率と実際の勝率(順位)との比較
Ø 課題:予測勝率と実際の勝率との対比(前者を条件としたときの条件付平均値)
19. 10月25日:ゼミ論中間報告
@ 148「都道府県別合計特殊出生率に影響を及ぼす要因の検証」
Ø 内容:進学率、平均寿命の変数の追加
Ø 課題:合計特殊出生率に影響をあたえる要因の上位概念の整理(それに対応する変数の性質)、厚生労働省「21世紀成年者縦断調査」の活用
20. 11月1日:ゼミ論個別相談(希望者のみ研究室にて)
21. 11月8日:ゼミ論個別相談(希望者のみ研究室にて)
22. 11月15日:ゼミ論中間報告(希望者のみ研究室にて)
23. 11月22日:ゼミ論執筆指導(希望者のみ研究室にて)
24. 11月29日:ゼミ論執筆指導(希望者のみ研究室にて)
25. 12月 6日:ゼミ論提出
26. 12月 13日:ゼミ論報告会用ハンドアウト原稿提出
Ø ハンドアウトの構成
I. 分析の目的
II. データの説明
III. 分析と結果の考察
IV. 結論
V. 参考文献
Ø 書式など:A4用紙で2ページないし4ページ、最初のページに、(1)表題、(2) 作成者の番号・氏名、(3)提出or作成年月日、を記すこと。図表には、番号と表題をつけること。
27. 12月17日(土)13:00—17:30 ゼミ論報告会@1-302
Ø 報告会プログラム
I. はじめに
II. 報告
@ 147「株価予測とニューラルネット」
A 141「地方財政に関する統計的分析」
B 145「地域格差と住みやすさ」
C 140「早稲田式負けない馬券術—レース予測の回帰分析—」
D 146「セイバーメトリックスを用いた埼玉西武ライオンズの勝率分析」
E 148「都道府県別合計特殊出生率に影響を与える要因の検証」
F 144「スキー場の入場者数に関する分析」
III. 第17期生ゼミ論抱負
IV. おわりに
(終了後、忘年会)
Ø レポート:
I. 内容:自分のもの以外のゼミ論報告の中からひとつを選び、内容を要約して論評せよ。
II. 提出期限:2011年12月31日
III. 提出方法:Course N@vi への添付ファイル
IV. 用紙・分量:A4用紙1枚程度
28. 12月20日:ゼミ論執筆指導(希望者のみ研究室にて)
29. 1月17日:ゼミ論執筆指導(希望者のみ研究室にて)
30. 1月24日:ゼミ論再提出
以上