専門演習2011年度演習記録

 

(作成:西郷 浩;掲示開始:201141日;最終更新:201226日)

 

専門演習(3年生 17期生)

l         曜日・時限・教室:火37-407

l         教科書:

Ø         [1] Crawley, M.J.(野間口謙太郎・菊池泰樹 訳、2008年)『統計学:Rを用いた入門書』共立出版

Ø         [2] 金明哲(2007)Rによるデータサイエンス』森北出版

l         評価:presentation + project

l         出席確認:あり

l         講義記録:

1.        510日:ゼミのルールの説明、教科書の割り当て、幹事の選出

2.        517日:教科書[1]の輪読

Ø         153154156:第1 基本

3.        524日:教科書[1]の輪読

Ø         153154156:第1 基本

Ø         159163165:第2 データフレーム

4.        531日:教科書[1]の輪読

Ø         159163165:第3 さまざまな中心値

Ø         161162:第4章 分散

5.        67日:教科書[1]の輪読

Ø         161162:第4章 分散

6.        614日:教科書[1]の輪読

Ø         161162:第4章 分散

Ø         150157164:第5 1標本問題

7.        621日:教科書[1]の輪読

Ø         150157164:第5 1標本問題

8.        628日:教科書[1]の輪読

Ø         151152160:第6 2標本データ

9.        7 5日:教科書[1]の輪読

Ø         151152160:第6 2標本データ

10.    712日:教科書[1]の輪読

Ø         151152160:第6 2標本データ

Ø         149158165:第7 統計モデル

11.    719日:教科書[1]の輪読

Ø         149158165:第7 統計モデル

Ø         153163164:第8 回帰モデル

12.    726日:教科書[1]の輪読

Ø         153163164:第8 回帰モデル

13.    82日:教科書[1]の輪読

Ø         153163164:第8 回帰モデル

Ø         149154159:第9 分散分析

14.    914—17日:ゼミ合宿@山中湖グリーンロッヂ(教科書[1]輪読+4年生のゼミ論中間報告。4年生の記録も参照)

Ø         91414:00-17:00149154159:第9 分散分析

Ø         91419:00-21:304年生のゼミ論中間報告

Ø         9159:00-12:00150152155:第10 共分散分析・第11 重回帰、151160161:第12 対比

Ø         91514:00-17:004年生のゼミ論中間報告、151160161:第12 対比

Ø         91519:00-21:304年生のゼミ論中間報告、151160161:第12 対比、156157158:第13 計数データ

Ø         9169:00-12:004年生のゼミ論中間報告

Ø         916日:13:00-16:00:レクリエーション(フットサル、ソフトボール)

Ø         917日:10:00-12:00:観光(紅富士の湯)

15.    927日:教科書[1]

Ø         156157158:第13 計数データ

Ø         152162163:第14 比率データ

16.    104日:教科書[1]の輪読

Ø         152162163:第14 比率データ

17.    1011日:教科書[1]の輪読

Ø         149154155:第15 死亡及び故障データ、第16 2項応答変数

18.    1018日:教科書[1,2]の輪読

Ø         149154155[1] 15 死亡及び故障データ、第16 2項応答変数

Ø         149156161[2] 4 データの視覚化

19.    1025日:教科書[2]の輪読

Ø         149156161[2] 4 データの視覚化

Ø         157162163[2] 1 主成分分析

20.    111日:教科書[2]の輪読

Ø         157162163[2] 1 主成分分析

Ø         151155160[2] 2 因子分析

21.    118日:教科書[2]の輪読

Ø         152164165[2] 3 対応分析

Ø         150153154[2] 4 多次元尺度法

22.    1115日:休講(補講:20111217 ゼミ論報告会)

23.    1122日:教科書[2]の輪読

Ø         156158159:第5 クラスター分析

Ø         150162163:第6 自己組織化マップ

24.    1129日:教科書[2]の輪読

Ø         150162163:第6 自己組織化マップ

Ø         149154164:第7 線形回帰分析

25.    126日:教科書[2]の輪読

Ø         149154164:第7 線形回帰分析

Ø         153157159:第8 非線形回帰分析

26.    1213日:教科書[2]の輪読

Ø         151155165:教科書[2] 9 線形判別分析

Ø         152160161:教科書[2] 10 非線形判別分析

27.    1217日(土)13:00—17:30 ゼミ論報告会@1-3021115日の補講をふくむ)

Ø         16期生の箇所参照

Ø         レポート:

I.                内容:ゼミ論報告の中からひとつを選び、内容を要約して論評せよ。

II.             提出期限:20111231

III.          提出方法:Course N@vi

IV.           用紙・分量:A4用紙1枚程度

28.    1220日:教科書[2]の輪読

Ø         152160161:教科書[2] 10 非線形判別分析

Ø         152158163:教科書[2] 11 生存時間分析

29.    117日:教科書[2]の輪読

Ø         152158163:教科書[2] 11 生存時間分析

30.    124日:教科書[2]の輪読、レポート提出

Ø         160・船原 丈寛:教科書[2] 12 時系列分析

Ø         レポート提出

Ø         レポートの構成

I.                分析の目的

II.             データの説明

III.          分析と考察

IV.           結論

V.              参考文献

書式など:A4・横書き。最初のページに、(1)表題、(2) 作成者の番号・氏名、(3)提出or作成年月日、を記すこと。図表には、番号と表題をつけること。

Ø         ゼミ論計画書(4年生の第1回演習で提出)

I.                テーマ(目的)

II.             利用データ

III.          利用データの基本分析

IV.           分析手法

V.              参考文献

書式など:A4・横書き。最初のページに、(1)表題、(2) 作成者の番号・氏名、(3)提出or作成年月日、を記すこと。図表には、番号と表題をつけること。提出期限:2012年度第1回ゼミ

 

 

専門演習(4年生 16期生)

l         曜日・時限・教室:火47-407

l         内容:ゼミ論作成の指導

l         評価:presentation + ゼミ論

l         出席確認:あり

l         講義記録:

1.        510日:3年次レポートの返却、ゼミ論計画書提出、ゼミ論中間報告

@       147「ニューラルネットワークと株価」

Ø         内容:東証株価指数・日経平均株価の水準と変化率

Ø         課題:ニューラルネットワークを利用した株価分析に関する文献の探索

2.        517日: ゼミ論中間報告

@       141「地方交付税の統計的分析から見る地方財政」

Ø         内容:地方交付税・人口などの多変量を利用した都道府県のクラスター分析

Ø         課題:130.「地方交付税に見る地方格差と問題点」の参照、データの獲得、教師ありの分類の利用

A       143「住宅投資の計量分析(仮題)」

Ø         内容:国土交通省「建築着工統計」にもとづく分析のアイディアの紹介

Ø         課題:住宅投資に関する計量モデルによる分析を参照する。「建築着工統計」データへの時系列モデルの適用

3.        524日:ゼミ論中間報告

@       144「スキー場の入場者数に関する分析」

Ø         内容:SKI MAPPLE データをもちいた回帰分析・主成分分析・クラスター分析

Ø         課題:因果関係の特定、データの信頼性(変数の定義など)の検証、需要分析の視点、社会生活基本調査データの利用

A       145「地域格差と住みやすさ」

Ø         内容:全国物価地域差指数や人口密度、面積などによる東京都と高知県との比較

Ø         課題:企業ランキングなどの多変量解析を利用したデータ縮約方法の探索

4.        531日:ゼミ論中間報告

@       140「競馬のすすめ」

Ø         内容:着順の決定要因(odds, など)

Ø         課題:従属変数(着順かタイムか;変数変換)と独立変数の工夫

A       148「都道府県別夫婦の賃金と家賃の合計特殊出生率に与える影響」

Ø         内容:都道府県別合計特殊出生率への経済的要因の影響

Ø         課題:合計特殊出生率決定要因に関する論文の探索、合計特殊出生率データの表示

5.        67日:ゼミ論中間報告

@       147「ニューラルネットワークによる日経平均株価予測」

Ø         内容:テクニカル分析に使われる指標と、それらを入力としてつかったニューラルネットワークによる日経平均株価予測」

Ø         課題:指標の追加と評価方法の検討

A       141「地方交付税の統計的分析から見る地方財政」

Ø         内容:産業構造(第123次産業別県内総生産)を変数に追加して実施した判別分析

Ø         課題:地方交付税決定要因の概念化、概念化にもとづく変数選択、人口規模の処理

6.        614日:ゼミ論中間報告

@       143「住宅投資の計量分析」

Ø         内容:新規住宅着工件数へのARモデルの適用、マンション価格へのヘドニックアプローチ

Ø         課題:時系列モデルの選択(トレンドの処理)、リフォーム統計・国勢調査(世帯構造の変化)の確認、マンションの売買(カタログ)価格の入力

7.        6 21日:ゼミ論中間報告

@       144「スキー場の入場者数に関する分析」

Ø         内容:H18年社会生活基本調査による、属性別スキー・スノーボード行動者数の分析

Ø         課題:H18年よりも前の社会生活基本調査による分析(コーホート分析)

8.        628日:ゼミ論中間報告

@       146「埼玉西武ライオンズの野球データ解析」

Ø         内容:埼玉西部ライオンズの試合結果に関するデータの提示と、分析案の紹介

Ø         課題:投手力指標の工夫

A       140「競馬の進め:競馬投票券必勝法の発見」

Ø         内容:odds の対数変換、主成分分析による騎手の能力の測定、バラツキの測定の工夫(変動係数)、treeモデルによる勝ち馬oddsの分析

Ø         課題:主成分得点の活用

9.        75日:ゼミ論中間報告

@       141「地方財政に関する統計的分析」

Ø         内容:人口、歳入・歳出、第1次産業生産額、出生(率)、死亡(率)最低賃金によるクラスター分析と地方交付税のクラスター分析との比較

Ø         課題:教師ありの分類の試算(CARTなど)、人口規模の処理、外れ値(北海道)の処理の検討

10.    712日:ゼミ論中間報告

@       147「ニューラルネットワークによる日経平均株価予測」

Ø         内容:3指標(10指標中)を入力としたニューラルネットワークモデルによる日経平均株価の予測

Ø         課題:4以上の指標をもちいたニューラルネットワークモデルの推定、変数の意味による選別

A       143「住宅投資の計量分析」

Ø         内容:国土交通省「年度別新設住宅着工戸数」へのARIMAモデルの適用と予測

Ø         課題:1983年における趨勢の分岐の可能性の検討、対数階差データへの2次の階差の適用

11.    719日:ゼミ論中間報告

@       144「スキー場の入場者数に関する分析」

Ø         内容:H18年社会生活基本調査によるスキー・スノーボード行動者率の分析(学歴の影響)

Ø         課題:コーホート分析、行動者率への影響要因の整理、レジャー白書(時系列データ)の分析

A       140「競馬のすすめ」

Ø         内容:サンプルサイズを拡大した主成分分析の実行、変動係数の利用、馬の体重の変化の利用

Ø         課題:体重の変化の取り扱い(非線形性の考慮、一般化加法モデルの検討)

12.    726日:ゼミ論中間報告

@       146「先発投手の潜在能力による勝率の推定」

Ø         内容:セイバーメトリックスを利用した先発投手の評価、logitモデルによる推定

Ø         課題:相手投手の能力の反映、合成変数の作成(e.g. 主成分分析)、home or visitor 変数と他の変数との交互作用

A       145「都道府県住みやすさランキングの作成」

Ø         内容:総務省統計局『統計で見る都道府県の姿2011』をもちいた、住みやすさ指標作成のための因子分析

Ø         課題:自分の考える「住みやすさ」の概念化、概念に対応した変数の選択、変数の基本分析(ヒストグラム、散布図行列など)の徹底

B       全員

Ø         課題:夏合宿の準備

ü         分析目的の明示

ü         使用データの説明

ü         使用データの基本的な性質

ü         分析

13.    82日:予備日(研究室においてゼミ論相談)

14.    914—17日:ゼミ合宿(ゼミ論中間報告+3年生の教科書輪読。3年の記録も参照)

Ø       91414:00-17:003年生の教科書[1]の輪読

Ø       91419:00-21:00

@       145「地域格差と住みやすさ」

ü         内容:因子分析をもちいた暮らしやすさ因子の抽出

ü         課題:「暮らしやすさ」概念の整理、概念に沿った変数の選択

A       146「地域格差と住みやすさ」

ü         内容:先発投手の能力(セイバーメトリックス利用)による試合の勝敗確率の推定

ü         課題:計数データの分析の利用

Ø       9159:00-12:003年生の教科書[1]の輪読

Ø       91514:00-17:004年生のゼミ論中間報告、3年生の教科書[1]の輪読

@       140「競馬のすすめ」

ü         内容:オッズと着順との関係、体重変化・オッズのバラツキの考慮、末足の標準化(レース内容への対応)

ü         課題:種牡馬の影響の分析

A       144「スキー場の入場者数に関する分析」

ü         内容:「Ski Mapple」による供給側の分析、総務省統計局「社会生活基本調査」による需要側の分析(コーホート効果)

ü         課題:「社会生活基本調査」の詳細な分析(就業状態の効果など)

Ø       91519:00-21:404年生のゼミ論中間報告、3年生の教科書[1]の輪読

@       147「ニューラルネットワークによる株価予測」

ü         内容:ニューラルネットワークによる日経平均株価の分析

ü         課題:ニューラルネットワークにおける変数選択の問題、個別銘柄の予測

Ø       916日:9:00-12:004年生のゼミ論中間報告

@       141「地方財政に関する統計的分析」

ü         内容:地方交付税の決定要因の概念化、概念に沿った変数の選択、クラスター分析(地方交付税を加えないで実行したクラスターと地方交付税との対応)

ü         課題:教師ありの分類(たとえば、回帰木)の実行

A       143「住宅投資の計量分析」

ü         内容:ARIMAモデルによる1974年以降の新設住宅戸数の推定と予測、世帯に関する統計による補足

ü         課題:世帯類型データの分析

B       148「都道府県別夫婦の賃金と住居費用、持ち家比率の合計特殊出生率に与える影響」

ü         内容:男性の給与と女性の賃金率、平均住居費、持ち家率を説明変数とした都道府県別合計特殊出生率の

ü         課題:都道府県別合計特殊出生率の相違をもたらす理論的要因の探索

Ø       916日:13:00-16:00:レクリエーション(フットサル、ソフトボール)

Ø       917日:10:00-12:00:観光(紅富士の湯)

15.    927日:ゼミ論中間報告

@       140「競馬のすすめ」

Ø         内容:位置取り変数の追加(レースの質をあらわす)

Ø         課題:多項選択モデルの適用

A       141「地方財政に関する統計的分析」

Ø         内容:クラスター分析の結果の表示、回帰木のあてはめ

Ø         課題:地方交付税の配分の条件に照らした回帰木の結果の評価

16.    104日:ゼミ論中間報告

@       144「スキー場の入場者に関する分析」

Ø         内容:コーホート分析による、スキー・行動者率への世代効果の検討

Ø         課題:性別による区分、0日行動者の表章

A       148「都道府県別合計特殊出生率に影響を与える要因の検証」

Ø         内容:25-29歳の女子有配偶率、大学進学率の

Ø         課題:モデルの推定

17.    1011日:ゼミ論中間報告

@       145「地域格差と住みやすさ」

Ø         内容:安心度・利便度・娯楽度・将来性に対応した変数選択

Ø         課題:4つの側面の具体化(変数選択の根拠としての)、変数選択の根拠の精緻化

A       147「ニューラルネットワークによる株価予測」

Ø         内容:個別銘柄(りそなホールディングス)へのニューラルネットワークの適用、入力変数の数・種類の吟味

Ø         課題:ニューラルネットにおける予測のための変数選択の指標、ニューラルネットで選択された変数の関係の吟味

18.    1018日:ゼミ論中間報告

@       143「住宅投資の計量分析」

Ø         内容:都道府県別借家家賃の分布に関する因子分析、クラスター分析

Ø         課題:分布を説明するモデルの探索、国勢調査データの分析(世帯類型)

A       146「西武ライオンズの勝率についての分析」

Ø         内容:推定モデルから予測した勝率と実際の勝率(順位)との比較

Ø         課題:予測勝率と実際の勝率との対比(前者を条件としたときの条件付平均値)

19.    1025日:ゼミ論中間報告

@       148「都道府県別合計特殊出生率に影響を及ぼす要因の検証」

Ø         内容:進学率、平均寿命の変数の追加

Ø         課題:合計特殊出生率に影響をあたえる要因の上位概念の整理(それに対応する変数の性質)、厚生労働省「21世紀成年者縦断調査」の活用

20.    111日:ゼミ論個別相談(希望者のみ研究室にて)

21.    118日:ゼミ論個別相談(希望者のみ研究室にて)

22.    1115日:ゼミ論中間報告(希望者のみ研究室にて)

23.    1122日:ゼミ論執筆指導(希望者のみ研究室にて)

24.    1129日:ゼミ論執筆指導(希望者のみ研究室にて)

25.    12 6日:ゼミ論提出

26.    12 13日:ゼミ論報告会用ハンドアウト原稿提出

Ø         ハンドアウトの構成

I.                分析の目的

II.             データの説明

III.          分析と結果の考察

IV.           結論

V.              参考文献

Ø         書式など:A4用紙で2ページないし4ページ、最初のページに、(1)表題、(2) 作成者の番号・氏名、(3)提出or作成年月日、を記すこと。図表には、番号と表題をつけること。

27.    1217日(土)13:00—17:30 ゼミ論報告会@1-302

Ø         報告会プログラム

I.                はじめに

II.             報告

@     147「株価予測とニューラルネット」

A     141「地方財政に関する統計的分析」

B     145「地域格差と住みやすさ」

C     140「早稲田式負けない馬券術レース予測の回帰分析

D     146「セイバーメトリックスを用いた埼玉西武ライオンズの勝率分析」

E     148「都道府県別合計特殊出生率に影響を与える要因の検証」

F     144「スキー場の入場者数に関する分析」

III.          17期生ゼミ論抱負

IV.           おわりに

(終了後、忘年会)

Ø         レポート:

I.                内容:自分のもの以外のゼミ論報告の中からひとつを選び、内容を要約して論評せよ。

II.             提出期限:20111231

III.          提出方法:Course N@vi への添付ファイル

IV.           用紙・分量:A4用紙1枚程度

28.    1220日:ゼミ論執筆指導(希望者のみ研究室にて)

29.    117日:ゼミ論執筆指導(希望者のみ研究室にて)

30.    124日:ゼミ論再提出

 

 

以上