専門演習2019年度演習記録
(作成:西郷 浩;掲示開始:2019年4月1日;最終更新:2023年5月8日)
専門演習(4年生 第24期生)
l 曜日・時限・教室:火5・春学期3-810・秋学期 3-712
l 教科書:なし
l 評価:presentation + project
l 出席確認:あり
l 講義記録:
1. 4月9日:ゼミ論計画書の提出、ゼミ論中間報告
@ 227「ニュース記事等のテキストデータが景気に与える影響」
Ø 内容:テキストマイニングによる、景気に先行する文字情報についての効果の分析
Ø 課題:利用可能なテキストデータの確認
A 228「ギターの価格と様々な要因を基にギターの価値について分析する」
Ø 内容:ギターの価格決定要因に関する回帰モデル、樹木モデルの構築
Ø 課題:データセットの作成
B 229「AgriTechを利用した農林業活性化のための状況分析+効果的な解決策の提示」
Ø 内容:租税に関する知識など、農林業従事者の賃金上昇による担い手育成に資する、農林業振興のための実効性のある方策の提示
Ø 課題:論文の目的の具体化
2. 4月16日:ゼミ論中間報告
@ 230「SNSにおける視聴者の評価に関する計量的分析」
Ø 内容:SNSの人気の程度と関係する要因の分析
Ø 課題:データセットの構築
A 231「刑罰の計量分析」
Ø 内容:窃盗犯罪に関する、懲役年数と犯罪の内容(被害額など)との関係の回帰分析
Ø 課題:データセットの構築、分権の参照(石黒真木夫・岡本基・椿広計・宮本美智子・弥永真生・柳本武美(2016)『法廷における統計リテラシー』近代科学社
B 232「商業施設の立地が人口分布に及ぼす影響」
Ø 内容:論文の構想、文献の紹介
Ø 課題:2007年以降のデータによる、文献のモデルの模倣
3. 4月23日:ゼミ論中間報告
@ 233「Jリーグの順位予測」
Ø 内容:論文の構想の紹介
Ø 課題:データセットの作成
A 234「日本経済低迷の要因分析」
Ø 内容:株価(指数)と他の経済変数との関係の分析
Ø 課題:関連文献の探索、データセットの作成
B 235「花粉の飛沫量の予測モデルの構築」
Ø 内容:観測地点別の花粉飛沫量と関連データの紹介、類似テーマを分析したwebsiteの紹介
Ø 課題:適切な機械学習モデルの探索
4. 5月7日:ゼミ論中間報告
@ 236「CD購入抽選予測のモデル構築」
Ø 内容:CD購入抽選の仕組みと論文の目的の説明、もう一つのテーマ(里親に関する統計的分析)についての説明
Ø 課題:マーケティングモデルの確認、データ利用の倫理規定の確認
A 237「監査報酬金額の決定要因」
Ø 内容:監査報酬の周辺知識についての説明、先行研究の紹介、内部統制の影響の可能性
Ø 課題:データセットの作成、先行研究(藤原2011)の模倣、内部統制に関する説明変数の追加
B 238「不動産価格の決定要因:鉄道交通の便が基準地価に及ぼす定量的研究」
Ø 内容:基準地価の説明、基準地価に影響を及ぼす要因の提示、参考文献の候補の提示
Ø 課題:データセットの作成(路線をひとつに限定して)と分析
5. 5月14日:ゼミ論中間報告
@ 239「コンビニエンスストアが地域治安に与える影響」
Ø 内容:各犯罪種別における町丁別認知件数のデータなどのデータの紹介
Ø 課題:犯罪モデルの確認
A 240「所得格差が食品ロスに及ぼす影響」
Ø 内容:食品ロスに関するデータの提示
Ø 課題:食品ロスに関連するデータと理論の確認
B 242「習近平、李克強2013から2019年のスピーチにおける政治イデオロギーの時系列解析」
Ø 内容:テキストデータをもちいた、スピーチのイデオロギーの度合いに関する時系列分析
Ø 課題:他の変数の探索
6. 5月21日:ゼミ論中間報告
@ 227「」
Ø 内容:新聞紙上における景気の登場回数等の抽出と分析例、テキストマイニング手法の適用
Ø 課題:データの作成、景気指標との対応の確認
A 228「深層学習を用いた楽曲のアーティストの分類」
Ø 内容:Librosaのインストール、分析サイトの紹介
Ø 課題:インプットの内容、アウトプットの内容の説明
B 229「」
Ø 内容:歌詞の形態素分析、
Ø 課題:Python等で可能な分析の実行
7. 5月28日:ゼミ論中間報告
@ 230「年金制度に関する統計的分析」
Ø 内容:各国の年金制度の説明、および分析目的・分析方法についての方針の説明
Ø 課題:文献の探索
A 231「量刑についての定量的分析」
Ø 内容:データセット作成の進捗状況、箱ひげ図や散布図の作成
Ø 課題:データセットの作成
B 232「商業施設の立地が人口分布に及ぼす影響について」
Ø 内容:国土交通政策研究所の研究者が作成した論文の内容についての解説
Ø 課題:GISが扱えるソフトウェアについての調査、地理情報を含んだデータの入手可能性の確認
8. 6月4日:ゼミ論中間報告
@ 234「日本経済低迷の要因分析」
Ø 内容:文献の探索
Ø 課題:文献の探索(例:津田博史(1994)『株式の統計学』朝倉書店)
A 237「監査報酬額の決定要因」
Ø 内容:文献探索の結果、社外取締役の2面正(報酬額を上げる効果と下げる効果)
Ø 課題:データセットの作成、回帰分析等による初歩的な分析
B 235「花粉の飛沫量に関する統計的分析」
Ø 内容:花粉の飛沫量の可視化、札幌・仙台・新宿・松本の1日の花粉飛沫量に関する回帰分析
Ø 課題:空間統計学的な手法の探索。
9. 6月11日:ゼミ論中間報告
@ 233「Poisson分布を利用したJリーグの勝率分析」
Ø 内容:参考文献の紹介
Ø 課題:参考文献と同じモデルの推定
A 236「CD購入抽選予測のモデル構築」
Ø 内容:関連文献(マーケティング、投票行動)の探索結果の報告、代替的な分析対象の提示
Ø 課題:代替的テーマの分析、もとのテーマとの両面作戦
10. 6月18日:ゼミ論中間報告
@ 239「コンビニエンスストアが地域の治安に与える影響に関する分析」
Ø 内容:犯罪件数を被説明変数、コンビニエンスストアや人口などを説明変数とした回帰分析
Ø 課題:地域における犯罪発生の仕組みを考慮したモデル構築、カウントデータの分析
A 240「食料自給率の増減要因分析」
Ø 内容:食料自給率に関する分析計画の提示
Ø 課題:データセットの構築、文献探索
B 242「習近平と李克強の政治イデオロギーに関するテキスト分析」
Ø 内容:テキストマイニング、ローカルレベルモデルの適用
Ø 課題:ローカルレベルモデルの数理的な理解
C 238「最寄駅に優等列車が停車することの住宅地価格への影響」
Ø 内容:総武線沿線の基準地価を被説明変数、最寄駅の優等列車停車の有無、最寄駅からの距離、東京駅からの距離を説明変数とした回帰分析
Ø 課題:データセットの拡充(サンプルサイズの増加と説明変数の追加)、散布図による変数変換の必要性の吟味
11. 6月25日:ゼミ論中間報告
@ 227「新聞に登場する単語と景気との関係」
Ø 内容:Google scraper によるテキスト収集と月別の新聞記事の単語度数の比較
Ø 課題:単語間の関係の分析
A 228「深層学習を用いた楽曲のアーティストの分類」」
Ø 内容:Librosaへの入力、それからの出力の内容の説明、文献案内
Ø 課題:画像処理を利用した楽曲の比較
B 229「テキストマイニングを利用した歌詞分析」
Ø 内容:Python による形態素解析の実行、
Ø 課題:単語の積極性・消極性の再定義、文献探索、歌詞の比較方法の吟味
12. 7月2日:ゼミ論中間報告
@ 231「刑罰の計量分析」
Ø 内容:データセットの拡充(100件程度)、回帰分析
Ø 課題:前科件数のダミー変数化、併合罪などの整理、機械学習的手法の適用
A 232「商業施設の立地が人口分布に及ぼす影響について」
Ø 内容:都市発展段階説の説明、データの入手可能性、ソフトウェアの利用可能性
Ø 課題:データセットの構築、ソフトウェアによる計算結果の提示
13. 7月9日:ゼミ論中間報告
@ 233「Poisson分布を利用したJリーグの勝率分析」
Ø 内容:先行研究の推定方法の説明、データセットの構築
Ø 課題:Poisson回帰の推定
A 234「日本経済低迷の要因分析」
Ø 内容:株価指数を被説明変数とした重回帰分析、VARモデルの推定
Ø 課題:VARモデル推定のためのRオブジェクトの確認
B 235「花粉の飛沫量に関する統計的分析」
Ø 内容:hourly data による花粉の飛沫量を被説明変数とする回帰式の作成(地域別)
Ø 課題:時差相関係数の分析、日次データによる回帰式の推定
14. 7月16日:ゼミ論中間報告
@ 236「CD購入当選確率の推定」
Ø 内容:集計したデータに基づくCD購入当選確率についての回帰分析
Ø 課題:集計前のデータによる分析、応募数に関する回帰分析
A 237「監査報酬の決定要因分析」
Ø 内容:データセット(サイズ約50)をもちいた回帰分析、社外取締役員比率の係数(プラス)
Ø 課題:データセットの拡大、説明変数の工夫(企業規模との合成、など)、説明変数の意味(推定結果の解釈)の再検討
B 238「優良列車停車駅であることが地価に及ぼす影響」
Ø 内容:web scraping によるデータ収集の可能性、文献紹介
Ø 課題:データセットの構築
15. 7月23日:ゼミ論中間報告
@ 240「食料自給率に関する統計的分析」
Ø 内容:データの入手先、参考文献の紹介
Ø 課題:データセットの構築、基本分析(散布図の作成など)、回帰式の初歩的な分析
A 239「コンビニエンスストアが地域の治安に与える影響に関する分析」
Ø 内容:先行研究の紹介、面積による変数の比率化
Ø 課題:先行研究を参考にしたモデルの改良
B 242「習近平と李克強の政治イデオロギーに関するテキスト分析」
Ø 内容:ローカルレベルモデルによる習近平と李克強の演説に含まれるイデオロギー(潜在変数)の計量化
Ø 課題:モデルへの説明変数の取り込み
16. 9月17日--19日ゼミ論中間報告
@ 9月17日14:30-17:00:4年生のゼミ論中間報告
Ø 227「日本経済新聞の記事を利用した景気指標の作成」
ü 内容:ネガポジ分析の実行、景気ウォッチャー調査の利用、LSTM RNNによる文脈も考慮した分類器の作成
ü 課題:ネガボジ両方に同じ単語が登場する原因の究明と解決
Ø 229「テキストマイニングを利用した歌詞分析」
ü 内容:サカナクションと他の歌手の歌詞におけるネガポジ分析(単語の出現頻度)の実行
ü 課題:単語の出現頻度を多変量とした分類(教師有、なし)
Ø 233「サッカーJ1リーグの勝敗予測モデル」
ü 内容:ポアソン分布のパラメータを、自チーム:ホーム平均得点×攻撃力×相手チーム守備力、相手チーム:アウェイ平均得点×攻撃力×対戦相手守備力として推定し、独立性を仮定して2変数(自チーム得点、相手チーム得点)の度数分布表から勝敗率を計算する方法の適用、サッカー籤への応用
ü 課題:時系列モデルを援用した、チーム力の変化を考慮したモデルの作成・推定
A 9月17日19:00-21:00:4年生のゼミ論中間報告
Ø 237「監査報酬の決定要因分析」
ü 内容:東証一部上場企業のうち、四大監査法人の監査を受ける企業(金融業以外)の監査報酬の決定要因分析、監査報酬に影響を及ぼす要因の概念的整理、それらの概念に対応する変数の選択、回帰分析の実行
ü 課題:離散的な説明変数への対応(決定木の利用など)
Ø 236「CD購入抽選予測のモデル構築」
ü 内容:ロジットモデルの利用
ü 課題:推定された係数の実際上の有意性の検証、ランダムフォレストを利用した説明変数の有用性の検証
Ø 232「商業施設の立地が人口分布に及ぼす影響について」
ü 内容:データセットを再構築する必要性の説明、先行研究と同じデータを利用した単回帰分析
ü 課題:データセットの再構築、新しいデータによる分析
B 9月18日9:00-12:00:4年生のゼミ論中間報告
Ø 240「食料自給率の決定要因」
ü 内容:149か国、2000-2013年(欠測の無いデータセットとするための選択)の国ごとの平均値を用いた重回帰分析
ü 課題:パネルデータ分析の実行
Ø 231「刑罰の計量分析」
ü 内容:量刑判断基準の可視化に特化する理由の説明、ランダムフォレストによる分析
ü 課題:サンプルサイズの拡大(ランダムフォレスト実行時の結果の安定性の確保)
Ø 239「コンビニエンスストアが地域の治安に与える影響に関する分析」
ü 内容:位置情報を利用したデータセットの作成、相関分析、回帰分析の実行
ü 課題:昼夜間人口(両者の差ないし比がコンビニエンスストアの数と相関するとの指摘あり)の考慮
Ø 234「日本経済低迷の要因分析」
ü 内容:月次データによる、東証株価指数と関連する変数によるVARモデルの推定、Granger因果性の検証、インパルス応答関数の推定
ü 課題:非定常性の確認(必要に応じて共和分分析)、変化率(収益率)によるVARモデルの推定
C 9月18日14:00-15:00:レクリエーション
D 9月18日19:00-21:00:コンパ
E 9月19日9:00-10:30:4年生ゼミ論中間報告
Ø 228「深層学習を用いたアーティストの分類」
ü 内容:librosa による、wavデータの周波数領域への変換、画像データの分析
ü 課題:分析が実行できるかの確認、比較の枠組み(ジャンル×国内外による2元配置分析など)の設定
Ø 238「優良列車停車駅であることが地価に及ぼす影響」
ü 内容:webscraping によるデータの収集、データの拡大の可能性
ü 課題:分析の実行
Ø 235「花粉の飛沫量に関する統計的分析」
ü 内容:1時間ごとのデータ(2018年3月から5月まで@横浜)の時系列分析、日次データ・年次データの分析
ü 課題:誤差項が自己相関を持つ回帰モデルによる予測の実行、年次データによる「前年夏の気温の影響」の検証
F 9月19日10:40:解散
17. 10月1日:ゼミ論相談(希望者のみ@研究室)
18. 10月8日:ゼミ論中間報告
@ 227「日本経済新聞の記事を利用した景気指標の作成」
Ø 内容:LSTM RNNによる文脈も考慮した分類器の作成・実行
Ø 課題:景気指標の作成、文意が誤解されやすい例文のリストの作成
A 228「深層学習を用いたアーティストの分類」
Ø 内容:CNN (Convolutional Neural Network) の説明
Ø 課題:楽曲に関するCNNの実行
B 229「テキストマイニングを利用した歌詞分析」
Ø 内容:tf-IDFの実行
Ø 課題:決定木(ないしRandomforest)による教師あり分類、教師なし分類の実行
19. 10月15日:ゼミ論中間報告
@ 231「刑罰の計量分析」
Ø 内容:サンプルサイズの増加(約100→約200)
Ø 課題:サンプルサイズの増加(約300へ)、GAMの適用(非線形性への対応)
A 233「サッカーJ1リーグの勝敗予測モデル」
Ø 内容:分析対象年の増加
Ø 課題:独立性の検証(観察得点度数分布と理論得点度数分布との比較)、加重平均による、パラメータの時系列的変化への考慮
-- 10月22日:国民の休日(即位礼正殿の儀)
20. 10月29日:ゼミ論中間報告
@ 234「日本経済低迷の要因分析」
Ø 内容:共和分検定、VECMの推定
Ø 課題:非定常系列によるVARモデルの次数決定、VECM(p-1)の推定
A 235「花粉の飛沫量に関する統計的分析」
Ø 内容:横浜市における年次データによる回帰分析
Ø 課題:移動平均からの乖離を使用した回帰分析、VARモデルによる因果性の検証
B 236「CD購入抽選予測のモデル構築」
Ø 内容:モザイク図の描画、限界効果の推定
Ø 課題:連続型変数についてのモザイク図の描画、限界効果の比較、論文執筆
C 232「商業施設の立地が人口分布に及ぼす影響について」
Ø 内容:距離の計算量への対応、先行研究の出力に関する疑問
Ø 課題:距離の計算、回帰分析結果の提示
21. 11月5日:ゼミ論中間報告
@ 237「監査報酬の決定要因分析」
Ø 内容:会社の監査体制を考慮した分析(ダミー変数の利用、層別)、推定結果の解釈の再検討
Ø 課題:推定結果の解釈の部分についての参考文献の調査、決定木分析などの適用、サンプルサイズの増加
A 238「優良列車停車駅であることが地価に及ぼす影響」
Ø 内容:実販売価格データの入手と基本分析の紹介
Ø 課題:説明変数の離散性への対応(決定木分析など)
B 239「コンビニエンスストアが地域の治安に与える影響に関する分析」
Ø 内容:外れ値処理、説明変数の追加(昼間人口など)、回帰分析、ロジット分析
Ø 課題:カウントデータ分析用のモデル(例:ポアソン回帰)の適用
22. 11月12日:ゼミ論中間報告
@ 240「食料自給率の決定要因」
Ø 内容:パネルデータ分析(OLS、固定効果モデル、変量効果モデル)
Ø 課題:GDPと食料自給率との理論的な関係の精査、パネルデータ推定方法の確認
A 227「日本経済新聞の記事を利用した景気指標の作成」
Ø 内容:ゼミ論の構成、ゼミ論の内容についての報告
Ø 課題:既存の材料で論文を書くことに専念
B 228「深層学習を用いたアーティストの分類」
Ø 内容:CNNによる楽曲の計量化、計量に基づく楽曲の分類
Ø 課題:教師データの増加、誤差分析
23. 11月19日:ゼミ論中間報告
@ 229「テキストマイニングを利用した歌詞分析」
Ø 内容:決定木(ないしRandomforest)による教師あり分類、教師なし分類の実行
Ø 課題:誤差分析、論文の執筆
A 231「刑罰の計量分析」
Ø 内容:非線形性確認の結果、論文の構成
Ø 課題:判例以外の裁判の結果の入手可能性の確認(図書館)
B 233「サッカーJ1リーグの勝敗予測モデル」
Ø 内容:得点分布における独立性の検定、理論度数と実際の度数との差についての考察
Ø 課題:論文の執筆
24. 11月26日:ゼミ論中間報告
@ 234「日本経済低迷の要因分析」
Ø 内容:VECMの次数についての確認、論文の構成
Ø 課題:論文の執筆
A 235「花粉の飛沫量に関する統計的分析」
Ø 内容:平均からの乖離についての回帰分析
Ø 課題:論文の執筆
B 236「CD購入抽選予測のモデル構築」
Ø 内容:ロジットモデルの係数(変数の影響力)の大小の解釈
Ø 課題:論文の執筆
C 237「監査報酬の決定要因分析」
Ø 内容:密接な先行研究の発見
Ø 課題:論文の執筆
25. 12月3日:ゼミ論中間報告
@ 238「優良列車停車駅であることが地価に及ぼす影響」
Ø 内容:実売価格データの分析
Ø 課題:論文の執筆
A 239「コンビニエンスストアが地域の治安に与える影響に関する分析」
Ø 内容:年間データによる再分析
Ø 課題:データセットの構築についての詳述、計数データ分析モデルの説明
B 240「食料自給率の決定要因」
Ø 内容:国別の散布図
Ø 課題:先行研究(クロスセクション分析)と自分の研究(パネルデータ分析)の比較、論文の執筆
C 228「深層学習を用いたアーティストの分類」
Ø 内容:教師データの増加、誤差分析、相関分析
Ø 課題:相関係数が0の直観的な意味の説明、論文の執筆
D 232「商業施設の立地が人口分布に及ぼす影響について」
Ø 内容:進捗状況の説明
Ø 課題:ゼミ論報告会の内容(先行研究の紹介、構築する予定のデータセットの説明、予想される結果)、データセットの構築、回帰分析
26. 12月10日:ゼミ論第1回提出(オンライン)
27. 12月17日:ゼミ論ハンドアウト原稿提出(オンライン)
28. 12月21日(土)9:00-16:20:ゼミ論報告会@3-909
8:55-9:00 はじめに 西郷
@ 9:00-9:30 237「日本における社外役員が監査報酬額に与える影響:コーポレートガバナンスと監査コストの関係」
A 9:30-10:00 231「刑罰の計量分析」
B 10:00-10:30 240「食料自給率の決定要因―パネルデータ分析による国際比較を通して―」
10:30-10:40 休憩
C 10:40-11:10 234「日経平均株価の変動要因分析―マクロ経済指標が与える影響から考える―」
D 11:10-11:40 235「横浜市の花粉の飛沫量について」
E 11:40-12:10 236「特典付きCDの当選確率の分析―抽選結果からの予測―」
12:10-13:00 昼休み
F 13:00-13:30 233「Jリーグにおける勝敗予測モデル」
G 13:30-14:00 239「コンビニエンスストアと治安の関係分析—東京23区のデータを用いて—」
H 14:00-14:30 227「機械学習を用いた新聞記事からの景気動向指数の作成」
14:30-14:45 休憩
I 14:45-15:15 229「歌詞から探るサカナクションの魅力について」
J 15:15-15:45 228「音楽の深層学習によるアーティスト分析」
K 15:45-16:10 232「大規模商業施設の立地が都市構造に与える影響」
16:10-16:20 OB&OG挨拶+おわりに 西郷
Ø レポート:
I. 内容:自分のもの以外のゼミ論報告の中からひとつ(遅刻・早退等で聞けなかった分はそれも加える)を選び、内容を要約して論評せよ。
II. 提出期限:2019年12月31日23:59
III. 提出方法:Course N@vi への添付ファイル(PDF)
IV. 用紙・分量:A4用紙1枚程度
29. 1月7日:ゼミ論執筆指導(希望者のみ)@研究室
30. 1月14日:ゼミ論執筆指導(希望者のみ)@研究室
31. 1月21日:ゼミ論第2回提出(印刷物)
32. 1月28日:ゼミ論第3回提出(オンライン)
以上