![]()
統計学の勉強会「おしゃれStatistics」がMTLカフェで開催されました。
黒田です。本日、統計学の勉強会「おしゃれStatistics」がMTLカフェで開催されました。
現在ビックデータ時代の真っ只中ですが、Hadoopを使うにしろ、MapReduceで使うアルゴリズム、つまりは統計学を理解しておかないとということで、私も参加させて頂きました。
どの発表も資料がとても分かり易く、統計学が素人な私にはとても勉強になりました。以下が本日の発表資料へのリンクになります。
@isseing333さんによる「統計学のこぼれ話とデータマイニング」
@millionsmileさんによる「統計学と複雑ネットワークのちょっと深いい話」
@teramonagiさんによる「金融業界でよく使う統計学」
複雑ネットワークのお話でソーシャルグラフ上をインフルエンサーのツイートがRetweetされていく様を説明されていましたが、職業柄、これはソフトウェアメトリクスにも使えそうだなぁと思いました。
プログラムのモジュールの依存関係もノードとリンクの関係でネットワークとして表せたら、ハブになっている結合度の高いモジュールを一発で発見でき、対策として凝集性を高めたり、結合度を下げるためにモジュール化を推進したりとアクションをとることが出来るので、品質リスクの低減に繋がりそうな気がしました。
また、リポジトリへのコミット回数、期間、コミッター、修正量等の統計をとって、一定期間に特にコミット数(修正回数)が多いモジュールは、仕様が安定していないとか、品質に問題があるとかの分析にも利用できそうですね。(こっちは完全にEPMですね。)
時間があるときにR言語で色々試してみようと思いました。
