Rによる統計的学習入門を読んで自分なりにまとめてみた

 

初めまして、今回は自分の知識の定着を目的としたブログになります。

 

統計的学習入門(An Introduction to Statistical Learning with Applications in R)を読んで、分析でのいろんなツールで何をやっているのかを整理したかったから、書くことにしました。

分析とは、回帰、分類、クラスタリングと次元削減の4つが主に行われているのかなと今のところは思っています。

 

本書で紹介されていたものをRを使って、自分で分析するところまでやりたい。つまり、実際のデータを持ってきて、問題提起、分析をして結論を出す。言語はRと後々Pythonも追加したい。

 

3章 線形回帰、線形重回帰、

4章 ロジスティック回帰、線形判別分析、2時判別分析、K最近傍法

5章 ホールドアウト検証、1つ抜き交差検証、k分割交差検証、ブーストラップ

6章 1)部分集合選択法(最良部分集合選択、変数増加法と変数減少法、ホールドアウト検証法と交差検証法、2)縮小推定(リッジ回帰、Lasso)3、次元削減(主成分分析、部分最小2乗法)

7章 多項式回帰、階段関数、スプライン、一般化加法モデル

8章 決定木(回帰、分類、バギングとランダムフォレスト)

9章 サポートベクターマシン(分類機、ROC曲線、多クラスの場合におけるSVM)

10章 Deeplearning、ニューラルネットワーク、CNN、IMDb、RNN

12章 K-MeansClusterint, HierarchicalClustering, PracticalissuesinClustering

13章 教師なし学習 (主成分分析ークラスタリング(K平均クラスタリングー階層的スラスタリング)

 

これら訳37個を、1、概要分析方の解説、2、何をしているのか、アルゴリズムの復習、注意点、3、Rを使い、実際に分析する。という順番にまとめていこうと思う。基本的に、章末にある実習でRを使って実際に分析に使われているものをまとめていく、また、章の問題で複雑に感じるものは随時追加していくので、初めはさっぱりさせるつもりである。

 

随時、見易さだったりを考慮して、パートに分けたり、していくのはもちろん、英語中国語のサイトも作り次第、ブログにリンクを載せようと思う。当分先の話かもしれない。

 

ちなみに、このブログを書いている者は、現在サンフランシスコの統計学部3年生で23歳の男性である。

 

指摘はいつでも大歓迎なので、ぜひメッセージしてください。

 

*追記1

機械学習おすすめ書籍 | 必読の1冊 『Rによる統計的学習入門(ISL)』
https://totadata.com/book_islr/

こちらのサイトがすごく参考になりそうなので、迷惑にならないようなレベルで参考にさせてもらいます!
多分、UIとか内容の質が全く格が違うから、あくまで自分の思考の生理用のブログということで、おそらく問題にはならない(なれない)ような気がします。

 

*追記2(2021/10/06)

このクオリティでもかなり拘っていて、時間がかなりかかって、効率をもう少し重視したいため、もっと簡潔にまとめることとする。