Rによる統計的学習入門を読んで自分なりにまとめてみた
初めまして、今回は自分の知識の定着を目的としたブログになります。
統計的学習入門(An Introduction to Statistical Learning with Applications in R)を読んで、分析でのいろんなツールで何をやっているのかを整理したかったから、書くことにしました。
分析とは、回帰、分類、クラスタリングと次元削減の4つが主に行われているのかなと今のところは思っています。
本書で紹介されていたものをRを使って、自分で分析するところまでやりたい。つまり、実際のデータを持ってきて、問題提起、分析をして結論を出す。言語はRと後々Pythonも追加したい。
3章 線形回帰、線形重回帰、
4章 ロジスティック回帰、線形判別分析、2時判別分析、K最近傍法
5章 ホールドアウト検証、1つ抜き交差検証、k分割交差検証、ブーストラップ
6章 1)部分集合選択法(最良部分集合選択、変数増加法と変数減少法、ホールドアウト検証法と交差検証法、2)縮小推定(リッジ回帰、Lasso)3、次元削減(主成分分析、部分最小2乗法)
7章 多項式回帰、階段関数、スプライン、一般化加法モデル
8章 決定木(回帰、分類、バギングとランダムフォレスト)
9章 サポートベクターマシン(分類機、ROC曲線、多クラスの場合におけるSVM)
10章 Deeplearning、ニューラルネットワーク、CNN、IMDb、RNN
12章 K-MeansClusterint, HierarchicalClustering, PracticalissuesinClustering
13章 教師なし学習 (主成分分析ークラスタリング(K平均クラスタリングー階層的スラスタリング)
これら訳37個を、1、概要分析方の解説、2、何をしているのか、アルゴリズムの復習、注意点、3、Rを使い、実際に分析する。という順番にまとめていこうと思う。基本的に、章末にある実習でRを使って実際に分析に使われているものをまとめていく、また、章の問題で複雑に感じるものは随時追加していくので、初めはさっぱりさせるつもりである。
随時、見易さだったりを考慮して、パートに分けたり、していくのはもちろん、英語中国語のサイトも作り次第、ブログにリンクを載せようと思う。当分先の話かもしれない。
ちなみに、このブログを書いている者は、現在サンフランシスコの統計学部3年生で23歳の男性である。
指摘はいつでも大歓迎なので、ぜひメッセージしてください。
*追記1
機械学習おすすめ書籍 | 必読の1冊 『Rによる統計的学習入門(ISL)』
https://totadata.com/book_islr/
こちらのサイトがすごく参考になりそうなので、迷惑にならないようなレベルで参考にさせてもらいます!
多分、UIとか内容の質が全く格が違うから、あくまで自分の思考の生理用のブログということで、おそらく問題にはならない(なれない)ような気がします。
*追記2(2021/10/06)
このクオリティでもかなり拘っていて、時間がかなりかかって、効率をもう少し重視したいため、もっと簡潔にまとめることとする。