機械学習のための特徴量エンジニアリングを読んだので感想をまとめる - 3月 31, 2019 こんにちは、ぐぐりら(@guglilac)です。 twitterで良さそうな評判を度々目にしていて、気になってはいるけどわざわざ買うほどいい本なのかな〜〜と思っていたところに「英語の原著ならただで読める」という情報を得て早速PDFをダウンロード。 `feature engineering for machine learning pdf`とかググればでてきます。 洋書の技術書はよくただでPDFが落ちているのでダウンロードだけはいつもするのですが(PRMLとか)、ページ数が多いものばかりダウンロードしてきてしまうのでいつも読み切れません。 ですが、今回の「機械学習のための特徴量エンジニアリング」はページ数も200ページちょいと手頃で、なんとなく知っている内容が書かれているということもあり、「いっちょ頑張って読みきってみるか!」と重い腰をあげたのでした。 台湾から帰ってきたばかりで英語モチベが高いのも影響してそうです。モチベがあるうちにいっぱい英語読もうと思って論文読みも最近続けています。 やっぱり英語は得意ではないので途中よくわからんところも少しありましたがざーっと進めてようやく読み終わりました。一週間弱?ですかね。 ## 概要 タイトルの通り、機械学習に使う特徴量エンジニアリングのテクニックがつまった一冊です。 扱う対象となるデータの種類も数値データ、カテゴリカルデータ、自然言語、画像などよくあるものは網羅されている印象でした。 特徴量エンジニアリング自体を体系立ててまとめた本というものはあまりなく、プロジェクトごとにググったりして人のテクニックを真似して少しずつ体得してきたみたいな側面の強い分野だと思います。 自分も機械学習をやってきて、先にあげた種類のデータには自然と触れてきていますが、毎回ググったり先生や上司に教わったりしながら、元データからうまい特徴量へ変換するやり方を学んできました。 この本はそのある種「秘伝のタレ」のようなテクニックである特徴量エンジニアリングを体系立ててまとめた、みたいな立ち位置の書籍になります。 これから学ぶ方は高速道路に乗って効率よく学ぶことができて素晴らしいと思います。 似た本に前処理大全という本もあります。自分は読んだことがないのですが、興味があるので読んでみたいです。立ち読みした感じでは、今回読んだ機械学習のための特徴量エンジニアリングよりも辞書的な役割の強い本みたいですね。そういう技術書は電子書籍ではなく書籍として欲しいです。 * 機械学習パイプライン * 数値データの取り扱い * テキストデータの取り扱い * 特徴量スケーリングによる効果 * カテゴリ変数の取り扱い * 次元削減 * 非線形特徴量の生成 * 特徴量生成の自動化(画像特徴と深層学習) * 論文レコメンドシステム構築を模したトレーニング という内容になっています。 ## 感想とか ページ数が多くはないことからもわかる通り、完全な初学者向けの本ではないように感じました。というのも、数学の基本的な知識は前提とされている感じがあるからです。 そこまで丁寧に説明している書籍はまた別であるので、きついと思ったらそちらに適宜戻ったりしながら学ぶのがいいと思いますが、おそらく想定されている読者層はもう少し機械学習を学んできた人なのだろうと思います。 自分もおそらくターゲットの一人かと思いますが、「なんとなく機械学習や関連する数学の知識はあるけど実際にモデルを組んでゴリゴリ性能をあげるっていう経験が不足している」ぐらいの人がターゲットな気がします。 ここに書かれていることはたぶん基本的なことなので、kaggleや実際に企業に入って機械学習モデリングするにあたって、こういうテクニックは当たり前のようにできるようにならないといけないんだな、という認識になりました。 半分以上の内容はなんとなくこれまで学んできたことに含まれているというようなレベル感でしたが、抜けも多く、基本をさらうにはいい本なんだなあ、と思いました。 ちょっと内容が古いように感じた(画像の章ではAlexNetが紹介されていましたが、もう少し新しいのでもよいのでは。。。?となった)のですが、基本的なことはなかなか廃れないと思うので一度これで勉強すると新しい知識を得る際のコストが下がりそうで良いです。 Kaggleで実践したいです。わかってても実際に手が動かないとだめなんだよなあ、と読んでる間に何回か感じました。 コードもたくさん載ってて参考になりそうです。 ## まとめ * 特徴量エンジニアリングが幅広く学べる * 初学者というより、ある程度機械学習わかってる人が勉強しなおすのに便利そう * このあたりのテクニックが当たり前にできるようになりたい 英語で技術書一冊読みきったの初で達成感がありました。。。少し英語への抵抗感が減ってきたので、毎日英語読みは続けていこうと思ってます。 この記事をシェアする Twitter Facebook Google+ B!はてブ Pocket Feedly コメント
コメント
コメントを投稿