Pythonによるデータ分析入門 第2版
読み終わったというか、正確には寝かさせておいたが、今見直してみるともう見るべき部分がなくなってしまい、処分しよう思いますので、内容や得られたものについてメモ。
Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理
- 作者:Wes McKinney
- 発売日: 2018/07/26
- メディア: 単行本(ソフトカバー)
前提
バックグラウンドが特殊なので前提をまず説明。
- 私は、情報系の大学及び大学院を出ていますが、プログラマではなく、文系職的な仕事をしています。データ分析等の業務もまったくもって主ではありません。
- 大学において特にプログラミングについてアレルギーはありませんでしたので(情報系でも書けない人は書けなかったので)、その点は、少し非プログラマの普通からは少しズレています。とはいえ、Javaが中心であったため、Pythonへのキャッチアップは、少し苦労しました。
- 文系職的な仕事とはいえ、プログラミングのバックグラウンドもないわけではなく、その点は微妙にニッチであるため、業務上上手くデータを活用できないかとトライしているところ。
本書について
NumPy、SciPy、pandas、Matplotlib、Jupyter等々の使用例(サンプルコード)とその実行例がまとめられた辞書のような印象を受けています。
一応、頭から読むようなデザインで本の構成がなされていると思いますが、実際プログラム(データ処理)で使用すると全部が全部使用するわけではないのでやっぱり辞書的な利用方法なのかなと。
データ分析の実例は後ろの方にありますが、年代別の名前ランキングの推移のような「だからなんだ」という事例であり、あまり
結論:ネットで調べて実装できてしまう人には特に不要かと
購入したのは昨年末なので1年弱前ですが、半分ぐらい読んで放置していました。一方で、実務では四苦八苦しながらもデータ分析を行っています。本書に書いている内容に意味がないかといえばそうでもなく、実務で使用(トライ)しているプログラムの内容とは合致しています。
(人によるかもしれませんが)何が必要かといえば、ライブラリの使い方ではなく、どのような問題があったときに、一例としてどのようなデータ分析の選択肢があるのかという話なのですよね。
データ分析を専門とする大学院生や社会人ならば、実例を知っている人が身近にいるはずなので、ライブラリから入っても良いのかもしれませんが、そこら辺のツテがない人間としては、実例が載っている本やgaccoの講座の方が有用でした。 但し、以下の前提です。
- ネットでサンプルコード等を見て自力である程度実装(トライアントエラー)できる。
- データ分析屋さんとのツテがない。
蛇足
データ分析屋さんとのツテがない人間が、データ分析の事例を知るものとして、以下の講座はとても良かったです。
《特別開講》社会人のためのデータサイエンス入門 | gacco https://lms.gacco.org/courses/course-v1:gacco+ga031+2020_09/about
社会人のためのデータサイエンス演習 | gacco https://lms.gacco.org/courses/course-v1:gacco+ga063+2020_09/about