データ分析開始
データ分析開始
データセットをFataFrameとしてインポートした後、読者はアナリストと
してまず行わなければならないステップを考えておくことが重要だ。データ
を初めて調べるときに、通常どのようなタスクを行うか、可能なデータ型
全てが分かっている、本章では、新なデータセットを扱うときに行うタスク
をまず学ぶ。さらに、そう簡単ではない作業課題について、pandasではど
うすれば良いか学習する。
データ分析ルーチンの開発
データ分析の開始をどうするか標準的な方法はない。普通は、データセッ
トを最初に検討するときに、自分でルーチンを定めて開発するのが良い
やり方だ。朝起きて、シャワーを浴び、仕事で出かけ、食事をするなどと
同じように、データ分析開始ルーチンで新なデータセットへの取り組み
を迅速に進めることができます。このルーチンは、pandasやデータ分析
に慣れるに従い進化する。タスクの動的なチェックリストにもなる
検索的データ分析ーEDA Exploratory Data Analysisは統計的検定手続き
を使わないデータ分析のプロセス全体を指す用語
EDAは、データ間の関係を様々に可視化して興味深いパターンを発見し
たり、仮説を開発する。