1. TOP
  2. プログラム
  3. ソフト
  4. python
  5. pandasー集計

pandasー集計

データのダンプ

データをきれいにクレンジングしたら、出力(ダンプ)しておくと、
分析のたびにクレンジングのやり直しを省略する事ができます。
もう一つ、ダンプの前に列の配置の調整してからファイルに
出力した方が、後々データを見た時直感的に分かりやすくなります。
カラム名を指定するだけです。
to.csv()で出力
index = False で行番号を付けない

データの集計

ダンプファイルを読み込む
pd.read_csv()
これをpurchase_monthを縦軸に、商品毎の集計を行う
続いて、purchase_monthを縦軸に、売上金額、顧客、地域の集計を行う
vipot_table()
index:データの列名を指定、結果の行見出しになる
columns:元データの列名を指定、結果の列見出しになる
values:元データの列名を指定すると、その列に対する結果のみ
aggfunc:に関数を指定できる、関数のリストでも良い