1. TOP
  2. プログラム
  3. ソフト
  4. python
  5. Pandas 名簿の修正

Pandas 名簿の修正

名前の修正

小文字を大文字に変換
str.upper

半角・全角スペース除去
str.replace()

 

欠損値の確認

.isnull()

欠損値を保持する
loc関数は条件を付与し、それに合致するデータを抽出することができます。
今回の条件は「金額が欠損している」
「~flg_is_null」の「~」は否定演算子です。
これは、flg_is_null == Falseと同義っです。

再度、欠損値のチェック

uriage_data.isnull().any(axis=0)

skipna

これはNaNデータを無視するかどうかでです
今回はFalseであるので、NaNが存在する場合、最小値は
NaNと表示されます。

顧客名簿での問題

姓名の間のスペース
全角、半角のスペースが混じっている
str.replace(" ","")
str.replace(" ", "")
名前の誤変換の場合、誤変換なのか、別人なのかは単純ではないので
プログラムでは補正できない。