Pandas 名簿の修正
名前の修正
小文字を大文字に変換
str.upper
半角・全角スペース除去
str.replace()
欠損値の確認
.isnull()
欠損値を保持する
loc関数は条件を付与し、それに合致するデータを抽出することができます。
今回の条件は「金額が欠損している」
「~flg_is_null」の「~」は否定演算子です。
これは、flg_is_null == Falseと同義っです。
再度、欠損値のチェック
uriage_data.isnull().any(axis=0)
skipna
これはNaNデータを無視するかどうかでです
今回はFalseであるので、NaNが存在する場合、最小値は
NaNと表示されます。
顧客名簿での問題
姓名の間のスペース
全角、半角のスペースが混じっている
str.replace(" ","")
str.replace(" ", "")
名前の誤変換の場合、誤変換なのか、別人なのかは単純ではないので
プログラムでは補正できない。