データ分析開始 投稿:2022年09月02日 データ分析開始 データセットをFataFrameとしてインポートした後、読者はアナリストとしてまず行わなければならないステップを考えておくことが重要だ。データを初めて調べるときに、通常どのようなタスクを行うか、可能なデー […]
指数・対数 投稿:2021年08月16日 業界トップの夢 業界2位のB社は、業界1位のA社を売上高で追い越すという野望を持っているB社の社長は、経理部長に「今後10年間でA社の売上高に追いつくために、年率何%の成長が必要か計算しろ」との指示を出した。現時点で、A […]
cancer.target 投稿:2021年08月12日 共通処理 サンプルの冒頭部分に出てくる、共通処理の説明NumPyやpandasやmatplotlibは機械学習で必須のライブラリです。japanize_mathplotlibはmatplotlibとグラフ表示のライブラリ […]
UCI公開データセット 投稿:2021年08月02日 公開データセット 機械学習の実習には必ず学習データが必要です。学習データは、例外値を自然な形で含んでいる点などの観点で実際のデータであることが望ましい。しかし、機械学習に使われるデータは通常、企業の機密データである可能性 […]
乳ガン診断データセット 投稿:2021年08月02日 データの内容 乳がんの検診で腫瘍が見つかった患者に対して腫瘍細胞を採取して顕微鏡で分析した結果を数値化した情報となっている。下記の10個の特徴量が、個々の細胞に対して数値化されます。a) 半径(中心から周囲までの距離の平 […]