UCI公開データセット 投稿:2021年08月02日 公開データセット 機械学習の実習には必ず学習データが必要です。学習データは、例外値を自然な形で含んでいる点などの観点で実際のデータであることが望ましい。しかし、機械学習に使われるデータは通常、企業の機密データである可能性 […]
乳ガン診断データセット 投稿:2021年08月02日 データの内容 乳がんの検診で腫瘍が見つかった患者に対して腫瘍細胞を採取して顕微鏡で分析した結果を数値化した情報となっている。下記の10個の特徴量が、個々の細胞に対して数値化されます。a) 半径(中心から周囲までの距離の平 […]
ベイズ推定と正規分布 投稿:2021年08月02日 精度の悪い温度計でお湯の温度を測る お風呂を適温42°Cに沸かしたい。沸いたかな、という頃合いに温度計で温度を測った。ただし、使った温度計は精度が悪いもので、計測される温度Xは、実際の温度θが平均、標準偏差が2°Cの正規 […]
正規分布は主役です 投稿:2021年08月02日 統計学の主役 統計学で最もよく利用されるのは、正規分布と呼ばれる連続型の確率分布です。これはスタンダードな統計学(ネイマンピアソン統計学)でもそうですし、ベイズ統計学でも同じです。正規分布が汎用される理由は、おおまかにい […]
機械学習のパターン 投稿:2021年07月26日 プロジェクトの進め方 1:機械学習の適用領域の選択2:業務データの入手確認3:データ加工4:モデルの開発5:評価 処理パターンの種類 1:教師あり学習 A:分類1:教師あり学習 B:回帰1:教師あり学習 c:時系列分析2 […]