UCI公開データセット 投稿:2021年08月02日 公開データセット 機械学習の実習には必ず学習データが必要です。学習データは、例外値を自然な形で含んでいる点などの観点で実際のデータであることが望ましい。しかし、機械学習に使われるデータは通常、企業の機密データである可能性 […]
乳ガン診断データセット 投稿:2021年08月02日 データの内容 乳がんの検診で腫瘍が見つかった患者に対して腫瘍細胞を採取して顕微鏡で分析した結果を数値化した情報となっている。下記の10個の特徴量が、個々の細胞に対して数値化されます。a) 半径(中心から周囲までの距離の平 […]
ベイズ推定と正規分布 投稿:2021年08月02日 精度の悪い温度計でお湯の温度を測る お風呂を適温42°Cに沸かしたい。沸いたかな、という頃合いに温度計で温度を測った。ただし、使った温度計は精度が悪いもので、計測される温度Xは、実際の温度θが平均、標準偏差が2°Cの正規 […]
正規分布は主役です 投稿:2021年08月02日 統計学の主役 統計学で最もよく利用されるのは、正規分布と呼ばれる連続型の確率分布です。これはスタンダードな統計学(ネイマンピアソン統計学)でもそうですし、ベイズ統計学でも同じです。正規分布が汎用される理由は、おおまかにい […]
ベイズと学習機能 投稿:2021年07月26日 逐次合理性 「2個の情報をいっぺんに使って推定した結果」と、「第一の情報を使って推定し、その推定結果を事前確率として、第二の情報を使って推定した結果」が全く一致するベイズ推定では一般に成り立ちます。ということは、情報をい […]