統計学者とデータサイエンティスト
用語の違い
テーブルデータについての用語には紛らわしいものがある
統計学者とデータサイエンティストで同じものに異なる用語を使うか
らだ。統計学者はモデルの中で応答変数または従属変数を予測する
のに予測変数という用語を用いる。
データサイエンティストは、目標を予測するのに特徴量という用語を
用いる。
特に混乱を招くのは、サンプルだ。コンピュータサイエンティストは
は、テーブルデータの1つの行をサンプルと呼ぶが、統計学者は、行
の集まりをサンプル(標本)と呼ぶ
グラフという用語
コンプピュターサイエンスや情報技術では、エンティティ間の連結
とその基礎となるデータ構造を示す。
統計学でh、データ構造ではなく各種のプロットや可視化だけを指し
エンティティ間の連結を意味しない。