1. TOP
  2. プログラム
  3. ソフト
  4. python
  5. データサイエンスですること

データサイエンスですること

検索的データ分析
データサイエンスの中核である検索的データ分析(EDA)とは何か、
扱うデータの構造、データの特徴を、相関も含めてどのように把握す
るかという基本的な事柄を学ぶ、同時に、統計学及びR/Pythonにおけ
る基本的なデータについて学ぶ。統計学の初歩を兼ねている

データと標本の分布
ビックデータ時代になりサンプルの重要性は高まっている。2では、
統計学の復習としてバイアスの問題、信頼区間や各種の分布について
カイ2乗分布、F分布を追加、コンピュータの導入で重要性がました
ブートストラップや、ロングテールの分布について学ぶ

統計実験と有意性検定
統計的な実験設計と有意性検定という従来の統計学においてもデータ
サイエンスにおいても重要な内容を扱う。データサイエンスで重要と
なるA/Bテスト、リサンプリング、多腕バンディトアルゴリズムなど
を扱う、従来の統計学ではさまざまな公式が使われるが、データサイ
エンスではそれよりもリサンプル手法を駆使してEDAを推進すること

回帰と予測
予測のための回帰という技法は、従来の統計学においてもデータサイ
エンスでも基本的で重要なものだ。ここでは、単回帰だけでなく、
重回帰やスプライン回帰を学ぶ。異常検出については、回帰診断を
学ぶ

分類
データサイエンスでは、分類hが意志決定支援に欠かせない。ここで
はナイーブベイズ、判別分析、ロジステック回帰、分類モデル評価
不均衡データという基本を学ぶ

統計的機械学習
機械学習はデータサイエンスの予測モデルに欠かせないものとなって
いる。ここでは基本的なモデルと技法を、K近傍法、木モデル、バギ
ング、ランダムフォレスト、ブースティングなどを学ぶ

リアルタイムでの意思決定支援に教師支援に教師なし学習は欠かせな
い。主成分分析、k平均クラスタリング、階層クラスタリング、モデ
ルベースクラスタリングなどの基本的な技法とともに、スケーリング
技法を学ぶ