1. TOP
  2. プログラム
  3. ソフト
  4. python
  5. pandasとR言語

pandasとR言語

pandas

名前の由来は[panel data]と[Python data analysis]から来ている
リッチなデータ構造と関数を提供する。これらの機能は構造化されたデータを
素早く簡単に、取扱うために設計されたものです。pandasの主要なオブジェクト
はデータフレーム(DataFrame)という、2次元の表形式で、列指向のデータ構造
のオブジェクトです。行・列にラベルが付いている。
pandasはNumPyの高性能の配列計算機能と、表計算ソフトや(例えばSQLのよな)
リレーショナルデーターベースの柔軟なデータ操作能力を併せ持ちます。
pandasは洗練されたインデックス付き機能を備えており、データの再形成や
スライス、ダイシング、集約、部分集合の選択が容易です。
R言語を統計学の計算に用いてるユーザーには、DataFrameオブジェクト
の名前は、命名の由来となった、Rのdata.frameオブジェクトと似ている
ので親しみやすい。しかし両者は同一ではなく、R言語のdata.frameが提供
する機能は、pandasのRataFrameオブジェクトが提供する機能のごく一部分
に留まります。