PythonのPandasでDataFrameを操る魔術をまとめてみた

Pandasを使うとPythonでデータをテーブルみたいに扱えるようになる。集計したり、解析したりするのが楽ちんに!DataFrameのきめ細かな操作方法がなかなか覚えにくいのでチートシート用メモです!順次更新予定です!

とりあえずDataFrame形式のデータを作ってみる

DataFrameの構造を確認

  • 行数
  • 次元数
  • 基礎情報
  • 基礎統計量

データへのアクセス

カラムやインデックスにアクセス

カラム名を指定してアクセス

カラム名を複数指定してアクセス

インデックスを指定してアクセス

インデックスを複数指定してアクセス

特定の区間を番号で指定して抽出

DataFrameを1行ずつfor文でループさせる

indexを書き換える

DataFrameのシャローコピーとディープコピー

詳細は、「PandasでDataFrame型をコピーする際はシャローとディープの違いに注意 | Miningoo」に書きました!

データの正規化

正規化の代表的な手法 z-score normalization と min-max normalization | Miningoo

最後にコードをまとめると

参考

Python Pandasでのデータ操作の初歩まとめ − 前半:データ作成&操作編 – Qiita