Pythonでデータフレームのカラムを操作する方法です。
使用するのは、PythonのPandasライブラリのcolumns属性です。
まず、リストを使って簡単なデータフレームを作成します。
pd.Dataframeにリストを指定して実行します。
import pandas as pd
df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
df
データフレームが表示されました。
カラム名もインデックス名も設定されていない場合には、このようにそれぞれ0から順番に番号が振られます。
まず、このデータフレームにカラム名を設定してみましょう。
それぞれ設定したいカラム名をリストにして、df.columnsに格納します。
実行します。
df.columns=['col01','col02','col03']
df
カラム名を設定することができました。
次に、設定したカラム名を変更してみましょう。
変更後のカラム名をそれぞれリストにして、df.columnsに格納します。
先程のカラム名を設定する方法と同じですね。
実行します。
df.columns=['idx04','idx05','idx06']
df
カラム名が変更することができました。
次に、インデックス名の設定もしてみましょう。
インデックスの操作にはindex属性を使用します。
設定したいインデックス名をそれぞれリストにして、df.indexに格納します。
実行します。
df.index=['idx01','idx02','idx03']
df
インデックス名を設定することができました。
なお、columns属性、index属性の他に、データフレームのデータの取得ができるvalues属性もあります。
試しにdf.valuesで実行します。
データを取得することができました。
arrayは配列を表してしており、ここでは3列3行の2次元配列であることが確認できます。
dtypeはデータ型のことで、int64はデータが整数であることを示しています。
df.values