Pythonでデータフレームを作成する方法です。
使用するのは、PythonのPandasライブラリのDataFrameメソッドです。
データフレームとは、インデックス、カラム、データから構成される二次元データのことです。
必須の引数は、データフレームの中身となるデータです。
任意の引数に、インデックス名とカラム名を指定できます。
インデックスとカラム名を指定しない場合、デフォルトで0から順番に数字が表示されます。
今回は二通りの方法で簡単なデータフレームを作成してみましょう。
import pandas as pd
pd.DataFrame(data=[[157,48],[162,52],[174,63]],index=['A','B','C'],columns=['height','weight'])
まず、1つめはデータに二次元配列を指定する方法です。
pd.Dataframeの引数に、データの値、インデックス名、カラム名を指定します。
それぞれの値は角括弧でくくります。
実行します。
身長と体重のデータが入ったデータフレームを作成できました。
なお、引数のキーであるdata、index、columnsは省略できます。
pd.DataFrame({'height':[157,162,174],'weight':[48,52,63]},index=['A','B','C'])
今度は辞書を使って同じデータフレームを作成しましょう。
辞書を使う場合は、キーにカラム名、値にデータを指定します。
pd.DataFrameの引数に辞書とインデックス名を指定します。
実行します。
辞書を使って、先ほどと同じデータフレームを作成できました。
なお、データには二次元配列と辞書の他にも、numpyの多次元配列であるndarrayや、csvファイル等を指定することもできます。