import pandas as pd
import numpy as np
df = pd.DataFrame([[3,np.nan,6], [4,'abc',np.nan], [1, 8,np.nan],[2,11,12],[np.nan,14,18]],
columns=['col01', 'col02', 'col03'],
index=['idx01', 'idx02', 'idx03','idx04','idx05'])
df
df.sort_values(by='col01')
指定したカラムの値に沿って並べ替える方法です。
使用するメソッドは、pandasデータフレームのsort_valuesメソッドです。
第一引数のbyに並び替えたいカラムを指定することで、指定したカラムを軸に並び替えることができます。
このようなデータフレームを用意します。
col01を指定して並び替えてみましょう。
実行します。
データが並び替えられました。
任意の引数で便利なのはascendingとna_positionです。
df.sort_values(by='col01',ascending=False)
ascendingはデフォルトではTrueで昇順ですがFalseにすることで降順にすることもできます。
df.sort_values(by='col01',na_position='first')
na_positionを追加してfirstと指定すると欠損値を1番上に並べ替えることができます。
欠損値を1番上にして並べることができました。