Pythonのデータ分析ライブラリであるPandasのDataFrameから行や列を削除する方法について解説します。
DataFrameからデータを削除する方法
DataFrameからデータを削除する方法は主に2種類あります。
del
ステートメントdrop
メソッド
これらを使って削除ができます。del
はPythonのステートメント(文)です。drop
の方はDataFrameのメソッドで、これを使うことで行や列を指定して削除することができます。
drop
メソッドの使い方
行を削除する
例えば、「3行目がいらない!」とか「140~145行目がいらない!」と行った場合を考えてみます。一行だけ削除する場合は数字をそのまま引数に、複数行を指定する場合はリストで削除したいところを指定してあげればOKです。
droped_df = df.drop(3) # 3行目だけを削除
droped_df = df.drop(range(140,146)) # 140~145行目を削除
列を削除する
解析に不要な特徴量を削除したい場合、データフレームの列を削除する必要があります。こんな時はdrop
のパラメータaxis
をaxis=1
とすることで、列を削除することができます。
droped_df = df.drop("label", axis=1) # label列だけ削除
以上がPythonのPandasライブラリのDataFrameから行や列を削除する基本的な方法です。これらの方法を覚えて、データ分析をより効率的に進めていきましょう!.