Pythonはデータ分析や処理に非常に便利な言語で、特にCSVファイルの操作には優れた機能を持っています。今回は、Pythonを使ってCSVファイルの特定の列のデータを一括で置換する方法について解説します。
CSVファイルの読み込み
まずは、pandasのread_csv
関数を使用して、CSVファイルを読み込みます。これにより、CSVファイルのデータがpandasのDataFrameとして扱えるようになります。
import pandas as pd
import os
filtered_csv_dir = './'
filtered_csv_filename = 'sample_csv.csv'
filtered_csv_path = os.path.join(filtered_csv_dir, filtered_csv_filename)
# CSVファイルの読み込み
df = pd.read_csv(filtered_csv_path)
データの置換
次に、特定の列のデータを置換します。ここでは、’name’列と’color’列のデータをそれぞれ対応するフルーツの名前や色に置換します。
# name列のデータを置換
fruit_name_mapping = {
1: "バナナ",
2: "りんご",
3: "レモン",
4: "もも",
5: "オレンジ",
6: "マンゴー"
}
df['name'] = df['name'].map(fruit_name_mapping)
# color列のデータを置換
color_mapping = {
1: "黄色",
2: "赤色",
3: "ピンク色",
4: "オレンジ色"
}
df['color'] = df['color'].map(color_mapping)
列名の変更
最後に、列名を変更します。これには、rename
メソッドを使用します。
# 列名を変更
df.rename(columns={
'name': 'フルーツ名',
'color': '色',
'quantity': '数量'
}, inplace=True)
結果の書き出し
最後に、to_csv
メソッドを使用して、変更を加えたDataFrameを同じCSVファイルに書き出します。
# 結果を同じCSVファイルに書き出し
df.to_csv(filtered_csv_path, index=False)
以上がPythonを使ってCSVファイルのデータを一括置換する方法です。この方法を使えば、大量のデータを効率的に処理することが可能です。.