PythonでCSVファイルを読み込み、各フィールドの先頭と末尾の空白を削除する方法について説明します。この操作は、データの前処理やクリーニングの一部としてよく行われます。
csv モジュールを使用する方法
Pythonの組み込みの csv
モジュールを使用して、CSVファイルから空白をトリミングすることができます。以下にそのコードスニペットを示します。
import csv
# CSVファイルを開く
with open('myfile.csv', 'r') as f:
reader = csv.DictReader(f)
# 各行を処理する
for row in reader:
# 各フィールドの先頭と末尾の空白を削除
trimmed_data = {k: v.strip() for k, v in row.items()}
# 結果を表示
print(trimmed_data)
このコードは、CSVファイルを開き、csv.DictReader
を使用して各行を辞書として読み込みます。その後、辞書内包表記を使用して各フィールドの値の先頭と末尾の空白を削除します。
pandas を使用する方法
また、pandas
ライブラリを使用して同様の操作を行うこともできます。以下にそのコードスニペットを示します。
import pandas as pd
# CSVファイルを読み込む
df = pd.read_csv('myfile.csv')
# 各列の先頭と末尾の空白を削除
df = df.applymap(lambda x: x.strip() if isinstance(x, str) else x)
# 結果を表示
print(df)
このコードは、CSVファイルを pandas.DataFrame
として読み込み、applymap
関数を使用して各セルの先頭と末尾の空白を削除します。
以上、PythonでCSVファイルから空白をトリミングする方法について説明しました。これらの方法を使用すれば、データの前処理やクリーニングを効率的に行うことができます。