PythonでCSVファイルを読み込み、各フィールドの先頭と末尾の空白を削除する方法について説明します。この操作は、データの前処理やクリーニングの一部としてよく行われます。

csv モジュールを使用する方法

Pythonの組み込みの csv モジュールを使用して、CSVファイルから空白をトリミングすることができます。以下にそのコードスニペットを示します。

import csv

# CSVファイルを開く
with open('myfile.csv', 'r') as f:
    reader = csv.DictReader(f)

    # 各行を処理する
    for row in reader:
        # 各フィールドの先頭と末尾の空白を削除
        trimmed_data = {k: v.strip() for k, v in row.items()}

        # 結果を表示
        print(trimmed_data)

このコードは、CSVファイルを開き、csv.DictReader を使用して各行を辞書として読み込みます。その後、辞書内包表記を使用して各フィールドの値の先頭と末尾の空白を削除します。

pandas を使用する方法

また、pandas ライブラリを使用して同様の操作を行うこともできます。以下にそのコードスニペットを示します。

import pandas as pd

# CSVファイルを読み込む
df = pd.read_csv('myfile.csv')

# 各列の先頭と末尾の空白を削除
df = df.applymap(lambda x: x.strip() if isinstance(x, str) else x)

# 結果を表示
print(df)

このコードは、CSVファイルを pandas.DataFrame として読み込み、applymap 関数を使用して各セルの先頭と末尾の空白を削除します。

以上、PythonでCSVファイルから空白をトリミングする方法について説明しました。これらの方法を使用すれば、データの前処理やクリーニングを効率的に行うことができます。

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です