PythonでCSVファイルを読み込む際には、エンコーディングを指定することが重要です。特に日本語が含まれる場合、適切なエンコーディングを指定しないとエラーが発生することがあります。
Shift_JISとCP932
Pythonで日本語を含むCSVファイルを読み込む場合、一般的にはencoding='shift_jis'
を指定します。しかし、特定の日本語文字(例えば、全角の数字やローマ数字など)が含まれていると、’shift_jis’ではエラーが発生することがあります。
このような場合、encoding='cp932'
を指定することで問題を解決できます。以下に具体的なコードを示します。
import pandas as pd
df = pd.read_csv('data.csv', encoding='cp932')
print(df)
このコードでは、CP932エンコーディングを使用してCSVファイルを読み込んでいます。
UTF-8
一方、UTF-8エンコーディングを使用することもあります。以下に具体的なコードを示します。
import csv
with open('data.csv', encoding='utf-8') as file:
reader = csv.reader(file)
for row in reader:
print(row)
このコードでは、UTF-8エンコーディングを使用してCSVファイルを読み込んでいます。
まとめ
PythonでCSVファイルを読み込む際には、エンコーディングを適切に指定することが重要です。日本語が含まれる場合、’shift_jis’、’cp932’、または’utf-8’を試してみてください。