PythonでCSVファイルを開く際には、エンコーディングを指定することが重要です。特に日本語が含まれる場合、適切なエンコーディングを指定しないとエラーが発生することがあります。
Shift_JISでの読み込み
一般的に、日本語を含むCSVファイルを読み込む場合は、encoding='shift_jis'
を指定します。
import pandas as pd
df = pd.read_csv('data.csv', encoding='shift_jis')
しかし、それでもエラーとなってしまう場合があります。例えば、以下のようなCSVファイルです。
CP932での読み込み
shift_jis
で読み込めない場合は、encoding='cp932'
を試してみてください。
df = pd.read_csv('data.csv', encoding='cp932')
これで、特殊な文字も読み込み可能です。
UTF-8での読み込み
また、UTF-8でエンコードされたCSVファイルを読み込む場合は、encoding='utf_8'
を指定します。
import csv
with open('data.csv', encoding='utf_8') as file:
reader = csv.reader(file)
for row in reader:
print(row)
以上、PythonでCSVファイルをエンコーディングして開く方法について解説しました。適切なエンコーディングを指定することで、様々なCSVファイルを正確に読み込むことができます。