PythonでCSVファイルを開く際には、エンコーディングを指定することが重要です。特に日本語が含まれる場合、適切なエンコーディングを指定しないとエラーが発生することがあります。

Shift_JISでの読み込み

一般的に、日本語を含むCSVファイルを読み込む場合は、encoding='shift_jis'を指定します。

import pandas as pd
df = pd.read_csv('data.csv', encoding='shift_jis')

しかし、それでもエラーとなってしまう場合があります。例えば、以下のようなCSVファイルです。

CP932での読み込み

shift_jisで読み込めない場合は、encoding='cp932'を試してみてください。

df = pd.read_csv('data.csv', encoding='cp932')

これで、特殊な文字も読み込み可能です。

UTF-8での読み込み

また、UTF-8でエンコードされたCSVファイルを読み込む場合は、encoding='utf_8'を指定します。

import csv
with open('data.csv', encoding='utf_8') as file:
    reader = csv.reader(file)
    for row in reader:
        print(row)

以上、PythonでCSVファイルをエンコーディングして開く方法について解説しました。適切なエンコーディングを指定することで、様々なCSVファイルを正確に読み込むことができます。

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です