PythonでExcelファイル(.xls、.xlsx)を読み込むためには、xlrd
とpandas
というライブラリが必要です。これらのライブラリをインストールするには、以下のコマンドを使用します。
pip install -U xlrd
pip install -U pandas
xlrd
はExcelファイルを読み込むライブラリで、対象ファイルの拡張子は「.xls」「.xlsx」です。pandas
はデータ分析用のライブラリで、この中のread_excel
メソッドを使います。
しかし、pandas
でExcelファイル(.xlsx)が読み込めない場合があります。その時の対処法としては、xlrd
のバージョンを下げるか、ファイルを読み取るライブラリをopenpyxl
に変更する方法があります。
pip3 install xlrd==1.2.0
pip3 install openpyxl
そして、Excelファイルを読み込む際には、ライブラリを指定します。
df = pd.read_excel('sample.xlsx',engine="openpyxl")
以上がPythonでExcelファイルを読み込む基本的な方法です。これにより、ExcelのデータをPythonで扱うことが可能になり、様々なデータ分析が行えます。.