Pythonの外部ライブラリであるpandasを使用してExcelファイル(xlsx, xls)をDataFrameとして読み込む方法を解説します。DataFrameとして読み込まれたデータは、様々な加工や集計が可能になります。
使用ライブラリ
PythonでExcelファイルを読み込むためには、以下のライブラリが必要です。
- pandas
- openpyxl
- xlrd
これらのライブラリはpipコマンドを使ってインストールできます。
pip install pandas openpyxl xlrd
Excelファイルの読み込み
Excelファイルを読み込むには、pandasのread_excel
メソッドを使用します。
import pandas as pd
df = pd.read_excel('data.xlsx')
このコードは、data.xlsx
というExcelファイルを読み込み、その内容をDataFrameとしてdf
に格納します。
インデックスの指定
read_excel
メソッドのindex_col
引数を使用すると、読み込み時に特定の列をインデックスとして設定できます。
df = pd.read_excel('data.xlsx', index_col=0)
このコードは、Excelファイルの最初の列をインデックスとして設定します。
以上がPythonでExcelファイルを読み込む基本的な方法です。さらに詳しい情報は、参考リンクをご覧ください。