PythonはExcelファイルを読み込むことができます。VBAではなくPythonを使う理由は既に公開されている様々なライブラリを利用してデータを処理できる点にあります。
必要なライブラリのインストール
Pythonでexcelファイルを読み込むためには、xlrd
とpandas
というライブラリが必要になります。以下のコマンドを使ってインストールを行います。
pip install -U xlrd
pip install -U pandas
xlrd
はexcelファイルを読み込むライブラリで、対象ファイルの拡張子は「.xls」「.xlsx」です。pandas
はデータ分析用のライブラリで、この中の read_excel
メソッドを使います。
Excelファイルの読み込み
PythonのPandasモジュールでExcelファイルを読み込むには read_excel
メソッドを使います。Excelファイルの読み込み方法には、大きく3つのパターンがあります。
read_excel
のデフォルト設定の読み込み- シート番号で読み込み
- シート名で読み込み
read_excel
のデフォルト設定の読み込み
read_excel
メソッドのデフォルト設定は、1枚目のシートを読み込む設定になっています。
import pandas as pd
df = pd.read_excel ('~/desktop/GA-demo.xlsx')
df
シート番号で読み込み
オプションに sheet_name=n
を記述することで、指定したシートを読み込むことができます。「n」はシート番号で、シート番号は 0始まりです。
import pandas as pd
pd.read_excel ('~/desktop/GA-demo.xlsx', sheet_name=1)
シート名で読み込み
オプションに sheet_name='シート名'
を記述することで、指定したシートを読み込むことができます。
import pandas as pd
pd.read_excel ('~/desktop/GA-demo.xlsx', sheet_name='データセット2')
以上がPythonでExcelファイルをクエリする基本的な方法です。これらの方法を使えば、PythonでExcelデータを効率的に処理することが可能です。.