PythonはExcelファイルを読み込むことができます。VBAではなくPythonを使う理由は既に公開されている様々なライブラリを利用してデータを処理できる点にあります。

必要なライブラリのインストール

Pythonでexcelファイルを読み込むためには、xlrdpandasというライブラリが必要になります。以下のコマンドを使ってインストールを行います。

pip install -U xlrd
pip install -U pandas

xlrdはexcelファイルを読み込むライブラリで、対象ファイルの拡張子は「.xls」「.xlsx」です。pandasはデータ分析用のライブラリで、この中の read_excel メソッドを使います。

Excelファイルの読み込み

PythonのPandasモジュールでExcelファイルを読み込むには read_excel メソッドを使います。Excelファイルの読み込み方法には、大きく3つのパターンがあります。

  1. read_excelのデフォルト設定の読み込み
  2. シート番号で読み込み
  3. シート名で読み込み

read_excelのデフォルト設定の読み込み

read_excelメソッドのデフォルト設定は、1枚目のシートを読み込む設定になっています。

import pandas as pd
df = pd.read_excel ('~/desktop/GA-demo.xlsx')
df

シート番号で読み込み

オプションに sheet_name=n を記述することで、指定したシートを読み込むことができます。「n」はシート番号で、シート番号は 0始まりです。

import pandas as pd
pd.read_excel ('~/desktop/GA-demo.xlsx', sheet_name=1)

シート名で読み込み

オプションに sheet_name='シート名' を記述することで、指定したシートを読み込むことができます。

import pandas as pd
pd.read_excel ('~/desktop/GA-demo.xlsx', sheet_name='データセット2')

以上がPythonでExcelファイルをクエリする基本的な方法です。これらの方法を使えば、PythonでExcelデータを効率的に処理することが可能です。.

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です