Pythonはデータ分析に非常に便利な言語で、Excelファイルの操作も得意としています。特に、Excelの行列データを読み込む機能は、データ分析の現場で頻繁に使用されます。今回は、PythonでExcelの行列を読み込む方法について解説します。
ライブラリのインストール
まず、Excelファイルを読み込むためには、xlrd
とpandas
というライブラリが必要です。以下のコマンドを使ってインストールを行います。
pip install -U xlrd
pip install -U pandas
Excelファイルの読み込み
PythonのPandasモジュールでExcelファイルを読み込むには read_excel
メソッドを使います。以下にその基本的な使い方を示します。
import pandas as pd
df = pd.read_excel('Data.xlsx', index=False, dtype='object')
このコードでは、Data.xlsx
というExcelファイルを読み込み、その内容をdf
という変数に格納しています。
行列データの抽出
具体的な行列データの抽出方法は以下の通りです。
import xlrd
# Excelファイルを指定
Wb = xlrd.open_workbook('C:/Users/Documents/テスト.xlsx')
# シートを指定
Sheet_1 = Wb.sheet_by_name('シート1')
# シートの最終行を取得
Sheet_Max = Sheet_1.nrows
# 配列宣言
My_Name = []
My_Suryo = []
# シートの2行目~最終行をループ
for i in range(1, Sheet_Max):
# A列を配列へ格納
My_Name.append(Sheet_1.cell_value(i, 0))
# B列を配列へ格納
My_Suryo.append(int(Sheet_1.cell_value(i, 1)))
print(My_Name)
print(My_Suryo)
このコードでは、指定したExcelファイルを開き、特定のシートのデータを行列として読み込んでいます。
以上がPythonでExcelの行列を読み込む基本的な方法です。これを活用することで、Excelデータの分析がより効率的に行えます。.