Pythonはデータ分析に非常に便利な言語で、特にpandasライブラリを使用すると、Excelファイルの読み込みやフィルタリングが容易になります。
pandasを使用したExcelファイルの読み込み
まずはpandasを使用してExcelファイルを読み込む方法を見てみましょう。以下にそのコードを示します。
from pandas import DataFrame, Series, ExcelFile
import os
def isExcelFilePath(filepath:str)->bool:
return (filepath.endswith('.xlsx') or filepath.endswith('.xls'))
def getExcelFile(filepath:str)->ExcelFile:
if (not os.path.exists(filepath) or (not isExcelFilePath(filepath))):
return None
return ExcelFile(filepath)
def getDataFromExcelFile(excelFile:ExcelFile)->DataFrame:
return excelFile.parse(index_col=None)
dataFrame = getDataFromExcelFile(getExcelFile('./sample.xlsx'))
print(dataFrame)
このコードでは、まずExcelファイルを読み込み、それをpandasのDataFrameに変換しています。
pandasを使用したExcelファイルのフィルタリング
次に、pandasを使用してExcelファイルのデータをフィルタリングする方法を見てみましょう。以下にそのコードを示します。
searchedDataRow = dataFrame[dataFrame['社員コード'] == 'A000']
このコードでは、DataFrame内の’社員コード’が’A000’の行をフィルタリングしています。
以上がPythonとpandasを使用してExcelファイルを読み込み、フィルタリングする基本的な方法です。これらのコードを適切に組み合わせることで、さまざまなデータ分析を行うことが可能になります。