Pythonはデータ分析に非常に便利な言語で、特にpandasライブラリを使用すると、Excelファイルの読み込みやフィルタリングが容易になります。

pandasを使用したExcelファイルの読み込み

まずはpandasを使用してExcelファイルを読み込む方法を見てみましょう。以下にそのコードを示します。

from pandas import DataFrame, Series, ExcelFile
import os

def isExcelFilePath(filepath:str)->bool:
    return (filepath.endswith('.xlsx') or filepath.endswith('.xls'))

def getExcelFile(filepath:str)->ExcelFile:
    if (not os.path.exists(filepath) or (not isExcelFilePath(filepath))):
        return None
    return ExcelFile(filepath)

def getDataFromExcelFile(excelFile:ExcelFile)->DataFrame:
    return excelFile.parse(index_col=None)

dataFrame = getDataFromExcelFile(getExcelFile('./sample.xlsx'))
print(dataFrame)

このコードでは、まずExcelファイルを読み込み、それをpandasのDataFrameに変換しています。

pandasを使用したExcelファイルのフィルタリング

次に、pandasを使用してExcelファイルのデータをフィルタリングする方法を見てみましょう。以下にそのコードを示します。

searchedDataRow = dataFrame[dataFrame['社員コード'] == 'A000']

このコードでは、DataFrame内の’社員コード’が’A000’の行をフィルタリングしています。

以上がPythonとpandasを使用してExcelファイルを読み込み、フィルタリングする基本的な方法です。これらのコードを適切に組み合わせることで、さまざまなデータ分析を行うことが可能になります。

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です