Pythonはビジネスでよく使われるExcelファイルの処理にとても優れています。しかし、PythonはExcelファイルでは特に低速です。この記事では、PythonでExcelファイルを高速に読み込むいくつかの方法を紹介します。
CSVを使用する
ExcelファイルをCSV形式で保存するだけで、読み込み速度が大幅に向上します。Pythonのcsvファイルインポートは、Excelファイルよりも100倍高速です。
import pandas as pd
df = pd.read_csv("your_file.csv")
ただし、csvファイルはほとんどの場合.xlsxファイルよりも大きくなります。
データフレームの作成方法を変更する
PandasのDataFrameの作成方法を変更することで、プロセスをスピードアップできます。各ファイルを既存のDataFrameに追加する代わりに、各DataFrameを個別にリストにロードします。次に、リスト全体を単一のDataFrameに連結します。
df = []
for file_number in range(10):
temp = pd.read_csv(f"Dummy {file_number}.csv")
df.append(temp)
df = pd.concat(df, ignore_index=True)
まとめ
Pythonを使えば、巨大なExcelファイルでも簡単に処理でき、再利用可能なコードを作成できるほか、同僚にドキュメントを提供することもできます。またPythonの高度な機能にも簡単にアクセスできることも確認できました。これらの方法を試して、PythonでのExcelファイルの読み込み速度を向上させてみてください。.