Pythonで経験的累積分布関数(ECDF)をプロットする方法について説明します。ECDFは、データセット内の各データポイントが全体の何パーセントを占めているかを示す便利な視覚化ツールです。
Matplotlibを使用したECDFのプロット
Matplotlibは、Pythonでグラフを作成するための主要なライブラリの1つです。以下に、Matplotlibを使用してECDFをプロットする基本的なコードスニペットを示します。
import matplotlib.pyplot as plt
import numpy as np
# データの生成
np.random.seed(1)
x = 4 + np.random.normal(0, 1.5, 200)
# ECDFのプロット
fig, ax = plt.subplots()
ax.ecdf(x)
plt.show()
このコードは、正規分布からランダムに生成された200個のデータポイントを使用してECDFをプロットします。
Stack Overflowの提案
Stack Overflowのユーザーは、以下のようにNumPyのlinspace
関数とsort
関数を使用してECDFをプロットする方法を提案しています。
import numpy as np
import matplotlib.pyplot as plt
# aはデータ配列
x = np.sort(a)
y = np.arange(len(x))/float(len(x))
plt.plot(x, y)
このコードは、データ配列a
の各値が全体の何パーセントを占めているかをプロットします。
以上がPythonでECDFをプロットする基本的な方法です。これらのコードスニペットを参考に、自分のデータ分析に活用してみてください。