Pythonにおいて、データからランダムにサンプリングする際、またはサンプリングする際に各データに異なる重みを付ける場合、random
モジュールや numpy
ライブラリを利用することが一般的です。以下では、リストからランダムに要素をサンプリングする方法と、各要素に異なる重みを付けてサンプリングする方法を示します。
1. データからランダムにサンプリング
import random
data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
# サイズが3のランダムなサンプルを取得
sampled_data = random.sample(data, 3)
print("サンプルデータ:", sampled_data)
この例では、random.sample
関数を使用して、data
リストからサイズが3のランダムなサンプルを取得しています。
2. 重み付きサンプリング
import random
data = [1, 2, 3, 4, 5]
weights = [0.1, 0.2, 0.3, 0.2, 0.2]
# 重みに基づいてランダムにサンプリング
sampled_data = random.choices(data, weights=weights, k=3)
print("重み付きサンプルデータ:", sampled_data)
この例では、random.choices
関数を使用して、data
リストから重み付きでサイズが3のランダムなサンプルを取得しています。weights
パラメータに各要素の重みを指定しています。
これらの方法を駆使することで、異なるデータサンプリングのニーズに対応できます。