Pandasのnunique()
関数を使用すると、Pandas DataFrame内のユニークな値の数をカウントすることができます。この関数は以下の基本的な構文を使用します:
# 各列のユニークな値をカウント
df.nunique()
# 各行のユニークな値をカウント
df.nunique(axis=1)
以下に、この関数を実際のPandas DataFrameで使用する例を示します:
import pandas as pd
# DataFrameを作成
df = pd.DataFrame({
'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
'points': [8, 8, 13, 13, 22, 22, 25, 29],
'assists': [5, 8, 7, 9, 12, 9, 9, 4],
'rebounds': [11, 8, 11, 6, 6, 5, 9, 12]
})
# 各列のユニークな値をカウント
print(df.nunique())
このコードを実行すると、各列のユニークな値の数が表示されます。
また、groupby()
メソッドと組み合わせることで、グループごとのユニークな値の数をカウントすることも可能です。以下に例を示します:
# チームごとに'points'のユニークな値をカウント
print(df.groupby('team')['points'].nunique())
このコードを実行すると、各チームの’points’のユニークな値の数が表示されます。
以上が、PythonのPandasライブラリを使用してユニークな値をカウントする基本的な方法です。データ分析において、ユニークな値の数を知ることは非常に重要なステップであり、Pandasのnunique()
関数はそのための強力なツールです。