Pandasのnunique()関数を使用すると、Pandas DataFrame内のユニークな値の数をカウントすることができます。この関数は以下の基本的な構文を使用します:

# 各列のユニークな値をカウント
df.nunique()

# 各行のユニークな値をカウント
df.nunique(axis=1)

以下に、この関数を実際のPandas DataFrameで使用する例を示します:

import pandas as pd

# DataFrameを作成
df = pd.DataFrame({
    'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
    'points': [8, 8, 13, 13, 22, 22, 25, 29],
    'assists': [5, 8, 7, 9, 12, 9, 9, 4],
    'rebounds': [11, 8, 11, 6, 6, 5, 9, 12]
})

# 各列のユニークな値をカウント
print(df.nunique())

このコードを実行すると、各列のユニークな値の数が表示されます。

また、groupby()メソッドと組み合わせることで、グループごとのユニークな値の数をカウントすることも可能です。以下に例を示します:

# チームごとに'points'のユニークな値をカウント
print(df.groupby('team')['points'].nunique())

このコードを実行すると、各チームの’points’のユニークな値の数が表示されます。

以上が、PythonのPandasライブラリを使用してユニークな値をカウントする基本的な方法です。データ分析において、ユニークな値の数を知ることは非常に重要なステップであり、Pandasのnunique()関数はそのための強力なツールです。

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です