Python Pandasでユニークな値をカウントする方法

投稿者 admin 2024年7月21日

Pandasのnunique()関数を使用すると、Pandas DataFrame内のユニークな値の数をカウントすることができます。この関数は以下の基本的な構文を使用します：

# 各列のユニークな値をカウント
df.nunique()

# 各行のユニークな値をカウント
df.nunique(axis=1)

以下に、この関数を実際のPandas DataFrameで使用する例を示します：

import pandas as pd

# DataFrameを作成
df = pd.DataFrame({
    'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
    'points': [8, 8, 13, 13, 22, 22, 25, 29],
    'assists': [5, 8, 7, 9, 12, 9, 9, 4],
    'rebounds': [11, 8, 11, 6, 6, 5, 9, 12]
})

# 各列のユニークな値をカウント
print(df.nunique())

このコードを実行すると、各列のユニークな値の数が表示されます。

また、groupby()メソッドと組み合わせることで、グループごとのユニークな値の数をカウントすることも可能です。以下に例を示します：

# チームごとに'points'のユニークな値をカウント
print(df.groupby('team')['points'].nunique())

このコードを実行すると、各チームの’points’のユニークな値の数が表示されます。

以上が、PythonのPandasライブラリを使用してユニークな値をカウントする基本的な方法です。データ分析において、ユニークな値の数を知ることは非常に重要なステップであり、Pandasのnunique()関数はそのための強力なツールです。

投稿者 admin

コメントを残すコメントをキャンセル

Pandasでデータフレームの要約統計量を計算する方法

ラズベリーパイとPythonを使用した画像処理

Javaでのプロキシの設定方法

WindowsでPythonを動かす方法