PythonのPandasライブラリを使用して、DataFrameの特定の列からユニークな値を取得する方法について説明します。

DataFrameの作成

まず、以下のようなサンプルのPandas DataFrameを作成します。

import pandas as pd

data = {
    'A': ['A1', 'A2', 'A3', 'A4', 'A5'],
    'B': ['B1', 'B2', 'B3', 'B4', 'B4'],
    'C': ['C1', 'C2', 'C3', 'C3', 'C3'],
    'D': ['D1', 'D2', 'D2', 'D2', 'D2'],
    'E': ['E1', 'E1', 'E1', 'E1', 'E1']
}

df = pd.DataFrame(data)

ユニークな値の取得

次に、unique()関数を使用して、特定の列からユニークな値を取得します。以下に、列’B’と列’E’からユニークな値を取得する例を示します。

# 列'B'からユニークな値を取得
unique_B = df['B'].unique()
print(unique_B)
# Output: array(['B1', 'B2', 'B3', 'B4'], dtype=object)

# 列'E'からユニークな値を取得
unique_E = df['E'].unique()
print(unique_E)
# Output: array(['E1'], dtype=object)

ユニークな値の数の取得

nunique()関数を使用して、特定の列のユニークな値の数を取得することもできます。以下に、列’C’のユニークな値の数を取得する例を示します。

# 列'C'のユニークな値の数を取得
num_unique_C = df['C'].nunique()
print(num_unique_C)
# Output: 3

以上が、Pandas DataFrameの特定の列からユニークな値を取得する基本的な方法です。これらの関数を活用することで、データ分析や前処理を効率的に行うことができます。

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です