PythonのPandasライブラリを使用して、DataFrameの特定の列からユニークな値を取得する方法について説明します。
DataFrameの作成
まず、以下のようなサンプルのPandas DataFrameを作成します。
import pandas as pd
data = {
'A': ['A1', 'A2', 'A3', 'A4', 'A5'],
'B': ['B1', 'B2', 'B3', 'B4', 'B4'],
'C': ['C1', 'C2', 'C3', 'C3', 'C3'],
'D': ['D1', 'D2', 'D2', 'D2', 'D2'],
'E': ['E1', 'E1', 'E1', 'E1', 'E1']
}
df = pd.DataFrame(data)
ユニークな値の取得
次に、unique()
関数を使用して、特定の列からユニークな値を取得します。以下に、列’B’と列’E’からユニークな値を取得する例を示します。
# 列'B'からユニークな値を取得
unique_B = df['B'].unique()
print(unique_B)
# Output: array(['B1', 'B2', 'B3', 'B4'], dtype=object)
# 列'E'からユニークな値を取得
unique_E = df['E'].unique()
print(unique_E)
# Output: array(['E1'], dtype=object)
ユニークな値の数の取得
nunique()
関数を使用して、特定の列のユニークな値の数を取得することもできます。以下に、列’C’のユニークな値の数を取得する例を示します。
# 列'C'のユニークな値の数を取得
num_unique_C = df['C'].nunique()
print(num_unique_C)
# Output: 3
以上が、Pandas DataFrameの特定の列からユニークな値を取得する基本的な方法です。これらの関数を活用することで、データ分析や前処理を効率的に行うことができます。