Pythonのデータ分析ライブラリであるPandasには、文字列を大文字に変換するためのメソッドstr.upper()
があります。このメソッドは、SeriesやDataFrame中の文字列を大文字に変換します。
使用方法
以下に、str.upper()
の基本的な使用方法を示します。
import pandas as pd
# データフレームを作成
data = {'Vegetables': ['broccoli','carrot','onion','celery','spinach'], 'Price': [2,3,1.5,2.5,1]}
df = pd.DataFrame(data, columns = ['Vegetables', 'Price'])
# 'Vegetables'列の文字列を大文字に変換
df['Vegetables'] = df['Vegetables'].str.upper()
このコードは、’Vegetables’列のすべての文字列を大文字に変換します。
注意点
str.upper()
は、元のデータを変更せずに新しいSeriesを返します。そのため、結果を保存するには、新しい変数に結果を代入するか、元の列を上書きする必要があります。
まとめ
Pandasのstr.upper()
メソッドは、データ分析の前処理で頻繁に使用される便利な機能です。特に、手入力のデータを扱う際には、文字列の大文字・小文字の統一が重要となります。このメソッドを使うことで、効率的にデータの前処理を行うことができます。.