PandasはPythonのライブラリで、データ分析やデータ操作に広く使用されています。特に、データフレーム(DataFrame)という2次元のデータ構造を提供しており、それぞれの列が異なるデータ型を持つことができます。
Pandasのデータ型
Pandasのデータフレームでは、以下のようなデータ型が使用できます。
- object (文字列)
- int64 (整数)
- float64 (小数点を含む数値)
- bool (True/False)
- datetime64 (日付と時間)
データ型の確認
データフレームの各列のデータ型を確認するには、dtypes
属性を使用します。
import pandas as pd
data = {
"名前": ["太郎", "次郎", "三郎"],
"身長": [180.0, 170.0, 160.0],
"年齢": [30, 25, 20],
}
df = pd.DataFrame(data)
print(df.dtypes)
データ型の変換
データ型の変換にはastype
メソッドを使用します。このメソッドを使用すると、ほぼ任意の型から任意の型へ変換(キャスト)することができます。
# '年齢'列をfloat型に変換
df['年齢'] = df['年齢'].astype(float)
print(df.dtypes)
以上がPandasでのデータ型の確認と変換についての基本的な操作です。これらの知識を持つことで、データ分析の作業がよりスムーズに進むでしょう。.