pandas.read_csv
は、Pythonのデータ分析ライブラリPandasの中で最もよく使われる関数の一つです。この関数は、CSVファイルを読み込み、その内容をPandasのDataFrameとして返します。
基本的な使用方法
最も基本的な使用方法は、ファイルパスを文字列で指定する方法です。
import pandas as pd
df = pd.read_csv('sample.csv')
print(df)
引数の詳細
read_csv
関数には多くの引数があり、それぞれが特定の目的を果たします。以下に、いくつかの主要な引数を紹介します。
filepath_or_buffer
CSVファイルのパスを指定します。全引数の中で唯一の必須引数です。
sep
区切り文字を指定します。デフォルトはカンマ(,
)です。
header
列名が存在する行番号を指定します。デフォルトは'infer'
で、これは最初の行が列名であると推測します。
dtype
列のデータ型を指定する辞書を提供します。
usecols
読み込む列を指定するリストを提供します。
まとめ
pandas.read_csv
関数は、データ分析において非常に重要なツールです。多くの引数がありますが、それぞれがデータの読み込みをより柔軟に制御するためのものです。この関数を理解し、適切に使用することで、データ分析の効率を大幅に向上させることができます。.