Pythonは、数値データの分析を行うのに非常に便利な言語です。データの分析を行うまず第一歩として、データを読み込む必要があります。ここでは、CSVファイルから数値データを読み込む方法を紹介します。
CSVファイルから数値データを読み込む
PythonでCSVファイルから数値データを読み込む基本的な方法は、numpy
のloadtxt
関数を使用する方法です。
import numpy as np
data = np.loadtxt('filename.csv', comments='year', delimiter=',', dtype='float')
ここで、comments
で、読み飛ばす行の左端に存在する文字列を指定します。delimiter
で、区切り文字を指定します。もしスペースで区切ってあった場合には、delimiter=...
という記述は必要ありません。dtype
で、データをどの形式で読み込むかを指定します。デフォルトはfloat
(浮動小数点数)です。整数として読み込みたい場合にはint
とすればよい。
まとめ
PythonでCSVファイルから数値データを読み込む方法は多数ありますが、ここでは最も基本的なnumpy
のloadtxt
関数を使用する方法を紹介しました。この方法をマスターすれば、Pythonで数値データの分析を始める第一歩となります。