Pythonはデータ分析に非常に便利な言語で、特にCSVファイルの操作には優れた機能を持っています。今回は、Pythonを使用してCSVファイルの行数をカウントする方法について解説します。
CSVファイルの行数をカウントする
Pythonの標準ライブラリであるcsv
モジュールを使用して、CSVファイルの行数をカウントすることができます。以下にそのコードを示します。
import csv
def count_csv_rows(file_path):
with open(file_path, 'r') as file:
reader = csv.reader(file)
row_count = sum(1 for row in reader)
return row_count
file_path = 'data_file.csv' # CSVファイルのパスを指定
row_count = count_csv_rows(file_path)
print("行数:", row_count)
このコードでは、csv.reader
オブジェクトを作成し、そのオブジェクトをイテレートすることで各行を読み込みます。そして、ジェネレータ式を使って各行ごとに1をカウントし、その合計を取得します。
ヘッダーがある場合
CSVファイルにヘッダー行がある場合は、以下のようにnext
関数を使用してヘッダー行を読み飛ばすことができます。
import csv
def count_csv_records(file_path):
with open(file_path, 'r') as file:
reader = csv.reader(file)
header = next(reader) # ヘッダー行を読み飛ばす
record_count = sum(1 for row in reader)
return record_count
file_path = 'data_file.csv' # CSVファイルのパスを指定
record_count = count_csv_records(file_path)
print("レコード数:", record_count)
以上がPythonを使用してCSVファイルの行数をカウントする方法です。大量のデータを扱う際には、このような基本的な操作が非常に役立ちます。