【Python】CSVファイルを読み込んで特定のデータだけ抽出・保存するコード

Python効率化

CSVファイルを扱う際、必要なデータだけを抜き出して保存したいと思うことはありませんか?特に大量のデータがあると、目的の情報を探し出すのは面倒ですよね。エラーが出たり、意図しない結果が得られたりすることも多いと思います。そんな悩みを解決するために、Pythonを使って特定のデータを簡単に抽出し、別のCSVファイルに保存する方法をお教えします。

CSVファイルとは?

CSV(Comma-Separated Values)ファイルは、データをテキスト形式で保存するための形式です。各データはカンマで区切られており、表形式のデータを扱うのに非常に便利です。例えば、Excelで作成したデータをCSV形式で保存することができます。

必要なライブラリのインストール

まず、PythonにはCSVファイルを扱うための便利なライブラリが用意されています。これを使うために、pandasというライブラリをインストールしましょう。

bash
pip install pandas

CSVファイルを読み込む

次に、CSVファイルを読み込むためのコードを紹介します。以下のコードを参考にしてください。

“`python
import pandas as pd

CSVファイルの読み込み

df = pd.read_csv(‘input_file.csv’) # ‘input_file.csv’は読み込むCSVファイルの名前
“`

このコードでは、pandasライブラリを使ってCSVファイルをデータフレームという形式で読み込んでいます。

特定のデータを抽出する

読み込んだデータから特定の条件に合うデータだけを抽出する方法を見ていきましょう。たとえば、「年齢」が30歳以上の人だけを抽出する場合は以下のように書きます。

“`python

年齢が30歳以上のデータを抽出

filtered_data = df[df[‘年齢’] >= 30] # ‘年齢’はCSVファイル内のカラム名
“`

抽出したデータを保存する

最後に、抽出したデータを新しいCSVファイルとして保存します。以下のコードを追加してください。

“`python

抽出したデータを新しいCSVファイルに保存

filtered_data.to_csv(‘output_file.csv’, index=False) # ‘output_file.csv’は保存先のファイル名
“`

index=Falseを指定することで、行のインデックスを新しいファイルに含めないようにしています。

まとめ

この記事では、Pythonを使ってCSVファイルを読み込み、特定のデータを抽出し、新しいCSVファイルに保存する方法を解説しました。手順をまとめると以下の通りです。

  1. pandasライブラリをインストールする
  2. CSVファイルを読み込む
  3. 特定の条件に合うデータを抽出する
  4. 抽出したデータを新しいCSVファイルに保存する

これで、CSVファイルのデータを簡単に扱うことができるようになります。エラーに悩まされることも少なくなりますので、ぜひ試してみてください!

コメント

タイトルとURLをコピーしました