CSVファイルを扱う際、必要なデータだけを抜き出して保存したいと思うことはありませんか?特に大量のデータがあると、目的の情報を探し出すのは面倒ですよね。エラーが出たり、意図しない結果が得られたりすることも多いと思います。そんな悩みを解決するために、Pythonを使って特定のデータを簡単に抽出し、別のCSVファイルに保存する方法をお教えします。
CSVファイルとは?
CSV(Comma-Separated Values)ファイルは、データをテキスト形式で保存するための形式です。各データはカンマで区切られており、表形式のデータを扱うのに非常に便利です。例えば、Excelで作成したデータをCSV形式で保存することができます。
必要なライブラリのインストール
まず、PythonにはCSVファイルを扱うための便利なライブラリが用意されています。これを使うために、pandasというライブラリをインストールしましょう。
bash
pip install pandas
CSVファイルを読み込む
次に、CSVファイルを読み込むためのコードを紹介します。以下のコードを参考にしてください。
“`python
import pandas as pd
CSVファイルの読み込み
df = pd.read_csv(‘input_file.csv’) # ‘input_file.csv’は読み込むCSVファイルの名前
“`
このコードでは、pandasライブラリを使ってCSVファイルをデータフレームという形式で読み込んでいます。
特定のデータを抽出する
読み込んだデータから特定の条件に合うデータだけを抽出する方法を見ていきましょう。たとえば、「年齢」が30歳以上の人だけを抽出する場合は以下のように書きます。
“`python
年齢が30歳以上のデータを抽出
filtered_data = df[df[‘年齢’] >= 30] # ‘年齢’はCSVファイル内のカラム名
“`
抽出したデータを保存する
最後に、抽出したデータを新しいCSVファイルとして保存します。以下のコードを追加してください。
“`python
抽出したデータを新しいCSVファイルに保存
filtered_data.to_csv(‘output_file.csv’, index=False) # ‘output_file.csv’は保存先のファイル名
“`
index=Falseを指定することで、行のインデックスを新しいファイルに含めないようにしています。
まとめ
この記事では、Pythonを使ってCSVファイルを読み込み、特定のデータを抽出し、新しいCSVファイルに保存する方法を解説しました。手順をまとめると以下の通りです。
pandasライブラリをインストールする- CSVファイルを読み込む
- 特定の条件に合うデータを抽出する
- 抽出したデータを新しいCSVファイルに保存する
これで、CSVファイルのデータを簡単に扱うことができるようになります。エラーに悩まされることも少なくなりますので、ぜひ試してみてください!


コメント