Pythonデータ加工 ~CSVファイルの読み込み、行列削除、保存~

データ加工

みなさんこんちには、やっちゃんです。

これからPythonでのデータ解析について勉強を始める方に向けて

Pythonでデータフレームの加工や集計スキルを順々に学べるように、紹介していきます。

CSVファイルを読みこみ、エクセルのような行列加工、

複数のファイルの読み込みと連結、作ったCSVファイルの保存など基礎的なスキルの習得を

目指していきましょう。

本日は以下の三点です。

スポンサーリンク

CSVファイルの読み込み(単一)

①pandasというデータを扱うための標準的なライブラリをインポート

②csvファイルをpd.read_csv()で読み込みます。

この際、読み込みたいcsvファイルとnotebook等のソースコードのファイルは同じディレクトリにしておきましょう。

今回はkaggleの「Dummy Marketing and Sales Data」の

学生のWebマーケティング勉強用に作られたとされるデータセットを用いています。

③最後はdfまたはdf.head()でcsvのファイル内容をしっかり確認。今回のCSVファイルが

4572 rows × 5 columnsのデータセットであることをdfで確認できますが、

df.head()にすると頭の指定行をだけを確認できます。

最初にdfで行列数を確認した後は、長ったらしいので、dfは消すか、df.head()で短く表示しておくのがいいです。

  
TVRadioSocial MediaInfluencerSales
016.06.5662312.907983Mega54.732757
113.09.2377652.409567Mega46.677897
241.015.8864462.913410Mega150.177829
383.030.0200286.922304Mega298.246340
415.08.4374081.405998Micro56.594181

列または行の削除

①df.drop([]),axis=1)で列の削除を行います

 Social MediaInfluencerSales
02.907983Mega54.732757
12.409567Mega46.677897
22.913410Mega150.177829
36.922304Mega298.246340
41.405998Micro56.594181

②df.drop([]),axis=0)で列の削除を行います。デモで1行目と4行目を削除します。

Pythonでは列、行ともに行列番号が自身が考えている数の‐1の値で表されています。ですので、自信が1行目を消したいと思うときは0、4行目を消したいときは3を指定します。

 Social MediaInfluencerSales
12.409567Mega46.677897
22.913410Mega150.177829
41.405998Micro56.594181
51.027163Mega105.889148
64.273602Micro198.679825

CSVファイルの保存

df.to_csv()で保存します。

保存できたでしょうか?最後は確認してみてくださいね。

本日は以上です。Pythonでデータ解析してみたいけど、そもそもデータフレームの加工の仕方がわからない!なんて人、ここからです。これから一緒に勉強していきましょう!

わからないこと、ほかにもご意見等あれば是非お待ちしております^^。

コメント

タイトルとURLをコピーしました