【読書×プログラミング】『Pythonによる自動化仕事術』を試す【Pandas】

読書×プログラミングの2日目。

現在は『あなたの仕事が一瞬で片付くPythonによる自動化仕事術』という本を利用しながらPythonの勉強をしています(Python利用は初めて)。現在、自分がエンジニア+エンジニアとは関係ない副業をしているので、その副業の業務を自動化できないかなというのが勉強のスタートです。

Pandasを試す

本の進行に従い本日は「Pandas」というライブラリを試す。Pandasというライブラリを使用すると、csvデータの分析・編集が楽に行えるらしい。

いきなりつまづく

本の中でいきなりデータ読み込み用コードが出てきたのだけど、これは前回使っていたjupyter labで書いていけば良いのだろうか、と戸惑った。少し調べてみるとjupyter labは、対話型実行環境で普通にグラフ表示などもブラウザ内で行うことができるよう。ここに書いていって問題なさそうだ。本だけだとちょっとわかりづらい。

data.csvを表示させる

ここも本だけだとわかりにくかったのだけど、以下の手順でOK

練習用データの data.csv政府統計の総合窓口から取ってくる(もしかしたら、Youtube内で言及しているかも)

data_csv_path = './data.csv' でdata.csvまでのpathを変数に入れる。今回は同階層に置いておいた。

read.csv でcsv読み出し、変数に入れる。

変数を書き込むとデータを表示できる

f:id:osushi_engineer:20220404203253p:plain

data.csvを表示させるまでの4行
表示メソッド

表示メソッドは色々あるらしい。head(),tail(),sample()など

一番重要そうなのは、統計表示describe()なので、それだけ書いておく。これをみると最大人口が1350万だとか全国平均が210万人だとかがわかったりする。

 

df_population_data.describe().round(0)

f:id:osushi_engineer:20220404205159p:plain

というわけで、本日はPandasによる表示まで。