Translate

【Excel卒業】卒論を楽にするためにpythonをつかってみよう。自動化やきれいなグラフ描画に有利【python】

 こんにちは甘味です。
大学も後期になってくると、大学三年生はゼミ活動が始まり、大学4年生は本格的に卒論に取り組むことになりますね。

特に理系の大学生さんだと、計測機器でデータを計測し、その生データを用いて自分の卒論で得たいデータを算出することになると思います。

計測したデータを処理する方法として最も一般的な方法としては、Excelを使うのが一般的だと思うのですが、Excelによる計算の場合には、大きな時系列データを扱う場合には処理が重かったりと大変なケースが出てきます。

さらに、扱う生データや被験者の数が多くなればなるほど、マニュアルで計算するのには限界があります。

そういった大学の卒論やゼミ活動でのデータ処理の面倒な計算処理を解決する方法としては、Excelを用いないで、プログラミング言語を用いるといった点が挙げられます。

プログラミング言語にはいろいろなものがあって、どのプログラミング言語を使用していいのかわからないことが多いですが、個人的にはmatlabという言語かpythonを使うのが習得難易度の観点からいってもおすすめです。

今回は、卒論とか大学のゼミ活動をより効率的に行うためにプログラミング言語をどのように使っていくかについて紹介させていただきます。これについては自分の経験側に則っているので、あくまでの個人の感想として捉えてもらえると助かります。


Excelでいちいち計算するのは面倒



大学の卒論やゼミ活動でデータをとった際に、データを解析したり計算したりする際には、Excelを使うのが一般的かもしれません。

単一のデータファイルをマニュアルで処理するのであれば、Excelで行うのでは問題ないのですが、たいていの大学のゼミ活動や卒論の場合には、単一の計測だけで終わることはまずありません。たいていの場合、同じ条件で複数回、複数人の計測をするのが一般的です。

それを何度もマニュアルでExcelで処理するのは、時間がかかるし、なによりマニュアルでやるとヒューマンエラーのミスが混在してしまいます。

そのため、こういったデータを扱うのであれば、Excelではなく、プログラミング言語を使って処理するのがおすすめです。

習得難易度的にはpython、MATLAB。コスパ的には圧倒的にpython

ではどういったプログラミング言語を使ったらよいのかといった点が気になると思います。プログラミング言語と聞くと真っ先にはC言語とかJavaとかといったものが浮かぶと思います。これらの言語は計算処理が速いという大きな利点があるのですが、習得難易度がやや高いという点から、気軽に始められるかというと少々難しいという点があります。

個人的に圧倒的におすすめなのが、pythonというプログラミング言語かMATLABというプログラミング言語です。

後者の言語はデータ解析のアカデミックな領域ではかなりメジャーな言語なのですが、有料のプログラミング言語であるという点がネックであります。一応学生版があり、学生時代は比較安い価格で利用することができるのですが、将来的に社会人としてその言語を使うかというとなかなか非現実的だといえます。

一方で前者のpythonは無料である点や拡張性が高い点、環境構築が簡単で気軽に始めることができるという点からこれからプログラミングを始めるという人にとっては非常に敷居が低いのではないかと考えます。

事実私が学生自体最初はExcelでやっていたのですが、大学の卒論や普段のゼミ活動でのデータ計測のデータ量が多くなってくると、処理が追い付かなくなってきたのですが、pythonでの計算処理に変えた所、作業効率が圧倒的に向上して、かなり楽になりました。

pythonを始めるならAnaconda一択

pythonを始めるのには、一体どういったことをしたらよいのだろうかという点が気になると思います。

個人的には、Anacondaというものをインストールするのが圧倒的に楽です(私もこれで環境構築しています)。

プログラミング言語で難しい点としては、プログラミング言語を動かすための環境構築があるのですが、pythonの場合にはAnacondaを使えば、一発で環境構築までできるのです。それどころか、プログラミング言語を実際に書いて編集するための便利なエディタもあらかじめ入っているので最高です。

Anacondaは下記のサイトでダウンロードすることができます。基本的には自分のパソコンのOSのバージョンに合わせてインストールするだけで大丈夫でしょう。

Anaconda のインストールが完了したらその中に入っているSpyderというソフトウェアを開いてみましょう。こちらが実際にpythonのコードを書くためのエディタになっています。

環境構築したけど何からはじめたらいいかわかんない場合。とりあえずcsvデータの処理から始めてみてはどうでしょう。

実際にpyhonコードを書く環境が整ったとして、ここから何をしたらよいのかというので躓く人が多くいると思います。

pythonの教本を読んでコードを写経しても今の自分のやりたい処理とリンクしていないとかがあってモチベーションが上がらない、わけがわからないといったことがあると思います(私もそうでした)。

私もいろいろ経験してわかったこととしては、やはり自分の持っている生データを実際に読み込んで、トライアンドエラーを繰り返しながら手を動かすのが上達への道になると思います。

個人的におすすめなのは、まずは自分の持っているcsvファイルをpythonのスクリプトで読み込んで、実際に計算処理を加えるといったのが良いでしょう。
こちらの記事では、大学の卒論で非常に役立つループ回路についても記載しているので、卒論執筆の際には、一読してもらえるとすぐに使えるようになると思います。卒論の時短に大きく貢献できると思います。

pythonはグラフ描画がきれい。matplotlibを使いこなそう

大学の卒論発表やゼミの進捗発表ではデータの可視化が必要不可欠になります。当然Excelでデータを解析してグラフを作ってもよいのですが、Excelでグラフを作った場合には、細かいフォーマットをいじるときや、グラフの透過度や線のスタイル、プロットや凡例の追加などが面倒臭いことが多いです。

pythonの場合には、グラフ描画用のパッケージとしてmatplotlibというのが容易されており、非常にきれいなグラフを描くことができます。これを駆使することで他の卒論発表と一線を画した発表をすることができるようになるでしょう。しかもpythonでグラフ描画をすれば卒論で必要になる、相関係数とか回帰式とかも併せて描画することができるので、手間がかからなくなります。

こちらのブログでも、大学の卒論でよく使うと考えられる、折れ線グラフ、棒グラフ、散布図の描画方法に加えて、回帰式や相関係数の算出や描画についてもまとめているので、合わせて見てくれると理解が深まると思います。


pythonを駆使して卒論を楽に

これらのpythonの技術を使えば、大学の卒論の解析は非常に楽になります。卒論が一番大学生活でも大変なので、ここさえ楽になれば、その間の就活でも楽になりますし、卒論を終えて卒業した後でも役に立つことは間違いありません。

ぜひとも、大学の卒論やゼミ活動をきっかけにプログラミング言語に触れてみてはいかがでしょうか?