動作分析などの解析をやったりビックデータを扱ったりすることが多くなってくるとpythonのSciPyモジュールだけでは少し足りなくなってきてしまうことがあります。特に複雑な統計解析をする上でRを使わざる得ないケースもあり、私もその一人でした。
データの読み取りからデータセットの作成の超基本的なところから一から体系的に勉強するのはかなり大変と感じていたので、今回は目標を①因子分析を行う、②構造方程式モデリングを行う、この二つの処理が最低限出来るようにデータセットを作るところをChatGPTを駆使してやってみた過程を紹介していきます。
いわゆるコーディングをChatGPTに手伝ってもらうためのプロンプトのコツといった部分になるかなと思います(あくまで個人的な経験談です)
pythonで今までやっていた処理をRに変換するのに、コードを直接ぶち込んで変換してと言うのも一つの手だった。
今回のケースは最低限一つのプログラミング言語のデータ型を何かしらの形で記述できることが前提になります。また筆者はChatGPT-Plusには課金しているのでo1までは使えますが、今回のケースは4oに質問したというケースで書いています。
私の場合にはpythoだったので、pandasでcsvファイルを読み取って各データの定義や処理を書いています。
chatGPTへの指示としては「今張った部分のpythonコードをRの形式で変換して」、こんな感じで打っています。コピペしたpythonの処理はcsvデータの読み取り~変数定義の部分です。
結果としては全く問題なく遂行することができました。そのあとはpythonからR言語に変換してもらったコードベースで質問を続けます。
次いでに因子分析の質問もしてみた。回転方法も指示してヒートマップの視覚化も問題なく可能。
参考になるグラフの画像ファイルがあれば、その通りに図表を成形してくれる
ここからいらない部分の処理や追加で加えたい部分などを指示してやれば、狙ったグラフがとんでもない速さで作ることができます。特に今回のケースのようにpython→Rみたいな感じでのなじみのないプログラミング言語でのグラフ生成などはChatGPTを頼ったほうがよさそうです。