KAKENデータベースに基づいて各大学の科研費採択件数などを分析する自分のワークフローをまとめておきます。
KAKENデータベースからのデータ取得
KAKENSearchAllInstitutes.ipynbを用いて、大学、採択年などを予め指定して検索し、KAKENデータベースから科研費採択データを取得します。
ダウンロードされたCSVファイル名の変更(大学名の付加)
KAKENデータベースからダウンロードフォルダに自動的にダウンロードされるCSVファイルはダウンロー日時がファイル名になっているため、わかりやすいように大学名をファイル名に付加します。採択件数がゼロだった場合にはダウンロードファイルが存在しないため、採択件数のカウントを保存したエクセルファイルを参考にして、カウントゼロの大学名を除外し、大学名とCSVファイルとの対応を付けます。
使うスクリプト名:KAKENDataFileRename.ipynb
CSVファイルをエクセルファイルに変換
CSVファイルを自分が作成したpythonスクリプトで読もうとしたときに、文字のエンコードの問題がなぜか解決できなかったので、一度エクセルに保存しなおします。
使うスクリプト名:CSVtoEXEL.ipynb
年次推移の分析
KAKENDataAnalysisYearlyChanges.ipynb