平成29年11月29日にデータ活用ライブラリ(Pandas)ハンズオンを開催しました。

このハンズオンでは、データを利活用する(データの読み込み、加工、分析)ときに便利なツールである「Pandas」について、機能や使い方を学びました。
「Pandas」とは、プログラミング言語Pythonにおいてデータ分析・解析を行うのに必要な機能を提供している非常に便利なライブラリです。

ハンズオンの内容

講師は、ITOCの専門研究員で主に機械学習分野を担当している木村研究員と高木研究員の二人が務めました。

木村研究員 高木研究員

カリキュラムは以下のとおりです。

データ活用についての説明
  ↓
環境構築、使用するデータのダウンロード
  ↓
Pandasについての講座と演習
 Jupyter Notebook上で、演習用に用意されたコードを実行します。
  ↓
2人1組のチームに分かれて、練習問題を解答
どのチームが早く正解にたどり着くのか競争しながら学習します。
  ↓
質疑応答

朝9時から夕方17時までの長い研修でしたが、参加者8名の方々は最後まで頑張って取り組んでいただきました。参加していただきました皆さん、丸一日お疲れさまでした。

 ハンズオンの様子 ハンズオンの様子 
 
ハンズオンの様子 

所感

サンプルコードを配布して、一緒に実行しながらその結果を見つつ学習を進めていきました。皆さん、サンプルコードの理解は順調に進みましたが、後半におこなった「自分でデータの加工の仕方を考えてそれをコードに落とし込んでいく」ところは苦労なさっている様子でした。

「どのようにデータを加工すべきか」「データのどの項目に着目すべきか」などについては、繰り返しさまざまなデータに触れて、考える訓練をしないと身につかないのかな、と思いながらハンズオンの様子をみていました。

どのようにデータを使えばどのような結果が得られるのか、つまり、なにを目的としてデータをどのように活用するのか、ということを考えられることは重要だと思いました。