第18回データサイエンスすいすい会に登壇させて頂きました。
この記事ではスライドの内容を引用しつつ、初学者~中級者がデータ可視化の要点を掴む上での学習について紹介します。
(といいつつ自分も道半ばですが)
はじめに:そもそもデータ可視化とは
データ可視化は文字通り「データを人間が認知しやすい視覚的形式で表現すること」ですが、データ可視化は多くの要素で成り立つ分野だと思います。
有り体に言えばデータ可視化はプレゼン術でもありますし、データ分析手法でもありますし、データ探索するための方法でもあります。
このあたりの話を先に紹介します。
矢崎さんの「データ可視化」の指す、三種類の行為が詳しいです。
データ可視化と一口に言っても
探索としてのデータ可視化
分析としてのデータ可視化
表現、伝達としてのデータ可視化
の3つの領域が大きくあるように思います。
その3つの領域を分析プロセスに合わせたものが図の左側、各プロセスに関連する学習事項を並べたものが右側です。
(本当はSQLなど細々と含めたいものはありつつ…絞りました)
学習事項を眺めると面白いのは、分析プロセスの最初と最後、分析結果のインパクトを大きく決める部分が人文科学よりなことですね。
問いの立て方を失敗すると分析はコケますし、分析結果を適切に意思決定者や実務者に伝えられないと、どれだけ素晴らしい分析も実益に結び付けにくくなります。
一方でデータをどのように理解するか、分析をどのように実施するかは理系的技能が求められます。
統計学的教養は言うまでもなく、データをどのように処理するべきか(それは適切な分析方法・可視化手法の選択であったり、可視化ツールの使用法であったり)がそうですね。
つまりデータ可視化分野はいわゆる文系、理系のスキル両方を必要とするハイブリッド領域であり、この分野で本質的に上達するためには各学習領域のバランスが大事になると思います。
ということでデータ可視化を学習するときは
自分はデータ可視化3領域のどこを深めるべきか
関連学習領域のどこを深めるべきか
総合的な自分の可視化能力はバランスが取れているか
を意識していくと良いと思います。
どう学習するか
そして何をどう学習すると良いのかという話になるわけですが、学習材料については発表スライドや以下の2記事を参考にいただきつつ…
自分が学習で重視することは「実践」と「情報網」です。
データ可視化の体系的な知識を身に着けることは難しくありません。
書籍も簡潔にまとまっていることが多いです。勘どころを掴むことはそこまで難しくありません。
では掴んだ勘どころを自分の技能にするにはどうするか。磨くにはどうするか。
実践と知識のアップデートに答えがあります。
自分のスライドではMakeoverMondayとTwitterの活用をオススメしました。
また以下の記事も詳しいです。
Tableau自体の進化もさることながら、情報のアップデートが早い分野です。
効率的に知識を磨く体制を整えていきましょう。
最後に
改めて発表の機会をいただいたデータサイエンスすいすい会主催のGRI様、ありがとうございました。
登壇された岩橋さん、古幡さんの発表内容も素晴らしいものでしたので、ぜひご一読ください。
ご質問はTwitterかLinkedinでお願いします。それでは。