ロジカルデータ分析の秘訣1:使うデータの範囲は、その背景と共に考える
金属製品製造産業が他の産業と比べてどのようなポジションにあるのか。この全体像は、「地場産業とは何か」をデータで見る中で、チームメンバーも一部把握できていた。そこから先は対象を金属製品製造産業に絞り、他産業との比較をより具体的にRESASを用いて行った。
例えばRESASで見られる主要指標の一つに「労働生産性」がある。これは従業員一人当たりが創出する付加価値額(≒利益)を示す。RESASでは、地域や産業を絞り、過去30年分の時系列データを表示することができる。
ここで気を付けなくてはいけないのは、全てをシステム任せにしないことだ。表示された結果は全て本当にそのまま自分が必要としているものなのだろうか。
例えば、「今の目的に対してどの期間のデータを見るべきか」はチームで決めなくてはならない重要事項だ。ところが、多くの場合、便利なツールが自動で結果を表示すると、思考停止したままそれをそのまま使い、結論を出してしまいがちだ。
チーム内で、過去30年の間に産業データに大きな影響を与えるイベントを考えてもらった結果、「2008年のリーマンショック」と「2006年の市町村合併」が挙がった。前者は産業全体のパフォーマンスに例外的な結果をもたらし、後者はデータの前提や定義自体を大きく揺るがすイベントに間違いない。つまり、それ以前のデータは情報として現在の姿との時間的距離が大きいだけでなく、データを読み取る前提条件が異なるリスクが潜んでいる。
この点については、諸々の議論の結果、今回の検討には合併後、直近10年のデータにフォーカスして進めることで合意ができた。