「時系列」を操り特徴つかむ 

  • このエントリーをはてなブックマークに追加
  • このエントリーをはてなブックマークに追加

前回は多くのデータを1つの数字に集約し、全体像を浮き彫りにするという考え方の代表として「単純平均」「加重平均」「年間平均成長率」について議論した。今回は様々な角度からデータを切り取り、特徴をつかんでいく方法をみていく。

この方法は大きく3つに分けることができる。1つ目は「並べてみる」。2つ目は「ばらつきをみる」。3つ目は「構成比をみる」だ。並べてみることの代表例である時系列データについて考えてみよう。

2つのグラフをみてほしい。同じデータをもとに作られたものだとは思わない人が多いのではないだろうか。実はこれらのグラフは横軸の取り方を変えただけなのだ。

Image5

Aは1980年から2011年まで、Bは07年から11年までの数字をグラフにしている。縦軸は国内で生産された普通乗用車の数だ。ここにデータをみる、分析する際の怖さがある。横軸の取り方次第で、全く別の景色がみえてきてしまうのだ。

時系列のデータを分析する際には次の3つに留意したい。

1つ目は分析対象のデータは本当に連続しているのかということである。特に長期にわたるデータの場合、「面接調査から紙面でのアンケートへ」など途中でデータの取得方法が変わっていたり、「20歳以上から18歳以上へ」といった具合にデータ取得対象が変わっていたりすることは少なくない。

当初は変更がしっかり注意書きされていても、時間がたつにつれ曖昧になることもある。自治体データなどは平成の大合併の時期をまたいでみる場合に留意が必要だ。

実際、私は以前、中国の石炭産出量のデータを集めていたときに、調査対象の炭田が途中で変化していることに気がつかず、あやうく間違ったデータを信じ込みそうになった経験がある。

2つ目は、グラフの縦軸、横軸のスケールが、自分がみたい事象にあっているかをチェックすることである。

「最近5年」の動向をみようとしてグラフBを作成しても、この5年間がリーマン・ショック以降のように特殊な状況にある場合、意味ある考察をするのは難しいかもしれない。

最近5年の状況をみるのであれば、データを1ヶ月ごとにプロットし、より詳細に見るべきだろう。何のための分析かを明確にしつつ、軸のスケールなどを決める、あるいは複数のグラフを作り眺めてみることが重要である。

グラフのプロット幅を決めるというのは、既に分析をしている人間の意図がそこに大きく反映されていることを意識しなければならない。

3つ目は数字を並べてみえてきたことと、入手している定性的な情報や現場で感じている相場観が整合しているかということを、必ず確認しながら分析を進めるということである。これは、数字に惑わされないという意味からもとても大切だ。

パソコンを使えば半ば自動的にきれいなグラフなどができてしまうために、数字やグラフだけが一人歩きを始め、後になって冷静にそのグラフなどに向き合ってみるとうまく説明できない、意味が分からない、といったことは社内のいたるところで発生しているのではないだろうか。

ぜひ、以上3つのポイントを意識しながら、最も基本的な分析である「時系列データ」を操ってみてほしい。
※この記事は日本経済新聞2013年9月11日に掲載されたものです。
(Cover photo: shutterstock / Ismagilov)

名言

PAGE
TOP