データマイニングハックス(仮)

東京都内のIT企業でデータ分析の仕事をしています。データマイニングを使って世界を良い方向へ変えていきたいです。起業準備中。各種オフ会なども積極的に参加したいと考えています。もし、よろしければお声掛けください。

データマイニングで地震の発生を予測できるか

 地震が続くと「最近、怖いね・・・」と誰もが思うと思います。

 では、果たして、直近の地震の頻度や大きさと将来発生する地震の大きさに相関はあるのでしょうか。

 もし、直近の地震の発生と将来の地震の発生の間に、相関が認められれば「最近、地震が増えているから気を付けよう」という対策に理にかなった行動だと言えるでしょう。

 逆に、直近の地震の頻度や地震の大きさと将来に発生する地震に何の相関もない場合、「最近、地震が増えているから」という対策には意味がなく、この場合は、別の予測に従うか、もしくは対策は直近の地震に関わらず常に備えておく必要があることになります。

 ExcelからIEを操作し、下記のサイトからデータを入手しました。

 使用データ: tenki.jpから取得した全データから、震源地が海外のモノを省いたデータ群。 URL:http://bousai.tenki.jp/bousai/earthquake/entries

 

注意点: 

データの精度に関しては、評価することができないので、下記に記述する内容は専門家から見たら、「まったく無駄な検証です」と引っ込まれる可能性も棄却できません。

 

 まず、取得したデータから地震の発生頻度と1日に観測された最大のマグニチュードをグラフにしてみました。

f:id:dmhacks:20120802192547j:plain

  3.11以降で地震の発生の仕方がガラリと変わってしまったのがわかります。

  次に前日に観測された最大のマグニチュードを横軸に、当日に観測された最大のマグニチュードを縦軸にとった散布図を見てみます。

f:id:dmhacks:20120802192554j:plain

  これだけ見ると、どうも当日に観測される最大のマグニチュードは、前日に観測された最大のマグニチュードと相関があるように見えます。

  「昨日は大きな地震があったから気をつけよう」というのは理に叶っている、と言えるのかもしれません。

  試しにに、3.11よりも前と以降をそれぞれ分けて散布図に描いてみました。

 

f:id:dmhacks:20120802192600j:plain

 どうやら3.11より前と以降では、前日に観測された地震が当日の地震に影響を与える度合いが異なるようです。