暇人日記II

Courseraの課題で学習できたことの応用を書いていきます!

東京都コロナ感染者数の予測線がFitしないのはアルゴリズムのせいか要素のせいか

前回の日記までコーセラで学んだNeural Networkで予測を行ったところ、

イマイチということが続いていました。

 

今回はNeural Networkというアルゴリズムが悪いのか、

それとも人出指数の要素が悪いのか、を検証してみたいと思います。

 

検証の方法はいたって簡単です。

Neural Networkを使いながら要素を変更します。

 

人出指数は↓のようなもので、

f:id:omoshiroamericanews:20200527220016p:plain

精度が↓でした。

f:id:omoshiroamericanews:20200527225624p:plain

Training Setの期間のFitがイマイチなんで、要素を変更して同期間でみてみたいと思います。

 

要素は人出指数ではなく神奈川と埼玉の感染者数を使います。

 

前回の日記で使ったのですが中々のフィット感でした。

このときの精度はなかなかに見えます↓

 

f:id:omoshiroamericanews:20200527215848p:plain

 

神奈川と埼玉の感染者数を要素とするのは将来のコロナ感染者数を

予測するには使えません。

例えば1か月後の6/30の神奈川と埼玉の感染者数は分からないので、

予測としては使えないと思います、

 

しかし今回はNeural Networkのフィット感が悪い理由を要素なのかどうか知りたいので

やってみます。

神奈川県埼玉県の要素でフィット感が良くなれば、Neural Network は悪くなく人手指数が不十分ということになると思います。

 

神奈川県と埼玉県の感染者数を基に東京都の感染者数を予測したのが

こちらです↓

※数字は7日間平均です。

f:id:omoshiroamericanews:20200527230812p:plain

 

かなりTraining Set期間のFit感がいい感じです。

f:id:omoshiroamericanews:20200527230952p:plain




ここまでフィット感があれば人出指数が不十分という風に思いました!