初心者の改良!? まだまだ道半ば。
前回の東京都コロナ感染者数の予測では5/30などの将来が予測できなかったため、
何とかしようと思いついたのが、予測の要素に人出をいれることです。
データ基はNHKの記事で
WEB特集 人出はどこで増えた? 最新データで見えた“緩み”とは | NHKニュース
こちらのグラフを基に目検討で数字を読み取って表を作ることにします。
作った表です↓
・
・
・
よくNewsでは今の行動が2週間後の感染者数減少に役立ちますという
フレーズを聞きます。
3月11日の73人の累計感染者数は14日前の2月26日の人出の影響をうけたという
仮説にします。
2月26日の人出が12000人が3月11日の73人の累計感染者数に影響しているという
ことです。
ところでこの3月11日の12000は渋谷センター街の人出です。
なので3月11日の12000を1として3月11日以降の人出を数値化してみます。
こちらです↓
・
・
・
一番右を『人出指数』として、
日付、人出指数、コロナ感染者数で並べたのがこちらです↓
・
・
・
これで予測したのがこちらです↓
赤の棒グラフが実績で、青の線が予測です。
ダメです。当たってる感じがしません。
3/11-4/22のTraining Setの中の精度は
累計でみると
なんですが、
グラフで切り出してみると、↓で当たってる感じがないです。
感染者数は増えていくのに、人出指数は減っていくという関係で
難しいのかもしれません。
初心者がNeural Networkで東京都コロナ感染者予測してみた、そして予測できず。
まず、東京都コロナ感染者数の累計グラフです↓
データは3/11-5/4までの54日間ありますが、
3/11-4/22の43日間について実績に沿った予測線を作ります↓
青の線が私の初心者なりのNeural Networkで予測した東京都コロナ感染者数です。
自分で独力で作った割にはまぁまぁ当たっているような線になりました(^^)
この青の線を予測条件を変えずに延伸します↓
そして、実績の赤線も延伸してどういう精度だったか見てみます↓
実績の赤線が予測の青線の上をいっています。
実数を見てみます↓
青の線が私の初心者なりのNeural Networkで予測した東京都コロナ感染者数で、
赤の線が東京都コロナ感染者数の累計です。
ようやくNeural Networkっぽく予測することができました!
それでは予測基データ/方法などなどの前提です。
データ基
データは前回と同じく東洋経済新報社のこちら↓のサイトです。
対象期間
3/11-5/3の54日間になります。
予測概要
予測目的 東京都感染者数
予測要素 神奈川と埼玉の感染者数
東京都感染者数を神奈川と埼玉の感染者数を予測するということです。
予測方法 Neural Network
構造は↓で行いました。
タイトルには予測と書いたんですが、
予測できないことに気づきました。
例えば5/30の予測ができるかといえばできなくて、それは予測基の神奈川と埼玉の5/30のコロナ感染者数が計算上
必要なんです泣
このへんをもっとうまく考えれるようにしたいです。
またやってみます!
ルーターを買いかえた方がいいかどうかに考える確認事項
時々家のWifiの接続が悪くなるので
10年前に買ったルーターが古すぎるせいかなと思って買い替えようと思いました。
このサイトに非常に助けてもらいました。
ソフトバンク光の通信速度が遅い?測定方法と速度改善方法について - わたしのネット
このサイトをみながら私が確認した事項を順に並べています。
確認①家の契約業者とプランと通信速度
まず、家の契約業者ですがSoftbank光です。
プランを調べると1Gppsは出ることになっていますが、
IPv6対応ではないことがわかりました。
IPv6の方が速度が上がるのでそちらに対応できるようにすることも手段の1つ
として頭に入れておきます。
確認②契約プラン並みの通信速度が出ているかどうか確認
今、ダウンロードの通信速度は1Gppsですが実際はどんなものかと思って
Speedtest Custom - Test your internet speeds
で調べてみました。
結果です↓
40Mbpsですか。。。1Gpps=1000Mbpsだから4%くらいのパフォーマンスですね泣
どれくらいの速度があれば十分なんだろうと思ったので調べたところ、
大体100MBpsあれば十分のようです。
A;PCのせいかどうか確認
これはPCで測定したWifiのパフォーマンスです。
恥ずかしながらPCも10年前に買ったものなのでPCのせいかもしれないと思い、
iphoneでも計測してみました。
結果は同様に40Mbpsでした。
PCのせいではなくWifiのスピードが40Mbpsと判断しました。
B-1;ルーターのせいかどうか確認-機器の規格をみてみる
Wifiの規格があるようで青丸あたりだと目標の100MBpsに届かないことが
わかりました。
ルーターに書いてないかどうかみたところ、規格は書いてなかったんですが、
機種名はかいてありました。
それでSpecを調べたところ
でした。
『n』に対応していれば600Mbpsまで対応できるはずなんですが。。。
(B-2);ルーターのせいかどうか確認-有線と比較
40MbpsはWifiでのパフォーマンスなので、
LANケーブルでPCとルーターをつないだ時のパフォーマンスも
念のため見ることにしました。
LANケーブルでは100MBpsのスピードがでるのであれば
違う要因を考えた方がいいと思いました。
ところがLANケーブルにも規格があることがわかりました。
我が家の契約プランは1GppsなのでCat5e/6/6aのどれかでないと判断できません。
手持ちの家のLANケーブルを見てみたところ、書いてなかったorz
ともあれ
ルーターとPCを優先で接続しました。
50Mbpsになりました。
同じルーターからですがWifiと有線LANで10Mbpsの差があります。
有線LANでもつないでも50MBpsで、ソフトバンク光の1000MBpsの5%で、
ターゲット100MBpsの半分なので新しくルーターを買うことにしました。
懸念事項 PCは古すぎないか?
ルーターを買う前に自分のPCのWifiの通信速度を調べてみました。
ルーターを増強してもPCのWifiがついてこなかったら、意味がないと思ったので。
自分のPCの無線規格は↓でした。
『n』だと600Mbpsまでは対応可能なはずです。
WifiだけでなくPCについてるLANの通信速度も調べてみました。
有線LANについては↓の記事がありました。
私のPCは実測50MBpsなのですが、1Gppsが出せる1000BASE-Tだといいなぁと
思って調べました。
https://support.pikara.jp/1g/win10.html
にLANポートの規格の調べ方が書いてありましたが
LANの名前をみて調べるというやり方でした。
LANの名前が見つからなかったので断念いたしました。
ルーターを買い替える
私がルーターのSpecで求めるものをまとめました。
■通信速度 ターゲット通信速度100MBとソフトバンク光1000MBの間くらい
また10年買い替えないと思うと多少過剰なくらいの通信速度にしようと
思いました。5Gは5.4GB=5400MBになるらしいですしByドコモ発表
■Wifi規格 『IEEE802.11n』と『IEEE802.11ac』に対応
他のサイトで見つけた表です。
家のPCは2.4GHzしか対応しないので『IEEE802.11ac』のみなど困りそうなのが
1つ目の理由です。2つ目の理由はどうも5GHzの人気が上昇中であることと
10年買い替えないと思うので多少過剰なスペックにしておこうと思いました。
■IPv6対応
現在の家の契約プランはIPv6に対応していないのですが、
人気が上昇中であることと同じく多少過剰なスペックにしておこうと思いました。
これらを満たしているものを買うことに決めました。
追加対策IPv6契約にする
もしルーターを買い替えても家のWifi環境に満足できないときは、
家の契約をIPv6にするしかないと思いました
これは青で囲った部分の機器を月額約500円でレンタルする必要があります。
それでは快適なWifi環境目指して頑張ります!
コロナでオンライン無料になったもの
自粛で家にいることが長くなったので、せっかくの時間を使って
無料で見れるものをリストアップしてみました!
オペラ
こんな機会でなければ見ないし無料にもならないものの筆頭(?)です。
日替わりでオペラがやっています。
メットオペラといえばNYにある世界で最もお金がある(?)オペラなので
セットが豪華です!
オーケストラ
高尚ということで敬遠されがちなオーケストラですが、ただなら見たい!笑
ベルリンフィルの過去の演奏が無料公開されています!
ミュージカル
youtubeの『show must go on』チャネルで毎週金曜に1日か2日だけ
ミュージカルが公開されています。
先週4/17はオペラ座の怪人でした!
今週4/24はLove Never Dieという知らないミュージカルです。
知らないからこそ、そしてタダだからこそ見てみたいなぁと思っています!
ライブ
嵐、ミスチル、B'z、浜崎あゆみ、TRFなどのLIVE映像が
youtubeで続々公開されています!
ライブには1回も行ったことなかったので見てるだけで楽しいです!
コーセラ機械学習で学んだ線形回帰でコロナ感染者数を予測してみる(4/18時点)※4/24UPDATE有
私は文系事務職のアラフォーですが、コーセラの機械学習のオンライン講座を
3か月でできるとガイドされているものを倍の6か月かかって修了しました。
せっかく学んだので、コロナ感染者数の予測をしたらどうなるかを
やってみたかったのでトライします。
今回は学んだ手法を試すだけなので、精度/結果は求めないことにします。
そもそも初心者の私の予測がそれっぽくなるわけないですし笑
前提
予測するのは東京都の感染者数にします。
データ元は東洋経済新報社のこちら↓のサイトです。
対象期間は3月18日から4月18日にします。
技術が拙いので省略する要素がこちらです。
①緊急事態宣言などで特殊な変数は入れない。
4/7の緊急事態宣言の前と後では、あるいは都知事の自粛要請の前と後では
傾向が違うはずですが技術が拙いので考えないことにします。
予測方法は線形回帰(Linear Regression)で行います。
コーセラ機械学習では手持ちのすべてのDataで予測するのではなく、
手持ちのDataを予測用と検証用に分けて予測用Dataでできた予測を
検証用Dataで精度を確認するように、と教えられました。
どういうことかというと、↓のグラフは縦軸に感染者数、
横軸に3月18日から4月18日を横軸にとって
3月18日をDay1、3月19日Day2・・・としています。
プログラミングを使うとこの赤点すべてを通る予測線を作成できますが、
『当たりすぎ』ていてもDay40や50でも当たるとは言えないので
そのリスクを減らすために妥当性を手持ちのDataで
行っておきなさいということでした。
ということで、
3月18日-4月8日(約20日)をTraining Setとして
4月9日-4月18日(約10日)をTest Setとしてシュミレーションしてみたいと思います。
直線予測
まずは直線の予測です。
3月18日-4月8日(約20日)をTraining Setで一番当たっている良い直線は↓になります。
ではこれを4月9日-4月18日(約10日)の期間に延長してみます↓
赤点が予測線が大きく上回って推移しています。
見た目にも当たったとは言い難い予測線です。
コーセラではこれはTraining setを当てすぎに行っているから、
Test setが当たらない状態ということでした。
あまり当たってるように見えませんが直線ではこれがBESTということになります。
曲線予測
まず、3月18日-4月8日(約20日)の期間です。
Training Setで一番当たっている曲線は↓になります。
さっきの直線より当たっているように見えます!
ではこれを4月9日-4月18日(約10日)の期間に延長してみます↓
おっ、さっきより見た目がいいです!
この予測の決定的な欠陥は予測用のDataが4月8日までなことだと思います。
というのは4月7日は非常事態宣言が出たので、
4月8日の前と後では傾向が変わるべきだと思いますので、
それが考慮されていないのが予測としては欠陥かなと思います。
一方で非常事態宣言が出なかったら、どうだったかという目線では
見れるかもしれませんが、その場合は予測線は4月8日以降の赤点の
上に行くべきだと思いますので、ビミョーな思いです。
5月6日までまったら、データを
①3月18日-4月7日、②4月8日-22日、③4月23日-5月6日
①②をTraining Setで③をTest Setで検証してみたいと思いました。
とにかく、学んだことをここまでグラフで見えるように表現できて楽しかったです。
また日にちがたったらUPDATEしてみたいと思います。
<4/26更新分>
**************************************************************************
曲線予測で予測線を変えず4/24までの実績をUPDATEしました。
予測自体が不正確だと思っていますが、
自粛を頑張っている身としては非常事態宣言で青の予測線になるところが
赤点ですんでいると思いたいです。