暇人日記II

Courseraの課題で学習できたことの応用を書いていきます!

2020-08-01から1ヶ月間の記事一覧

初心者コンテストに挑戦 振り返り

精度が95%以上出なかった。 Neural Networkの場合 すでに過学習か? 今後の課題 Logistic Regressionの場合 精度が95%以上出せなかったことが全て それでは振り返ってみたいと思います。 まず合格点は86点でしたが、57点が最高点でした。 提出した値がど…

初心者コンテストに挑戦⑦Neural Networkでやってみる

年齢を10代、20代、30代として計算してみました。 精度は93-4%です。 年齢を10代、20代とせずに19,25,28などでやっていた予測と 同条件で比較します。 そんなに変わりません。 年齢をカテゴライズしてもあまり予測精度には差が出ないことがわかりました。 …

初心者コンテストに挑戦⑥Neural Networkでやってみる

Predictionを計算する式が間違えていました。 修正してλとMaxIterを色々なパターンを試しました↓ 5000のSampleで実験しました。 λ MAXIter 精度 J 10 10 0.9334 2.6894 1 10 0.9252 2.6044 0.1 10 0.9252 3.0549 0.01 10 0.9322 2.4036 0.001 10 0.9252 3.07…

初心者コンテストに挑戦⑤Neural Networkでやってみる

前回とは方法を変えてNeural Networkでやってみたいと思います。 階層はこのようにしてみました↓ λ=1、MaxIter=250で行ったところ、計算負荷が大きいのか 3時間たっても計算が終了しません。。。。 計算負荷をさげるためにHidden Layerを25から10に変えま…

初心者コンテストに挑戦④Cross Validationする

前回はTraining Set 27100に対して精度92%の最適θをTest setにあてはめて 提出したところ、85点が合格のところ56点でした。 理由は2つ考えられると思います。 ①27100のTraining Set全部に対してだったのでoverfitのかもしれません。 ②もしくは精度92%が低…

初心者コンテストに挑戦③ Octaveで計算

前回、予測の基データをOctaveに読み込ませるところまでやりました。 なので今回はその基データで予測を行ってみたいと思います。 予測方法はCourseraのMachine Learning講座のWeek3と同じ方法を踏襲しました↓ これで最適θが出るので、そうしたら予測して精…

初心者コンテストに挑戦② 前処理 欠損値の確認と文字を数字へ振り替え

前回の続きです。 ①trainデータをJupyterで読みこんで欠損値がないかどうか確認します。 describe関数で基礎統計量を確認しました↓ データの型を確認したいと思います。 欠損値の数を確認できる関数 ②数で表現できないデータを数字に振り替えてみたいと思い…

初心者コンテストに挑戦①

SignateさんのBeginnerコンテストに挑戦してみます↓ 私はPythonはUdemyさんのコースだけの勉強であまりわかっていないので、 CourseraのOctaveで解くことになります。 目的は定期預金キャンペーンに入ったか否かなのでlogistic Regressionの問題です。 要素1…