統計 分母をnで割った分散の計算がイマイチな理由 母集団の分散を推定する場合、大抵の場合、分散の分母をn-1で計算した値(不偏分散)を使います。見方・言い方を変えると、母集団の分散を推定するのに分母をn-1ではなくnで計算するとイマイチなところがあるということです。どういう点がイマイチなのかを整理します。 2022.04.09 統計
Web/ブログ アドセンス クリック単価が1円とか0円の原因ってこれじゃない? 世間では、アドセンスのクリック単価の平均は20円〜30円と言われるのに、1クリックで、1円なんてことも…。そしてついに0円…。さすがに0円はおかしいだろうと思い原因を調べました。同じような状況になっている方のモヤモヤもきっとスッキリするはず。 2022.04.09 Web/ブログ
R 競馬予想 データを可視化 スピード指数を活用する スピード指数を可視化して、出馬表をグラフィカルにするためのソースコードを公開します。データを可視化すれば、情報を適切に評価して、迷うことなく買い目を選択できるようになったり、競馬が上手な人にしかわからないことがわかるようになるなどの効果が得... 2022.03.31 Rデータサイエンス
R 分散や標準偏差の分母はnかn-1か?シミュレーションを交えて説明 統計学を勉強していくと、テキストによって、標準偏差や分散の分母がnだったり、n-1だったりして混乱しますよね。結論を言うと 目の前にある標本がどの程度ばらついているか表現したい場合はnで割る。標本から母集団の分散を「推定」する場合はn-1で割った方が推定精度が高い。 ということです。このページでは、乱数を発生させて、実験して確認してみます。 2022.03.27 R統計
R 競馬予想AI netkeibaのスクレイピングでオッズ、人気も取得 netkeibaをスクレイピング。でも、rvestパッケージではnetkeibaのオッズや人気は、スクレイピングできないんです。ここでは、RSeleniumパッケージを使ってオッズや人気をスクレイピングする方法を紹介しています。 2022.03.26 Rデータサイエンス
R 競馬予想AIの作り方 無料ツールのみで作成する方法 競馬AIを作る方法について説明しています。競馬AIを作るために使える無料ツール「R」と「RStudio」、そして競馬AI作成の中核となる「データ収集」「AIモデルの作成」といった作業についても具体的に紹介しています。 2022.03.20 Rデータサイエンス
R 競馬予想AIの作り方 〜 Rで出馬表をWebスクレイピング 前回の記事でせっかくスピード指数をスクレイピングしてデータベースを作ったのだから、次のレースの検討に活かしたい‼️そうすれば、きっと…(笑)。というわけで、今週末開催されるレースの出走テーブルをnetkeibaさんからスクレイピングさせてもらうことにしました。 2022.03.19 Rデータサイエンス
R R: matrixとdata.frameでlapplyの挙動が違って混乱?スッキリ解決 lapply()関数って、matrix型に適用した場合とdata.frame型に適用した場合で、関数の挙動がちょっと違ってみえたりして、混乱しがち。matrix型、data.frame型に対するlapply()関数の挙動をスッキリ整理します。 2022.03.16 R
R RによるExcelファイル(csv, xlsx)の読み込み方法 せっかくRを使えるようになっても、解析したいデータがExcelファイル…。データを解析するには、まず、解析データをExcelファイルからRに読み込む必要があります。ここでは、大きく3つの方法を紹介します。 2022.03.12 R
R RとKeras(TensorFlow)でディープラーニング Keras/TensorFlowを使えばRでもディープラーニングを行うことができます。しかも、とても簡単に。Keras/TensorFlowのインストールから、簡単な例題までを、はじめてディープラーニングにトライする方に向けてまとめています。 2022.03.10 Rデータサイエンス