R

R:apply関数をdata.frameに使う場合の注意点

data.frameにapply()関数を適用する場合の注意点をまとめています。apply()関数の使い方をネットで調べても、data.frameに対する使用法はたくさん見つかりますが、注意点が全然出てきません。エラーに悩まされたり、間違った計算をしないように、押さえておくべきところをちゃんと押さえておきましょう。
R

スクレイピングに必要な最低限のHTML/CSSの知識

スクレイピングでデータを収集するためには、HTMLで書かれたWebページの文書構造を理解し、どこに目的のデータが記載されているかをコンピュータに教えてやる必要があります。このページではスクレイピングに最低限必要なHTML/CSSの知識をまとめています。
Web/ブログ

WordPressで数式を書くには

技術系の記事を書くならWordPressでも数式を使いたくなりますよね。MathJax-Latexというプラグインを使えばWordPressで数式が使えるようになります。設定方法と数式の書き方をまとめています。
統計

分母をnで割った分散の計算がイマイチな理由

母集団の分散を推定する場合、大抵の場合、分散の分母をn-1で計算した値(不偏分散)を使います。見方・言い方を変えると、母集団の分散を推定するのに分母をn-1ではなくnで計算するとイマイチなところがあるということです。どういう点がイマイチなのかを整理します。
Web/ブログ

アドセンス クリック単価が1円とか0円の原因ってこれじゃない?

世間では、アドセンスのクリック単価の平均は20円〜30円と言われるのに、1クリックで、1円なんてことも…。そしてついに0円…。さすがに0円はおかしいだろうと思い原因を調べました。同じような状況になっている方のモヤモヤもきっとスッキリするはず。
R

競馬予想 データを可視化 スピード指数を活用する

スピード指数を可視化して、出馬表をグラフィカルにするためのソースコードを公開します。データを可視化すれば、情報を適切に評価して、迷うことなく買い目を選択できるようになったり、競馬が上手な人にしかわからないことがわかるようになるなどの効果が得...
R

分散や標準偏差の分母はnかn-1か?シミュレーションを交えて説明

統計学を勉強していくと、テキストによって、標準偏差や分散の分母がnだったり、n-1だったりして混乱しますよね。結論を言うと目の前にある標本がどの程度ばらついているか表現したい場合はnで割る。標本から母集団の分散を「推定」する場合はn-1で割った方が推定精度が高い。ということです。このページでは、乱数を発生させて、実験して確認してみます。
R

競馬予想AI netkeibaのスクレイピングでオッズ、人気も取得

netkeibaをスクレイピング。でも、rvestパッケージではnetkeibaのオッズや人気は、スクレイピングできないんです。ここでは、RSeleniumパッケージを使ってオッズや人気をスクレイピングする方法を紹介しています。
R

競馬予想AIの作り方 無料ツールのみで作成する方法

競馬AIを作る方法について説明しています。競馬AIを作るために使える無料ツール「R」と「RStudio」、そして競馬AI作成の中核となる「データ収集」「AIモデルの作成」といった作業についても具体的に紹介しています。
R

競馬予想AIの作り方 〜 Rで出馬表をWebスクレイピング

前回の記事でせっかくスピード指数をスクレイピングしてデータベースを作ったのだから、次のレースの検討に活かしたい‼️そうすれば、きっと…(笑)。というわけで、今週末開催されるレースの出走テーブルをnetkeibaさんからスクレイピングさせてもらうことにしました。