データサイエンス

R

競馬 2024年1月20日、1月21日の「血統指数」「タイム指数」「1着予想確率」

競馬予想に大切な要素である血統(父馬、母父馬)、過去の走破タイムを数値で評価。数値化することでこれまで競馬が上手い人にしかわからなかったこともクッキリ。
データサイエンス

競馬スピード指数の作り方 〜 作成過程を公開(1)

競馬データの分析の目的は、競走馬の能力を適切に把握すること。そのための1つの方法として馬の能力の指数化、いわゆる、スピード指数化というものがあります。スピード指数の計算は距離、馬場等に対して、さまざまな補正がなされています。「さまざまな補正」に自分の考え方を盛り込みたい、という人はどうしても自分で指数を作る必要があります。その指数を作っていく過程をまとめています。
データサイエンス

競馬スピード指数 当たる?当たらない?精度を知ってうまく活用

競馬をやっている人なら一度は「スピード指数」という言葉を聞いたことがありますよね。「当たる」という人もいれば、「当たらない」という人も。おそらく日本でもっとも有名なスピード指数である「西田式スピード指数」について精度、誤差を評価してみました。精度、誤差を知って上手に活用しましょう。
R

競馬 単勝オッズと着順の統計。あなたが選んだ馬は何着になる?

「単勝オッズが〇〇倍だったら、1着になる確率は△△%」「単勝オッズが■■%を超えると1着になる確率よりも2着になる確率の方が高くなる」なんて情報知ってたら、もっと競馬を楽しめるようになるはず。単勝オッズと着順の関係を整理してみました。
R

今週のメインレース の「血統指数」「タイム指数」「1着予想確率」

競馬予想に大切な要素である血統(父馬、母父馬)、過去の走破タイムを数値で評価。数値化することでこれまで競馬が上手い人にしかわからなかったこともクッキリ。
R

スクレイピングに必要な最低限のHTML/CSSの知識

スクレイピングでデータを収集するためには、HTMLで書かれたWebページの文書構造を理解し、どこに目的のデータが記載されているかをコンピュータに教えてやる必要があります。このページではスクレイピングに最低限必要なHTML/CSSの知識をまとめています。
R

競馬予想 データを可視化 スピード指数を活用する

スピード指数を可視化して、出馬表をグラフィカルにするためのソースコードを公開します。データを可視化すれば、情報を適切に評価して、迷うことなく買い目を選択できるようになったり、競馬が上手な人にしかわからないことがわかるようになるなどの効果が得...
R

競馬予想AI netkeibaのスクレイピングでオッズ、人気も取得

netkeibaをスクレイピング。でも、rvestパッケージではnetkeibaのオッズや人気は、スクレイピングできないんです。ここでは、RSeleniumパッケージを使ってオッズや人気をスクレイピングする方法を紹介しています。
R

競馬予想AIの作り方 無料ツールのみで作成する方法

競馬AIを作る方法について説明しています。競馬AIを作るために使える無料ツール「R」と「RStudio」、そして競馬AI作成の中核となる「データ収集」「AIモデルの作成」といった作業についても具体的に紹介しています。
R

競馬予想AIの作り方 〜 Rで出馬表をWebスクレイピング

前回の記事でせっかくスピード指数をスクレイピングしてデータベースを作ったのだから、次のレースの検討に活かしたい‼️そうすれば、きっと…(笑)。というわけで、今週末開催されるレースの出走テーブルをnetkeibaさんからスクレイピングさせてもらうことにしました。