R 分散や標準偏差の分母はnかn-1か?シミュレーションを交えて説明 統計学を勉強していくと、テキストによって、標準偏差や分散の分母がnだったり、n-1だったりして混乱しますよね。結論を言うと目の前にある標本がどの程度ばらついているか表現したい場合はnで割る。標本から母集団の分散を「推定」する場合はn-1で割った方が推定精度が高い。ということです。このページでは、乱数を発生させて、実験して確認してみます。 2022.03.27 R統計
R 競馬予想AI netkeibaのスクレイピングでオッズ、人気も取得 netkeibaをスクレイピング。でも、rvestパッケージではnetkeibaのオッズや人気は、スクレイピングできないんです。ここでは、RSeleniumパッケージを使ってオッズや人気をスクレイピングする方法を紹介しています。 2022.03.26 Rデータサイエンス
R 競馬予想AIの作り方 無料ツールのみで作成する方法 競馬AIを作る方法について説明しています。競馬AIを作るために使える無料ツール「R」と「RStudio」、そして競馬AI作成の中核となる「データ収集」「AIモデルの作成」といった作業についても具体的に紹介しています。 2022.03.20 Rデータサイエンス
R 競馬予想AIの作り方 〜 Rで出馬表をWebスクレイピング 前回の記事でせっかくスピード指数をスクレイピングしてデータベースを作ったのだから、次のレースの検討に活かしたい‼️そうすれば、きっと…(笑)。というわけで、今週末開催されるレースの出走テーブルをnetkeibaさんからスクレイピングさせてもらうことにしました。 2022.03.19 Rデータサイエンス
R R: matrixとdata.frameでlapplyの挙動が違って混乱?スッキリ解決 lapply()関数って、matrix型に適用した場合とdata.frame型に適用した場合で、関数の挙動がちょっと違ってみえたりして、混乱しがち。matrix型、data.frame型に対するlapply()関数の挙動をスッキリ整理します。 2022.03.16 R
R RによるExcelファイル(csv, xlsx)の読み込み方法 せっかくRを使えるようになっても、解析したいデータがExcelファイル…。データを解析するには、まず、解析データをExcelファイルからRに読み込む必要があります。ここでは、大きく3つの方法を紹介します。 2022.03.12 R
R RとKeras(TensorFlow)でディープラーニング Keras/TensorFlowを使えばRでもディープラーニングを行うことができます。しかも、とても簡単に。Keras/TensorFlowのインストールから、簡単な例題までを、はじめてディープラーニングにトライする方に向けてまとめています。 2022.03.10 Rデータサイエンス
R R : ggplot2の軸ラベルってどうやって変更するの?3つの方法を紹介 Excelのグラフなら軸ラベルを変えたければ、ラベル部分をダブルクリックすることで簡単に修正できるのに、ggplot2で描いた場合のラベルって、どうやって修正するの?そんなあなたに、3つの方法を紹介します。 2022.03.07 R
R R言語とは?Rでできること。現役Rユーザーが語る。 R言語は、データ分析、統計解析に特化した言語であるとよく言われます。しかし「データ分析」「統計解析」しかできないと考えてしまっては損をしています。C/C++のような汎用のプログラミング言語同様の制御構造を備えていますし、CRANで公開されているパッケージを利用すれば、はるかに簡単に望みの機能を実装することができる言語です。 2022.03.02 R
R R : stringrで文字列を検索、置換 Rで文字列操作を行う場合、baseRでもstringrでもどちらでも行える内容はほぼ同じです。このページでは、stringrに対応するbaseRの文字列操作関数を示しつつ、stringrの使い方をまとめています。 2022.02.23 R