R Rで文字列を扱う人には必須!正規表現を使えるようになろう! Rの文字列操作関数には、正規表現を使って文字列のマッチングを行うものがあります。この関数を使いこなせれば、データ分析の前処理がかなり楽になるはず。ここに載せている正規表現のパターンだけでも、かなり多くの文字列操作ができるはずです。 2022.02.20 R
R Rで競馬スピード指数をスクレイピング:ソースコード このページは以下の記事に対応するRのソースコードを記載しています。データサイエンスで競馬に挑戦!Rでスピード指数をスクレイピング 2022.02.09 Rデータサイエンス
R 競馬予想AIの作り方 〜 Rでスピード指数をスクレイピング スピード指数データは「無料」「スピード指数」で検索して、トップに出てくる下記のサイトからを入手させていただくことにしました。競馬新聞&スピード指数(無料) 2022.02.09 Rデータサイエンス
R 競馬 過去データcsvをnetkeibaから無料で入手する方法 JRA-VANを無料で使えるのはお試し期間のみ。競馬のデータ分析を継続して行うには、どうしても過去の競馬レース結果データを自前で収集する必要があります。netkeibaからのスクレイピング方法やデータをcsv 形式で保存する方法について記述しています。 2022.01.15 Rデータサイエンス
R R : if文の使い方。間違えやすいポイントに注意 Rにも、他のプログラミング言語と同様、条件判定の制御文があります。ただ、Rのif文は、挙動を正しく理解していないと誤った計算をしてしまう場合があります。if文の使い方と間違えやすいポイントについて整理しています。 2021.06.13 R
R k近傍法(k-Nearest Neighbor algorithm, k-NN法) 機械学習アルゴリズムの中で最も単純なものの一つで、分類を目的に使用されるk近傍法についてまとめています。 2021.05.21 Rデータサイエンス
R R : matrixとdata.frameの違い matrixもdata.frameも行、列に数字を並べたもののようですが、ここを曖昧にしてしまうと計算ミスを招きかねない。わかっている人には至極当たり前のことかと思いますが、この記事を読んで僕と同じようにつまずく人が少しでも減ってくれれば幸いです。 2021.05.18 R