RSeleniumを使うために必要なファイルとインストール方法

R

RSeleniumを使うためには、Rのコード以外に、以下のアプリとファイルが必要です。

  • Chrome
  • java
  • selenium-server-standalone
  • Chrome用のWebDriver

この記事は、上記のアプリ、ファイルのインストール方法、ダウンロード方法をまとめたものです。

RSeleniumを使うために

本ブログの競馬データのスクレイピング記事の中で、RSeleniumを使ってスクレイピングを行っています。

Rで競馬データをスクレイピング :step2コード
指定した開催日に行われた競馬のrace_idをスクレイピングするためのコードです。

 

RSeleniumを動かすためには、Rのコード以外に、以下のアプリとファイルが必要です。

  • Chrome
  • java
  • selenium-server-standalone
  • Chrome用のWebDriver

インストール等の詳細は以下の通りです。

 

Chromeのインストール

このコードを実行するためには、Chromeが必要です。インストールされていない場合は、こちらからインストールしておいてください。

Google Chrome - Google の高速で安全なブラウザをダウンロード
新しい Google Chrome で毎日をもっと快適に。Google の最先端技術を搭載し、さらにシンプル、安全、高速になった Chrome をダウンロードしてご活用ください。

 

javaのインストール

このコードを実行するためには、javaが必要です。インストールされていない場合は、こちらからインストールしておいてください。

 

https://www.java.com/ja/

 

selenium-server-standaloneのダウンロード

このコードを実行するためには、selenium-sever-standalone-xxxxxx.jar(xxxxxはバージョン)がRの作業ディレクトリに保存されていることが必要です。

当ブログ記載のRのコードはselenium-server-standaloneを前提にしています。selenium-server-standaloneがあるのは、バージョン3.141.59までのようです(seleniumのバージョンは4.7以降まで進んでいますが)。

selenium-sever-standaloneのファイルはここからダウンロードできます。

Downloads
Selenium automates browsers. That's it!

ここの「Previous Releases」をクリックすると
Selenium 3.141.59
があり、これの「+」印をクリックすると
selenium-server-standalone-3.141.59.jar
がダウンロードできます。

新しいバージョンはseleniumについては、私の勉強不足でまだ使えない状況ですが、使えるようになり次第、ブログの方も更新していきたいと思います。

 

Chrome用のWebDriverのダウンロード

このコードを実行するためには、Chrome用のWebDriverがRの作業ディレクトリに保存されていることが必要です。インストールされていない場合は、こちらからChromeのバージョンにあったWebDriverをダウンロードしてください。

 

ChromeDriverのダウンロードはこちら

 

まとめ

上記4つのアプリ、ファイルをインストール、ダウンロードすれば、RSeleniumを使う準備は完了です。RからRSeleniumを使ってスクレイピングする例はこちらにあります(step2でRSeleniumを使っていますが、step2を実行するためには、step1の実行も必要です)。

Rで競馬データをスクレイピング :step1コード
netkeibaのサイトから競馬開催日をスクレイピングするためのコードです。
Rで競馬データをスクレイピング :step2コード
指定した開催日に行われた競馬のrace_idをスクレイピングするためのコードです。
Rで競馬データをスクレイピング :step3コード
race_idに対応したレース条件、レース結果、払い戻し情報をスクレイピングするためのコードです。