強化学習/MacでOpenAI Gymを使う のバックアップ差分(No.1)


  • 追加された行はこの色です。
  • 削除された行はこの色です。
*はじめに [#lca308b4]

[[OpenAI Gym:http://gym.openai.com]] は、安全な人工汎用知能 (AGI) の研究を支援している非営利団体 [[OpenAI:https://openai.com]] が提供している強化学習ツールキットです。

OpenAI Gymのページには、Pythonの標準パッケージ管理ツールであるpipを用いてインストールする方法が載っています。
しかし、機械学習用の環境であるAnacondaはとても便利なので、ここでは、Anacondaを使ってMac上にOpenAI Gymをインストールする方法を説明します。

AnacondaのインストールとJupyter Notebookの使い方については、こちらで確認してください。
-[[Pythonでデータ分析するはじめの一歩(Mac編)>機械学習/Pythonでデータ分析するはじめの一歩(Mac編)]] - とうごろうぃき


この記事の内容は、以下の環境で確認しました。
-macOS High Sierra 10.13.5
-Anaconda 5.3 for macOS Python 3.7 version



*Gymのインストール [#zbb1cc19]

まず、Anaconda NavigatorのHome画面で「Environments」をクリックして、環境の一覧を開きます。
#ref(Anaconda_environments.png,nolink,50%)

「base (root)」から「Open Terminal」を選んで、ターミナルを開きます。

ターミナルが開いたら、condaでGymをインストールします。
#geshi(sh){{
(base) $ conda install -c akode gym
}}



*Gymの動作確認 [#f3078185]

Anaconda NavigatorのHomeから、(「base (root)」の)「Launch」をクリックします。
#ref(Anaconda_jupyter_launch.png,nolink,50%)

Jupyter Notebookが起動し、ブラウザが開きます。

新しいNotebookを開いて、次のサンプルプログラムを打ち込み、実行します。
#geshi(python){{
import gym
env = gym.make('CartPole-v0')

for i_episode in range(20):
    observation = env.reset()  # 状態
    for t in range(100):
        env.render()
        print(observation)
        action = env.action_space.sample()  # 行動(一様選択) 0: 左、1: 右
        observation, reward, done, info = env.step(action)  # 行動を実行し、次の状態、報酬、終端状態かどうか、デバッグ用情報を受け取る
        if done:
            print("Episode finished after {} timesteps".format(t+1))
            break
}}

次のような画面が出てきて、ランダムな動きをしたらOKです。
#ref(Gym_cart_pole.png,nolink,50%)


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS