強化学習/MacでOpenAI Gymを使う
をテンプレートにして作成
開始行:
*はじめに [#lca308b4]
[[OpenAI Gym:http://gym.openai.com]] は、安全な人工汎用知...
OpenAI Gymのページには、Pythonの標準パッケージ管理ツール...
しかし、機械学習用の環境であるAnacondaはとても便利なので...
AnacondaのインストールとJupyter Notebookの使い方について...
-[[Pythonでデータ分析するはじめの一歩(Mac編)>機械学習/P...
この記事の内容は、以下の環境で確認しました。
-macOS High Sierra 10.13.5
-Anaconda 5.3 for macOS Python 3.7 version
*Gymのインストール [#zbb1cc19]
まず、Anaconda NavigatorのHome画面で「Environments」をク...
#ref(Anaconda.png,nolink,25%)
「base (root)」から「Open Terminal」を選んで、ターミナル...
#ref(Anaconda_environments.png,nolink,25%)
ターミナルが開いたら、condaでGymをインストールします。
#geshi(sh){{
(base) bash-3.2$ conda install -c akode gym
}}
*Gymの動作確認 [#f3078185]
Anaconda NavigatorのHomeから、(「base (root)」の)「Laun...
#ref(Anaconda_jupyter_launch.png,nolink,25%)
Jupyter Notebookが起動し、ブラウザが開きます。
新しいNotebookを開いて、次のサンプルプログラムを打ち込み...
#geshi(python){{
import gym
env = gym.make('CartPole-v0')
for i_episode in range(20):
observation = env.reset() # 状態
for t in range(100):
env.render()
print(observation)
action = env.action_space.sample() # 行動(一様...
observation, reward, done, info = env.step(action...
if done:
print("Episode finished after {} timesteps".f...
break
}}
次のような画面が出てきて、ランダムな動きをしたらOKです。
#ref(Gym_cart_pole.png,nolink,25%)
終了行:
*はじめに [#lca308b4]
[[OpenAI Gym:http://gym.openai.com]] は、安全な人工汎用知...
OpenAI Gymのページには、Pythonの標準パッケージ管理ツール...
しかし、機械学習用の環境であるAnacondaはとても便利なので...
AnacondaのインストールとJupyter Notebookの使い方について...
-[[Pythonでデータ分析するはじめの一歩(Mac編)>機械学習/P...
この記事の内容は、以下の環境で確認しました。
-macOS High Sierra 10.13.5
-Anaconda 5.3 for macOS Python 3.7 version
*Gymのインストール [#zbb1cc19]
まず、Anaconda NavigatorのHome画面で「Environments」をク...
#ref(Anaconda.png,nolink,25%)
「base (root)」から「Open Terminal」を選んで、ターミナル...
#ref(Anaconda_environments.png,nolink,25%)
ターミナルが開いたら、condaでGymをインストールします。
#geshi(sh){{
(base) bash-3.2$ conda install -c akode gym
}}
*Gymの動作確認 [#f3078185]
Anaconda NavigatorのHomeから、(「base (root)」の)「Laun...
#ref(Anaconda_jupyter_launch.png,nolink,25%)
Jupyter Notebookが起動し、ブラウザが開きます。
新しいNotebookを開いて、次のサンプルプログラムを打ち込み...
#geshi(python){{
import gym
env = gym.make('CartPole-v0')
for i_episode in range(20):
observation = env.reset() # 状態
for t in range(100):
env.render()
print(observation)
action = env.action_space.sample() # 行動(一様...
observation, reward, done, info = env.step(action...
if done:
print("Episode finished after {} timesteps".f...
break
}}
次のような画面が出てきて、ランダムな動きをしたらOKです。
#ref(Gym_cart_pole.png,nolink,25%)
ページ名: