用于健身房环境的简单且无处不在的转换记录器包装器,用于促进离线强化学习数据集的制造。
项目描述
健身房环境的转换记录器包装器
用于健身房环境的简单且无处不在的转换记录器包装器,用于促进离线强化学习 (RL) 数据集的制造。转换(观察、动作、奖励、完成和信息)和情节(转换集)通过 LZ4 压缩进行缓冲,每个情节都保存为 JSON 行 (.jsonl)。可以进一步处理输出文件以与Ray RLlib等离线 RL 库兼容(请参阅用法)。
要求
- 蟒蛇> = 3.6
- 皮皮包:
pip install -r requirements.txt
用法
只需导入和包装您的 Gym 环境:
import gym
from gym_recorder import TransitionRecorderWrapper # import the wrapper
env = gym.make("CartPole-v1")
env = TransitionRecorderWrapper(env) # wrap your environment
env.reset()
# Use your environment as you would
while True:
env.render()
action = env.action_space.sample()
obs, reward, done, info = env.step(action)
if done:
env.reset()
您还可以使用该save_folder选项自定义转换的保存位置、min_transitions_per_file自定义输出文件大小以及使用该compress选项禁用压缩。
转换
生成的.jsonl文件可以进一步处理以供离线 RL 库使用,例如Ray RLlib。要将.jsonl包装器生成的数据集转换为RLlib 离线数据集,您可以运行以下命令:
python -m gym_recorder.converters.ray -i data/raw -o data/ray
可以使用 找到更多选项python -m gym_recorder.converters.ray --help。
项目详情
下载文件
下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。
源分布
gym-recorder-0.0.3.tar.gz
(3.0 kB
查看哈希)
内置分布
gym_recorder-0.0.3-py3-none-any.whl
(3.0 kB
视图哈希)
关
gym_recorder -0.0.3-py3-none-any.whl 的哈希值
| 算法 | 哈希摘要 | |
|---|---|---|
| SHA256 | 68b2dcf73f964b2f9be1f076145e36a7b6af5ebdadb92669edf54213054edf9f |
|
| MD5 | 9fe19e52d7ebe1aa68e6ccbb08db6e5f |
|
| 布莱克2-256 | 9ee87d71807d8c0255c98cf563e2548d71956f6c26f658d10215b1a05c499627 |