street-fighter-ai/001_image_stack_vision_based_reward/evaluate.py

import retro

from stable_baselines3 import PPO
from stable_baselines3.common.vec_env import DummyVecEnv
from stable_baselines3.common.monitor import Monitor
from stable_baselines3.common.evaluation import evaluate_policy

from street_fighter_custom_wrapper import StreetFighterCustomWrapper

def make_env(game, state):
    def _init():
        env = retro.RetroEnv(
            game=game, 
            state=state, 
            use_restricted_actions=retro.Actions.FILTERED, 
            obs_type=retro.Observations.IMAGE    
        )
        env = StreetFighterCustomWrapper(env)
        return env
    return _init

game = "StreetFighterIISpecialChampionEdition-Genesis"
state_stages = [
    "Champion.Level1.ChunLiVsGuile",
    "Champion.Level2.ChunLiVsKen",
    "Champion.Level3.ChunLiVsChunLi",
    "Champion.Level4.ChunLiVsZangief",
    "Champion.Level5.ChunLiVsDhalsim",
    "Champion.Level6.ChunLiVsRyu",
    "Champion.Level7.ChunLiVsEHonda",
    "Champion.Level8.ChunLiVsBlanka",
    "Champion.Level9.ChunLiVsBalrog",
    "Champion.Level10.ChunLiVsVega",
    "Champion.Level11.ChunLiVsSagat",
    "Champion.Level12.ChunLiVsBison"
    # Add other stages as necessary
]

env = make_env(game, state_stages[0])()

# Wrap the environment
env = Monitor(env, 'logs/')
env = DummyVecEnv([lambda: env])

model = PPO.load('trained_models/ppo_chunli_1296000_steps')
mean_reward, std_reward = evaluate_policy(model, env, render=True, n_eval_episodes=10)
print(f"Mean reward: {mean_reward:.2f} +/- {std_reward:.2f}")
image stack and lstm 2023-03-29 17:14:39 +00:00			`import retro`
ram_based_image_stack 2023-03-30 18:10:25 +00:00
image stack and lstm 2023-03-29 17:14:39 +00:00			`from stable_baselines3 import PPO`
			`from stable_baselines3.common.vec_env import DummyVecEnv`
ram_based_image_stack 2023-03-30 18:10:25 +00:00			`from stable_baselines3.common.monitor import Monitor`
			`from stable_baselines3.common.evaluation import evaluate_policy`
image stack and lstm 2023-03-29 17:14:39 +00:00
			`from street_fighter_custom_wrapper import StreetFighterCustomWrapper`
ram_based_image_stack 2023-03-30 18:10:25 +00:00
image stack and lstm 2023-03-29 17:14:39 +00:00			`def make_env(game, state):`
			`def _init():`
			`env = retro.RetroEnv(`
			`game=game,`
			`state=state,`
			`use_restricted_actions=retro.Actions.FILTERED,`
			`obs_type=retro.Observations.IMAGE`
			`)`
ram_based_image_stack 2023-03-30 18:10:25 +00:00			`env = StreetFighterCustomWrapper(env)`
image stack and lstm 2023-03-29 17:14:39 +00:00			`return env`
			`return _init`

			`game = "StreetFighterIISpecialChampionEdition-Genesis"`
			`state_stages = [`
			`"Champion.Level1.ChunLiVsGuile",`
			`"Champion.Level2.ChunLiVsKen",`
			`"Champion.Level3.ChunLiVsChunLi",`
			`"Champion.Level4.ChunLiVsZangief",`
			`"Champion.Level5.ChunLiVsDhalsim",`
			`"Champion.Level6.ChunLiVsRyu",`
			`"Champion.Level7.ChunLiVsEHonda",`
			`"Champion.Level8.ChunLiVsBlanka",`
			`"Champion.Level9.ChunLiVsBalrog",`
			`"Champion.Level10.ChunLiVsVega",`
			`"Champion.Level11.ChunLiVsSagat",`
			`"Champion.Level12.ChunLiVsBison"`
			`# Add other stages as necessary`
			`]`

			`env = make_env(game, state_stages[0])()`

			`# Wrap the environment`
ram_based_image_stack 2023-03-30 18:10:25 +00:00			`env = Monitor(env, 'logs/')`
image stack and lstm 2023-03-29 17:14:39 +00:00			`env = DummyVecEnv([lambda: env])`

ram_based_image_stack 2023-03-30 18:10:25 +00:00			`model = PPO.load('trained_models/ppo_chunli_1296000_steps')`
			`mean_reward, std_reward = evaluate_policy(model, env, render=True, n_eval_episodes=10)`
			`print(f"Mean reward: {mean_reward:.2f} +/- {std_reward:.2f}")`